Bei statistischen Untersuchungen fallen Daten an. Je mehr Daten vorliegen, um so schwieriger ist es, den Überblick zu bekommen. Werden die Daten grafisch dargestellt, können unübersichtliche Datensätze besser veranschaulicht werden.
Die Daten werden geordnet, in Gruppen bzw. Klassen eingeteilt und in einem Diagramm dargestellt.
Solch eine grafische Darstellung wird Histogramm genannt.
Die folgende Übersicht zeigt verschiedene Arten von Histogrammen. Je ein Beispiel soll das entsprechende Histogramm verdeutlichten.
Vorgehensweise
Die Häufigkeitsverteilung eines bestimmten Merkmals liegt vor. So ein Merkmal kann z.B. die Körpergröße oder das Alter von Personen sein.
1. Klasseneinteilung
Mehrere Beobachtungswerte werden zu Klassen zusammengefasst. Die Klassen können eine konstante oder variable Breite haben. Für jede Klasse wird die Anzahl der Daten ermittelt, die in diese Klasse gehören.
Die Klassengrenzen dürfen sich nicht überschneiden.
Die Klassenbreite ist die Differenz zwischen oberer und unterer Klassengrenze.
Die Randklassen sind nicht offen, d.h. die erste und letzte Klasse haben eine untere bzw. obere Grenze.
2. Grafische Darstellung
Auf der Achse werden die Intervalle entsprechend der Klasseneinteilung aufgetragen. Dann werden Rechtecke über den Intervallen gezeichnet.
Für die Rechteckhöhe ergeben sich je nach gewählter Histogrammart unterschiedliche Werte.
Sind die Klassen benachbart, dann grenzen die Rechtecke aneinander.
Den folgenden Beispielen liegt folgender Datensatz zugrunde.
Bei der Einschulungsuntersuchung wurden von Kindern die Körpergrößen in gemessen.
Größe | Anzahl |
---|---|
110 | 7 |
111 | 10 |
112 | 9 |
113 | 11 |
114 | 12 |
115 | 14 |
116 | 11 |
117 | 10 |
118 | 7 |
119 | 6 |
120 | 3 |
1. Klasseneinteilung mit konstanter Klassenbreite
Bei den Beispielen , , und wird eine konstante Klassenbreite von gewählt. Die Klassenbreite ist z.B. das halboffene Intervall . Darin sind alle Daten , für die gilt und entsprechend die anderen Klassen.
1. Beispiel für ein Histogramm mit absoluter Häufigkeit und konstanter Klassenbreite
Klasse | Anzahl | Klassenbreite |
---|---|---|
[110;112[ | 17 | 2 |
[112;114[ | 20 | 2 |
[114;116[ | 26 | 2 |
[116;118[ | 21 | 2 |
[118;120] | 16 | 2 |
2. Grafische Darstellung
Auf der Achse werden die Intervalle entsprechend der Klasseneinteilung aufgetragen. Dann werden Rechtecke über den Intervallen gezeichnet.
Dabei entspricht die Rechteckhöhe der absoluten Häufigkeit.
Aus dem Histogramm kann sehr einfach an der Achse die Anzahl der Kinder abgelesen werden, die zu einer bestimmten Klasse gehören.
In der Klasse mit den Größen befinden sich 26 Kinder.
2. Histogramm mit relativer Häufigkeit und konstanter Klassenbreite
1. Klasseneinteilung
Die Klasseneinteilung erfolgt wie beim 1. Beispiel.
Mit der Anzahl der einsortierten Daten wird dann die relative Häufigkeit bestimmt.
Klasse | Anzahl | rel. Häufigkeit | Klassenbreite |
---|---|---|---|
[110;112[ | 17 | 0,17 | 2 |
[112;114[ | 20 | 0,20 | 2 |
[114;116[ | 26 | 0,26 | 2 |
[116;118[ | 21 | 0,21 | 2 |
[118;120] | 16 | 0,16 | 2 |
2. Grafische Darstellung
Auf der Achse werden die Intervalle entsprechend der Klasseneinteilung aufgetragen. Dann werden Rechtecke über den Intervallen gezeichnet.
Dabei entspricht die Rechteckhöhe der relativen Häufigkeit.
Z.B. beträgt die relative Häufigkeit für die Klasse mit den Größen .
3a. Beispiel für ein normiertes Histogramm mit konstanter Klassenbreite und Häufigkeitsdichte
1. Klasseneinteilung
Die Klasseneinteilung erfolgt wie beim 1. Beispiel.
Die Häufigkeitsdichte wird berechnet:
Klasse | Anzahl | Klassenbreite | Häufigkeitsdichte |
---|---|---|---|
[110;112[ | 17 | 2 | 8,5 |
[112;114[ | 20 | 2 | 10 |
[114;116[ | 26 | 2 | 13 |
[116;118[ | 21 | 2 | 10,5 |
[118;120] | 16 | 2 | 8 |
2. Grafische Darstellung
Die Häufigkeitsdichte ergibt die Höhe des Rechtecks.
Für die Zeichnung der Rechtecke muss ein Maßstab festgelegt werden. Hier wurde z.B. festgelegt, dass einer relativen Häufigkeitsdichte von eine Rechteckhöhe von zugeordnet wird.
Der Flächeninhalt entspricht dann der absoluten Häufigkeit.
Z.B. berechnet man die absolute Häufigkeit für die Klasse mit:
3b. Beispiel für ein normiertes Histogramm mit konstanter Klassenbreite und relativer Häufigkeitsdichte
1. Klasseneinteilung
Die Klasseneinteilung erfolgt wie beim 1. Beispiel.
Die relative Häufigkeitsdichte wird berechnet:
Klasse | Anzahl | rel.Häufigkeit | Klassenbreite | Häufigkeitsdichte |
---|---|---|---|---|
[110;112[ | 17 | 0,17 | 2 | 0,085 |
[112;114[ | 20 | 0,20 | 2 | 0,10 |
[114;116[ | 26 | 0,26 | 2 | 0,13 |
[116;118[ | 21 | 0,21 | 2 | 0,105 |
[118;120] | 16 | 0,16 | 2 | 0,08 |
2. Grafische Darstellung
Die relative Häufigkeitsdichte ergibt die Höhe des Rechtecks.
Für die Zeichnung der Rechtecke muss ein Maßstab festgelegt werden. Hier wurde z.B. festgelegt, dass einer relativen Häufigkeitsdichte von eine Rechteckhöhe von zugeordnet wird.
Der Flächeninhalt entspricht dann der relativen Häufigkeit.
Z.B. berechnet man die relative Häufigkeit für die Klasse mit:
2. Klasseneinteilung mit variabler Klassenbreite
Bei variablen Klassenbreiten können die Histogramme nur mit der Häufigkeitsdichte bzw. relativen Häufigkeitsdichte dargestellt werden. Eine Darstellung mit absoluten Häufigkeiten würde zu Fehlinterpretationen führen.
Bei den Beispielen und wird eine variable Klassenbreite gewählt. Die Klassenbreite für die Klasse ist das halboffene Intervall . Darin sind alle Daten , für die gilt . Diese Klasse hat eine Breite von . Die Klasse hat eine Breite von und die Klasse hat eine Breite von .
4. Beispiel für ein normiertes Histogramm mit variabler Klassenbreite und Häufigkeitsdichte
Die Häufigkeitsdichte wird berechnet:
Klasse | Anzahl | Klassenbreite | Häufigkeitsdichte |
---|---|---|---|
[110;113[ | 26 | 3 | 8,67 |
[113;115[ | 23 | 2 | 11,5 |
[115;120] | 51 | 5 | 10,2 |
2. Grafische Darstellung
Die Häufigkeitsdichte ergibt die Höhe des Rechtecks.
Für die Zeichnung der Rechtecke muss ein Maßstab festgelegt werden. Hier wurde z.B. festgelegt, dass einer Häufigkeitsdichte von eine Rechteckhöhe von zugeordnet wird.
Der Flächeninhalt entspricht dann der absoluten Häufigkeit.
Z.B. berechnet man die absolute Häufigkeit für die Klasse mit:
5. Beispiel für ein normiertes Histogramm mit variabler Klassenbreite und relativer Häufigkeitsdichte
1. Klasseneinteilung
Die Klasseneinteilung erfolgt wie beim Beispiel.
Die relative Häufigkeitsdichte wird berechnet:
Klasse | rel. Häufigkeit | Klassenbreite | rel. Häufigkeitsdichte |
---|---|---|---|
[110;113[ | 0,26 | 3 | 0,087 |
[113;115[ | 0,23 | 2 | 0,115 |
[115;120] | 0,51 | 5 | 0,102 |
2. Grafische Darstellung
Die relative Häufigkeitsdichte ergibt die Höhe des Rechtecks.
Für die Zeichnung der Rechtecke muss ein Maßstab festgelegt werden. Hier wurde z.B. festgelegt, dass einer relativen Häufigkeitsdichte von eine Rechteckhöhe von zugeordnet wird.
Der Flächeninhalt entspricht dann der relativen Häufigkeit.
Z.B. berechnet man die relative Häufigkeit für die Klasse mit: