Springe zum Inhalt oder Footer
SerloDie freie Lernplattform

Konfidenzintervalle

Die Trefferwahrscheinlichkeit pp für ein bestimmtes Ereignis ist unbekannt. Um einen Schätzwert für pp zu bekommen, wird aus der zugrunde liegenden Gesamtheit eine Stichprobe vom Umfang nn gezogen und die relative Trefferwahrscheinlichkeit h=Xnh=\dfrac{X}{n} bestimmt. hh ist ein Schätzwert für pp.

Konfidenzellipse

Konfidenzellipse

Schluss von der Stichprobe auf die Gesamtheit

Der wahre Wert pp für die Wahrscheinlichkeit (z. B. Fehlerwahrscheinlichkeit einer Maschine) ist unbekannt.

Die Wahrscheinlichkeit pp soll durch den prozentualen Anteil Xn\dfrac{X}{n} in einer Stichprobe der Größe nn abgeschätzt werden.

Aus der Stichprobe wird der Wert des prozentualen Anteils Xn\dfrac{X}{n} bestimmt. Dieser Wert ist ein erster Schätzwert für die unbekannte Wahrscheinlichkeit pp.

Zur Eingrenzung des wahren Wertes für pp bildet man ein Intervall um Xn\dfrac{X}{n} herum (dessen Mitte Xn\dfrac{X}{n} ist), welches pp enthalten soll.

Abhängig von der gewünschten Sicherheitswahrscheinlichkeit γ\gamma (Vertrauensniveau), mit der das Intervall pp überdecken soll, wird die Intervallgröße berechnet.

MerkeKonfidenzintervall

Konfidenzintervall: Xnpcσn\left|\dfrac{X}{n}- p\right|\leq c\cdot\dfrac{\sigma}{n}

Die Berechnung der Intervallgrenzen erfolgt durch Lösung der Ungleichung.

(Eine Tabelle mit den Werten von cc befindet sich im Artikel Prognoseintervalle.)

Näherungsverfahren zur Bestimmung von Konfidenzintervallen

Das Rechenverfahren zur Bestimmung von Konfidenzintervallen ist recht aufwendig.

Deshalb wird ein Näherungsverfahren eingesetzt.

Für 0,3h0,70{,}3\leq h\leq 0{,}7 kann pp unter der Wurzel durch hh ersetzt werden.

    Xnpcp(1p)n    hpch(1h)n\;\Rightarrow\;\left|\dfrac{X}{n}-p\right|\leq c\cdot \sqrt{\dfrac{p\cdot (1-p)}{n} }\;\Rightarrow\;\left|h-p\right|\leq c\cdot \sqrt{\dfrac{h\cdot (1-h)}{n} }

Mit den Zahlen aus dem Musterbeispiel h=0,09h=0{,}09 und n=400,c=1,96n=400, c=1{,}96 folgt dann:

0,09p1,960,09(10,09)400\left| 0{,}09-p\right|\leq 1{,}96\cdot \sqrt{\dfrac{0{,}09\cdot (1-0{,}09)}{400} }

0,09p0,0280    p10,0620p20,1180    [0,0620;0,1180]\left| 0{,}09-p\right|\leq 0{,}0280\;\Rightarrow\;p_1\approx0{,}0620\quad p_2\approx0{,}1180\;\Rightarrow\;[0{,}0620;0{,}1180]

Bei exakter Rechnung liegt pp im Intervall [0,0657  ;  0,1221][0{,}0657\;;\;0{,}1221], bei der Näherungslösung liegt pp im Intervall [0,0620;0,1180][0{,}0620;0{,}1180], also nur geringfügig anders.

Wahl eines genügend großen Stichprobenumfangs

Der Anteil in der Stichprobe soll sich vom Anteil in der Gesamtheit um höchsten den Wert d2\dfrac{d}{2} unterscheiden. Wie groß muss die Stichprobe sein?

Was wir haben wollen, ist Xnpd2\left| \dfrac{X}{n}-p\right|\leq \dfrac{d}{2}.

Wir wissen Xnpcσn\left| \dfrac{X}{n}-p\right|\leq c\cdot \dfrac{\sigma}{n}

Wenn also

cσnd2\displaystyle c\cdot \dfrac{\sigma}{n}\leq \dfrac{d}{2}

ist, muss auch die gesuchte Ungleichung Xnpd2\left| \dfrac{X}{n}-p\right|\leq \dfrac{d}{2} gelten.

Die Ungleichung cσnd2c\cdot \dfrac{\sigma}{n}\leq \dfrac{d}{2} wird nach nn aufgelöst (siehe Musterbeispiel).

Näherungslösung für die Wahl eines genügend großen Stichprobenumfangs

Für das Konfidenzintervall gilt: Xnpcσn\left|\dfrac{X}{n}- p\right|\leq c\cdot\dfrac{\sigma}{n}

Für die Länge ll des Konfidenzintervalls gilt:

l2cp(1p)nl\leq 2\cdot c\cdot \sqrt{\dfrac{p(1-p)}{n}}

Das Produkt p(1p)p(1-p) wird für p=0,5p=0{,}5 am größten.

Dann gilt:

l2cp(1p)n2c14nl\leq 2\cdot c\cdot \sqrt{\dfrac{p(1-p)}{n}}\leq 2\cdot c\cdot \sqrt{\dfrac{1}{4n}}

Diese Länge ll soll höchstens gleich dd sein, d. h. die Länge des Konfidenzintervalls ist dann gleich dd.

  2c14nd    nc2d2\Rightarrow\; 2\cdot c\cdot \sqrt{\dfrac{1}{4n}}\leq d\;\Rightarrow\;n\geq \dfrac{c^2}{d^2}

Für das Musterbeispiel "Wahl eines genügend großen Stichprobenumfangs" ergibt sich dann folgende Näherung:

Es ist d2=0,01    d=20,01=0,02\dfrac{d}{2}=0{,}01\;\Rightarrow\;d=2\cdot 0{,}01=0{,}02 und c=3c=3.

n\displaystyle nc2d2\displaystyle \dfrac{c^2}{d^2}

Setze d=0,02d=0{,}02 und c=3c=3 ein.

320,022\displaystyle \dfrac{3^2}{0{,}02^2}
22500\displaystyle 22500

Bei der genauen Rechnung im Musterbeispiel "Wahl eines genügend großen Stichprobenumfangs" erhielt man n21600n\geq 21600. Im Vergleich dazu die mit geringerem Rechenaufwand ermittelte Näherungslösung n22500n\geq 22500.

Übungsaufgaben: Konfidenzintervalle

Laden

Laden


Dieses Werk steht unter der freien Lizenz
CC BY-SA 4.0Was bedeutet das?