Bei einem Hypothesentest stehen sich zwei einander widersprechende Behauptungen / Vermutungen (sog. Hypothesen) gegenüber. Welche der beiden Hypothesen wahr ist und welche falsch, weiß man nicht und man kann es auch nicht wissen, da in den Hypothesen Aussagen über vom Zufall beeinflusste Vorgänge gemacht werden (z. B. dass die Wahrscheinlichkeit eines bestimmten Ereignisses einen Wert oberhalb bzw. unterhalb eines angegebenen Wertes liegt o.ä.).

Der Hypothesentest dient nun dazu anhand des Ergebnisses einer Stichprobe zu einer Entscheidung darüber zu kommen, welche der beiden Hypothesen man eher zu glauben bereit ist oder anders ausgedrückt: welche der beiden Hypothesen angenommen (bzw. beibehalten) und welche verworfen wird. 

Eine 100%-ige Sicherheit, dass die angenommene Hypothese auch tatsächlich wahr ist, kann der Hypothesentest naturgemäß niemals bieten.

Zur Berechnung der Wahrscheinlichkeiten eines solches Tests benutzt man die Binomialverteilung.

Vorgehensweise

Die beiden Hypothesen

Als erstes muss man aus der Aufgabenstellung die beiden einander gegenüberstehenden Hypothesen herauslesen.

In der Regel werden in den beiden Hypothesen Aussagen über die Wahrscheinlichkeit für den Eintritt eines bestimmten Ereignisses gemacht.

  1. Um welches Ereignis handelt es sich? Dieses Ereignis wird dann als "Treffer" (im Sinne des Treffers einer Bernoulli-Kette) aufgefasst und seine Wahrscheinlichkeit üblicherweise mit %%p%% abgekürzt.

  2. Welche Aussagen über p stehen einander gegenüber? Oft wird in der Aufgabenstellung nur eine der beiden Hypothesen konkret formuliert. Die andere muss man dann (zumeist einfach durch logische Verneinung der angegebenen Hypothese) selbst erschließen.

  3. Bei einem Signifikanztest: Welche der beiden Hypothesen ist die Nullhypothese und welche die Gegenhypothese?

Beispiel

Handwerksmeister X besitzt eine Maschine, die bestimmte Bauteile fertigt. Erfahrungsgemäß sind ca. 2% der angefertigten Bauteile Ausschuss, d. h. sie sind so misslungen, dass Herr X sie nicht verwenden kann.

Herr X vermutet nun, dass sich der Ausschussanteil in letzter Zeit erhöht hat. Da er sich jedoch nicht sicher ist, will er einen Test durchführen…

Welche beiden Hypothesen stehen sich gegenüber und welches ist die Nullhypothese?

Lösung:

Zugrunde liegendes Bernoulli-Experiment: Anfertigen eines Bauteils durch die Maschine.

Treffer: Das Bauteil ist Ausschuss.

Einander gegenüber stehen sich nun die Hypothesen

"Die Trefferwahrscheinlichkeit %%p%% hat sich erhöht" (Vermutung von Herrn X) und

"Die Trefferwahrscheinlichkeit %%p%% hat sich nicht erhöht".

Da Herr X seine Vermutung prüfen will, muss er zunächst einmal davon ausgehen, dass seine Vermutung nicht stimmt und dann versuchen seine Vermutung doch zu belegen und nicht umgekehrt von der Richtigkeit seiner Annahme bereits ausgehen. Als Nullhypothese muss er daher wählen

%%{\mathrm H}_0: p \leq 2\%\,%%

und als Gegenhypothese

%%{\mathrm H}_1: p \gt 2\% \,%%.

Die Stichprobe: Testgröße und Stichprobenlänge

Um zu einer Entscheidung darüber zu gelangen, welche der beiden Hypothesen angenommen und welche verworfen werden soll, plant man nun die Durchführung eine Stichprobe: D. h. es wird vorgesehen, dass das betreffende Zufallsexperiment n-mal voneinander unabhängig durchgeführt und dabei notiert wird, wie oft das betreffende Ereignis eintritt.

Die Anzahl n der Wiederholungen des Zufallsexperiments bezeichnet man als die Länge der Stichprobe.

Das, worauf bei der Durchführung der einzelnen Versuche geachtet wird (also die Anzahl der Eintritte des betreffenden Ereignisses), nennt man die Testgröße. Sie wird manchmal mit T, oft auch mit X oder Z abgekürzt.

Bei der Stichprobe handelt es sich dabei um eine Bernoulli-Kette. Die Testgröße ist daher binomialverteilt.

Beispiel (Fortsetzung)

Um den Test durchzuführen beauftragt Herr X den mit der Bedienung der Maschine betrauten Mitarbeiter seines Betriebes bei den nächsten 100 von der Maschine gefertigten Bauteilen darauf zu achten, wie viele davon Ausschuss sind, und ihm das Ergebnis am Ende der Woche mitzuteilen.

Was ist in diesem Fall die Stichprobenlänge und was ist bei dieser Stichprobe die Testgröße?

Lösung:

Die Stichprobe hat die Länge 100.

Die Testgröße ist die Anzahl der Ausschussstücke unter den 100 Bauteilen der Stichprobe.

Die Entscheidungsregel: Annahme- und Ablehnungsbereich

Abhängig vom Wert, den die Testgröße in der Stichprobe annimmt, wird man die Richtigkeit der einen bzw. der anderen der beiden Hypothesen annehmen.

Diejenigen Werte zwischen 0 und n, bei denen die Richtigkeit der Hypothese %%H%% angenommen werden soll, bezeichnet man als den Annahmebereich von %%H%%. Die anderen Werte, also die, bei denen %%H%% verworfen (d.h. abgelehnt) wird, bilden den Ablehnungsbereich von %%H%%.

Die Entscheidungsregel aufstellen heißt für eine der beiden Hypothesen - üblicherweise für die Nullhypothese - Annahme- und Ablehnungsbereich festzulegen.

Beispiel (Fortsetzung)

Herr X entscheidet die Maschine bei mehr als vier defekten Teilen zur Reparatur zu schicken, bei weniger will er die Sache nicht weiter verfolgen.

Was ist hier der Annahme- und was der Ablehnungsbereich?

Lösung:

%%A = \{0, 1, 2, 3, 4\}%% ist der Annahmebereich,
%%\bar{A} =\{5, 6, 7, …, 100\}%% ist der Ablehnungsbereich

Weitere wichtige Begriffe

Fehler 1. Art und 2. Art

Bei einem Hypothesentest können zwei spezielle Fehler auftreten:

  • Ein Fehler 1. Art liegt vor, wenn bei einem Hypothesentest die Nullhypothese zu Unrecht verworfen wird.
  • Ein Fehler 2. Art liegt vor, wenn bei einem Hypothesentest die Nullhypothese zu Unrecht beibehalten wird.

Damit ergeben sich vier mögliche Ausgänge für einen Hypothesentest. Diese lassen sich mit einer Tabelle veranschaulichen:

%%\,%%

%%{\mathbf H}_\mathbf0%% ist wahr.

%%{\mathbf H}_\mathbf0%% ist falsch.

Die Testgröße T nimmt bei der Stichprobe einen Wert im Annahmebereich von %%{\mathrm H}_0%% an.

richtige Entscheidung

%%{\mathrm H}_0%% ist wahr und wird (zu Recht) beibehalten.

falsche Entscheidung

%%{\mathrm H}_0%% ist falsch und wird zu Unrecht beibehalten.

Fehler 2. Art

Die Testgröße T nimmt bei der Stichprobe einen Wert im Ablehnungsbereich von %%{\mathrm H}_0%% an.

falsche Entscheidung

  %%{\mathrm H}_0%% ist wahr und wird zu Unrecht verworfen.

Fehler 1. Art

richtige Entscheidung

%%{\mathrm H}_0%% ist falsch und wird (zu Recht) verworfen.

Der Fehler 2. Art lässt sich im Allgemeinen nicht berechnen, da für die Gegenhypothese keine Trefferwahrscheinlichkeit angegeben ist (Ausnahme Alternativtest).

Beispiel (Fortsetzung)

Wie hoch ist die Wahrscheinlichkeit, dass Herr X fälschlicherweise annimmt, die Maschine arbeite schlechter?

Um diesen Fehler 1. Art zu berechnen muss man die Wahrscheinlichkeit dafür bestimmen, dass die Maschine 2% Ausschuss produziert, in der Stichprobe aber trotzdem fünf oder mehr defekte Teile sind.

Dies kann man beispielsweise im Tafelwerk der Binomialverteilung nachschlagen. Dort sind die Wahrscheinlichkeiten für null bis k Treffer bei verschiedenen Testlängen und Trefferwahrscheinlichkeiten angegeben.

Da hier die Chance für mehr als k Treffer gesucht ist, muss man über das Gegenereignis gehen:
In unserem Beispiel wird die Wahrscheinlichkeit für %%0%% bis %%k = 4%% Treffer mit Trefferwahrscheinlichkeit %%p_G =0,02%% bei %%n=100%% Versuchen gesucht.

%%P^{100}_{0,02}(X\ge 5)=1- P^{100}_{0,02}(X\le 4)=1- 0,9492=0,0502≈5\% %%

Herr X schickt die Maschine also mit einem Risiko von 5% zur Reparatur, obwohl sie fehlerfrei arbeitet.

Signifikanzniveau

Die Entscheidungsregel sollte nicht willkürlich oder nach Gefühl aufgestellt werden. Denn dann kann es passieren, dass Hypothesen zu leicht angenommen oder abgelehnt werden, was die Aussagekraft des Tests verschlechtert.

Um das zu verhindern bestimmt man vorher ein Signifikanzniveau. Dieses stellt sicher, dass das Ergebnis des Tests aussagekräftig ist.

Das Signifikanzniveau ist dabei gleich der Wahrscheinlichkeit einen Fehler 1. Art zu begehen.
Übliche Werte sind 5% und 10%, bei großen Stichproben manchmal auch 1%.

Beispiel (Fortsetzung)

Wie ist das Signifikanzniveau im Test von Herr X?

Es ist gleich dem Fehler 1. Art. Dieser wurde im oberen Absatz schon berechnet, er ist gleich 5%.

Wie man für ein vorgegebenes Signifikanzniveau die entsprechende Entscheidungsregel aufstellt, wird im zugehörigen Artikel gezeigt.

Kommentieren Kommentare

Zu article Hypothesentest: Fehler 1.Art Berechnung
WernerPhil 2016-05-16 15:19:35
im Berechnungsbeispiel Fehler 1.Art kann etwas nicht simmen: meines Erachtens müsste es heißen: P^{100}_{0,02}(X\ge 5)=1- P(X\le 4)=1- 0,9492=0,0508≈5\% Es wird doch die W. für k größer 5 im Annahmebereich d.h. bei Ausschussanteil 2% gesucht also P^{100}_{0,02}(X\ge 5)
SebSoGa 2016-05-17 16:49:52
Hey WernerPhil,

Du hast völlig recht, man sollte sich P^{100}_{0,02}(X ≥ 5) anschauen. Alternativ könnte man sich P^{100}_{0,98}(X ≤ 95) anschauen (kannst du erklären warum?), aber die Lösung, die hier stand hatte einen kleinen Fehler (die 5 und die 95 wurden verwechselt).
Ich habe den Fehler behoben, sollte spätestens in einer Stunde sichtbar sein.
Danke für deinen Kommentar!
Viele Grüße und viel Spaß beim Lernen
Sebastian
Antwort abschicken
Zu article Hypothesentest: Fertigstellung
LorenzHuber 2014-09-11 08:37:50
Ich werde den Artikel beenden und eventuell etwas überarbeiten