Die Entscheidungsregel eines Hypothesentests besagt, bei welchen Trefferzahlen in der Stichprobe welche der beiden Hypothesen angenommen werden soll.

 

Begriffe

Der Annahmebereich einer Hypothese H sind diejenigen Trefferzahlen zwischen 0 und n, bei denen die Richtigkeit einer Hypothese H angenommen werden soll.

Der Ablehnungsbereich von H besteht dann aus den restlichen Werten, also denjenigen Trefferzahlen, bei denen H verworfen (d.h. abgelehnt) wird.

Der Grenzwert zwischen An- und Ablehnungsbereich wird üblicherweise als kritischer Wert bezeichnet. Man wählt dabei meistens die Trefferzahl, ab der die zu überprüfende Hypothese angenommen wird.

 

Die Entscheidungsregel aufstellen heißt, für eine der beiden Hypothesen - üblicherweise für die Nullhypothese - Annahme- und Ablehnungsbereich festzulegen.

Bemerkung:
Bei zweiseitigen Signifikanztests ist nach Abweichungen der Trefferwahrscheinlichkeit in beide Richtungen gesucht. Hier ist der Annahmebereich der Nullhypothese zweigeteilt.

Beispiel

Jemand hat festgelegt, dass die Hypothese H: "Höchstens 2% der Werkstücke sind defekt"

  • angenommen wird, wenn sich in einer Stichprobe der Länge 100 höchstens 4 defekte Stücke befinden.
  • abgelehnt wird, wenn sich in der Stichprobe der Länge 100 mehr als 4 defekte Stücke befinden.
  • Dann ist  %%\mathrm A=\left\{0,1,2,3,4\right\}%% der Annahmebereich von H,
  • und %%\overline{\mathrm A}=\left\{5,6,7,…,100\right\}%% der Ablehnungsbereich von H.

 

Hintergrund

Bei einem Hypothesentest stehen sich zwei einander widersprechende Hypothesen gegenüber, in denen (in der Regel) Aussagen über die Wahrscheinlichkeit für den Eintritt eines bestimmten Ereignisses gemacht werden.

 

Um zu einer Entscheidung darüber zu gelangen, welche der beiden Hypothesen angenommen und welche verworfen werden soll, plant man die Durchführung einer Stichprobe: D. h. es wird vorgesehen, dass das betreffende Zufallsexperiment n-mal voneinander unabhängig durchgeführt und dabei notiert wird, wie oft das Ereignis eintritt.

 

Wird die Stichprobe dann konkret durchgeführt, kann die Testgröße theoretisch jeden beliebigen Wert zwischen 0 und n annehmen. Auch wenn die Trefferwahrscheinlichkeit p sehr hoch ist, ist es theoretisch denkbar, dass in der Stichprobe durch Zufall nur sehr wenige Treffer vorkommen, im Extremfall sogar gar keine. Ebenso ist es auch bei einer niedrigen Trefferwahrscheinlichkeit p nicht ausgeschlossen, dass sich in der Stichprobe dennoch zufällig sehr viele Treffer finden, im Extremfall bis zu n. Allerdings wird man diese Fälle als sehr unwahrscheinlich einstufen. Daher sind wir (mit Recht) eher dazu bereit, bei einer hohen Trefferzahl eine hohe Trefferwahrscheinlichkeit und bei einer niedrigen Trefferzahl eine niedrige Trefferwahrscheinlichkeit zu vermuten. Abhängig vom Wert, den die Testgröße in der Stichprobe annimmt, wird man deshalb die Richtigkeit der einen bzw. der anderen der beiden Hypothesen annehmen.

 

Entscheidungsregel mit Signifikanzniveau

Die Entscheidungsregel darf nicht willkürlich gewählt werden, denn sie bestimmt die Aussagekraft des Tests. Wird der kritische Wert zu niedrig oder zu hoch angesetzt wird die Hypothese unabhängig von der tatsächlichen Wahrscheinlichkeit fast immer angenommen bzw. abgelehnt.

Um eine gewisse Aussagekraft, man spricht auch von Signifikanz, sicherzustellen, bestimmt man das Signifikanzniveau des Tests. Das ist gleich der Wahrscheinlichkeit, einen Fehler 1. Art zu begehen.

Nun wählt man den kritischen Wert so, dass der Fehler 1. Art kleiner als das Signifikanzniveau ist. Dazu stellt man die Formel für den Fehler auf und sucht den kleinsten Wert, der die Bedingung noch erfüllt.

Typische Werte für das Signifikanzniveau sind 1%, 5% oder 10%. Die konkrete Wahl hängt meist von der Länge n der Stichprobe ab.
Bei n < 100 ist es sehr schwer, den Fehler auf unter 1% zu halten. Dieses Niveau wird daher nur bei großen Stichproben verwendet.
10% können bei größeren Proben dafür zu sehr großen Abweichungen führen.

Beispiel

Um das Signifikanzniveau im obigen Beispiel zu bestimmen, muss man also die Wahrscheinlichkeit für den Fehler 1. Art bestimmen. Dieser tritt ein, wenn fünf oder mehr defekte Stücke auftreten, obwohl immer noch nur 2% Ausschuss produziert werden.
Bestimme also die Wahrscheinlichkeit für fünf oder mehr Treffer bei n = 100 Versuchen mit Trefferwahrscheinlichkeit p = 0,02.
Das kann man z.B. mit dem Tafelwerk zur Binomialverteilung.
Da hier aber immer die Wahrscheinlichkeit für null bis k Treffer angegeben sind muss man über das Gegenereignis gehen. Bestimme also die Wahrscheinlichkeit für (100-5) = 95 oder weniger Treffer bei n = 100 und p = 0,98 und ziehe diese von eins ab.

%%1-P^{100}_{0,98}(X\le95)=1- 0,9492= 0,0502\approx5\% %%

Wie müsste die Entscheidungsregel für Signifikanzniveau 1% lauten?

Dazu muss der Fehler kleiner 0,01 sein. Man sucht also das kleinste k, so dass gilt:

%%1-P^{100}_{0,98}(X\le k)<0,01 \Leftrightarrow P(X\le k)>0,99%%

Das gilt für k = 93, also wird die Hypothese bei sieben defekten Stücken abgelehnt.

Warum nicht 0%?

Optimal wäre es natürlich, überhaupt keinen Fehler zu machen. Das ist aber nicht möglich, da man dazu die Nullhypothese immer annehmen müsste. Denn im Extremfall kann es dazu kommen, dass kein einziger entsprechender Treffer auftritt, obwohl sie wahr ist.
Ein solcher Test würde aber keinen Sinn machen.

Zudem besteht ein indirekter Zusammenhang zwischen den beiden Fehlern. Je geringer die Chance für einen Fehler 1. Art ist, desto größer wird die Chance für einen Fehler 2. Art.

Man wählt den Fehler 1. Art für das Signifikanzniveau, da eine geringe Wahrscheinlichkeit hier bedeutet, dass man eher bei der bisherigen Ansicht bleibt. Nur wenn es auffallende Abweichungen gibt, bestätigt man die neue Hypothese.

Kommentieren Kommentare