🎓 Ui, schon Prüfungszeit? Hier geht's zur Mathe-Prüfungsvorbereitung.
Springe zum Inhalt oder Footer
SerloDie freie Lernplattform

Kurs

Einführung in Hypothesentests

1 Überblick

In diesem Kurs lernst du nach und nach wichtige Begriffe rund um das Themenfeld Hypothesentest kennen. Dabei arbeitest du mit einem Beispiel "Farben erkennen" und wirst zunächst ohne Hypothesentest die Begriffe Nullhypothese, Gegenhypothese, Stichprobenlänge, kritischer Wert, Entscheidungsregel, An- und Ablehnungsbereich und Fehler 1. und 2. Art kennenlernen.

Am Ende des Kurses kannst du:

  • Hypothesentests durchführen

  • Graphisch erklären, was bei einem Hypothesentest passiert

  • Fehler 1. Art zu vorgegebenen Entscheidungsregeln bestimmen

Voraussetzungen:

Kursdauer: 45 Min

2 Bist du telepathisch begabt?

Kannst du Farben erkennen, ohne sie zu sehen? Mach das Experiment!

Lege dir vier gleichartige, aber unterschiedlichfarbige Gegenstände zurecht, zum Beispiel vier verschiedenfarbige Buntstifte oder Fineliner. Wichtig ist, dass du durch die Form nicht erkennen kannst, welche Farbe du in der Hand hast.

Schließe nun die Augen und mische die Gegenstände so, dass du nicht mehr sagen kannst, wo welche Farbe liegt.

Wiederhole dann das folgende Experiment 20 Mal:

  1. Ziehe blind einen Gegenstand.

  2. Entscheide dich (immer noch blind) welche Farbe er hat.

  3. Öffne deine Augen und markiere auf einer Strichliste, ob du richtig geraten hast

  4. Lege den Gegenstand zurück und mische.

Vier unterschiedliche Farben, aber identische Stiftform

Vier unterschiedliche Farben, aber identische Stiftform

Überlege, bevor du weiterliest:
  • Was ist bei einem Versuchsdurchlauf (ziehen, raten, überprüfen) die Wahrscheinlichkeit dafür, richtigzuliegen?

  • Wie viele richtig erratene Gegenstände (=Treffer) würdest du durchschnittlich erwarten?

  • Ab wie vielen Treffern würdest du nicht mehr von Glück reden?

3 Hypothesen

Wenn du davon ausgehst, dass du telepathisch begabt bist, stellst du damit eine Hypothese (=Vermutung) auf.

Ausgangssituation: Du nennst eine von vier möglichen Farben, jede Farbe ist gleich wahrscheinlich. Also ist die Wahrscheinlichkeit, dass du bei einem Versuch richtig rätst, 14\frac{1}{4} bzw. 25%25\%. Dies ist die aktuell gültige Hypothese über die Trefferwahrscheinlichkeit. Man nennt sie auch Nullhypothese H0H_0.

Neue Annahme: Du denkst, dass du telepathisch begabt bist und deshalb mit einer höheren Wahrscheinlichkeit richtig liegst als 25%25\%. Dabei musst du gar nicht sagen, um wie viel (obwohl du es natürlich kannst), sondern stellst lediglich die Gegenhypothese H1H_1 auf: "Ich glaube, dass ich mit mehr als 25%25\% Wahrscheinlichkeit den richtigen Stift finde."

4 Entscheidungsregel

Ab welcher Anzahl richtig erratener Gegenstände würdest du bei einer Stichprobenlänge von 20 Versuchen behaupten, dass es sich nicht um Glück, sondern um Telepathie handelt?

Wo du jetzt ohne weitere Überlegungen die Grenze ziehst und sagst: "Ab dieser Zahl kann man doch nicht mehr von Raten reden!" ist subjektiv. Sagst du zum Beispiel, dass bereits ab 10 erratenen Gegenständen für dich die Gegenhypothese, also Telepathie, die anzunehmende Hypothese ist, kannst du die folgende Entscheidungsregel aufstellen:

Dein kritischer Wert c sind die 10 korrekt erratenen Gegenstände bzw. allgemein deine 10 Treffer.

Der Annahmebereich von der Nullhypothese H0H_0, also der Bereich, in dem du davon ausgehst, dass nur geraten wurde, ist somit A={0;...;9}A=\left\{0;...;9\right\}

Der Ablehnungsbereich von der Nullhypothese, also der Bereich, an dem du der Meinung bist, dass die Gegenhypothese H1H_1 eher verwendet werden soll, ist der restliche Bereich A={10;...;20}\overline{A}=\left\{10;...;20\right\}.

Optisch kannst du dir das erstmal wie einen Zahlenstrahl vorstellen, der die Länge der Stichprobe, also 2020, hat und der kritische Wert c ist der Wert, der den Zahlenstrahl in zwei Bereiche unterteilt:

Annahme- und Ablehnungsbereich sind abhängig vom kritischen Wert und der Stichprobenlänge

Annahme- und Ablehnungsbereich sind abhängig vom kritischen Wert und der Stichprobenlänge

5 Zugrundeliegende Zufallsgröße

Sich einfach einen kritischen Wert zu überlegen, ist nicht sehr empirisch und natürlich kann in der Forschung nicht so vorgegangen werden! Um besser zu verstehen, wie der kritische Wert bestimmt werden sollte, musst du die grundlegende Situation nochmal mathematischer beleuchten.

Bei diesem Gesamtexperiment handelt es sich um eine Bernoulli-Kette, denn

  • Jeder einzelne Versuch hat nur zwei mögliche Ergebnisse: Treffer und Nichttreffer

  • Die Wahrscheinlichkeit für einen Treffer bleibt gleich

  • Die Reihenfolge der Treffer und Nichttreffer ist egal, es interessiert nur die Anzahl

Aufgrund des dritten Punktes hast du gleichzeitig eine Zufallsgröße TT: "Anzahl der richtig erratenen Gegenstände". Diese Zufallsgröße ist binomialverteilt mit der Stichprobenlänge n=20n=20 und der Trefferwahrscheinlichkeit p=25%p=25\%, wenn man die Nullhypothese, also das Raten annimmt.

Durch obige Feststellung kannst du die Wahrscheinlichkeitsverteilung für P(T=k)P\left(T=k\right) (Wahrscheinlichkeit, genau k-mal zu treffen) in einem Histogramm darstellen, zum Beispiel im Tafelwerk die zugehörigen Wahrscheinlichkeiten ablesen oder mit der Bernoulli-Formel selbst berechnen:

Screenshot aus Geogebra Rechner Suite

Screenshot aus Geogebra Rechner Suite

Die Verteilung hilft dir, besser einzuschätzen, welche Ereignisse du als wahrscheinlich oder als eher unwahrscheinlich annehmen kannst.

6 Fehlerhafte Annahmen

Das Problem an der ganzen Situation: Man kann nie ausschließen, dass die gewählte Hypothese nicht doch falsch ist. Vielleicht hattest du als Telepath*in heute nur einen schlechten Tag und eigentlich kannst du es wirklich oder du hattest als ratende Person unglaubliches Glück. Selbst wenn man die Stichprobenlänge stark erhöht, kann man nie ausschließen, dass nicht doch versehentlich die falsche Annahme getroffen wird.

Wie wahrscheinlich es ist, dass du dich irrtümlich für eine Hypothese entschieden hast, kannst du bei

  • Vorgegebenem kritischen Wert cc

  • Bekannter Stichprobenlänge und Trefferwahrscheinlichkeit

sogar ganz einfach bestimmen. Dafür brauchst du die kumulierte Wahrscheinlichkeit, also anstelle von P(T=c)P\left(T=c\right) bestimmst du P(Tc)P\left(T\ge c\right) (oder je nach Situation auch direkt P(Tc)P\left(T\le c\right)).

Du glaubst, dass H0: p=25%H_0:\ p=25\% gilt, also dass die Person nur rät. Du führst den Versuch n=20n=20 Mal aus und legst fest, dass ab mindestens c=10c=10 Treffern die Hypothese abgelehnt werden soll. Die Wahrscheinlichkeit, dass du die Hypothese H0H_0 ablehnst, also einen Wert T10T\ge10 erhältst, obwohl nur geraten wurde, ist die Wahrscheinlichkeit P(T10)P\left(T\ge10\right), wobei du an der Trefferwahrscheinlichkeit p=25%p=25\% und Stichprobenlänge n=20n=20 festhältst.

Die so ermittelte Wahrscheinlichkeit für eine Fehlentscheidung nennt man Fehler 1. Art oder α\alpha-Fehler.

Hypothese H0H_0 gilt

Gegenhypothese H1H_1 gilt

H0H_0 wird als gültig angenommen

Richtige Entscheidung!

Man geht von H0H_0 aus, obwohl H1H_1 gilt. H1H_1 wird also irrtümlich abgelehnt.

Fehler 2. Art oder β\beta-Fehler

H1H_1 wird als gültig angenommen

Man geht von H1H_1 aus, obwohl H0H_0 gilt, H0H_0 wird also irrtümlich abgelehnt.

Fehler 1. Art oder α\alpha-Fehler

Richtige Entscheidung!

7 Signifikanzniveau und Signifikanztest

Empirischer, als den kritischen Wert selbst festzulegen, ist es, sich eine Irrtumswahrscheinlichkeit zu überlegen, die man verkraften kann und den kritischen Wert zu dieser Irrtumswahrscheinlichkeit zu bestimmen. Sagen wir, du möchtest mit deinem telepathischen Talent in eine Talkshow. Das Produktionsteam könnte jetzt vorgeben: "Du darfst nur in der Show auftreten, wenn die Wahrscheinlichkeit dafür, dass wir irrtümlich davon ausgehen, dass du nicht rätst, bei 20 Versuchen höchstens 5%5\% beträgt."

Die 5%5\% stehen dabei für den α\alpha-Fehler (Fehler 1. Art) und beschreiben die Wahrscheinlichkeit dafür, dass die Nullhypothese H0H_0 abgelehnt wird, obwohl sie gilt. Gibt man den α\alpha-Fehler fest vor, wie es beim Signifikanztest immer der Fall ist, wird er häufig auch als Irrtumswahrscheinlichkeit oder Signifikanzniveau bezeichnet.

Je kleiner man das Signifikanzniveau wählt, desto unwahrscheinlicher ist es, dass man mit seiner Hypothese falsch liegt. Allerdings ist der Test dann eventuell nicht brauchbar, weil man zum Beispiel zu wenig Risiken eingeht.

Bild

8 Hypothesentest durchführen

Um den kritischen Wert c zu bestimmen beziehungsweise die Entscheidungsregel abhängig von einem Signifikanzniveau aufzustellen, gehst du folgendermaßen vor:

VorgehenVorgehen Hypothesentest
  1. Testgröße, Stichprobenlänge und Signifikanzniveau definieren

  2. Hypothesen mit Trefferwahrscheinlichkeit aufstellen

  3. Annahme und Ablehnungsbereich in Abhängigkeit von cc aufstellen (Entscheidung linksseitiger oder rechtsseitiger Hypothesentest)

  4. Term zur "Berechnung" von α\alpha angeben und ggf. vereinfachen

  5. kritischen Wert cc z.B. mithilfe vom Tafelwerk bestimmen

  6. Entscheidungsregel angeben und ggf. weiterführende Fragen beantworten.

Du schaffst es bei 20 Versuchen 10 Objekte korrekt zu erkennen. Würdest du in die Talkshow eingeladen werden, wenn das Signifikanzniveau 5% beträgt?

Testgröße: T: "Anzahl der korrekt erratenen Gegenstände"

Stichprobenlänge: 20 Versuche

Hypothesen und Entscheidungsregel in Abhängigkeit von cc:

Nullhypothese

Gegenhypothese

In Worten

Person rät nur

(Standardfall)

Person kann häufiger als erwartet blind die Farbe erkennen

mit Trefferwahrscheinlichkeit p

H0: p=25%H_0:\ p=25\%

H1: p>25%H_1:\ p>25\%

Als Annahme- bzw. Ablehnungsbereich in Abhängigkeit von c

A={0;...;c1}A=\left\{0;...;c-1\right\}

A={c;...;20}\overline{A}=\left\{c;...;20\right\}

Term zur Berechnung von α\alpha:

α\alpha ist die maximale Wahrscheinlichkeit, dass man einen Wert in A\overline{A} erhält (also in diesem Fall TcT\ge c) und trotzdem die Hypothese H0H_0 gilt:

P(Tc)\displaystyle P\left(T\ge c\right)0,05\displaystyle 0{,}05

Es können nur kummulierte Wahrscheinlichkeiten der Form P(Tc)P\left(T\le c\right). Benutze das Gegenereignis

1P(T<c)\displaystyle 1-P\left(T<c\right)0,05\displaystyle 0{,}05

statt T<cT<c kannst du auch Tc1T\le c-1 schreiben

1P(Tc1)\displaystyle 1-P\left(T\le c-1\right)0,05\displaystyle 0{,}05+P(Tc1)0,95\displaystyle +P\left(T\le c-1\right)-0{,}95
0,95\displaystyle 0{,}95P(Tc1)\displaystyle P\left(T\le c-1\right)

z.B. im Tafelwerk schlägst du nach, wann die kummulierte Wahrscheinlichkeit letztmals unter 0,95 liegt.

Im Tafelwerk oder anderen tabellarischen Übersichten nimmst du am besten ein Lineal und schiebst dieses so lange nach unten zu größeren Werten von kk, bis du die 95% erreichst. Der letzte Wert unter 0,95 ist die obere Grenze des Annahmebereichs, der erste darüber ist die untere Grenze des Ablehnungsbereichs. So erhältst du:

A={0;...;8}, A={9;...20}A=\left\{0;...;8\right\},\ \overline{A}=\left\{9;...20\right\} und mit den 10 geglückten Versuchen würdest du in die Sendung eingeladen werden!

Vorsicht

Die meisten Fehler passieren an der Grenze von AA und A\overline{A}, nämlich bei der Frage, ob der kritische Wert gerade noch in AA liegt oder bereits in A\overline{A}. Nimm dir für diese Entscheidung immer nochmal einen Atemzug Zeit und überprüfe, ab wann die geforderte Wahrscheinlichkeit wirklich überschritten wurde.

9 Hilfestellung: Graphische Darstellung

Da die Testgröße binomialverteilt ist, kann mithilfe verschiedener Werkzeuge, wie zum Beispiel GeoGebra, auch leicht die Verteilungskurve in einem Histogramm geplottet werden.

Graphisch ist der Hypothesentest dann so zu verstehen:

  1. Du legst Stichprobenlänge nn und Trefferwahrscheinlichkeit pp fest und lässt dir damit das Histogramm generieren

  2. Du entscheidest abhängig von der Nullhypothese, ob der Bereich, indem die Nullhypothese abgelehnt werden soll, am linken Rand oder am rechten Rand ist. Je nachdem ist es ein links- oder rechtsseitiger Test.

  3. Du suchst den kritischen Wert cc, unter dem/ab dem die restlichen Wahrscheinlichkeiten nur noch α\alpha (Signifikanzniveau) ist.

Häufig ist das Signifikanzniveau 5%5\% und du fragst dich nur noch "Was ist nn, was ist pp, schneide ich links oder rechts die 5%5\% ab?" und kannst dann deinen kritischen Wert daraus bestimmen.

Probier es für die Beispielaufgabe im Applet aus!

Stelle zunächst die Stichprobenlänge n=20n=20 ein. Außerdem hast du festgelegt, dass die Nullhypothese H0H_0: "Person rät nur" die Trefferwahrscheinlichkeit p=25%p=25\% hat. Das Signifikanzniveau wurde auf 5%5\% festgelegt.

Die Hypothese musst du ablehnen, wenn die Person besonders viele Gegenstände richtig errät. Der Ablehnungsbereich A\overline{A} ist also im oberen Teil der Stichprobe und es handelt sich somit um einen rechtsseitigen Test. Der Ablehnungsbereich wird dir im Applet schon automatisch angezeigt, mit dem blauen Schieberegler kannst du dir die kumulierten Wahrscheinlichkeiten aber auch nochmal anzeigen lassen.

Laden

10 Links- und rechtsseitiger Test

Gerade fiel schon der Begriff "rechtsseitiger Test" und im Applet hast du auch die Auswahl "linksseitiger Test" und "rechtsseitiger Test" bekommen. Wenn du eine graphische Vorstellung vom Test hast, ist diese Unterscheidung leicht zu treffen. Es geht nämlich lediglich um die Frage, ob der Ablehnungsbereich A\overline{A} auf der linken Seite der Kurve oder auf der rechten Seite der Kurve ist und ob man im Tafelwerk α\alpha bei der kumulierten Wahrscheinlichkeit sucht oder 1α1-\alpha.

Mehr dazu gibt es bei den Hypothesentest-Arten.

11 Beispielaufgabe linksseitiger Test

Der linksseitige Hypothesentest wird häufig als leichter angesehen, da man direkt die kumulierte Wahrscheinlichkeit nachschauen kann, ohne zuvor umzuformen. Versuche doch mal die folgende Aufgabe nach dem erarbeiteten Schema zu lösen:

Laden

Zur Hilfestellung kannst du vorab oder zur Kontrolle nochmal das Geogebra-Applet verwenden:

12 Zusammenfassung

Sich zu irren kann je nach Branche teuer oder tödlich sein. Kein Risiko einzugehen oder auf falschen Annahmen zu beharren, kann aber den gleichen Effekt haben. Der Hypothesentest ist ein statistischer Test, mit dem die Wahrscheinlichkeit, sich zu irren, von Beginn an vorgegeben und so abgeschätzt wird. Um einen links- oder rechtsseitigen Hypothesentest durchzuführen, gehst du folgendermaßen vor:

Vorgehen
  1. Testgröße, Stichprobenlänge und Signifikanzniveau definieren

  2. Hypothesen mit Trefferwahrscheinlichkeit aufstellen

  3. Annahme und Ablehnungsbereich in Abhängigkeit von cc aufstellen (Entscheidung linksseitiger oder rechtsseitiger Hypothesentest)

  4. Term zur "Berechnung" von α\alpha angeben und ggf. vereinfachen

  5. kritischen Wert cc z.B. mithilfe vom Tafelwerk bestimmen

  6. Entscheidungsregel angeben und ggf. weiterführende Fragen beantworten.

Graphisch verbirgt sich hinter dem Hypothesentest eine Binomialverteilung, also eine glockenartige Kurve (die aber nicht im Zentrum der Stichprobe liegen muss!) und die Suche nach einem kritischen Wert auf der linken oder rechten Seite der Kurve, der den Annahme- bzw. Ablehnungsbereich definiert. Der Flächeninhalt aller Säulen im Histogramm, die im Ablehnungsbereich liegen, entsprechen dem Signifikanzniveau α\alpha.


Dieses Werk steht unter der freien Lizenz
CC BY-SA 4.0Was bedeutet das?