46
Testen von Hypothesen Elke Warmuth Humboldt-Universit¨ at zu Berlin Sommersemster 2010 1 / 46

Testen von Hypothesen - hu-berlin.dedidaktik.mathematik.hu-berlin.de/files/testen_2010_h.pdfTesten von Hypothesen Signifikante Abweichungen Test ¨uber eine unbekannte Wahrscheinlichkeit

  • Upload
    others

  • View
    3

  • Download
    1

Embed Size (px)

Citation preview

  • Testen von Hypothesen

    Elke Warmuth

    Humboldt-Universität zu Berlin

    Sommersemster 2010

    1 / 46

  • 2 / 46

  • Testen von Hypothesen

    1 Testen von HypothesenSignifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    3 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Signifikant, signifikant, signifikant, ...

    4 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Signifikant, signifikant, signifikant, ...

    5 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Wikipedia, die freie Enzyklopädie:

    ”Statistische Signifikanz:

    In der Statistik heißen Unterschiede oder Zusammenhängesignifikant, wenn die Wahrscheinlichkeit gering ist, dass sie durchZufall zustande gekommen sind.“

    6 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Signifikant auf dem Niveau α

    Es sei 0 < α < 1. Im Rahmen eines Modells mit derWahrscheinlichkeitsverteilung P ist eine Abweichung k einerZufallsgröße X von ihrem Erwartungswert E (X ) eine signifikanteAbweichung auf dem Signifikanzniveau α, wenn gilt

    P(|X − E (X )| ≥ k) ≤ α

    Signifikant an sich gibt es nicht!

    Standardwerte für Signifikanzniveaus: 0, 05; 0, 02; 0, 01

    Je nach Problemstellung: Abweichung nach oben, Abweichungnach unten, Abweichung dem Betrage nach

    7 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    erste Kernidee:”signifikant“ bezieht sich auf eine

    Abweichung im Rahmen eines Modells.

    erster Schritt: Verständnis für Größenordnungen vonAbweichungen bei zufälligen Vorgängen

    zweiter Schritt: kσ-Bereiche

    letzter Schritt: Signifikanztest

    8 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Zufällige Schwankungen erfassen – Voraussetzung fürTestverständnis

    Erfahrungen sammeln, z.B. durch Simulation

    Schwankungen in Modellen untersuchen

    Größenordnungen von Wahrscheinlichkeiten schätzen

    9 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Der Anteil der A-Wähler in einer großen Wählerpopulation sei 0,3.Wie viele A-Wähler erwarten Sie

    a) in einer zufälligen Stichprobe vom Umfang 30 aus dieserPopulation,

    b) in einer zufälligen Stichprobe vom Umfang 300 aus dieserPopulation?

    Geben Sie jeweils ein möglichst kleines symmetrisches Intervall umden Erwartungswert an, das mindestens 95% Sicherheit besitzt.

    10 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Modellierung zu a):

    X – Anzahl der A-Wähler in der Stichprobe

    Modell: X ∼ B(30; 0, 3),E (X ) = 9,Var(X ) = 6, 3, σX ≈ 2, 5

    P(4 ≤ X ≤ 14) ≈ 0, 97

    Länge 10 undσX

    E (X )≈ 28%

    11 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Im Rahmen des Modells B(30; 0, 3) gilt

    1− P(4 ≤ X ≤ 14) = 1− P(|X − E (X )| ≤ 5)

    = P(|X − E (X )| ≥ 6) ≈ 0, 036 ist eine signifikante Abweichung vom Erwartungswert auf demSignifikanzniveau 0,03.

    12 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Modellierung zu b):

    Y – Anzahl der A-Wähler in der Stichprobe

    Modell: Y ∼ B(300; 0, 3),E (Y ) = 90,Var(Y ) = 63, σX ≈ 8

    P(74 ≤ Y ≤ 106) ≈ 0, 96

    Länge 32 undσY

    E (Y )≈ 18%

    13 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Im Rahmen des Modells B(300; 0, 3) gilt

    1− P(74 ≤ Y ≤ 106) = 1− P(|X − E (X )| ≤ 16)

    = P(|X − E (X )| ≥ 17) ≈ 0, 0417 ist eine signifikante Abweichung vom Erwartungswert auf demSignifikanzniveau 0,04.

    14 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Insbesondere bei kleinen Stichproben neigt man dazu, dieSchwankungen zu unterschätzen.

    Die Standardabweichung√

    np(1− p) wächst mit wachsendem n,aber der Quotient σXE(X ) geht gegen 0.

    15 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Wahrscheinlichkeiten schätzen

    ”Stelle durch eine Überschlagsrechnung fest, welche der

    vorgeschlagenen Antworten zu den folgenden Fragen am bestenpaßt. Eine faire Münze wird 10-mal (100-mal bzw. 1000-mal)geworfen. Die Wahrscheinlichkeit, daß genau die Hälfte Köpfe sind,ist ungefähr 25%, 10%, 5% oder 1%?“

    Quelle: H. Dinges, H. Rost: Prinzipien der Stochastik. Stuttgart: Teubner, 1982

    Schätzen – eine wichtige, aber im Mathematikunterricht oftvernachlässigte Fähigkeit

    Aufgabenformat herausfordernd, ähnlich Känguru-Aufgaben

    Es muss nicht immer ein Anwendungskontext sein.

    16 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    An – Ereignis ”Genau n2 Wappen bei n Würfen“, pn = P(An).

    Die Wahrscheinlichkeiten pn fallen mit wachsender Anzahl derWürfe gegen 0.

    n = 10: Bei Gleichverteilung hätte jede Anzahl dieWahrscheinlichkeit 111 . Die Binomialverteilung B(10; 0, 5) hatbei 5 ein deutliches Maximum, folglich P(A10) ≈ 0, 25.n = 100: Das 1 · σ-Intervall [45; 55] hat rund 68%Wahrscheinlichkeit. Das sind durchschnittlich mehr als 6% proWert. Also hat der wahrscheinlichste Wert rund 10%Wahrscheinlichkeit.

    17 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    n = 1000: Es ist σ =√

    250 ≈ 16. Das 1 · σ-Intervall [234; 266]hat rund 68% Wahrscheinlichkeit. Das sind durchschnittlichmehr als 2% pro Wert. Also passt 5% oder 1%Wahrscheinlichkeit.

    Stirlingsche Formel liefert

    P(S2n = n) ≈1√π · n

    S2n – Anzahl der Erfolge in einer Bernoulli-Kette der Länge 2nmit Erfolgswahrscheinlichkeit 0,5

    P(S1000 = 500) ≈ 1√π·500 ≈ 0, 025

    18 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    zweite Kernidee: Verbindung von Modellebene und Sachebenedurch Interpretationen von Wahrscheinlichkeit

    A. N. Kolmogorow in §2 Das Verhältnis zur Erfahrungswelt:

    Den Ereignissen A werden Wahrscheinlichkeiten P(A) zugeordnetmit folgenden Eigenschaften:

    I. Man kann praktisch sicher sein, dass bei einer großen Anzahlvon Wiederholungen des Vorgangs die relative Häufigkeit vonA sich nur wenig von P(A) unterscheiden wird.

    II. Wenn P(A) sehr klein ist, dann kann man praktisch sichersein, dass A bei einmaliger Beobachtung des Vorgangs nichteintreten wird.

    19 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    I. nennt man Empirisches Gesetz der großen Zahlen:

    Viele reale Erscheinungen weisen statistische Regelmäßigkeit auf,Erfahrungstatsache – nicht beweisbar

    II. ist Hintergrund für statistische Schlüsse:

    Es ist etwas eingetreten, das im zugrunde liegenden Modell(unter der zugrunde liegenden Hypothese) eine sehr kleineWahrscheinlichkeit hat. Daran glaube ich nicht, also verwerfe ichdas Modell (die Hypothese).

    20 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    H: p = 0, 5, A: p 6= 0, 5

    dritte Kernidee: Hypothese und Alternative beschreibenkonkurrierende Modelle

    (plausible) Testgröße: Anzahl X der Erfolge bei 20 Versuchen.

    Unter H (im Modell H) gilt E (X ) = 20 · 0, 5 = 10

    Gegen H und für A sprechen große Abweichungen derbeobachteten Erfolgsanzahl von 10. Wie viele?

    21 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Unter H sind Abweichungen vom Erwartungswert von 5 oder mehrsehr unwahrscheinlich (Wahrscheinlichkeit 0,04)

    22 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Brücke zur Erfahrungswelt (Kolmogorow):Wenn P(A) in einem Modell sehr klein ist, dann kann manpraktisch sicher sein, dass A bei einmaliger Beobachtung desVorgangs nicht eintreten wird.

    Entscheidungsregel:Wenn |X − 10| ≥ 5 beobachtet wird, lehne H ab.Wenn |X − 10| < 5 beobachtet wird, behalte H bei.

    K = {|X − 10| ≥ 5} heißt kritischer Bereich oderVerwerfungsbereich des Tests.

    Eigenschaft dieser Entscheidungsregel:Ist H das

    ”richtige“ Modell, dann lehnen wir die Hypothese H

    mit einer Wahrscheinlichkeit von 0,04 fälschlicherweise ab.Fehler 1. Art

    23 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Signifikanztest

    Ein Signifikanztest zum Signifikanzniveau α, 0 < α < 1, ist eineEntscheidungsregel, bei der die Wahrscheinlichkeit des Fehlers 1.Art höchstens α beträgt.

    K{|X − 10| ≥ 5} beschreibt einen Signifikanztest zumSignifikanzniveau α ≥ 0, 04, denn bei p = 0, 5 (unter H) giltP(|X − 10| ≥ 5) = 0, 04 ≤ α.

    Testen heißt also zunächst:

    eine Testgröße auf signifikante Abweichungen im Rahmen desdurch H gegebenen Modells zu untersuchen.Das Signifikanzniveau wird vorher benannt.Der kritische Bereich richtet sich nach der Alternative A.

    24 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    ”In der Statistik heißen Unterschiede oder Zusammenhänge signifikant,

    wenn die Wahrscheinlichkeit gering ist, dass sie durch Zufall zustande

    gekommen sind.“

    Im Modell B(20; 0, 5) ist die Wahrscheinlichkeit, dass durch Zufall mehrals 14 oder weniger als 6 Erfolge eintreten, sehr gering (0,04).

    Diese Abweichung vom Erwartungswert (um mindestens 5) ist auch

    signifikant auf dem Signifikanzniveau 0,05, weil 0, 04 < 0, 05 ist.

    25 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    K = {|X − 10| ≥ 5} beschreibt keinen Signifikanztest zumSignifikanzniveau α = 0, 01.Für einen solchen Test müsste die Abweichung vomErwartungswert größer sein.

    Testen heißt auch:

    Die Konsequenzen der Entscheidung untersuchen.Fehler 2.Art: H fälschlicherweise beibehalten.

    Das heißt, ein Modell mit p 6= 0, 5 ist”richtig“, aber zufällig

    ist die beobachtete Abweichung kleiner als 5.

    26 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Was ist, wenn z.B. p = 0, 7 das”richtige“ Modell ist?

    Unter A mit p = 0, 7 gilt X ∼ B(20; 0, 7).P(|X − 10| ≥ 5) = 0, 42 und P(|X − 10| < 5) = 0, 58.

    27 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Wenn p = 0, 7 gilt, dann entscheiden wir uns mitWahrscheinlichkeit 0,42 richtig und begehen mitWahrscheinlichkeit 0,58 einen Fehler, indem wir Hbeibehalten.

    Fehler 2. Art: H beibehalten, obwohl A richtig.

    Wahrscheinlichkeiten für Fehler 1. und 2. Art verhalten sichgegenläufig. Man kann nicht beide gleichzeitig

    ”kontrollieren“.

    Fehler 1. Art einhalten und Fehler 2. Art dann minimieren.

    28 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    29 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Gütefunktion – Konsequenzen der Entscheidungsregel aufeinen Blick

    β(p) = P(p)(K ) – Ablehnungswahrscheinlichkeit von H inAbhängigkeit von der Erfolgswahrscheinlichkeit p.

    Das ist keine bedingte Wahrscheinlichkeit.Funktionale Betrachtung.

    α = 0, 04

    n = 20 :

    K = {|X − 10| ≥ 5} β(p) = P(p)(|X − 10| ≥ 5)

    n = 100 :

    K = {|X − 10| ≥ 11} β(p) = P(p)(|X − 10| ≥ 11)

    30 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    31 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Zusammenfassung zum Testen von Hypothesen

    Aufgabe der beurteilenden Statistik

    Wahrscheinlichkeitstheorie stellt Modelle für reale Vorgängebereit

    Gesucht sind Entscheidungen über Modellparameter(z. B. p in B(n, p)), Unabhängigkeit, Modelltyp(z. B. N(µ, σ2)), ...

    Hypothesen beschreiben konkurrierende Modelle

    Entscheidung für oder gegen ein Modell auf der Grundlagezufallsabhängiger Daten

    Fehler prinizipiell nicht ausgeschlossen

    32 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Ablehnungsbereich abhängig von Alternative,Problem: geeignete Testgröße

    Es gibt kein wahr oder falsch, keine sicheren AussagenAblehnung von H bedeutet nicht, dass H falsch istBeibehalten von H bedeutet nicht, dass H richtig ist.

    Asymmetrie von H und AH beschreibt oft den gesicherten,

    ”konservativen“

    Standpunkt, das etablierte ModellA beschreibt z.B. die Forschungshypothese

    P(H ist falsch) hat in unserer Sicht keinen Sinn.

    33 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Was bedeutet es, wenn eine Hypothese H auf demSignifikanzniveau α abgelehnt wird?

    Die Testgröße ist in einen Bereich gefallen, dessenWahrscheinlichkeit unter H höchstens α beträgt.Das durch H gegebene Modell bietet keine gute Erklärungfür das beobachtete Ereignis.

    Es bedeutet nicht P(H ist falsch) ≤ α.

    34 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Was bedeutet es, wenn eine Hypothese H auf demSignifikanzniveau α beibehalten wird?

    Die beobachteten Daten sind mit dem durch H gegebenen Modell

    ”verträglich“, sie bieten keinen hinreichenden Anlass, H zu

    verwerfen.

    Es bedeutet nicht P(H ist richtig) ≥ 1− α.

    Wenn man H möglichst selten ablehnen will, wähle man ein sehrkleines α.

    Wenn man signifikante Ergebnisse melden will, wähle man eingroßes α.

    Das beobachtete Signifikanzniveau: Die unter H berechneteWahrscheinlichkeit für ein mindestens so extremes Ergebnis wiedas beobachtete.

    35 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Unter 1728 Personen, die in verschiedenen Krankenhäusern wegeneines Magengeschwürs behandelt wurden, hatten 679 Blutgruppe0; in der betreffenden Bevölkerungsgruppe ist Blutgruppe 0 miteinem Anteil von 36,5% vertreten.Ist die Abweichung signifikant?Quelle: Heinz Klaus Strick. Einführung in die Beurteilende Statistik. Braunschweig: Schroedel, 2008, S. 88.

    signifikant dem Niveau α = 0, 05

    Modellbildung: Sei p die Wahrscheinlichkeit, dass ein zufälligausgewählter Erkrankter die Blutgruppe 0 hat.

    Sei X die Anzahl der Menschen mit Blutgruppe 0 unter nErkrankten.

    Annahme: X ∼ B(n, p)

    36 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Unter 1728 Personen, die in verschiedenen Krankenhäusern wegen einesMagengeschwürs behandelt wurden, hatten 679 Blutgruppe 0; in derbetreffenden Bevölkerungsgruppe ist Blutgruppe 0 mit einem Anteil von36,5% vertreten.

    Beobachtet: hn(0) = 0, 393. Ist die Abweichung signifikant?

    Hypothesen sind vor der Stichprobenentnahme zu formulieren.

    H: p = 0, 365 gegen A: p 6= 0, 365.

    Unter H: X ∼ B(1728, p), E (X ) = 1728 · 0, 365 ≈ 631,

    Var(X ) =√

    1728 · 0, 365 · 0, 635 ≈ 20Was spricht gegen H und für A? Große Abweichungen vomunter H erwarteten Wert!

    Also K = {|X − 631| ≥ k}

    37 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Signifikanzniveau legt 2σ-Intervall nahe:

    unter H: [631− 40; 631 + 40] = [591; 671]

    wegen α = 0, 05 wählen wir K = {X ≤ 591 oder X ≥ 671}beobachteter Wert 679 liegt im Ablehnungsbereich von H,also lehnen wir H auf dem Signifikanzniveau 0,05 ab. Es liegtbei diesem Niveau eine signifikante Abweichung vor. Sie wärenicht signifikant bei α = 0, 01. Warum?

    Beobachtetes Signifikanzniveau: Abweichung 679− 631 = 48.Wie groß ist unter H eine solche oder noch größereAbweichung:

    P(|X − 631| ≥ 48) ≈ 0, 02Die beobachtete Abweichung wäre signifikant auf jedemSignifikanzniveau α ≥ 0, 02.

    38 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Klassenarbeit im Multiple-Choice-Format

    20 Fragen, je drei Antworten, genau eine richtig

    Ab wie vielen richtigen Antworten soll man eine 4 bekommen?

    Simulationen: Wir würfeln die Antworten.Auswertung der Simulationen

    Was müsste bei einem, der nicht nur rät, anders sein als beieinem Rater?

    Wann würde ich das Modell p = 13 verwerfen? Vorschläge?

    X – Anzahl der Erfolge (richtigen Antworten)

    Annahmen:

    unabhängige Fragenkonstante Erfolgswahrscheinlichkeit p

    39 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Modellverteilung B(20, 13) und Häufigkeitsverteilungenbei 30 Simulationen.

    40 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Modellverteilung B(20, 13) und Häufigkeitsverteilungenbei 30 Simulationen.

    41 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Testszenarium 1: H: p = 13 gegen A: p >13

    Standpunkt: Der Schüler muss mich überzeugen, dass er nichtnur rät, also K = {X ≥ k}, k noch zu bestimmen

    Fehler 1. Art: H ablehnen, obwohl richtig,

    d.h. Lehrer gibt 4, obwohl Schüler nur rät.

    Das will dieser Lehrer natürlich möglichst selten tun, deshalb

    P( 13)(X ≥ k) ≤ α

    Fixieren α = 0, 05. Es folgt k = 11, d.h. mindestens 11richtige Antworten für Note 4.

    P( 13)(X ≥ 11) ≈ 0, 04

    42 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Fehler 2. Art: H beibehalten, obwohl falsch,

    d.h. Lehrer gibt 5, obwohl Schüler etwas weiß.

    Gütefunktion: β(p) = P(p)(X ≥ 11) = 1− P(p)(X ≤ 10)

    β(0, 6) = 0, 76, Wahrscheinlichkeit für Fehler 2. Art beiErfolgswahrscheinlichkeit p = 0, 6 beträgt also 0,24.

    43 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Testszenarium 2: H: p > 13 gegen A: p ≤13

    Standpunkt: Der Schüler muss mich überzeugen, dass ernichts weiß, also K = {X ≤ k}, k noch zu bestimmen.

    Fehler 1. Art: H ablehnen, obwohl richtig,

    d.h. Lehrer gibt 5, obwohl Schüler etwas weiß.

    Das will dieser Lehrer natürlich möglichst selten tun, deshalb

    P(p)(X ≤ k) ≤ α für alle p >1

    3

    44 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Hypothese und Alternative zusammengesetzt

    Es reicht, die Signifikanzbedingung für p = 13 zu erfüllen.

    Fixieren α = 0, 06. Es folgt k = 3, d.h. mindestens 4 richtigeAntworten für Note 4.

    45 / 46

  • Testen von Hypothesen

    Signifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele

    Gütefunktion: β(p) = P(p)(X ≤ 3)

    β(0, 2) = 0, 41, Wahrscheinlichkeit für Fehler 2. Art beiErfolgswahrscheinlichkeit p = 0, 2 beträgt also 0,59.

    Vorsicht mit Multiple-Choice-Tests.

    46 / 46

    Teil 1Teil 1Testen von HypothesenSignifikante AbweichungenTest über eine unbekannte Wahrscheinlichkeit pGütefunktionBeispiele