Hypothesentests für Erwartungswert und Median...Eine Antwort liefern: z-Test t-Test Wilcoxon-Test...

Hypothesentests für

Erwartungswert und Median

für D-UWIS, D-ERDW, D-USYS und D-HEST – SS15

Normalverteilung

𝑋 ∼ 𝑁(𝜇, 𝜎2) :

«𝑋 ist normalverteilt mit Erwartungswert 𝜇 und Varianz 𝜎2»

𝑓 𝑥 =1

𝜎 2𝜋exp −

𝑥 − 𝜇 2

2𝜎2

cdf: ziemlich umständlich

Zentraler Grenzwertsatz (CLT):

𝑋𝑖 ∼ 𝐹 𝑖. 𝑖. 𝑑. mit 𝐸 𝑋𝑖 = 𝜇 und 𝑉𝑎𝑟 𝑋𝑖 = 𝜎2, dann gilt…

𝑋𝑛 ∼ 𝒩 𝜇,𝜎2

𝑛, falls 𝑛 → ∞

𝑆𝑛 = 𝑖=1𝑛 𝑋𝑖 ∼ 𝒩(𝑛𝜇, 𝑛𝜎2), falls 𝑛 → ∞

CLT: Normalapproximation des Binomialtests

1. Modell: n Lose kaufen, gleiche Gewinnchance, unabh.

jedes Los 𝑋𝑖: 1 mit W’keit 𝜋, 0 mit W’keit 1 − 𝜋

𝐸 𝑋𝑖 = 𝜋, 𝑉𝑎𝑟 𝑋𝑖 = 𝜋 1 − 𝜋

𝑋: Anzahl Gewinne, 𝑋 = 𝑋1 + 𝑋2 + ⋯+ 𝑋𝑛

2. ℋ0: 𝜋 = 𝜋0; ℋ𝐴: 𝜋 < 𝜋0

3. Teststatistik T: CLT 𝑇 ∼ 𝒩(𝑛𝜋0, 𝑛𝜋0(1 − 𝜋0))

4. Signifikanzniveau: 𝛼 = 0.05

CLT: Normalapproximation des Binomialtests

5. Verwerfungsbereich: 𝐾 = 0, 𝑐

Finde c, sodass 𝑃 𝑇 ≤ 𝑐 = 0.05 (mit Computer oder…

Standardisiere & verwende Tabelle:

𝑃 𝑇 ≤ 𝑐 = 𝑃 𝑍 ≤ 𝑐 = 0.05 mit 𝑐 =𝑐−𝑛𝜋0

𝑛𝜋0(1−𝜋0)

aus Tabelle: 𝑐 = −1.64

nach 𝑐 auflösen: 𝑐 = 𝑛𝜋0 − 1.64 𝑛𝜋0(1 − 𝜋0)

6. Testentscheid

Lernziele heute

z-Test

t-Test

Vorzeichentest

Wilcoxon-Test

Hausaufgaben

Skript: Kapitel 4.7 lessen

Serie 9 lösen

Quiz 9 bearbeiten

etutoR 7

Reaktionszeit

Reagiert man mit der Haupthand schneller, wie mit der Nebenhand?

Experiment: Population: Alle StudentInnen der Vorlesung

Stichprobe: 70 zufällig ausgewählte StudentInnen

Messmethode: Reaktionszeittest auf dem Internet

Testlauf mit beiden Händen (Reihenfolge randomisiert)

Messung mit beiden Händen (5 Messungen)

Robustheit: jeweils bestes und schlechtestes Resultat streichen, Rest mitteln

Differenz aus HH und NH berechnen

Anreiz: Verlosung eines Kinogutscheins

6http://www.bbc.co.uk/science/humanbody/sleep/sheep/

Daten sammeln mit Schafen…

Ergebnis

70 StudentInnen angeschrieben

Rücklauf: 37

Haupthand ist im Mittel 8 ms schneller, der Median liegt bei

10 ms schneller

Stichprobe versus Population

In der Stichprobe war die Haupthand 8 ms schneller

Können wir daraus schliessen, dass die Haupthand in der

ganzen Population im Mittel schneller ist?

Eine Antwort liefern:

z-Test

t-Test

Wilcoxon-Test (Mann-Whitney-U-Test)

Vorzeichen-Test

z-Test (𝝈𝑿 bekannt)

1. Modell: 𝑋𝑖 kontinuierliche Messgrösse;𝑋1, 𝑋2, … , 𝑋𝑛 𝑖. 𝑖. 𝑑. ,𝓝 𝝁, 𝝈𝑿

𝟐 , 𝝈𝑿 bekannt

2. Nullhypothese: ℋ0: 𝜇 = 𝜇0Alternative: ℋ𝐴: 𝜇 ≠ 𝜇0 (oder < oder >)

3. Teststatistik:

𝑍 =( 𝑋𝑛 − 𝜇0)

𝜎 𝑋𝑛

=𝑛( 𝑋𝑛 − 𝜇0)

𝜎𝑋=

beobachtet − erwartet

StandardfehlerVerteilung unter ℋ0: 𝑍 ∼ 𝒩(0,1)

4. Signifikanzniveau: 𝛼

5. Verwerfungsbereich für die Teststatistik:

𝐾 = (−∞,− Φ−1 1 − 𝛼/2 ∪ Φ−1 1 − 𝛼/2 ,∞)

𝐾 = −∞,−Φ−1 1 − 𝛼 bei ℋ𝐴: 𝜇 < 𝜇0

𝐾 = Φ−1 1 − 𝛼 ,∞) bei ℋ𝐴: 𝜇 > 𝜇0

6. Testentscheid: Liegt beobachteter Wert 𝑧 der Teststatistik in 𝐾

Problem in der Praxis: 𝝈𝑿 ist nicht bekannt!

Schätze die Varianz:

𝜎𝑋2 =

𝑛 − 1

𝑖=1

𝑋𝑖 − 𝑋𝑛

Neue Teststatistik:

𝑇 = 𝑋𝑛 − 𝜇0

𝜎𝑋

Verteilung von 𝑇, falls ℋ0 stimmt:

𝑇 ∼ 𝑡𝑛−1

«Student’s» t-Verteilung –

kleiner Abstecher im Verteilungszoo!

Annahme:

𝑋1, 𝑋2, … , 𝑋𝑛 ∼ 𝒩(𝜇, 𝜎𝑋2) und unabhängig

𝜎𝑋2 =

𝑛−1 𝑖=1

𝑛 𝑋𝑖 − 𝑋𝑛2 ist die geschätzte Varianz

Die Teststatistik

𝑇 = 𝑋𝑛 − 𝜇

𝜎𝑋

∼ 𝑡𝑛

folgt einer

«t-Verteilung mit n Freiheitsgraden»

Falls 𝑛 = ∞, dann ist 𝑡∞ = 𝒩(0,1)

William

Gosset

Umso weniger df,

umso meht Streuung

t-Test (𝝈𝑿 unbekannt)

1. Modell: 𝑋𝑖 kontinuierliche Messgrösse;𝑋1, 𝑋2, … , 𝑋𝑛 𝑖. 𝑖. 𝑑. ,𝓝 𝝁, 𝝈𝑿

𝟐 , 𝜎𝑋 wird mit 𝜎𝑋 geschätzt

2. Nullhypothese: ℋ0: 𝜇 = 𝜇0Alternative: ℋ𝐴: 𝜇 ≠ 𝜇0 (oder < oder >)

3. Teststatistik:

T =( 𝑋𝑛 − 𝜇0)

𝜎 𝑋𝑛

=𝑛( 𝑋𝑛 − 𝜇0)

𝜎𝑋=

beobachtet − erwartet

geschätzter StandardfehlerVerteilung unter ℋ0: T ∼ 𝑡𝑛−1

𝐾 = (−∞,− 𝑡𝑛−1;1−

∪ 𝑡𝑛−1;1−𝛼2, ∞)

𝐾 = −∞,−𝑡𝑛−1;1−𝛼 bei ℋ𝐴: 𝜇 < 𝜇0

𝐾 = 𝑡𝑛−1;1−𝛼 , ∞) bei ℋ𝐴: 𝜇 > 𝜇0

6. Testentscheid:Liegt beobachteter Wert 𝑡 der Teststatistik in 𝐾

t.test

power.t.test

Beispiel t-Test

1. Modell: 𝑋𝑖 Differenz in der Reaktionszeit von HH und NH von

StudentIn 𝑖

2. Nullhypothese: ℋ0: 𝜇 = 0 𝑚𝑠Alternative: ℋ𝐴: 𝜇 ≠ 0 𝑚𝑠

3. Teststatistik:

𝑇 =𝑛( 𝑋𝑛 − 𝜇0)

𝜎𝑋⇒ 𝑡 =

37(−8.03 − 0)

41.13= −1.19

4. Signifikanzniveau: 𝛼 = 0.05

5. Verwerfungsbereich:

𝐾 = −∞,−𝑡36;0.975 ∪ 𝑡36;0.975, ∞ = −∞,−2.03 ∪ 2.03,∞)

6. Testentscheid: 𝑡 ∉ 𝐾 ⇒ ℋ0 kann nicht verworfen werden

P-Wert

«Kleinstes Signifikanzniveau, bei dem ℋ0 gerade nochverworfen wird.» z.B. P-Wert = 0.03 𝛼 = 0.05 𝛼 = 0.01

ℋ𝐴: 𝜇 ≠ 𝜇0 und der beobachtete Wert 𝑡 = 𝑛| 𝑋𝑛−𝜇0|

𝜎𝑋

P-Wert berechnet sich…

𝑃 𝑇 > 𝑡 = 𝑃 𝑇 < − 𝑡 + 𝑃 𝑇 > 𝑡 = 2 ⋅ 𝑃 𝑇 > 𝑡 =

= 2 ⋅ 1 − 𝑃 𝑇 ≤ 𝑡 =

= 2 ⋅ 1 − 𝐹𝑡𝑛−1𝑡 = 2 ⋅ 1 − 𝐹𝑡𝑛−1

𝑛 𝑋𝑛−𝜇0

𝜎𝑋

wobei 𝐹𝑡𝑛−1die kumulative Verteilungsfunktion der 𝑡-Verteilung mit

𝑛 − 1 Freiheitsgraden

(𝟏 − 𝜶)-Vertrauensintervall für 𝝁

Äquivalente Definitionen:

Enthält wahren Wert 𝜇 mit Wahrscheinlichkeit 1 − 𝛼

Enthält alle Werte 𝜇0, bei denen ℋ0: 𝜇 = 𝜇0 vs ℋ𝐴: 𝜇 ≠ 𝜇0 mit Signifikanzniveau 𝛼 nicht verworfen wird

im t-Test Schritt 5: Nicht verwerfen, falls…

𝑋𝑛 − 𝜇 𝜎𝑋

< 𝑡𝑛−1;1−𝛼/2

… und das nach 𝜇 auflösen.

CI: 𝑥𝑛 − 𝑡𝑛−1;1−𝛼

2⋅ 𝜎𝑥

𝑛; 𝑥𝑛 + 𝑡𝑛−1;1−

2⋅ 𝜎𝑥

Bsp. Reaktionszeit:

−8.03 − 2.03 ⋅41.1

36; −8.03 + 2.03 ⋅

36= −22.2; 5.61 ms

Vorzeichentest = Binomialtest

1. Modell: 𝑋1, 𝑋2, … , 𝑋𝑛 𝑖. 𝑖. 𝑑., die 𝑋𝑖 können beliebig verteilt sein

2. Nullhypothese: ℋ0: 𝜇 = 𝜇0, 𝜇 ist der Median

Alternative: ℋ𝐴: 𝜇 ≠ 𝜇0 (oder einseitig)

3. Teststatistik:

𝑉: Anzahl 𝑋𝑖’s mit 𝑋𝑖 > 𝜇0

Verteilung unter ℋ0: V ∼ Bin(𝑛, 𝜋0) mit 𝜋0 = 0.5

𝐾 = 0, 𝑐𝑢 ∪ 𝑐𝑜, 𝑛

Die Grenzen 𝑐𝑢 und 𝑐𝑜 müssen mit der Binomialverteilung oder der

Normalapproximation berechnet werden.

6. Testentscheid:

Liegt beobachteter Wert 𝑣 der Teststatistik in 𝐾

Bsp. Vorzeichentest

Angenommen: ℋ0: 𝜇 = 𝜇0 = 10,ℋ𝐴: 𝜇 ≠ 10

Beobachtet: 𝑥1 = 13, 𝑥2 = 9, 𝑥3 = 17, 𝑥4 = 8, 𝑥5 = 14

Vorzeichen von 𝑥𝑖 − 𝜇0: +, -, +, -, +

Mache Binomialtest mit

ℋ0: 𝜋 = 0.5,ℋ𝐴: 𝜋 ≠ 0.5𝑛 = 5, 𝑣 = 3

Der Vorzeichentest kann genau dann verworfen werden,

wenn der entsprechende Binomialtest verworfen wird.

Keine Annahme andie Verteilung

Kleinere Macht

Wilcoxon-Test

Mischung von Vorzeichen- und t-Test

Annahme: 𝑋𝑖 ∼ ℱ 𝑖. 𝑖. 𝑑. , ℱ ist symmetrisch

Teste Median 𝜇 = 𝜇0

(einseitig oder zweiseitig)

Bsp. Wilcoxon-Test

ℋ0: 𝜇0 = 0

Beobachtet: -1.9, 0.2, 2.9, -4.1, 3.9

Absolutbeträge: 1.9, 0.2, 2.9, 4.1, 3.9

Ränge der Absolutbeträge: 2, 1, 3, 5, 4

Rangsumme der positiven Gruppe: 1+3+4=8

Minimale Rangsumme: 0

Maximale Rangsumme: 1+2+3+4+5=15

Wilcoxon-Test

Mischung von Vorzeichen- und t-Test

Annahme: 𝑋𝑖 ∼ ℱ 𝑖. 𝑖. 𝑑. , ℱ ist symmetrisch

Teste Median 𝜇: ℋ0: 𝜇 = 𝜇0(einseitig oder zweiseitig)

Intuition der Teststatistik

Sortiere 𝑥𝑖 − 𝜇0 → 𝑟𝑖 Rängen ursprüngliches Vorzeichen von 𝑥𝑖 − 𝜇0 geben

(engl. signed ranks)

Teststatistik 𝑉: Summe aller Ränge mit 𝑥𝑖 − 𝜇0 positiv

Falls ℋ0 stimmt, sollte die Rangsumme nicht zu gross und nicht zu klein sein

Übersicht der Tests

Annahmen𝒏𝒎𝒊𝒏 bei

𝜶 = 𝟎. 𝟎𝟓

Beispiel𝝈𝑿

bekannt𝑿𝒊 ∼ 𝓝

Verteilungi.i.d.

z-Test ● ● ● ● 1 89%

t-Test ● ● ● 2 79%

Wilcoxon ● ● 6 79%

Vorzeichen ● 5 48%

Verwendetes Beispiel:

• 𝑋𝑖 ∼ 𝒩 𝜇, 𝜎2 , 𝑛 = 10

• ℋ0: 𝜇 = 0; ℋ𝐴: 𝜇 ≠ 0; 𝛼 = 0.05

• Macht berechnet mit konkreter Alternative: 𝑋𝑖 ∼ 𝒩(1,1)

Stichprobengrösse

Annahme:

𝑋𝑖 ∼ 𝒩 𝜇, 𝜎2 𝑖. 𝑖. 𝑑.

𝜎𝑋 aus Pilotstudie bekannt

Forderung:

Breite von CI kleiner gleich 2 ⋅ 𝜌

Gesucht:

𝑛 =?

Faustregel für 95%-CI:

𝑛 ≥ 4 ⋅𝜎

Bsp. Reaktionszeit:

𝜎 = 41.1 𝑚𝑠

𝜌 = 10 𝑚𝑠

𝑛 ≥ 4 ⋅41.1

= 4 ⋅ 16.9 ≈ 68

Zusammenfassung

z-Test - 𝜎𝑋 bekannt

t-Test - 𝜎𝑋 unbekannt

Vorzeichentest - teste Median!

Wilcoxon-Test - egal welche Verteilung

Hausaufgaben

Skript: Kapitel 4.7 lessen

Serie 9 lösen

Quiz 9 bearbeiten

etutoR 7

Hypothesentests für Erwartungswert und Median...Eine Antwort liefern: z-Test t-Test Wilcoxon-Test...

Documents

Test de Luscher Test de Luscher

Multiple Hypothesentests

Mathematik für Biologen - uni-duesseldorf.debraun/bio1112/printout1318.pdf · Allgemeine Hypothesentests Mathematik f ur Biologen Prof. Dr. R udiger W. Braun Heinrich-Heine-Universit

Grammatik mit Sinn und Verstand - Tests...Test 14: Nominalisierung Test 15: Adjektive und Adverbien Test 16: Attribution Test 17: Nomen-Verb-Verbindungen Test 18: Redepartikel Zu:

Gliederung Zusammenfassung - arbeitswissenschaft.net · a Chance/RisikoBetrachtung a Datenerfassungsplan a Fischgrätdiagramm a Häufigkeitsdiagramm a Hypothesentests a Kastendiagramm

Burnout Schnelltest Burnout Test Fragebogen · Burnout Test - Ermitteln Sie im Burnout Test Ihr Burnout-Risiko um mögliche Anzeichen eines Burnout zu erkennen. Keywords Burnout Test,

Biostatistik, WS 2017/18 - staff.uni-mainz.de · Der Wilcoxon-Test heißt auch Mann-Whitney-Test. In der Literatur sind verschiedene Zentrierungen der Rangsumme gebrauchlich, ggfs

Amtliche Bekanntmachungen der TU Bergakademie …...impact test, drop weight tear test, Pellini-Test, Robertson test, effect of temperature and strain rate on mechanical properties,

Vorlesung: Statistik II für Wirtschaftswissenschaft · Statistik 2 Sommersemester 2017Helmut K uchenho (Institut f ur Statistik, LMU) 358 / 366 Der Wilcoxon Test f ur unabh angige

Test auf Normalverteilung Kolmogorov-Smirnov-Test Beispiel Mieten

Erstellen von Grafiken und Hypothesentests mit dem ... · Es werden alle Elemente kopiert und bspw. nach PowerPoint verschoben. Tipp: Ist Powerpoint bereit geöffnet, z.B mit Firmenlayout,

Mathematische und statistische Methoden IImethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2010/StatistikII/... · Wilcoxon Man könnte nun einenMan könnte nun einen 1-Stichproben

Statistische Datenanalyse mit R, Statistische Tests · Mittelwertvergleiche Eine metrische Variable normal verteilt Ein-Stichproben T-test t.test() nicht normal verteilt Wilcoxon

Keyword SV - auto-nischen-marketer.larspilawski.de · fotobuch test 8100 camcorder test 8100 rasenmäher test 8100 schulranzen test 8100 wasserkocher test 8100 router test 8100 festplatten

12 Rangtests zum Vergleich zentraler Ten- denzen · 12.2 Gepaarte Stichproben: Der Wilcoxon{Vorzeichen{Rangtest Sei (X 1;X 2) ein metrisch skaliertes Merkmals-paar. Man m ochte wissen,

Gemischte Lineare Modelle - lingexp.uni-tuebingen.de · Ubersicht I Lineare Modelle allgemein I Gemischte Lineare Modelle I Hypothesentests/ Modellvergleiche I Berichten der Ergebnisse

1 Wahrscheinlichkeitsrechnung - statsoz-neu.userweb.mwn.de · 0 Einf uhrung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Hypothesentests

Mittelwerte, Zusammenhangsmaˇe, Hypothesentests in Stata · Wiederholung: Daten & Deskriptive Statistik Zusammenhangsmaˇe Inferenzstatistik Zusammenfassung Daten verwalten I Datenmatrix

Kapitel 8: Verfahren für Rangdaten · Der Wilcoxon-Test für abhängige Stichproben ist innerhalb der nichtparametrischen Verfahren das Pendant zum U-Test für unabhängige Stichproben

Test First ist mehr als Unit Test Sinnvolle Teststrategien ... · Test First ist mehr als Unit Test Sinnvolle Teststrategien für agile Tests Dipl.-Math. Christian Alexander Graf