Hypothesentests fΓΌr Erwartungswert und Median...Eine Antwort liefern: z-Test t-Test Wilcoxon-Test...

Preview:

Citation preview

Hypothesentests fΓΌr

Erwartungswert und Median

fΓΌr D-UWIS, D-ERDW, D-USYS und D-HEST – SS15

Normalverteilung

2

𝑋 ∼ 𝑁(πœ‡, 𝜎2) :

«𝑋 ist normalverteilt mit Erwartungswert πœ‡ und Varianz 𝜎2Β»

pdf:

𝑓 π‘₯ =1

𝜎 2πœ‹exp βˆ’

π‘₯ βˆ’ πœ‡ 2

2𝜎2

cdf: ziemlich umstΓ€ndlich

Zentraler Grenzwertsatz (CLT):

𝑋𝑖 ∼ 𝐹 𝑖. 𝑖. 𝑑. mit 𝐸 𝑋𝑖 = πœ‡ und π‘‰π‘Žπ‘Ÿ 𝑋𝑖 = 𝜎2, dann gilt…

𝑋𝑛 ∼ 𝒩 πœ‡,𝜎2

𝑛, falls 𝑛 β†’ ∞

𝑆𝑛 = 𝑖=1𝑛 𝑋𝑖 ∼ 𝒩(π‘›πœ‡, π‘›πœŽ2), falls 𝑛 β†’ ∞

CLT: Normalapproximation des Binomialtests

1. Modell: n Lose kaufen, gleiche Gewinnchance, unabh.

jedes Los 𝑋𝑖: 1 mit W’keit πœ‹, 0 mit W’keit 1 βˆ’ πœ‹

𝐸 𝑋𝑖 = πœ‹, π‘‰π‘Žπ‘Ÿ 𝑋𝑖 = πœ‹ 1 βˆ’ πœ‹

𝑋: Anzahl Gewinne, 𝑋 = 𝑋1 + 𝑋2 + β‹―+ 𝑋𝑛

2. β„‹0: πœ‹ = πœ‹0; ℋ𝐴: πœ‹ < πœ‹0

3. Teststatistik T: CLT 𝑇 ∼ 𝒩(π‘›πœ‹0, π‘›πœ‹0(1 βˆ’ πœ‹0))

4. Signifikanzniveau: 𝛼 = 0.05

3

CLT: Normalapproximation des Binomialtests

5. Verwerfungsbereich: 𝐾 = 0, 𝑐

Finde c, sodass 𝑃 𝑇 ≀ 𝑐 = 0.05 (mit Computer oder…

Standardisiere & verwende Tabelle:

𝑃 𝑇 ≀ 𝑐 = 𝑃 𝑍 ≀ 𝑐 = 0.05 mit 𝑐 =π‘βˆ’π‘›πœ‹0

π‘›πœ‹0(1βˆ’πœ‹0)

aus Tabelle: 𝑐 = βˆ’1.64

nach 𝑐 auflΓΆsen: 𝑐 = π‘›πœ‹0 βˆ’ 1.64 π‘›πœ‹0(1 βˆ’ πœ‹0)

6. Testentscheid

4

Lernziele heute

z-Test

t-Test

Vorzeichentest

Wilcoxon-Test

Hausaufgaben

Skript: Kapitel 4.7 lessen

Serie 9 lΓΆsen

Quiz 9 bearbeiten

etutoR 7

5

Reaktionszeit

Reagiert man mit der Haupthand schneller, wie mit der Nebenhand?

Experiment: Population: Alle StudentInnen der Vorlesung

Stichprobe: 70 zufΓ€llig ausgewΓ€hlte StudentInnen

Messmethode: Reaktionszeittest auf dem Internet

Testlauf mit beiden HΓ€nden (Reihenfolge randomisiert)

Messung mit beiden HΓ€nden (5 Messungen)

Robustheit: jeweils bestes und schlechtestes Resultat streichen, Rest mitteln

Differenz aus HH und NH berechnen

Anreiz: Verlosung eines Kinogutscheins

6http://www.bbc.co.uk/science/humanbody/sleep/sheep/

Daten sammeln mit Schafen…

7

Ergebnis

70 StudentInnen angeschrieben

RΓΌcklauf: 37

Haupthand ist im Mittel 8 ms schneller, der Median liegt bei

10 ms schneller

8

Stichprobe versus Population

In der Stichprobe war die Haupthand 8 ms schneller

KΓΆnnen wir daraus schliessen, dass die Haupthand in der

ganzen Population im Mittel schneller ist?

Eine Antwort liefern:

z-Test

t-Test

Wilcoxon-Test (Mann-Whitney-U-Test)

Vorzeichen-Test

9

z-Test (πˆπ‘Ώ bekannt)

1. Modell: 𝑋𝑖 kontinuierliche MessgrΓΆsse;𝑋1, 𝑋2, … , 𝑋𝑛 𝑖. 𝑖. 𝑑. ,𝓝 𝝁, πˆπ‘Ώ

𝟐 , πˆπ‘Ώ bekannt

2. Nullhypothese: β„‹0: πœ‡ = πœ‡0Alternative: ℋ𝐴: πœ‡ β‰  πœ‡0 (oder < oder >)

3. Teststatistik:

𝑍 =( 𝑋𝑛 βˆ’ πœ‡0)

𝜎 𝑋𝑛

=𝑛( 𝑋𝑛 βˆ’ πœ‡0)

πœŽπ‘‹=

beobachtet βˆ’ erwartet

StandardfehlerVerteilung unter β„‹0: 𝑍 ∼ 𝒩(0,1)

4. Signifikanzniveau: 𝛼

5. Verwerfungsbereich fΓΌr die Teststatistik:

𝐾 = (βˆ’βˆž,βˆ’ Ξ¦βˆ’1 1 βˆ’ 𝛼/2 βˆͺ Ξ¦βˆ’1 1 βˆ’ 𝛼/2 ,∞)

𝐾 = βˆ’βˆž,βˆ’Ξ¦βˆ’1 1 βˆ’ 𝛼 bei ℋ𝐴: πœ‡ < πœ‡0

𝐾 = Ξ¦βˆ’1 1 βˆ’ 𝛼 ,∞) bei ℋ𝐴: πœ‡ > πœ‡0

6. Testentscheid: Liegt beobachteter Wert 𝑧 der Teststatistik in 𝐾

11

Problem in der Praxis: πˆπ‘Ώ ist nicht bekannt!

SchΓ€tze die Varianz:

πœŽπ‘‹2 =

1

𝑛 βˆ’ 1

𝑖=1

𝑛

𝑋𝑖 βˆ’ 𝑋𝑛

Neue Teststatistik:

𝑇 = 𝑋𝑛 βˆ’ πœ‡0

πœŽπ‘‹

𝑛

Verteilung von 𝑇, falls β„‹0 stimmt:

𝑇 ∼ π‘‘π‘›βˆ’1

12

Β«Student’sΒ» t-Verteilung –

kleiner Abstecher im Verteilungszoo!

Annahme:

𝑋1, 𝑋2, … , 𝑋𝑛 ∼ 𝒩(πœ‡, πœŽπ‘‹2) und unabhΓ€ngig

πœŽπ‘‹2 =

1

π‘›βˆ’1 𝑖=1

𝑛 𝑋𝑖 βˆ’ 𝑋𝑛2 ist die geschΓ€tzte Varianz

Die Teststatistik

𝑇 = 𝑋𝑛 βˆ’ πœ‡

πœŽπ‘‹

𝑛

∼ 𝑑𝑛

folgt einer

Β«t-Verteilung mit n FreiheitsgradenΒ»

Falls 𝑛 = ∞, dann ist π‘‘βˆž = 𝒩(0,1)

13

William

Sealy

Gosset

Umso weniger df,

umso meht Streuung

t-Test (πˆπ‘Ώ unbekannt)

14

1. Modell: 𝑋𝑖 kontinuierliche MessgrΓΆsse;𝑋1, 𝑋2, … , 𝑋𝑛 𝑖. 𝑖. 𝑑. ,𝓝 𝝁, πˆπ‘Ώ

𝟐 , πœŽπ‘‹ wird mit πœŽπ‘‹ geschΓ€tzt

2. Nullhypothese: β„‹0: πœ‡ = πœ‡0Alternative: ℋ𝐴: πœ‡ β‰  πœ‡0 (oder < oder >)

3. Teststatistik:

T =( 𝑋𝑛 βˆ’ πœ‡0)

𝜎 𝑋𝑛

=𝑛( 𝑋𝑛 βˆ’ πœ‡0)

πœŽπ‘‹=

beobachtet βˆ’ erwartet

geschΓ€tzter StandardfehlerVerteilung unter β„‹0: T ∼ π‘‘π‘›βˆ’1

4. Signifikanzniveau: 𝛼

5. Verwerfungsbereich fΓΌr die Teststatistik:

𝐾 = (βˆ’βˆž,βˆ’ π‘‘π‘›βˆ’1;1βˆ’

𝛼2

βˆͺ π‘‘π‘›βˆ’1;1βˆ’π›Ό2, ∞)

𝐾 = βˆ’βˆž,βˆ’π‘‘π‘›βˆ’1;1βˆ’π›Ό bei ℋ𝐴: πœ‡ < πœ‡0

𝐾 = π‘‘π‘›βˆ’1;1βˆ’π›Ό , ∞) bei ℋ𝐴: πœ‡ > πœ‡0

6. Testentscheid:Liegt beobachteter Wert 𝑑 der Teststatistik in 𝐾

t.test

power.t.test

Beispiel t-Test

1. Modell: 𝑋𝑖 Differenz in der Reaktionszeit von HH und NH von

StudentIn 𝑖

2. Nullhypothese: β„‹0: πœ‡ = 0 π‘šπ‘ Alternative: ℋ𝐴: πœ‡ β‰  0 π‘šπ‘ 

3. Teststatistik:

𝑇 =𝑛( 𝑋𝑛 βˆ’ πœ‡0)

πœŽπ‘‹β‡’ 𝑑 =

37(βˆ’8.03 βˆ’ 0)

41.13= βˆ’1.19

4. Signifikanzniveau: 𝛼 = 0.05

5. Verwerfungsbereich:

𝐾 = βˆ’βˆž,βˆ’π‘‘36;0.975 βˆͺ 𝑑36;0.975, ∞ = βˆ’βˆž,βˆ’2.03 βˆͺ 2.03,∞)

6. Testentscheid: 𝑑 βˆ‰ 𝐾 β‡’ β„‹0 kann nicht verworfen werden

15

P-Wert

Β«Kleinstes Signifikanzniveau, bei dem β„‹0 gerade nochverworfen wird.Β» z.B. P-Wert = 0.03 𝛼 = 0.05 𝛼 = 0.01

ℋ𝐴: πœ‡ β‰  πœ‡0 und der beobachtete Wert 𝑑 = 𝑛| π‘‹π‘›βˆ’πœ‡0|

πœŽπ‘‹

P-Wert berechnet sich…

𝑃 𝑇 > 𝑑 = 𝑃 𝑇 < βˆ’ 𝑑 + 𝑃 𝑇 > 𝑑 = 2 β‹… 𝑃 𝑇 > 𝑑 =

= 2 β‹… 1 βˆ’ 𝑃 𝑇 ≀ 𝑑 =

= 2 β‹… 1 βˆ’ πΉπ‘‘π‘›βˆ’1𝑑 = 2 β‹… 1 βˆ’ πΉπ‘‘π‘›βˆ’1

𝑛 π‘‹π‘›βˆ’πœ‡0

πœŽπ‘‹

wobei πΉπ‘‘π‘›βˆ’1die kumulative Verteilungsfunktion der 𝑑-Verteilung mit

𝑛 βˆ’ 1 Freiheitsgraden

16

(𝟏 βˆ’ 𝜢)-Vertrauensintervall fΓΌr 𝝁

Γ„quivalente Definitionen:

EnthΓ€lt wahren Wert πœ‡ mit Wahrscheinlichkeit 1 βˆ’ 𝛼

EnthΓ€lt alle Werte πœ‡0, bei denen β„‹0: πœ‡ = πœ‡0 vs ℋ𝐴: πœ‡ β‰  πœ‡0 mit Signifikanzniveau 𝛼 nicht verworfen wird

im t-Test Schritt 5: Nicht verwerfen, falls…

𝑋𝑛 βˆ’ πœ‡ πœŽπ‘‹

𝑛

< π‘‘π‘›βˆ’1;1βˆ’π›Ό/2

… und das nach πœ‡ auflΓΆsen.

CI: π‘₯𝑛 βˆ’ π‘‘π‘›βˆ’1;1βˆ’π›Ό

2β‹… 𝜎π‘₯

𝑛; π‘₯𝑛 + π‘‘π‘›βˆ’1;1βˆ’

𝛼

2β‹… 𝜎π‘₯

𝑛

Bsp. Reaktionszeit:

βˆ’8.03 βˆ’ 2.03 β‹…41.1

36; βˆ’8.03 + 2.03 β‹…

41.1

36= βˆ’22.2; 5.61 ms

17

Vorzeichentest = Binomialtest

18

1. Modell: 𝑋1, 𝑋2, … , 𝑋𝑛 𝑖. 𝑖. 𝑑., die 𝑋𝑖 kΓΆnnen beliebig verteilt sein

2. Nullhypothese: β„‹0: πœ‡ = πœ‡0, πœ‡ ist der Median

Alternative: ℋ𝐴: πœ‡ β‰  πœ‡0 (oder einseitig)

3. Teststatistik:

𝑉: Anzahl 𝑋𝑖’s mit 𝑋𝑖 > πœ‡0

Verteilung unter β„‹0: V ∼ Bin(𝑛, πœ‹0) mit πœ‹0 = 0.5

4. Signifikanzniveau: 𝛼

5. Verwerfungsbereich fΓΌr die Teststatistik:

𝐾 = 0, 𝑐𝑒 βˆͺ π‘π‘œ, 𝑛

Die Grenzen 𝑐𝑒 und π‘π‘œ mΓΌssen mit der Binomialverteilung oder der

Normalapproximation berechnet werden.

6. Testentscheid:

Liegt beobachteter Wert 𝑣 der Teststatistik in 𝐾

Bsp. Vorzeichentest

Angenommen: β„‹0: πœ‡ = πœ‡0 = 10,ℋ𝐴: πœ‡ β‰  10

Beobachtet: π‘₯1 = 13, π‘₯2 = 9, π‘₯3 = 17, π‘₯4 = 8, π‘₯5 = 14

Vorzeichen von π‘₯𝑖 βˆ’ πœ‡0: +, -, +, -, +

Mache Binomialtest mit

β„‹0: πœ‹ = 0.5,ℋ𝐴: πœ‹ β‰  0.5𝑛 = 5, 𝑣 = 3

Der Vorzeichentest kann genau dann verworfen werden,

wenn der entsprechende Binomialtest verworfen wird.

19

Keine Annahme andie Verteilung

Kleinere Macht

Wilcoxon-Test

Mischung von Vorzeichen- und t-Test

Annahme: 𝑋𝑖 ∼ β„± 𝑖. 𝑖. 𝑑. , β„± ist symmetrisch

Teste Median πœ‡ = πœ‡0

(einseitig oder zweiseitig)

20

Bsp. Wilcoxon-Test

β„‹0: πœ‡0 = 0

Beobachtet: -1.9, 0.2, 2.9, -4.1, 3.9

AbsolutbetrΓ€ge: 1.9, 0.2, 2.9, 4.1, 3.9

RΓ€nge der AbsolutbetrΓ€ge: 2, 1, 3, 5, 4

Rangsumme der positiven Gruppe: 1+3+4=8

Minimale Rangsumme: 0

Maximale Rangsumme: 1+2+3+4+5=15

Mit :

21

Wilcoxon-Test

Mischung von Vorzeichen- und t-Test

Annahme: 𝑋𝑖 ∼ β„± 𝑖. 𝑖. 𝑑. , β„± ist symmetrisch

Teste Median πœ‡: β„‹0: πœ‡ = πœ‡0(einseitig oder zweiseitig)

Intuition der Teststatistik

Sortiere π‘₯𝑖 βˆ’ πœ‡0 β†’ π‘Ÿπ‘– RΓ€ngen ursprΓΌngliches Vorzeichen von π‘₯𝑖 βˆ’ πœ‡0 geben

(engl. signed ranks)

Teststatistik 𝑉: Summe aller RΓ€nge mit π‘₯𝑖 βˆ’ πœ‡0 positiv

Falls β„‹0 stimmt, sollte die Rangsumme nicht zu gross und nicht zu klein sein

22

Übersicht der Tests

Annahmenπ’π’Žπ’Šπ’ bei

𝜢 = 𝟎. πŸŽπŸ“

Macht

fΓΌr

Beispielπˆπ‘Ώ

bekanntπ‘Ώπ’Š ∼ 𝓝

symm.

Verteilungi.i.d.

z-Test ● ● ● ● 1 89%

t-Test ● ● ● 2 79%

Wilcoxon ● ● 6 79%

Vorzeichen ● 5 48%

23

Verwendetes Beispiel:

β€’ 𝑋𝑖 ∼ 𝒩 πœ‡, 𝜎2 , 𝑛 = 10

β€’ β„‹0: πœ‡ = 0; ℋ𝐴: πœ‡ β‰  0; 𝛼 = 0.05

β€’ Macht berechnet mit konkreter Alternative: 𝑋𝑖 ∼ 𝒩(1,1)

StichprobengrΓΆsse

Annahme:

𝑋𝑖 ∼ 𝒩 πœ‡, 𝜎2 𝑖. 𝑖. 𝑑.

πœŽπ‘‹ aus Pilotstudie bekannt

Forderung:

Breite von CI kleiner gleich 2 β‹… 𝜌

Gesucht:

𝑛 =?

Faustregel fΓΌr 95%-CI:

𝑛 β‰₯ 4 β‹…πœŽ

𝜌

2

24

Bsp. Reaktionszeit:

𝜎 = 41.1 π‘šπ‘ 

𝜌 = 10 π‘šπ‘ 

𝑛 β‰₯ 4 β‹…41.1

10

2

= 4 β‹… 16.9 β‰ˆ 68

Zusammenfassung

25

z-Test - πœŽπ‘‹ bekannt

t-Test - πœŽπ‘‹ unbekannt

Vorzeichentest - teste Median!

Wilcoxon-Test - egal welche Verteilung

Hausaufgaben

Skript: Kapitel 4.7 lessen

Serie 9 lΓΆsen

Quiz 9 bearbeiten

etutoR 7

Recommended