View
6
Download
0
Category
Preview:
Citation preview
Hypothesentests fΓΌr
Erwartungswert und Median
fΓΌr D-UWIS, D-ERDW, D-USYS und D-HEST β SS15
Normalverteilung
2
π βΌ π(π, π2) :
Β«π ist normalverteilt mit Erwartungswert π und Varianz π2Β»
pdf:
π π₯ =1
π 2πexp β
π₯ β π 2
2π2
cdf: ziemlich umstΓ€ndlich
Zentraler Grenzwertsatz (CLT):
ππ βΌ πΉ π. π. π. mit πΈ ππ = π und πππ ππ = π2, dann giltβ¦
ππ βΌ π© π,π2
π, falls π β β
ππ = π=1π ππ βΌ π©(ππ, ππ2), falls π β β
CLT: Normalapproximation des Binomialtests
1. Modell: n Lose kaufen, gleiche Gewinnchance, unabh.
jedes Los ππ: 1 mit Wβkeit π, 0 mit Wβkeit 1 β π
πΈ ππ = π, πππ ππ = π 1 β π
π: Anzahl Gewinne, π = π1 + π2 + β―+ ππ
2. β0: π = π0; βπ΄: π < π0
3. Teststatistik T: CLT π βΌ π©(ππ0, ππ0(1 β π0))
4. Signifikanzniveau: πΌ = 0.05
3
CLT: Normalapproximation des Binomialtests
5. Verwerfungsbereich: πΎ = 0, π
Finde c, sodass π π β€ π = 0.05 (mit Computer oderβ¦
Standardisiere & verwende Tabelle:
π π β€ π = π π β€ π = 0.05 mit π =πβππ0
ππ0(1βπ0)
aus Tabelle: π = β1.64
nach π auflΓΆsen: π = ππ0 β 1.64 ππ0(1 β π0)
6. Testentscheid
4
Lernziele heute
z-Test
t-Test
Vorzeichentest
Wilcoxon-Test
Hausaufgaben
Skript: Kapitel 4.7 lessen
Serie 9 lΓΆsen
Quiz 9 bearbeiten
etutoR 7
5
Reaktionszeit
Reagiert man mit der Haupthand schneller, wie mit der Nebenhand?
Experiment: Population: Alle StudentInnen der Vorlesung
Stichprobe: 70 zufΓ€llig ausgewΓ€hlte StudentInnen
Messmethode: Reaktionszeittest auf dem Internet
Testlauf mit beiden HΓ€nden (Reihenfolge randomisiert)
Messung mit beiden HΓ€nden (5 Messungen)
Robustheit: jeweils bestes und schlechtestes Resultat streichen, Rest mitteln
Differenz aus HH und NH berechnen
Anreiz: Verlosung eines Kinogutscheins
6http://www.bbc.co.uk/science/humanbody/sleep/sheep/
Daten sammeln mit Schafenβ¦
7
Ergebnis
70 StudentInnen angeschrieben
RΓΌcklauf: 37
Haupthand ist im Mittel 8 ms schneller, der Median liegt bei
10 ms schneller
8
Stichprobe versus Population
In der Stichprobe war die Haupthand 8 ms schneller
KΓΆnnen wir daraus schliessen, dass die Haupthand in der
ganzen Population im Mittel schneller ist?
Eine Antwort liefern:
z-Test
t-Test
Wilcoxon-Test (Mann-Whitney-U-Test)
Vorzeichen-Test
9
z-Test (ππΏ bekannt)
1. Modell: ππ kontinuierliche MessgrΓΆsse;π1, π2, β¦ , ππ π. π. π. ,π π, ππΏ
π , ππΏ bekannt
2. Nullhypothese: β0: π = π0Alternative: βπ΄: π β π0 (oder < oder >)
3. Teststatistik:
π =( ππ β π0)
π ππ
=π( ππ β π0)
ππ=
beobachtet β erwartet
StandardfehlerVerteilung unter β0: π βΌ π©(0,1)
4. Signifikanzniveau: πΌ
5. Verwerfungsbereich fΓΌr die Teststatistik:
πΎ = (ββ,β Ξ¦β1 1 β πΌ/2 βͺ Ξ¦β1 1 β πΌ/2 ,β)
πΎ = ββ,βΞ¦β1 1 β πΌ bei βπ΄: π < π0
πΎ = Ξ¦β1 1 β πΌ ,β) bei βπ΄: π > π0
6. Testentscheid: Liegt beobachteter Wert π§ der Teststatistik in πΎ
11
Problem in der Praxis: ππΏ ist nicht bekannt!
SchΓ€tze die Varianz:
ππ2 =
1
π β 1
π=1
π
ππ β ππ
Neue Teststatistik:
π = ππ β π0
ππ
π
Verteilung von π, falls β0 stimmt:
π βΌ π‘πβ1
12
Β«StudentβsΒ» t-Verteilung β
kleiner Abstecher im Verteilungszoo!
Annahme:
π1, π2, β¦ , ππ βΌ π©(π, ππ2) und unabhΓ€ngig
ππ2 =
1
πβ1 π=1
π ππ β ππ2 ist die geschΓ€tzte Varianz
Die Teststatistik
π = ππ β π
ππ
π
βΌ π‘π
folgt einer
Β«t-Verteilung mit n FreiheitsgradenΒ»
Falls π = β, dann ist π‘β = π©(0,1)
13
William
Sealy
Gosset
Umso weniger df,
umso meht Streuung
t-Test (ππΏ unbekannt)
14
1. Modell: ππ kontinuierliche MessgrΓΆsse;π1, π2, β¦ , ππ π. π. π. ,π π, ππΏ
π , ππ wird mit ππ geschΓ€tzt
2. Nullhypothese: β0: π = π0Alternative: βπ΄: π β π0 (oder < oder >)
3. Teststatistik:
T =( ππ β π0)
π ππ
=π( ππ β π0)
ππ=
beobachtet β erwartet
geschΓ€tzter StandardfehlerVerteilung unter β0: T βΌ π‘πβ1
4. Signifikanzniveau: πΌ
5. Verwerfungsbereich fΓΌr die Teststatistik:
πΎ = (ββ,β π‘πβ1;1β
πΌ2
βͺ π‘πβ1;1βπΌ2, β)
πΎ = ββ,βπ‘πβ1;1βπΌ bei βπ΄: π < π0
πΎ = π‘πβ1;1βπΌ , β) bei βπ΄: π > π0
6. Testentscheid:Liegt beobachteter Wert π‘ der Teststatistik in πΎ
t.test
power.t.test
Beispiel t-Test
1. Modell: ππ Differenz in der Reaktionszeit von HH und NH von
StudentIn π
2. Nullhypothese: β0: π = 0 ππ Alternative: βπ΄: π β 0 ππ
3. Teststatistik:
π =π( ππ β π0)
ππβ π‘ =
37(β8.03 β 0)
41.13= β1.19
4. Signifikanzniveau: πΌ = 0.05
5. Verwerfungsbereich:
πΎ = ββ,βπ‘36;0.975 βͺ π‘36;0.975, β = ββ,β2.03 βͺ 2.03,β)
6. Testentscheid: π‘ β πΎ β β0 kann nicht verworfen werden
15
P-Wert
Β«Kleinstes Signifikanzniveau, bei dem β0 gerade nochverworfen wird.Β» z.B. P-Wert = 0.03 πΌ = 0.05 πΌ = 0.01
βπ΄: π β π0 und der beobachtete Wert π‘ = π| ππβπ0|
ππ
P-Wert berechnet sichβ¦
π π > π‘ = π π < β π‘ + π π > π‘ = 2 β π π > π‘ =
= 2 β 1 β π π β€ π‘ =
= 2 β 1 β πΉπ‘πβ1π‘ = 2 β 1 β πΉπ‘πβ1
π ππβπ0
ππ
wobei πΉπ‘πβ1die kumulative Verteilungsfunktion der π‘-Verteilung mit
π β 1 Freiheitsgraden
16
(π β πΆ)-Vertrauensintervall fΓΌr π
Γquivalente Definitionen:
EnthΓ€lt wahren Wert π mit Wahrscheinlichkeit 1 β πΌ
EnthΓ€lt alle Werte π0, bei denen β0: π = π0 vs βπ΄: π β π0 mit Signifikanzniveau πΌ nicht verworfen wird
im t-Test Schritt 5: Nicht verwerfen, fallsβ¦
ππ β π ππ
π
< π‘πβ1;1βπΌ/2
β¦ und das nach π auflΓΆsen.
CI: π₯π β π‘πβ1;1βπΌ
2β ππ₯
π; π₯π + π‘πβ1;1β
πΌ
2β ππ₯
π
Bsp. Reaktionszeit:
β8.03 β 2.03 β 41.1
36; β8.03 + 2.03 β
41.1
36= β22.2; 5.61 ms
17
Vorzeichentest = Binomialtest
18
1. Modell: π1, π2, β¦ , ππ π. π. π., die ππ kΓΆnnen beliebig verteilt sein
2. Nullhypothese: β0: π = π0, π ist der Median
Alternative: βπ΄: π β π0 (oder einseitig)
3. Teststatistik:
π: Anzahl ππβs mit ππ > π0
Verteilung unter β0: V βΌ Bin(π, π0) mit π0 = 0.5
4. Signifikanzniveau: πΌ
5. Verwerfungsbereich fΓΌr die Teststatistik:
πΎ = 0, ππ’ βͺ ππ, π
Die Grenzen ππ’ und ππ mΓΌssen mit der Binomialverteilung oder der
Normalapproximation berechnet werden.
6. Testentscheid:
Liegt beobachteter Wert π£ der Teststatistik in πΎ
Bsp. Vorzeichentest
Angenommen: β0: π = π0 = 10,βπ΄: π β 10
Beobachtet: π₯1 = 13, π₯2 = 9, π₯3 = 17, π₯4 = 8, π₯5 = 14
Vorzeichen von π₯π β π0: +, -, +, -, +
Mache Binomialtest mit
β0: π = 0.5,βπ΄: π β 0.5π = 5, π£ = 3
Der Vorzeichentest kann genau dann verworfen werden,
wenn der entsprechende Binomialtest verworfen wird.
19
Keine Annahme andie Verteilung
Kleinere Macht
Wilcoxon-Test
Mischung von Vorzeichen- und t-Test
Annahme: ππ βΌ β± π. π. π. , β± ist symmetrisch
Teste Median π = π0
(einseitig oder zweiseitig)
20
Bsp. Wilcoxon-Test
β0: π0 = 0
Beobachtet: -1.9, 0.2, 2.9, -4.1, 3.9
AbsolutbetrΓ€ge: 1.9, 0.2, 2.9, 4.1, 3.9
RΓ€nge der AbsolutbetrΓ€ge: 2, 1, 3, 5, 4
Rangsumme der positiven Gruppe: 1+3+4=8
Minimale Rangsumme: 0
Maximale Rangsumme: 1+2+3+4+5=15
Mit :
21
Wilcoxon-Test
Mischung von Vorzeichen- und t-Test
Annahme: ππ βΌ β± π. π. π. , β± ist symmetrisch
Teste Median π: β0: π = π0(einseitig oder zweiseitig)
Intuition der Teststatistik
Sortiere π₯π β π0 β ππ RΓ€ngen ursprΓΌngliches Vorzeichen von π₯π β π0 geben
(engl. signed ranks)
Teststatistik π: Summe aller RΓ€nge mit π₯π β π0 positiv
Falls β0 stimmt, sollte die Rangsumme nicht zu gross und nicht zu klein sein
22
Γbersicht der Tests
Annahmenππππ bei
πΆ = π. ππ
Macht
fΓΌr
BeispielππΏ
bekanntπΏπ βΌ π
symm.
Verteilungi.i.d.
z-Test β β β β 1 89%
t-Test β β β 2 79%
Wilcoxon β β 6 79%
Vorzeichen β 5 48%
23
Verwendetes Beispiel:
β’ ππ βΌ π© π, π2 , π = 10
β’ β0: π = 0; βπ΄: π β 0; πΌ = 0.05
β’ Macht berechnet mit konkreter Alternative: ππ βΌ π©(1,1)
StichprobengrΓΆsse
Annahme:
ππ βΌ π© π, π2 π. π. π.
ππ aus Pilotstudie bekannt
Forderung:
Breite von CI kleiner gleich 2 β π
Gesucht:
π =?
Faustregel fΓΌr 95%-CI:
π β₯ 4 β π
π
2
24
Bsp. Reaktionszeit:
π = 41.1 ππ
π = 10 ππ
π β₯ 4 β 41.1
10
2
= 4 β 16.9 β 68
Zusammenfassung
25
z-Test - ππ bekannt
t-Test - ππ unbekannt
Vorzeichentest - teste Median!
Wilcoxon-Test - egal welche Verteilung
Hausaufgaben
Skript: Kapitel 4.7 lessen
Serie 9 lΓΆsen
Quiz 9 bearbeiten
etutoR 7
Recommended