1 STATISIK LV Nr.: 1375 SS 2005 17. März 2005. 2 Statistische Tests Einführung: Testen von...

Preview:

Citation preview

1

STATISIKLV Nr.: 1375

SS 200517. März 2005

2

Statistische Tests

Einführung:• Testen von Hypothesen (Annahmen,

Behauptungen)• Statistischer Test: Verfahren, mit dessen

Hilfe sich bestimmte Hypothesen auf ihre Richtigkeit hin überprüfen lassen.

• Statistische Testverfahren basieren auf Stichprobentheorie

3

Statistische Tests

Einführung:• Ziel: Richtigkeit von Aussagen über die

Verteilung einer Zufallsvariablen überprüfen. • Entscheidungsgrundlage: Ergebnis eines

zufälligen Vorgangs.• Daher: Entscheidungen nicht immer richtig• Aber: Beim Vorliegen einiger der möglichen

Verteilungen ist die Wahrscheinlichkeit falsch zu entscheiden beschränkt.

4

Statistische Tests: Hypothesen

Hypothesen:• Annahmen, Behauptungen, Aussagen über

unbekannte Grundgesamtheit• 2 Arten von Hypothesen:

– Parameterhypothesen, Überprüfung durch Parametertests

– Verteilungshypothesen, Überprüfung durch Verteilungstests

5

Statistische Tests: Hypothesen

Formulierung von Hypothesen:• Nullhypothese H0 (Ausgangshypothese)• Alternativhypothese H1 (Gegenhypothese)

6

Statistische Tests: Hypothesen

Bsp.• Anteile:

– H0: Ausschussanteil = 10%– H1: Ausschussanteil > 10%

• Mittelwerte: – H0: Mittlere Länge eines Werkstücks = 5cm– H1: Mittlere Länge eines Werkstücks 5cm

• Gruppenvergleich: – H0: Gruppe 1 und Gruppe 2 sind gleich– H1: Gruppe 1 und Gruppe 2 sind ungleich

7

Statistische Tests

• Entscheidung für H0 oder H1 basiert auf einer Stichprobe x1,…,xn

• Wahrscheinlichkeitsaussage ob H0 zutrifft oder nicht.

• Frage: H0 ablehnen (verwerfen) oder H0 nicht ablehnen?

8

Statistische Tests

Mögliche Fehlentscheidungen:• Fehler 1. Art (α-Fehler): obwohl H0 korrekt

ist wird H0 abgelehnt• Fehler 2. Art (β-Fehler): obwohl H0 falsch

ist wird H0 nicht abgelehnt.

9

Statistische Tests

• Fehlentscheidungen

Trifft zuEntscheidung

H0 H1

H0Richtige

EntscheidungFehler 2. Art (β -Fehler)

H1Fehler 1. Art

(α-Fehler)Richtige

Entscheidung

10

Statistische Tests

Problem bei Fehlentscheidungen:• Falsche Entscheidung• Man weiß nicht, ob man in einer konkreten

Situation einen Fehler macht, sondern nur welcher Art dieser ist.

11

Statistische Tests

• Signifikanzniveau eines Tests α:– Die Wahrscheinlichkeit eine Fehler 1. Art zu

machen ist höchstens α, daher „Test zum Niveau α“ - egal mit welcher Wahrscheinlichkeit ein Fehler 2. Art begangen wird.

12

Statistische Tests

• Trifft H0 zu und entscheidet man sich für H1, dann ist die Wahrscheinlichkeit dabei einen Fehler zu machen ≤ α (α bekannt, wird festgelegt).

• Trifft H1 zu und entscheidet man sich für H0, dann ist die Wahrscheinlichkeit dabei eine Fehler zu machen = β (β unbekannt).

13

Statistische TestsFehler 1. Art und Fehler 2. Art

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6

x

f(x)

N(0,1) N(3,1)

Fehler 1. Art

Fehler 2. Art

µ0=0 µ1=3

14

Statistische Tests• D.h. durch Festlegen des α-Niveaus ist nur

die Entscheidung für H1 abgesichert. • Bei Entscheidung für H1:

– H1 ist richtig, – H1 ist falsch, ich mache einen Fehler mit

Wahrscheinlichkeit ≤ α.• Daher: Formuliere H0 so, dass sie abgelehnt

werden soll. bzw. in H0 soll diejenige Annahme festgelegt werden, der die größere Bedeutung zukommt.

15

Statistische Tests• Bsp. Medikamententest

H0: Medikament ist nicht wirksam gegen H1: Medikament wirkt. – Fehler 1. Art: das Medikament wirkt nicht, man

glaubt aber dass es wirkt– Fehler 2. Art: das Medikament wirkt, man

glaubt aber dass es unwirksam ist.Wähle α=0,01 (sehr klein), da Risiko ein nichtwirksames Medikament als wirksam einzustufen sehr groß ist.

16

Statistische Tests

• Arten von Hypothesen:• Einseitige Hypothesen

– H0: θ ≤ θ0 gegen H1: θ > θ0

– H0: θ ≥ θ0 gegen H1: θ < θ0

• Zweiseitige Hypothesen– H0: θ = θ0 gegen H1: θ ≠ θ0

• Verteilungshypothesen:– H0: bestimmten Vt. gegen H1: nicht diese Vt.

17

Statistische Tests

• Arten von Testproblemen:– Einseitige Testprobleme

• Tests für einseitige Hypothesen– Zweiseitige Testprobleme

• Tests für zweiseitige Hypothesen– Anpassungstests

• Test für Verteilungshypothesen

18

Statistische Tests• Gütefunktion oder Macht g(θ):

Wahrscheinlichkeit sich für H1 zu entscheiden, falls θ der wahre Parameter ist.

• Test zum Niveau α:– g(θ) ≤ α für alle θ H0

– g(θ) ≥ α für alle θ H1

– Ist θ H1, ist 1-g(θ) Wahrscheinlichkeit für den Fehler 2. Art.

– Funktion 1-g(θ) heißt Operationscharakteristik (OC)

19

Statistische TestsGütefunktion (einseitiger Test)

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,55

0,60

0,65

0,70

0,75

0,80

0,85

0,90

0,95

1,00

499 499,5 500 500,5 501 501,5 502

µ

g(µ)

µ0=500

20

Statistische TestsOperationscharaktersitik OC Kurve (einseitiger Test)

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,55

0,60

0,65

0,70

0,75

0,80

0,85

0,90

0,95

1,00

499,5 500 500,5 501 501,5 502

µ

Fehl

er 2

.Art

= 1

-g(µ

)

µ0=500

21

Statistische Tests

• Trennschärfe eines Tests:– Steilheit der OC Kurve 1-g(θ)– Es gilt: Je größer die Stichprobe umso besser

die Trennschärfe.

22

Statistische TestsOperationscharaktersitik OC Kurve (einseitiger Test),

unterschiedliche Stichprobengrößen n (n=9, n=100, n=10000)

0,000,050,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,951,00

499,5 500 500,5 501 501,5 502

µ

Fehl

er 2

.Art

= 1

-g(µ

)

µ0=500

23

Statistische Tests

• Vorgehensweise bei statistischen Tests (I):– Formulierung von H0 und H1 und Festlegen des

Signifikanzniveaus– Festlegung einer geeigneten Prüfgröße und

Bestimmung der Testverteilung unter H0.– Bestimmung des kritischen Bereichs– Berechnung der Prüfgröße (=Teststatistik)– Entscheidung und Interpretation

24

Statistische Tests

• Vorgehensweise bei statistischen Tests (II):– Formulierung von H0 und H1 und Festlegen des

Signifikanzniveaus– Festlegung einer geeigneten Prüfgröße und

Bestimmung der Testverteilung unter H0.– Berechnung der Prüfgröße (=Teststatistik)– Bestimmung des p-Wertes der Teststatistik– Entscheidung und Interpretation

25

Statistische Tests

• p-Wert– Anstatt den kritischen Bereich bzw. die

kritischen Werte zu bestimmen, Berechnung des „p-Wertes“.

– p-Wert (p-value): Niveau, bei dem der Test gerade noch abgelehnt hätte.

– Vergleich des p-Wertes mit dem vorher festgesetzten Niveau α.

– Entscheidung: Lehne H0 ab, wenn p-Wert < α

26

Statistische Tests

• Einseitige Tests (I)– H0: θ ≤ θ0 gegen H1: θ > θ0 und α = 0,05– Teststatistik (T) und deren Verteilung unter H0

bestimmen.– Bestimmung des kritischen Bereichs bzw. des

kritischen Werts (c)– T > c, lehne H0 ab– T ≤ c, lehne H0 nicht ab

27

Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

Dic

hte

der T

estv

erte

ilung

1-α = 0,95

α = 0,05

Kritischer BereichH0 ablehnen

H0 nicht ablehnen

Kritischer Wert: c

28

Statistische Tests

• Einseitige Tests (II)– H0: θ ≤ θ0 gegen H1: θ > θ0 und α = 0,05– Teststatistik (T) und deren Verteilung unter H0

bestimmen.– Bestimmung des p-Wertes– p < 2·α, lehne H0 ab– p ≥ 2·α, lehne H0 nicht ab

29

Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

Dic

hte

der T

estv

erte

ilung

1-α = 0,95

α = 0,05

Kritischer BereichH0 ablehnen

H0 nicht ablehnen

Kritischer Wert: c

Prüfgröße=1,64 p-Wert=0,103

30

Statistische Tests

• Einseitige Tests (I)– H0: θ ≥ θ0 gegen H1: θ < θ0 und α = 0,05– Teststatistik (T) und deren Verteilung unter H0

bestimmen.– Bestimmung des kritischen Bereichs bzw. des

kritischen Werts (c)– T < c, lehne H0 ab– T ≥ c, lehne H0 nicht ab

31

Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

Dic

hte

der T

estv

erte

ilung

1-α = 0,95

α = 0,05

Kritischer BereichH0 ablehnen

H0 nicht ablehnen

Kritischer Wert: c

32

Statistische Tests

• Einseitige Tests (II)– H0: θ ≥ θ0 gegen H1: θ < θ0 und α = 0,05– Teststatistik (T) und deren Verteilung unter H0

bestimmen.– Bestimmung des p-Wertes– p < 2·α, lehne H0 ab– p ≥ 2·α, lehne H0 nicht ab

33

Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

Dic

hte

der T

estv

erte

ilung

1-α = 0,95

α = 0,05

Kritischer BereichH0 ablehnen

H0 nicht ablehnen

Kritischer Wert: c

Prüfgröße=-1,64 p-Wert=0,103

34

Statistische Tests

• Zweiseitige Tests (I)– H0: θ = θ0 gegen H1: θ ≠ θ0 und α = 0,05– Teststatistik (T) und deren Verteilung unter H0

bestimmen.– Bestimmung des kritischen Bereichs bzw. der

kritischen Werte (cu und co)– T < cu oder T > co, lehne H0 ab– cu ≤ T ≤ co, lehne H0 nicht ab

35

Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

Dic

hte

der T

estv

erte

ilung

1-α = 0,95

α/2 = 0,025

Kritischer Bereich

H0 ablehnen

H0 nicht ablehnen

Kritischer Wert: co

Kritischer Bereich

H0 ablehnen

α/2 = 0,025

Kritischer Wert: cu

36

Statistische Tests

• Zweiseitige Tests (II)– H0: θ = θ0 gegen H1: θ ≠ θ0 und α = 0,05– Teststatistik (T) und deren Verteilung unter H0

bestimmen.– Bestimmung des p-Wertes– p < α, lehne H0 ab– p ≥ α, lehne H0 nicht ab

37

Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

Dic

hte

der

Test

vert

eilu

ng

1-α = 0,95

α/2 = 0,025

Kritischer Bereich

H0 ablehnen

H0 nicht ablehnen

Kritischer Wert: co

Kritischer Bereich

H0 ablehnen

α/2 = 0,025

Kritischer Wert: cu

Prüfgröße=1,96 p-Wert=0,05

Prüfgröße=1 p-Wert=0,24

38

Statistische Tests

• Kritischer Wert: Wert auf der Achse• p-Wert: Wert auf der Dichtfunktion• Entscheidung:

– Lehne H0 ab, wenn Prüfgröße im kritischen Bereich

– Lehen H0 ab, wenn p-Wert der Prüfgröße < α

39

χ² Unabhängigkeitstest

Chi-Quadrat (χ²) Unabhängigkeitstest• Teste ob 2 nominalskalierte Merkmale

voneinander unabhängig sind. • Bsp. Sind Geschlecht und Rauchverhalten

voneinander unabhängig?

40

χ² Unabhängigkeitstest

Chi-Quadrat (χ²) Unabhängigkeitstest• H0: die beiden Merkmale sind voneinander

unabhängig.• H1: die beiden Merkmale sind nicht

voneinander unabhängig, d.h. sie sind voneinander abhängig

• Festlegen des Signifikanzniveaus α.

41

χ² Unabhängigkeitstest

• Kontingenztafel:– Absolute Häufigkeiten der

Merkmalsausprägungen

A \ B b1 ... bs ∑

a1 h11 … h1s h1.

: : : :

ar hr1 … hrs hr.

∑ h.1 ... h.s h.. = n

42

χ² Unabhängigkeitstest

• Bsp. 4-Felder Tafel:– Absolute Häufigkeiten der

Merkmalsausprägungen

Raucher Geschlecht….… n j

m 15 3 18w 14 6 20

29 9 38

43

χ² Unabhängigkeitstest

Prüfgröße und Testverteilung: • Prinzip: Vergleiche die Werte, die man

unter Unabhängigkeit der Merkmale erwarten würde (he), mit den tatsächlich beobachteten Werten (ho).

• Wenn H0 gilt, welche Werte würde man erwarten?

• Berechung der unter H0 erwarteten absoluten Häufigkeiten.

44

χ² Unabhängigkeitstest

• Unter H0 erwartete absoluten Häufigkeiten• Interpretation der relativen Häufigkeiten als

Wahrscheinlichkeiten • Dann: unter H0 erwartete absoluten

Häufigkeiteno oi je h h

h =n

45

χ² Unabhängigkeitstest

• Bsp. Geschlecht - Rauchverhalteno oi je h h

h =n

ho

Geschlecht n jm 15 3 18w 14 6 20

29 9 38

Raucher

he

Geschlecht n jm 13,7 4,3 18w 15,3 4,7 20

29 9 38

Raucher

46

χ² Unabhängigkeitstest

• Teststatistik χ²:– Abweichung der beobachteten Häufigkeiten

von den erwartete Häufigkeiten

2o er sij ij2

ei=1 j=1 ij

h hχ =

h

47

χ² Unabhängigkeitstest

Verteilung der Teststatistik χ²: • χ²-Verteilung mit v = (r-1)·(s-1)

Freiheitsgraden

48

χ² Unabhängigkeitstest

Kritischer Bereich: • Signifikanzniveau α• Kritischer Wert: α-Quantil der χ²(r-1)·(s-1)

Verteilung• Lehne H0 ab, wenn gilt:

Wert der Teststatistik > kritischer Wert

49

χ² Unabhängigkeitstest

Bsp. Geschlecht – Rauchverhalten: Teststatistik χ²

• Verteilung der Teststatistik: χ²1 Chi-Quadrat Verteilung mit einem Freiheitsgrad

2o e2 2ij ij2

ei=1 j=1 ij

h hχ = 0,9

h

50

χ² Unabhängigkeitstest

Bsp. Geschlecht – Rauchverhalten: • Kritischer Wert: 0,05-Quantil der χ²1 Vt. = 3,84• Entscheidung:

(I) Teststatistik = 0,9 < 3,84 = kritischer Wert. Also: Lehne H0 nicht ab. (II) p-Wert = 0,33 > 0,05. Also: Lehne H0 nicht ab.

• Interpretation: Geschlecht und Rauchverhalten sind voneinander unabhängig.

51

χ² Homogenitätstest

Chi-Quadrat (χ²) Homogenitätstest• Betrachte zwei oder mehr Gruppen bzw.

Stichproben.• Teste, ob die Stichproben aus der gleichen

Grundgesamtheit stammen.

52

χ² Homogenitätstest

Chi-Quadrat (χ²) Homogenitätstest• H0: die beiden Stichproben stammen aus der

gleichen Grundgesamtheit. • H1: die beiden Stichproben stammen nicht

aus der gleichen Grundgesamtheit.• Festlegen des Signifikanzniveaus α.

53

χ² Homogenitätstest

Bsp. Geschlecht – Rauchverhalten• H0: Das Rauchverhalten der beiden

Gruppen stimmt überein. • H1: Das Rauchverhalten der beiden

Gruppen stimmt nicht überein.

54

χ² Homogenitätstest

Prüfgröße und Testverteilung: • Prinzip: Vergleiche die Werte, die man

unter H0 (gleiche Grundgesamtheit) erwarten würde (he), mit den tatsächlich beobachteten Werten (ho).

• Wenn H0 gilt, welche Werte würde man erwarten?

• Berechung der unter H0 erwarteten absoluten Häufigkeiten.

55

χ² Homogenitätstest

• Unter H0 erwartete absoluten Häufigkeiteno oi je h h

h =n

56

χ² Homogenitätstest

• Teststatistik χ²:– Abweichung beobachteten Häufigkeiten und

erwartete Häufigkeiten

• Verteilung der Teststatistik χ²: χ²-Verteilung mit v = (r-1)·(s-1) Freiheitsgraden

2o er sij ij2

ei=1 j=1 ij

h hχ =

h

57

χ² Homogenitätstest

Bsp. Geschlecht – Rauchverhalten:• Teststatistik χ² = 0,9• Verteilung der Teststatistik: χ²1 • Entscheidung:

– (I) χ² = 0,9 < 3,84. Lehne H0 nicht ab. – (II) p-Wert = 0,33 > 0,05. Lehne H0 nicht ab.

• Interpretation: die beiden Gruppen (Männer, Frauen) stammen aus der gleichen Grundgesamtheit, sie sind homogen.

58

χ² Tests

χ² Unabhängigkeits- und Homogenitätstests:• Teststatistik und Testverteilung sind gleich• Nullhypothese und Interpretation sind

verschieden. – Test auf Unabhängigkeit (die Merkmale sind

unabhängig voneinander)– Test auf Homogenität (die Stichproben

stammen aus der gleichen Grundgesamtheit).

59

χ² Tests

χ² Unabhängigkeits- und Homogenitätstests:• Für die Approximation durch die χ²-Vt.

sollten die erwarteten Häufigkeiten jeder Zelle 5 sein und keine der Zellen sollte unbesetzt sein.

• Sind die Voraussetzungen verletzt, kann man einen exakten Test durchführen

(siehe Hartung S. 414ff)

60

Anpassungstests

Test einer Verteilungshypothese – Nichtparametrische Testverfahren

• Betrachtet Unterschied zw. Stichproben-Vt. und theoretischer Verteilung.

• „Anpassungstest“ weil die Güte der Anpassung einer theoretischen Vt. an eine empirische Vt. überprüft wird.

61

Anpassungstests

χ² Anpassungstest: • H0: die Grundgesamtheit gehorcht einer

bestimmten Verteilung.• Vorgehensweise:

– Bestimme die unter H0 zu erwartenden Häufigkeiten he und vergleiche sie mit den beobachteten Häufigkeiten ho.

– Abweichung groß – Entscheidung gegen H0, Abweichung klein – Entscheidung für H0.

62

Anpassungstests

χ² Anpassungstest: • Teststatistik:

k ... Anzahl der Merkmalsausprägungen (diskrete Merkmale) bzw. Anzahl der Klassen (stetigen Merkmalen)

• Testverteilung: χ²v verteilt mit v=n-1 • Es gilt wieder: he sollten 5 sein.

k

1iei

2ei

oi2

h)h(h

χ

63

Anpassungstests

χ² Anpassungstest: • Entscheidung:

– Bestimmung des kritischen Bereichs, χ² > kritischer Wert, lehne H0 ab

– Bestimmung des p-Wertes, p-Wert < α lehne H0 ab

64

Anpassungstests

Kolmogorov-Smirnov- Anpassungstest: • Test zur Beurteilung der Güte der

Anpassung einer erwarteten theoretischen Verteilung an eine beobachtete empirische Verteilung.

• H0: die Grundgesamtheit gehorcht einer bestimmten Verteilung.

• Prinzip: Abweichung empirische- von der theoretische Verteilungsfunktion.

65

AnpassungstestsKolmogorov-Smirnov- Anpassungstest: • Prüfgröße (D):

– größte beobachtete absolute Abweichung der theoretischen von der empirischen Verteilungsfunktion.

• Testverteilung: – „Kolmogorov-Smirnov- Verteilung“, hängt nur

vom Stichproben-umfang n ab (1-α Quantile in Tabelle nachschlagen).

• Entscheidung: – D > kritischer Wert (aus Tabelle), lehne H0 ab.

66

Anteilstests

• Einstichprobentest für den Anteilswert – Hat der Anteil einen bestimmten Wert, bzw.

liegt er in einem bestimmten Bereich?– Entscheidung basiert auf dem Ergebnis einer

einzigen Stichprobe. • Zweistichprobentest für Anteilswerte

– Unterscheiden sich die Anteile zweier unabhängiger Gruppen?

– Entscheidung basiert auf zwei Stichproben

67

Anteilstest - Einstichprobentest

Einstichprobentest für den Anteilswert:• Einseitige Hypothesen:

– H0: θ ≤ θ0 gegen H1: θ > θ0

– H0: θ ≥ θ0 gegen H1: θ < θ0

• Zweiseitige Hypothesen: – H0: θ = θ0 gegen H1: θ ≠ θ0

68

Anteilstest - Einstichprobentest

Vorgehensweise: • Teststatistik bestimmen• Testverteilung bestimmen• Entescheidung über Annahme oder

Ablehnung von H0.

69

Anteilstest - Einstichprobentest

• Anteilswert einer Stichprobe: P = x / n• Unter H0 ist P, wenn nθ0(1-θ0) ≥ 9,

approximativ N-Vt., mit Parametern – E(P) = θ0

– Var(P) = θ0(1-θ0)/n · [(N-n)/(N-1)]• Vernachlässigung der Endlichkeitskorrektur wenn

n/N < 0,05.

70

Anteilstest - Einstichprobentest

Prüfgröße / Teststatistik:• Standardisierte Zufallsvariable Z:

0

P

P-θZ=σ

71

Anteilstest - Einstichprobentest

Testverteilung:• Teststatistik Z ist unter H0 N(0,1) verteilt. • Daher: Testverteilung ist die

Standardnormalverteilung.

72

Anteilstest - EinstichprobentestKritischer Bereich:• α festlegen (z.B. α = 0,05) • Kritischer Wert: α – Quantil der N(0,1)-Vt. • Entscheidung: H0 ablehnen, wenn Teststatistik im

kritischen Bereich. p-Wert: • α festlegen (z.B. α = 0,05)• p-Wert: Niveau, bei dem der Test gerade noch die

H0 ablehnen würde. • Entscheidung: H0 ablehnen, wenn p-Wert < α

(zweiseitiger Test) bzw. p < 2α (einseitiger Test).

73

Anteilstest - Einstichprobentest

Bsp: Anteil der weiblichen Studenten • H0: pw ≤ 0,5 gegen H1: pw > 0,5 und α=0,05• Approximation durch N-Vt. zulässig, da

unter H0 nθ0(1-θ0) = 9,5 ≥ 9. • Unter H0: E(P) = 0,5, Var(P) = 0,0065 und

σP = 0,0811 (Vernachlässigung der Endlichkeitskorrektur).

74

Anteilstest - Einstichprobentest

Bsp: Anteil der weiblichen Studenten • Teststatistik: Z = 0,324• Testverteilung: N(0,1)• Kritischer Wert: 1,64• p-Wert: 0,378• Entscheidung: Lehne H0 nicht ab (Z < 1,64

bzw. p-Wert > 0,1 = 2α)• Interpretation: Der Frauenanteil ist nicht

signifikant größer als 50%.

75

Anteilstest - Zweistichprobentest

Test für die Differenz zweier Anteilswerte• Stichprobe 1: Anteil P1 = x / n1

• Grundgesamtheit 1: Anteil θ1

• Stichprobe 2: Anteil P2 = x / n2

• Grundgesamtheit 2: Anteil θ2

• H0: Anteilswerte der beiden Grundgesamtheiten sind gleich. H0: θ1 = θ2 (=θ) gegen H1: θ1 ≠ θ2

76

Anteilstest - Zweistichprobentest

Teststatistik:

(Unter Vernachlässigung der Endlichkeitskorrektur und wenn Voraussetzungen für eine N-Vt. erfüllt sind)

• Verteilung der Teststatistik unter H0: Z ~ N(0,1)

1 2

1 2

1 2

(P -P )Z=n +nθ(1-θ)n n

77

Anteilstest - Zweistichprobentest

Entscheidung: • Bestimmung des kritischen Bereichs.

– Z > |c| lehne H0 ab

• Bestimmung des p-Wertes– p-Wert < α lehne H0 ab

• Interpretation: Wird H0 abgelehnt, dann sind die Anteile in den beiden Gruppen signifikant verschieden.

78

Test für arithmetisches Mittel

• Einstichprobentest für das arithm. Mittel: – Hat das arithm. Mittel einen bestimmten Wert,

bzw. liegt es in einem bestimmten Bereich?– Entscheidung basiert auf dem Ergebnis einer

einzigen Stichprobe. • Zweistichprobentest für das arithm. Mittel

– Unterscheiden sich die Mittelwerte zweier Gruppen?

– Entscheidung basiert auf zwei Stichproben

79

Test für arithmetisches Mittel

• Einstichprobentest für das arithm. Mittel: – Varianz der Grundgesamtheit ist bekannt.– Varianz der Grundgesamtheit ist unbekannt.

80

Test für arithmetisches Mittel

• Einstichprobentest für das arithm. Mittel: • Zweiseitige Hypothese:

H0: µ = µ0 gegen H1: µ ≠ µ0

• Festlegen des Signifikanzniveaus

81

Test für arithmetisches Mittel

• Varianz der Grundgesamtheit ist bekannt.• Unter H0 ist das arithm. Mittel der

Stichprobe N-Vt. mit E=µ und Var=σ²/n• Teststatistik:

• Testverteilung: N(0,1)n

σμX

σμXZ

X

82

Test für arithmetisches Mittel

• Bestimmung des kritischen Bereichs bzw. Berechung des p-Wertes

• Entscheidung• Interpretation

83

Test für arithmetisches Mittel

• Varianz der Grundgesamtheit ist unbekannt.• Schätzwert für unbekanntes σ²:

Stichprobenvarianz s². • Teststatistik:

• Testverteilung: tn-1

• t-Test

ns

μXT

84

Test für arithmetisches Mittel

• Bestimmung des kritischen Bereichs: kritische Werte: α/2-Quantile der t-Vt., symmetrische Vt. daher tc

u = -tco

• Berechung des p-Wertes: • Entscheidung:

|t| > tc, lehne H0 abp-Wert < α, lehne H0 ab

• Interpretation

85

Test für arithmetisches Mittel

Bsp. mittlere Körpergröße (n = 38)• H0: µ = 170 gegen H1: µ 170, α = 0,05 • Arithm. Mittel der Stpr: 174• Standardabweichung der Stichprobe: 10,4• Teststatistik: T = (174-170) / 10,4/38 = 2,5• Kritischer Wert: 2,02• p-Wert: 0,016• Mittlere Körpergröße ist signifikant 170

86

Test für arithmetisches Mittel

• Zweistichprobentest für die Differenz zweier arithmetischer Mittel– Unterscheiden sich die Mittelwerte zweier

Grundgesamtheiten?– Unterscheiden sich die Mittelwerte zweier

verbundener Stichproben?

87

Test für arithmetisches Mittel

• Differenz zweier arithmetischer Mittel die aus 2 Grundgesamtheiten stammen.

• Voraussetzung: – Stichproben unabhängig– Stichproben stammen aus einer N-vt.

Grundgesamtheiten bzw. Approximation durch N-Vt. ist zulässig

– Endlichkeitskorrektur ist vernachlässigbar

88

Test für arithmetisches Mittel

• Unterscheide, ob die Varianzen der beiden Grundgesamtheiten homogen sind oder nicht.

• Varianzen verschieden, σ1² σ2² : • Teststatistik:

• Testverteilung: Z asymptotisch N(0,1)-vt.

2

22

1

21

21

nS

nS

)XX(Z

89

Test für arithmetisches Mittel

• Varianzhomogenität, σ1² = σ2² = σ²: • Teststatistik:

wobei

• Testverteilung: T ~ tv mit v=n1+n2-2 Freiheitsgarden

21

21

21

nnnn

S

)XX(T

2nn1)S(n1)S(n

S21

222

211

90

Test für arithmetisches Mittel

• Verbundene Stichproben (abhängige oder gepaarte Stpr.)– Tritt auf, wenn z.B. die Merkmalsausprägungen

der ersten Stpr. und die der zweiten jeweils an demselben Merkmalsträger erhoben werden. Bsp: vorher – nachher Untersuchungen.

• Test für die Differenz arithmetischer Mittel bei verbundenen Stichproben.

91

Test für arithmetisches Mittel• Differenzen der Wertepaare: Di = X2i – X1i

sind N-vt. mit E(Di) = µ2i - µ1i = δ und Var(Di) =σD²

• Teststatistik:

• Testverteilung: T~tv mit v=n-1

nS

δDTD

n

1i

2iD

n

1ii )D(D

1n1SundD

n1X

92

Test für Varianz

• Einstichprobentest für die Varianz: – Hat die Varianz einen bestimmten Wert, bzw.

liegt er in einem bestimmten Bereich?– Entscheidung basiert auf dem Ergebnis einer

einzigen Stichprobe. • Zweistichprobentest für die Varianz

– Unterscheiden sich die Varianzen zweier Gruppen?

– Entscheidung basiert auf zwei Stichproben

93

Test für VarianzEinstichprobentest für die Varianz:• Annahme: Grundgesamtheit normalverteilt• H0: σ² = σ0² gegen H1: σ² σ0²• Teststatistik:

• Testverteilung: χ²v mit v=n-1• Entscheidung:

– χ² > χ²co oder χ² < χ²c

u, lehnen H0 ab – p-Wert < α, lehne H0 ab

2

22

σ1)s(nχ

94

Test für VarianzZweistichprobentest für den Quotienen zweier

Varianzen:• Annahme: Grundgesamtheit normalverteilt• H0: σ1² = σ2² gegen H1: σ1² σ2²• Teststatistik:

• Testverteilung: Fv1,v2 mit v1=n1-1 und v2=n2-1• Entscheidung:

– F > Fco oder F < Fc

u, lehnen H0 ab – p-Wert < α, lehne H0 ab

22

21

SS

F

Recommended