99
1 Grundgesamtheit – Stichprobe • Grundgesamtheit: z.B. alle schweizer WählerInnen • Stichprobe: 1‘000 repräsentative WählerInnen

1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

Embed Size (px)

Citation preview

Page 1: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

1

Grundgesamtheit – Stichprobe

• Grundgesamtheit: z.B. alle schweizer WählerInnen

• Stichprobe: 1‘000 repräsentative WählerInnen

Page 2: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

2

Stichproben

• Eine Forscherin entwickelt ein neues Medikament. Bei einem Test an 10 Personen, bewirkt der neue Stoff bei 7 Personen eine Verbesserung. Bei den traditionellen Medikamenten tritt eine positive Wirkung „nur“ bei 50% der Behandlungen ein.

• Weist die Untersuchung der Forscherin eine signifikante Messung auf oder ist sie zufällig?

Page 3: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

3

Natürliche Streuung

• Wenn man 10 mal eine Münze wirft, dann müsste man der Wahrscheinlichkeit gemäss 5 mal „Zahl“ und 5 mal „Kopf“ werfen. Das ist aber unwahrscheinlich!

• Das Gleiche gilt bei Medikamenten, wenn bei 50% der Patienten eine Wirkung eintritt. Wenn man 10 Patienten das Medikament gibt, wirkt es nicht zwingend jedes Mal bei 5 und bei 5 nicht.

Page 4: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

4

Ein Versuch

Serie 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15Wurf

1 0 0 0 1 1 0 0 0 1 1 0 1 1 1 02 0 0 1 1 0 0 0 1 1 0 1 1 0 0 13 0 0 0 0 1 0 1 1 1 0 0 1 1 1 04 1 1 1 1 0 1 0 0 1 1 0 1 1 0 15 1 1 1 1 0 0 0 0 1 0 1 1 1 0 06 1 0 1 0 0 0 0 0 0 1 0 0 1 0 17 0 0 1 0 1 0 1 1 1 1 0 0 0 1 08 0 0 1 0 0 0 0 0 1 1 1 1 1 0 09 0 0 0 0 1 0 0 1 0 0 0 1 1 0 1

10 1 0 0 0 1 1 1 0 0 0 1 1 1 0 1

Mittel 40 20 60 40 50 20 30 40 70 50 40 80 80 30 50

Page 5: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

5

Aufgabe

Öffnet den Datenset binomial_würfe.sav

1. Berechnet die Anzahl Fälle >=70 und davon abgeleitet, wieviel Prozent das sind

2. Macht das Gleiche für alle Fälle >=70 oder <=30

Page 6: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

6

Eine kleine Rechnung

• Von unseren 50 Wurfserien sind 9 mit einem Wert >= 70

• 9/0.5 = 18

• In 18% der Fälle liegt der Wert durch zufällige Streuung im Bereich >= 70

Page 7: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

7

Eine kleine Rechnung II

• Von unseren 50 Wurfserien sind 19 mit einem Wert >= 70 oder <= 30

• 19/0.5 = 38

• In 38% der Fälle liegt der Wert durch zufällige Streuung im Bereich >= 70 oder <= 30

Page 8: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

8

Bedeutung

• Wenn in 38% der Fälle ein Wert zufällig >= 70 oder <= 30 sein kann, ist das neue Medikament weder besser noch schlechter als die bestehenden Medikamente, mit einer Heilungschance von 50%

Page 9: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

9

Binomialtest

• Script S. 209

• Stichprobengrösse– Einmal Samplesize 10, einmal 40 (simul.sav)

Page 10: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

10

Normalverteilung

-3 -2 -1 0 1 2 3

Fläche = 1

Page 11: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

11

Beispiel von youtube

• www.youtube.com

• Key: normal distribution

Page 12: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

12

Normalverteilung II

-3 -2 -1 0 1 2 3

Prob =.683

Prob = .954

Prob = .997

Page 13: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

13

-3 -2 -1 0 1 2 3

z = 0.5

Die schraffierte Fläche repräsentiert die Wahrscheinlichkeit eines Z-Wertes >= .5

Werte können in einer Tabelle abgelesen werden

Fläche = .3085

Page 14: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

14

Page 15: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

15

Berechnen des z-Wertes

• Bsp. IQ (iq.sav) gruppe iqa 75a 106a 91a 89a 98a 96b 85b 102b 87b 85b 106

Deskriptive Statistik

100 57 142 99.19 13.525

100

iqGültige Werte(Listenweise)

N Minimum Maximum MittelwertStandardabweichung

Z-Wert für 75: (75-99.19)/13.52 = -1.79

Page 16: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

16

Aufgabe: Z-Werte

Datensatz iq.sav• Errechnet die neue Variable ziq gemäss der

Formel

s

xxz

1

Page 17: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

17

Stichproben

• Script S. 219

• Beispiel cholest_stichproben.sav

Page 18: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

18

Page 19: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

19

P für Cholestrinwert <= 193

• Z = 193-205/34.83 = -0.345

• P nach Tabelle = 37%

Page 20: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

20

Verteilung von 500 Stichprobenmittelwerten von Stichproben der Grösse 21

Page 21: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

21

Standardabweichung der Stichprobenmittel = Standard-Fehler

Bsp: 35 / Wurzel(21) = 7.64

Std.Err.=

Page 22: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

22

Anwendung

• Bei gegebenem Mittelwert und Standardabweichung der Grundgesamtheit kann man:

– die Wahrscheinlichkeit eines Z-Wertes für Stichproben finden

Page 23: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

23

Z-Wert

z = Mittelwert Stichprobe – Mittelwert Grundgesamtheit

Standardabweichung Grundgesamtheit

n

Page 24: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

24

Beispiel:

21 CEOs wurden nach ihrem Cholesteringehalt untersucht, mit dem Ergebnis von 193 mg/dl. Wir wissen, dass in der Bevölkerung der Cholesteringehalt im Mittel 205 mg/dl beträgt, das mit einer Standardabweichung von 35

z = 193 – 205

21

35= -1.57

Kontrolle Buch S. 223

Page 25: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

25

Was geschieht, wenn die Standardabweichung der Grundgesamtheit fehlt?

Wir wissen vielleicht, dass die Beschäftigten in einem Land im Mittel 40 Stunden arbeiten, kennen aber die Standardaweichung nicht.

Buch Norusis, S. 235 f.

Page 26: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

26

T-Statistik

• Formel:

t =

Stichprobenmittel – Mittel der Grundgesamtheit

n

s s ist die Std.Abw. der Stichprobe

Der ganze Teil ist die Std.Abw der Streuung aller möglichen Stichproben =

Std.Err. der Stichprobenmittel

Page 27: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

27

Die T-Statistik

• Basiert auf der t-Verteilung

• Die Verteilung verändert sich nach Anzahl n

• Um die richtige Verteilung zu finden, braucht es die Freiheitsgrade

Page 28: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

28

Die Berechnung zum Beispiel ist im Buch auf S. 240 zu finden.

T = (47-40)/0.49 = 14.3

Page 29: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

29

-3 -2 -1 0 1 2 3

x

0.0

0.1

0.2

0.3

0.4Normalt.df2t.df9

T- Verteilung

Page 30: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

30

Degrees of freedom (df)

• Die Anzahl von Stichprobenwerten, die frei variieren können

10

6

9

7

?

x = 8

40

Eine Restriktion

Freiheitsgrade = n - 1

Page 31: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

31

Ein t-Wert von 14.3?

• Was bedeutet dieser Wert bei 436 Freiheitsgraden?

• Kontrolle auf Tabelle

Page 32: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

32

Vorgehen in SPSS

• S. 240 Script

Page 33: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

33

Histogramm

Page 34: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

34

Ist die Verteilung normal?

• Aufgrund des visuellen Eindrucks eher nicht

• Überprüfung mit Shapiro-Wilk‘s und Kolmogorov-Smirnov (K-S) Test

• -> Explore-Befehl

• Script S. 264

Page 35: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

35

Zentraler Grenzwertsatz

• Genug grosse Stichproben (Faustregel > 30) streuen in ihren Mittelwerten approximativ normal. Dabei muss die Variable der Gesamtpopulation nicht normal verteilt sein.

Page 36: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

36

Diskussion der Ergebnisse

Statistik bei einer Stichprobe

437 47.00 10.207 .488Number of hoursworked last week

N MittelwertStandardabweichung

Standardfehler des

Mittelwertes

Test bei einer Sichprobe

14.326 436 .000 6.995 6.04 7.96Number of hoursworked last week

T df Sig. (2-seitig)Mittlere

Differenz Untere Obere

95% Konfidenzintervallder Differenz

Testwert = 40

Page 37: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

37

Konfindenzintervalle I

Aufgrund der hohen Signifikanz können wir davon ausgehen, dass die Hochschulabgänger mehr als 40 Stunden arbeiten.

Aber:

Wieviele Stunden arbeiten sie nun?

Page 38: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

38

Konfidenzintervalle II

Aufgrund unserer Daten könnten wir von 47 Stunden ausgehen.

Das ist die beste Vermutung, die aus dem Mittel der Stichprobe abgeleitet ist.

Aufgrund des Standardfehler wissen wir, dass die Stichproben eine Std.Abw. von .488 haben

Page 39: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

39

Konfidenzintervalle III

Im Beispiel haben wir ein 95%-iges Konfidenzintervall.

Dh. 95% der Fälle liegen innerhalb von ca. 2 Std.Abw.

Page 40: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

40

Konfidenzintervall IV

Jetzt können wir rechnen:

2 x 0.48 = 0.96

Mittelwert von 47 – 0.96 = 46.04

Mittelwert von 47+ 0.96 = 47.96

Page 41: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

41

Aufgaben

• Aufg. 2 S. 250

• Aufg. Statistics Coach (brakes.sav)

Page 42: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

42

T-Test mit abhängigen (gepaarten) Stichproben

Ausgangslage:

• Typischwerweise vorher - nachher

Page 43: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

43

β-Endorphin-Werte

vorher nachher diff________ ________ ________

4.30 29.60 25.30 4.60 25.10 20.50 5.20 15.50 10.30 5.20 29.60 24.40 6.60 24.10 17.50 7.20 37.80 30.60 8.40 20.20 11.80 9.00 21.90 12.90 10.40 14.20 3.80 14.00 34.60 20.60 17.80 46.20 28.40

GesamtergebnisMittelwert 8.43 27.16 18.74N 11 11 11

Beispiel Marathonläufer:

Ein Team erforschte, ob bei Langstreckenläufer der β-Endorphin-WerteNach einem Lauf höher sind als vorher.

Page 44: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

44

Lösungsansatz

• Wenn es keinen Unterschied gibt, dann müssen die Mittelwerte von vorher und nachher gleich sein, die Differenz demnach = 0

• Wenn die Differenz stark von 0 abweicht, dann ist der Unterschied nicht mehr zufällig

Page 45: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

45

Umsetzung mit SPSS

• T-Test mit einer Stichprobe

• T-Test mit gepaarten Stichproben

Page 46: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

46

Aufgabe

• Ein Forschungsteam möchte wissen, ob eine Diät erfolgreich war und ob durch die Diät das Tryglyceride-Niveau bei den Partizipienten signifikant gesunken ist.

• Datensatz: dietstudy.sav

Page 47: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

47

T-Test mit 2 unabhängigen Stichproben

Gaby möchte untersuchen, ob ihre neue Behandlung eine Linderung für Stottern bringt

Sie nimmt zwei Gruppen. Die eine bekommt ein Placebo, die andere Gruppe dieneue Behandlung.

Nach dem Experiment werden alle Testpersonen einem Test unterzogen. Die Stärke des Stotterns wird mit einem Wert 1 bis 10 vergeben, wobei 10 starkes Stottern bedeutet.

Datensatz: stottern.sav

Page 48: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

48

Erinnerung

• Standardfehler =

n

s Stichprobeder

Dies ist die geschätzte Standardabweichung von allen möglichen gleichen Stichproben, t errechnet sich dann:

hlerStandardfe

theitGrundgesamder Mittel - Stichprobeder Mittelt

Page 49: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

49

Was heisst das für unabhängige Stichproben

• Wenn beide Gruppen den gleichen Mittelwert haben, ist die Differenz der Mittel = 0

• Es wird nicht mehr der Standardfehler „des“ Mittelwertes errechnet sondern der Standardfehler der Mittelwert-Unterschiede

Page 50: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

50

In einer Population mit einem Mittel von 0 streuen sich mögliche Stichproben.Eine Differenz von 2 ist gemäss der Darstellung sehr sehr selten.

Page 51: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

51

Berechnung von t

Page 52: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

52

SPSS-Output

Gruppenstatistiken

10 9.40 .699 .221

10 7.20 1.874 .593

gruppe1

2

stotternN Mittelwert

Standardabweichung

Standardfehler des

Mittelwertes

Test bei unabhängigen Stichproben

5.444 .031 3.479 18 .003 2.200 .632 .871 3.529

3.479 11.459 .005 2.200 .632 .815 3.585

Varianzen sind gleich

Varianzen sind nichtgleich

stotternF Signifikanz

Levene-Test derVarianzgleichheit

T df Sig. (2-seitig)Mittlere

DifferenzStandardfehler der Differenz Untere Obere

95% Konfidenzintervallder Differenz

T-Test für die Mittelwertgleichheit

Page 53: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

53

Aufgabe

• Vergleich TV-Stunden - Internetgebrauch

Page 54: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

54

Varianzanalyse (einfaktoriell)

• Vergleich von mehr als 2 Gruppen über eine numerische Variable

Page 55: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

55

Ausgangslage

ONEWAY deskriptive Statistiken

Number of hours worked last week

111 45.03 10.138 .962 43.12 46.93 15 87

808 44.95 10.723 .377 44.21 45.69 6 89

131 45.69 11.669 1.020 43.67 47.70 20 89

286 46.37 10.413 .616 45.16 47.58 15 89

151 48.19 9.729 .792 46.62 49.75 24 80

1487 45.62 10.647 .276 45.08 46.16 6 89

Less than HS

High school

Junior college

Bachelor

Graduate

Gesamt

N MittelwertStandardabweichung

Standardfehler Untergrenze Obergrenze

95%-Konfidenzintervall fürden Mittelwert

Minimum Maximum

Datensatz: gssft.sav

Page 56: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

56

Frage und Hypothese

• Gibt es einen Unterschied zwischen den Ausbildungsgruppen bezüglich Arbeitszeit?

• Nullhypothese: Die Mittelwerte der einzelnen Gruppen unterscheiden sich nicht

Page 57: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

57

Page 58: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

58

Streuung innerhalb der Gruppen ist klein

Page 59: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

59

Streuung zwischen den Gruppen ist klein

Page 60: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

60

Resultat

ONEWAY ANOVA

Number of hours worked last week

1557.919 4 389.480 3.459 .008166892.2 1482 112.613168450.1 1486

Zwischen den GruppenInnerhalb der GruppenGesamt

Quadratsumme df

Mittel derQuadrate F Signifikanz

Page 61: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

61

F-Verteilung

• Die F-Verteilung wird nur zum Testen verwendet, etwa bei der Varianzanalyse, um festzustellen, ob die Grundgesamtheiten zweier Stichproben die gleiche Varianz haben.

(http://de.wikipedia.org/wiki/F-Verteilung)

Page 62: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

62

Bedingungen für ANOVA

• Unabhängigkeit der Gruppen

• Normalverteilung

• Varianzgleichheit

• Vgl. S. 307

Page 63: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

63

Wie weiter

• Die Null-Hypothese, dass die Gruppen-Mittelwerte gleich sind, konnte verworfen werfen.

• Die Varianzanalyse sagt aber nichts darüber aus, wo die Unterschiede liegen

-> Weitere Verfahren

Page 64: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

64

Bonferroni-Methode

• Mit ihrer Hilfe wird die Alphafehler-Kumulierung bei multiplen Paarvergleichen neutralisiert.

Page 65: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

65

Alpha-Fehler

• Je mehr Tests durchgeführt werden, desto "überhöhter" sind die üblichen Signifikanzangaben. Mit einem einzigen Test und einem Alpha von 0,05 ist die Wahrscheinlichkeit, die Null-Hypothese korrekterweise zu akzeptieren (1 - 0,05) = 0,95. Führen wir zwei (unabhängige) Tests durch, so wird diese Wahrscheinlichkeit deutlich reduziert: 0,95 x 0,95 = 0,90, was eine ebenso deutliche Änderung des entsprechenden Alpha-Werts von 0,05 auf 0,1 bedeutet. Diese Fehlerquelle ist allgemein als Alpha-Fehler-Kumulierung bekannt.

Page 66: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

66

Alpha-Fehler

• Wie groß ist die Wahrscheinlichkeit, bei 2maligem Würfeln mindestens 1 mal "6" zu werfen?Wir können die günstigen und möglichen Fälle abzählen (kompliziert) oder so überlegen:Die Wahrscheinlichkeit für "0 mal 6" beträgt 5/6·5/6 = 25/36."Mindestens 1 mal 6" ist das Gegenereignis dazu, alsoP(mind. 1mal 6) = 1 - P(0mal 6) = 1 - 25/36 = 11/36.

Page 67: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

67

Inkonsistenzen

Angenommen jemand will die Erwartungswerte vergleichen. Beim paarweisen Test werden alle Nullhypothesen nicht abgelehnt, nur die Hypothese wird abgelehnt.

Page 68: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

68

Resultate des TestsMehrfachvergleiche

Abhängige Variable: Number of hours worked last weekBonferroni

.079 1.074 1.000 -2.94 3.10-.660 1.369 1.000 -4.51 3.19

-1.340 1.187 1.000 -4.68 2.00-3.158 1.327 .174 -6.89 .57-.079 1.074 1.000 -3.10 2.94-.739 1.000 1.000 -3.55 2.07

-1.419 .730 .521 -3.47 .63-3.237* .941 .006 -5.88 -.59

.660 1.369 1.000 -3.19 4.51

.739 1.000 1.000 -2.07 3.55-.680 1.120 1.000 -3.83 2.47

-2.498 1.267 .488 -6.06 1.061.340 1.187 1.000 -2.00 4.681.419 .730 .521 -.63 3.47.680 1.120 1.000 -2.47 3.83

-1.818 1.067 .887 -4.82 1.183.158 1.327 .174 -.57 6.893.237* .941 .006 .59 5.882.498 1.267 .488 -1.06 6.061.818 1.067 .887 -1.18 4.82

(J) Highest degreeHigh schoolJunior collegeBachelorGraduateLess than HSJunior collegeBachelorGraduateLess than HSHigh schoolBachelorGraduateLess than HSHigh schoolJunior collegeGraduateLess than HSHigh schoolJunior collegeBachelor

(I) Highest degreeLess than HS

High school

Junior college

Bachelor

Graduate

MittlereDifferenz (I-J)

Standardfehler Signifikanz Untergrenze Obergrenze

95%-Konfidenzintervall

Die Differenz der Mittelwerte ist auf dem Niveau .05 signifikant.*.

Page 69: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

69

Aufgabe

• Datensatz antisemitismus.sav

Page 70: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

70

Page 71: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

71

Im Folgenden soll mit Hilfe einer einfaktoriellen Varianzanalyse untersucht werden,ob die Reaktionen von Personen unterschiedlichen Bildungsniveaus auf dieseAussage signifikant voneinander verschieden sind. Hierzu werden die Befragten inAbhängigkeit von ihren höchsten Schulabschlüssen in Gruppen unterteilt. Derhöchste von den Befragten erreichte Schulabschluß ist in der Variablen bildung angegeben.

Page 72: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

72

Stichprobengrösse

http://www.arnsberg.de/buergerpanel/bestimmung-stichprobengroesse.pdf

Page 73: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

73

Mann-Whitney U-Test

• Test für zwei unabhängige Stichproben• Alternative zum t-Test für unabhängige Stichproben

Page 74: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

74

Formel

Page 75: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

75

Beispiel

Statistiken

Rank of wirkung40

10.50040

25.500

GültigFehlend

N

SummeGültigFehlend

N

Summe

a

b

U1 = 10.5-((4*5)/2) = .5

Page 76: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

76

Output in SPSS

Statistik für Testb

.50010.500-2.205

.027

.029a

Mann-Whitney-UWilcoxon-WZAsymptotischeSignifikanz (2-seitig)Exakte Signifikanz[2*(1-seitig Sig.)]

wirkung

Nicht für Bindungen korrigiert.a.

Gruppenvariable: medib.

Ränge

4 6.38 25.504 2.63 10.508

mediabGesamt

wirkungN Mittlerer Rang Rangsumme

Page 77: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

77

Approximation

For large samples, the normal approximation:

can be used, where z is a standard normal deviate whose significance can be checked in tables of the normal distribution. mU and σU are the mean and standard deviation of U if the null hypothesis is true, and are given by

All the formulae here are made more complicated in the presence of tied ranks, but if the number of these is small (and especially if there are no large tie bands) these can be ignored when doing calculations by hand. The computer statistical packages will use them as a matter of routine.

Note that since U1 + U2 = n1 n2, the mean n1 n2/2 used in the normal approximation is the mean of the two values of U. Therefore, you can use U and get the same result, the only difference being between a left-tailed test and a right-tailed test.

Page 78: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

78

Relation to other tests

The U test is useful in the same situations as the independent samples Student's t-test, and the question arises of which should be preferred. U remains the logical choice when the data are ordinal but not interval scaled, so that the spacing between adjacent values cannot be assumed to be constant. It is much less likely than the t test to give a spuriously significant result because of one or two outliers.

Page 79: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

79

Wilcoxon-Test

• Vergleich von zwei abhängigen Stichproben

• Beispiel Alphasan – Betasan (Zöfel S. 231)

• Norusis S. 391

Page 80: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

80

Kruskal und Wallis‘ H-Test

Kruskal-Wallis-Test aus Wikipedia, der freien Enzyklopädie

Wechseln zu: Navigation, Suche

Der Kruskal-Wallis-Test (H-Test) ist ein parameterfreier statistischer Test, mit dem im Rahmen einer Varianzanalyse verglichen wird, ob sich verschiedene unabhängige Stichproben (Gruppen) hinsichtlich einer ordinalskalierten Variable unterscheiden. Er ähnelt einem Mann-Whitney-U-Test und basiert wie dieser auf Rangplatzsummen, mit dem Unterschied, dass er für den Vergleich von mehr als zwei Gruppen angewendet werden kann.

Die Nullhypothese H0 lautet: Zwischen den Gruppen besteht kein Unterschied. Als Prüfgröße des Kruskal-Wallis-Tests wird ein sogenannter H-Wert berechnet. Der H-Wert wird wie folgt gebildet:[1] Der Rang Ri für jede der n Beobachtungen in der Vereinigung der Stichproben wird bestimmt. Daraus werden dann die Rangsummen Sh für die einzelnen Gruppen und

daraus die Teststatistik errechnet. Diese folgt einer Chi-Quadrat-Verteilung. Die Freiheitsgrade (Df) berechnen sich nach Df=k-1, wobei k die Anzahl der Klassen (Gruppen) ist.

Die berechnete Prüfgröße H wird mit einer theoretischen Größe aus der Chi-Quadrat-Verteilung für eine gewählte Irrtumswahrscheinlichkeit verglichen. Ist der errechnete H-Wert größer als der H-Wert aus der Chi-Quadrat-Tabelle, wird H0 verworfen, es besteht also ein signifikanter Unterschied zwischen den Gruppen.

Page 81: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

81

Lineare RegressionDie Regressionsrechnung dient dazu, die Art des Zusammenhanges zw. 2 Variablen aufzuzeigen und Möglichkeiten anzubieten, den Wert einer (abhängigen) Variablen aus den Werten einer andern (unabhängigen) Variablen vorherzusagen.

Page 82: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

82

Die „beste“ Gerade finden

Page 83: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

83

Methode der kleinsten Quadratsumme (KQ-Summe)

Page 84: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

84

Methode der kleinsten Quadratsumme II

Hier werden die senkrechten Abstände der einzelnen Punkte von der Geraden bestimmt. Dabei werden diese quadriert um negative Vorzeichen zu eliminieren.

Anschliessend wird die Summe der quadrierten Abstände berechnet und es wird die „am besten angepasste“ Gerade ausgewählt, bei der die Summe der quadrierten Abstände am kleinsten ist.

Page 85: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

85

Regressionsgleichung• y = a + bx

• a: Achsenabschnitt (Ordinatenabschnitt)

• b: Steigung (Regressionskoeffizient)

• Beispiel: life expectancy = 90-(0.70 * birthrate)

Page 86: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

86

Berechnung in SPSS

Koeffizientena

89.985 1.765 50.995 .000

-.697 .050 -.968 -13.988 .000

(Konstante)

Births per 1000population,

Modell1

BStandardf

ehler

Nicht standardisierteKoeffizienten

Beta

Standardisierte

Koeffizienten

T Signifikanz

Abhängige Variable: Female life expectancya.

Achsenabschnitt

Steigung

Page 87: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

87

Werte vorhersagen

• y = a + bx• predicted life expectency = 90+(-)(0.697 x birthrate)

• Beispiel: wie hoch ist die Lebenserwartung bei einer Geburtsrate von 11 (pro 1000)

• Predicted life expectency = 90-(.697 x 11) = 82.21 Jahre

Page 88: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

88

Aufgabe

• Datensatz bank.de

• Erstellt eine Regression für die Variablen:

• Einstiegsgehalt (unabhängige Var) und Ausbildung (abhängige Var.)

• Berechnet das geschätzte Gehalt bei einer Ausbildungszeit von 10 Jahren

Page 89: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

89

Hypothesen Test

• Bei unseren Daten handelt es sich um eine Stichprobe

• Wir wollen eine Aussage über die Grundgesamtheit machen

H0 = der Regressionskoeffizient in der Grundgesamtheit ist Null

Page 90: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

90

ErklärungKoeffizientena

89.985 1.765 50.995 .000

-.697 .050 -.968 -13.988 .000

(Konstante)

Births per 1000population,

Modell1

BStandardf

ehler

Nicht standardisierteKoeffizienten

Beta

Standardisierte

Koeffizienten

T Signifikanz

Abhängige Variable: Female life expectancya.

t = Stichprobenmittel – Mittel der Grundgesamtheit

ss ist der Standardfehler des Regressionskoeffizienten (Steigung der Gerade)

t = -.70/.05 = -14

N.B. die Freiheitsgrade wären Anzahl Fälle der abhängigen Variable - 2

Page 91: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

91

Konfidenzintervalle

Koeffizientena

89.985 1.765 50.995 .000 86.173 93.797

-.697 .050 -.968 -13.988 .000 -.805 -.590

(Konstante)

Births per 1000population,

Modell1

BStandardf

ehler

Nicht standardisierteKoeffizienten

Beta

Standardisierte

Koeffizienten

T Signifikanz Untergrenze Obergrenze

95%-Konfidenzintervall fürB

Abhängige Variable: Female life expectancya.

Page 92: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

92

Vorhersage der Werte für die Grundgesamtheit

• Vorhersage der Mittelwerte

• Vorhersage einzelner Werte

Page 93: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

93

Vorgehen in SPSS

Page 94: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

94

Neue Variablen werden berechnet

Page 95: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

95

Streudiagramm für die Mittel

Page 96: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

96

Streudiagramm für einzelne Werte

Page 97: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

97

Page 98: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

98

Page 99: 1 Grundgesamtheit – Stichprobe Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1000 repräsentative WählerInnen

99