61
Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t- online.de

Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse [email protected]

Embed Size (px)

Citation preview

Page 1: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Tutorat Statistik II im SS 09einfaktorielle Varianzanalyse

[email protected]

Page 2: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Memo: Mediator- & Moderatoranalyse

Was fällt euch noch ein?

Page 3: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Memo

- Spezielle Verwendungen der Methode Regressionsanalyse

- Funktion Mediatoranalyse: Vermittlung der gemeinsamen Varianz über Drittvariablen sichtbar machen

- Die vier Schritte der Mediatoranalyse- Funktion Moderatoranalyse: Beinflussung der „Höhe“

des Zusammenhangs zwischen zwei Variablen durch (eine) dritte Variable prüfen

- Zentraler mathematischer Unterschied:Bei der Mediatoranalyse müssen alle Variablen korrelieren, bei der Moderatoranalyse soll die Drittvariable nicht mit Prädiktor/UV korrelieren

Page 4: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Thema: einfaktorielle Varianzanalyse

Page 5: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Gliederung

Die Varianzanalyse wird mit ANOVA = Analysis of Variance abgekürzt

I. Anwendung und Funktion der ANOVAII. Verknüpfung: Effekte, ALM & ANOVAIII. Berechnung der ANOVAIV. Hypothesen & VoraussetzungenV. Effektgrößen & Formalia

Page 6: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

I. ANOVA: Anwendung & Funktion

Page 7: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

ANOVA: Was und wozu?

Ziel: Vergleich von Mittelwerten

Warum kein t-Test?!

Einfaktorielle ANOVA mit zwei Gruppen entspricht dem t-Test (F=t²)

strukturell bildhaft

5 12

7 7

3 8

4 10

6 13

M=5 M=10

Page 8: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Alpha-Fehler-Kumulierung

Wenn drei Gruppen verglichen werden sollen, sind verschie-dene Vergleiche möglich:

(1) struk vs. bild: t(8) = -3.73; p = .006

(2) struk vs. emo: t(8) = -9.04; p = .000

(3) bild vs. emo: t(8) = -1.69; p = .129

Bei jedem der 3 Vergleiche besteht die Gefahr fälschlicher-weise einen signifikanten Effekt zu finden (α = 0.05)!

strukturell bildhaft emotional

5 12 12

7 7 11

3 8 12

4 10 12

6 13 13

M=5 M=10 M=12

Page 9: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Gruppen Vergleiche Kumulierter

α-Fehler3 3 0.1434 6 0.2645 10 0.4016 15 0.5377 21 0.6598 28 0.7629 36 0.842

10 45 0.90111 55 0.94012 66 0.96613 78 0.98214 91 0.99115 105 0.995

Alpha-Fehler-Kumulierung

Der kumulierte α-Fehler gibt die Wahrscheinlichkeit an, mindestens einen statistisch bedeutsamen Gruppenunterschied zu finden, obwohl in der Population die H0 gilt (alle Gruppen sind gleich).

Bereits bei 5 Gruppen nähern wir uns dem Zufallsniveau!

Page 10: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Bonferroni-KorrekturMit der Bonferroni-Korrektur wird das α-Fehler-Niveau für jeden einzelnen Test soweit herabgesetzt, dass der kumulierte Fehler nur noch 0.05 beträgt.

Beispiel: 5 Gruppen 10 Tests αadj = 0.05 / 10 = 0.005

Nachteil: sehr niedriges Alpha-Niveau bei den einzelnen Tests geringe Power (großer β-Fehler)

Bessere Alternative: Berechnung einer Varianzanalyse

Testsadj N

Page 11: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

ANOVA: Was und wozu?

o Die Varianzanalyse ist ein Verfahren zur Berechnung von Mittelwertsunterschieden zwischen Gruppen → t - Test

o Die Varianzanalyse wird verwendet, wenn man effizient und mit geringem Beta-Fehler (hoher Power) prüfen will, ob sich mehr als zwei Gruppenmittelwerte signifikant voneinander unterscheiden

Page 12: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Übersicht ANOVA

Page 13: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Begriffsklärung 1

o Einfaktoriell: Die ANOVA beinhaltet eine UV, die beliebig viele Stufen haben kann

o Beispiel: Ich untersuche ob sich die Extraversionswerte (AV) der Probanden in Abhängigkeit von der Haarfarbe unterscheiden (UV, hier mit 4 Stufen: braun, schwarz, blond, rot)

Page 14: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

o Mehrfaktoriell: Die ANOVA beinhaltet mehr als zwei UVs oder Faktoren, deren Wirkung auf die AV untersucht wird

o Beispiel: Als zusätzliche UV in meiner Extraversionsstudie nehme ich den ebenfalls vierstufigen Faktor Haarlänge auf

Damit werden auch Wechselwirkungen (Interaktionseffekte) zwischen den Faktoren analysierbar

Welche Methode zur Analyse von Wechselwirkungen kennt ihr bereits?

Begriffsklärung 2

Page 15: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

o Feste Effekte: Die UV ist nominalskaliert

o Zufällige Effekte: Die UV ist intervallskaliert

Die Implikationen für Berechnung und Interpretation der ANOVA werden später im Semester behandelt. Wissbegierigen sei vorab Leonhart S. 327-330 empfohlen.

Begriffsklärung 3

Page 16: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Begriffsklärung 4

o Univariat: Wir untersuchen eine AV in Abhängigkeit der UV

o Multivariat: Wir untersuchen mehrere AV

Beispiel: Der Einfluss des Geburtszeitpunkts (UV, dichotom: Sommer/Winter) auf IQ, Lebenszufriedenheit und Größe (AVs)

Page 17: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

II. Effekte, ALM & ANOVA

Page 18: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Effekte

Effekt: Abweichung eines Gruppenmittelwerts vom Gesamtmittelwert → Gruppenzahl = Anzahl der Faktorstufen

Mathematisch:

Page 19: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Gesamtmittelwert

Mittelwert Gruppe 2

Mittelwert Gruppe 1

→ ALM

Beispiel: Effekte

Page 20: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Strukturgleichung des ALM

ikikkiii

kikkiii

eaxbxbxby

axbxbxby

...23.12211

...23.12211

...

...ˆ

Page 21: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Effekte im ALM

Page 22: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

ALM in Matrizenform

Page 23: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Dummy- und Effektkodierung

o Die Varianzanalyse verwendet k-1 (k=Gruppen) Variablen um die Zugehörigkeit zu einer Gruppe in einer Designmatrix darzustellen

o Die Dummykodierung „spart“, indem sie von einem Nulleffekt für eine Gruppe ausgeht

o Die Effektkodierung macht sich die Tatsache zur Nutze, dass sich alle Effekte zu Null addieren:

Page 24: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Dummykodierung

Effektkodierung

Page 25: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

III. Berechnung der ANOVA

Page 26: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Berechnung der ANOVA

- Quadratsummenzerlegung

- F-Test & Interpretation

Page 27: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Quadratsummenzerlegung

Page 28: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Basis der Methode: Varianz

1

2

2

n

yy

df

SSMS

n

ii

Quadratsumme

Freiheitsgrade

MS: Mittlere Quadratsumme

Page 29: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Quadratsummenzerlegung

Gesamt-Quadratsumme (SStotal)

Quadratsumme innerhalb der Gruppen (SSwithin , SSError)

Quadratsumme zwischen den Gruppen (SSbetween, SSTreatment)

n

i

p

jij yy

1 1

2

n

i

p

jjij yy

1 1

2

p

jjj yyn

1

2

Page 30: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Gesamt-Quadratsumme

strukturell bildhaft

y11=5 y12=12

y21=7 y22=7

y31=3 y32=8

y41=4 y42=10

y51=6 y52=13

M1=5 M2=10

G=7.5

n

i

p

jijtotal yySS

1 1

2

2

222

222

222

7.5)-(13

7.5)-(107.5)-(8 7.5)-(7

7.5)-(12 7.5)-(6 7.5)-(4

7.5)-(37.5)-(7 7.5)-(5

totalSS

98.50

30.25 6.25 0.25 0.25 20.25

2.25 12.25 20.25 0.25 6.25

totalSS

Page 31: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

94.109

5.98ˆ 2 total

1

ˆ

1 1

2

2

pn

yy

df

SS

n

i

p

jij

total

totaltotal

y

strukturell bildhaft

y11=5 y12=12

y21=7 y22=7

y31=3 y32=8

y41=4 y42=10

y51=6 y52=13

M1=5 M2=10

G=7.5

Gesamtvarianz

Page 32: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Varianz innerhalb der Gruppen

5.48

36ˆ 2 within

n

i

p

jjijwithin yySS

1 1

2strukturell bildhaft

y11=5 y12=12

y21=7 y22=7

y31=3 y32=8

y41=4 y42=10

y51=6 y52=13

M1=5 M2=10

G=7.536

904 9 4 1 1 4 4 0

10)²-(13 10)²-(10 10)²-(8 10)²-(7 10)²-(12

5)²-(6 5)²-(4 5)²-(3 5)²-(7 5)²-(5

withinSS

8210 pNdfwithin

Page 33: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Varianz zwischen den Gruppen

50.621

50.62ˆ 2 between

p

jjjbetween yynSS

1

2strukturell bildhaft

y11=5 y12=12

y21=7 y22=7

y31=3 y32=8

y41=4 y42=10

y51=6 y52=13

M1=5 M2=10

G=7.550.62

25.3125.31

(2.5)5 (-2.5)5

7.5)-(105 7.5)-(5522

22

betweenSS

1121 pdfbetween

Page 34: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Zwischenergebnisse

Gesamtvarianz 94.109

50.98ˆ 2

total

totaltotal df

SS

50.48

36ˆ 2

within

withinwithin df

SS

50.621

50.62ˆ 2

between

betweenbetween df

SS

Varianz innerhalb

Varianz zwischen

Page 35: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Additivität

Quadratsummen sind additiv

innerhalbzwischentotal QSQSQS

Freiheitsgrade sind additiv

innerhalbzwischentotal dfdfdf

Varianzen sind nicht additiv222 ˆˆˆ innerhalbzwischentotal

Page 36: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

F-Test & Interpretation

Page 37: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Der F-Test

Vergleich zweier Varianzen (→ multiple Regression)

H0: Varianzen gleich groß F=1

H1: Zählervarianz (=erklärte Varianz) größer F>1

Femp > Fkrit Varianzen signifikant verschieden!

2

2

, ˆ

ˆ

innerhalb

zwischendfdf innerhalbzwischen

F

Page 38: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Abgleich: empirischer & kritischer Wert

o Analog zum t-Test wird der berechnete empirische Wert mit einem kritischen Wert aus einer Tabelle verglichenDie H1 gilt wenn Femp > Fkrit Die H0 gilt wenn Femp ≤ Fkrit

o Im Unterschied zum t-Test hängt der kritische F-Wert von Zähler- und Nennerfreiheitsgraden ab

Page 39: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Am Beispiel

o Femp (1, 8) = 62,5 : 4,5 = 13,89o Fkrit (1, 8) = 5,32; α = .05o Femp > Fkrit

Es gilt die H1

50.48

36ˆ 2

within

withinwithin df

SS

50.621

50.62ˆ 2

between

betweenbetween df

SS

Varianz innerhalb

Varianz zwischen

Page 40: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

→ Leonhart S. 658 ff.

Page 41: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Varianzanalyse: rechnerisches Vorgehen im Überblick

o Gruppen- und Gesamtmittelwerte bildeno Quadratsummen berechnen

= „Vorstufe“ der Varianzo Freiheitsgrade berechneno Mittlere Quadratsummen berechnen

= Varianzo F-Bruch bilden, Vergleich mit krit. F-Werto Interpretation: Entscheidung für H0 oder H1

Page 42: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

IV. Hypothesen& Voraussetzungen

Page 43: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Nullhypothese der ANOVA

H0: Alle Mittelwerte sind gleich: μ1 = μ2 = … = μp μi = μj (für alle i,j)

bzw.

H0: Alle Effekte sind NullH0: α1 = α2 = … = αp = 0 αi = 0 (für alle i)

bzw.

H0: Die Varianz der Effekte ist NullH0: σ²α = 0 oder σ²Effekt=0

Page 44: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

H1: Mindestens zwei Mittelwerte sind verschiedenμi ≠ μj (für mind. ein Paar i, j)

bzw.

H1: Mindestens ein Effekt ist ungleich Nullαi ≠ 0 (für mindestens ein i)

bzw.

H1: Varianz der Effekte ist größer als Nullσ²α > 0 oder σ²Effekt>0

Mittels ANOVA sind nur ungerichtete Alternativhypothesen möglich

Alternativhypothese der ANOVA

Page 45: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Voraussetzungen der ANOVA

(1) Intervallskalierte, normalverteilte AV

(2) Mindestens 20 Elemente pro Gruppe

(3) Ähnlich Gruppengrößen in den Zellen

(4) Varianzhomogenität

5.1min

max n

n

Page 46: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Prüfung der Varianzhomogenität

Zur Überprüfung der Varianzhomogenität stehen verschie-dene Tests zur Verfügung:

a) Barlett-Test (sehr empfindlich gegenüber der Verletzungen der Normalverteilung)

b) Levene-Test (relativ unempfindlich gegenüber Verletzungen der Normalverteilung)

c) Fmax-Statistik (Hartley Test, nur bei gleichen Gruppen-Größen)

Page 47: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Levene-Test

Der Levene-Test ist eine Varianzanalyse über die Ab-weichung der individuellen Messwerte vom Gruppenmittelwert:

H0:

jijij yyd

jddd ...21

Wird der Levene-Test signifikant (p < 0.05), dann ist die Annahme der Varianzgleichheit verletzt.

Page 48: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Varianzanalyse ist robust

D.h. bei Verletzungen der Annahmen resultieren meistens trotzdem sinnvolle Ergebnisse (Insbesondere bei großen Stichproben).

Wenn nur einzelne Annahmen verletzt sind, können die Ergebnisse einer ANOVA dennoch verwendet werden.

Allerdings muss dann berichtet werden, dass die Annahmen verletzt sind, damit der Leser weiß, das die Ergebnisse mit Vorsicht zu interpretieren sind!

Page 49: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

V. Effektgrößen & Formalia

Page 50: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Effektgrößen

o Was war noch gleich Cohens d?

o Auch bei der ANOVA lässt sich die praktische Relevanz von Effekten durch Berechnungen vergleichen.

o Eta² gibt an, wie viel % der Varianz der AV durch die UV erklärt wird.

Alternativ: Berechnung aus F-Wert

Page 51: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Formalia: F-Tests in Forschungsdokumentationen

Konventionen:- Nötige Infos: F- und p-Wert bzw. p-Niveau,

Zähler- und Nennerfreiheitsgrade- F- und p-Wert : exakt zwei Nachkommastellen;

Ausnahme: p-Wert bei n.s.

Signifikante Ergebnisse:(F[2, 37] = 5.34; p < .01)Nicht-signifkante Ergebnisse: (F[2, 37] = 1.44; p=.25) oder (F[2, 37] = 1.44; n.s.)

Page 52: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Vielen Dank für eure Aufmerksamkeit!

Page 53: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Arbeitsblatt Aufgabe 1

In einer Untersuchung zur Lesekompetenz in verschiedenen Ländern ergibt sich folgender Datensatz:

Land A Land B Land C

y11 = 80 y12 = 35 y13 = 70

y21 = 75 y22 = 50 y23 = 75

y31 = 60 y31 = 60 y33 = 75

y41 = 65 y42 = 40 y43 = 45

a. Formulieren Sie die Null- und die Alternativhypothese für eine ANOVA

b. Berechnen Sie die Quadrat-summen (total, within, between)

c. Berechnen Sie die mittleren Quadratsummen (…)

d. Berechnen Sie den empirischen F-Wert

e. Geben Sie den kritischen F-Wert an (-> 4,26)

f. Entscheiden Sie sich für eine der Hypothesen

Page 54: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Lösung (a)

H0: µa = µb = µc oder…

H0: Die Lesekompetenz unterscheidet sich nicht

H1: µi ≠ µj für mindestens ein Paar i,j oder…

H1: Die Lesekompetenz unterscheidet sich zwischen mindestens zwei Ländern

Page 55: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Lösung (b)

MA = 70; MB = 46,25; MC = 66,25

Mges = 60,83

SStotal = 2541,67

SSwithin = 1237,5

SSbetween = 1304,17

p

jjjbetween yynSS

1

2

n

i

p

jjijwithin yySS

1 1

2

n

i

p

jijtotal yySS

1 1

2

Page 56: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Lösung (c)

MStotal = 2541,67 : 11 = 231,06

MSwithin = 1237,5 : 9 = 137,5

MSbetween = 1304,17 : 2 = 625,08

11 pnNdftotal

Page 57: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Lösung (d,e,f)

d. Femp (2, 9) = 625,8 : 137,5 = 4,74

e. Fkrit (2, 9) = 4,26; α = .05

f. Da Femp > Fkrit gilt die H1

2

2

, ˆ

ˆ

innerhalb

zwischendfdf innerhalbzwischen

F

Page 58: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Arbeitsblatt Aufgabe 3

Berechnen Sie den Levene-Test für die Daten aus Aufgabe 1

Land A Land B Land C

y11 = 80 y12 = 35 y13 = 70

y21 = 75 y22 = 50 y23 = 75

y31 = 60 y31 = 60 y33 = 75

y41 = 65 y42 = 40 y43 = 45

Page 59: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Lösung

Land A Land B Land C

d11 = 10 d12 = 11,25 d13 = 3,75

d21 = 5 d22 = 3,75 d23 = 8,75

d31 = 10 d31 = 13,75 d33 = 8,75

d41 = 5 d42 = 6,25 d43 = 21,25

MA = 7,5; MB = 8,75; MC = 10,63

Mges = 8,96

Page 60: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Lösung 2

SStotal = 274,88SSwithin = 254,69SSbetween = 19,79

MStotal = 24,95MSwithin = 28,3MSbetween = 9,9

Page 61: Tutorat Statistik II im SS 09 einfaktorielle Varianzanalyse ch-langrock@t-online.de

Lösung 3

o Femp (2, 9) = 0,35

o Fkrit (2, 9) = 4,26; α = .05

Da Femp < Fkrit gilt die H0, die Annahme der Varianzhomogenität ist nicht verletzt