55
Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: „ Berufs Dozent: Dipl.Soz. Mike Kühne Referenten: Bianka Gäbler, Alexandra Mende Dresden, 15. Mai 2007 VARIANZANALYSE

Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

Embed Size (px)

Citation preview

Page 1: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

Technische Universität DresdenPhilosophische FakultätInstitut für SoziologieSS 2007Forschungsseminar: „ BerufsDozent: Dipl.Soz. Mike KühneReferenten: Bianka Gäbler, Alexandra Mende Dresden, 15. Mai 2007

VARIANZANALYSE

Page 2: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

Gliederung

1. Einführung

2. Anwendungsvoraussetzungen und –empfehlungen

3. Einfaktorielle Varianzanalyse

4. Zweifaktorielle Varianzanalyse

5. Erweiterungen der Varianzanalyse

Page 3: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

1. Einführung

Die Varianzanalyse untersucht die Wirkung, aber nicht die Stärke,

ein (oder mehrerer) unabhängiger Variablen auf ein (oder mehrerer)

abhängiger Variablen.

Unabhängige Variable muss mindestens nominal skaliert sein.

Abhängige Variable muss metrisch sein.

Unabhängige Variablen = Faktoren Ausprägungen der unabhängigen Variablen = Faktorstufen

Page 4: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

Mehrdimensionale Varianzanayse

Ein oder mehrereMindestens 2

usw.

Dreifaktorielle Varianzanalyse31

Zweifaktorielle Varianzanalyse21

Einfaktorielle Varianzanalyse11

Bezeichnung des Verfahrens

Zahl der unabhängigen

Variablen

Zahl der abhängigen Variablen

1. Einführung

Page 5: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

1. Einführung

Wichtigstes Analyseverfahren zur Auswertung von Experimenten

Beispiele:

- Einfluss unterschiedlicher Diäten auf das Körpergewicht

- Einfluss unterschiedlicher Düngemittel auf Ernteertrag

- Bei Experimenten: Vergleiche von Experimental- und Kontrollgruppen

Page 6: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

2. Anwendungsvoraussetzungen und- empfehlungen

Daten mit bestimmten Skalenniveau

Normalverteilung

Varianzhomogenität, d.h. die Varianz der Beobachtungswerte ist

annähernd gleich.

Theoretische Frage, die durch die Varianzanalyse beantwortet

werden soll, darf sich nicht erst aus den Daten ergeben.

Page 7: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

2. Anwendungsvoraussetzungen und- empfehlungen

Stichprobe sollte Grundgesamtheit repräsentieren.

Additivität, d.h. Einfluss der unabhängigen Variable auf die

Ergebnisvariable ist unabhängig von dem Einfluss einer

Störvariablen auf die Ergebnisvariable.

Die Faktoren müssen verschieden sein.

Page 8: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse3. Einfaktorielle Varianzanalyse

Beispiel:

Wie wirkt sich die Anzahl der Praktika auf das Einkommen der ersten

Tätigkeit nach dem Studium aus? Studiengänge: WiWi, Masch, EW

(Verwendung des „Hochschulgesamtdatensatzes_2003-

2004pur.sav“)1 unabhängige Variable (=Faktor)

Anzahl der Praktika gruppiert

3 Stufen:

- kein Praktikum

- 1 - 2 Praktika

- 3 – 5 Praktika

-

1 abhängige Variable

Höhe des Einkommens der ersten Tätigkeit

Page 9: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse

Kolmogorov-Smirnov-Anpassungstest

375

2069,21

1130,839

,048

,048

-,034

,922

,363

N

Mittelwert

Standardabweichung

Parameter derNormalverteilung

a,b

Absolut

Positiv

Negativ

Extremste Differenzen

Kolmogorov-Smirnov-Z

Asymptotische Signifikanz (2-seitig)

Einkommender erstenTätigkeit in

Euro

Die zu testende Verteilung ist eine Normalverteilung.a.

Aus den Daten berechnet.b.

0,363 > 0,05

Normalverteilung

Page 10: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse

Test der Homogenität der Varianzen

Einkommen der ersten Tätigkeit in Euro

2,617 2 349 ,074

Levene-Statistik df1 df2 Signifikanz

0,074 > 0,05

Page 11: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse

Bericht

Einkommen der ersten Tätigkeit in Euro

2348,81 183 1182,442

1630,01 138 961,635

2423,00 31 1036,946

2073,54 352 1142,563

praktikumgrkein Praktikum

1-2 Praktika

3-5 Praktika

Insgesamt

Mittelwert NStandardabweichung

€2.073,54y

€2.423,00y

€1.630,01y

€2.348,81y

3

2

1

kein Praktikum:

1-2 Praktika:

3-5 Praktika:

Gesamtmittelwert:

Mittelwerte

Page 12: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse

Page 13: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse

Sind die Unterschiede der Einkommensmittelwerte auf die

Anzahl der Praktika zurückzuführen?

Es gibt Unterschiede zwischen den Mittelwerten, d.h. es gibt

einen Einfluss der Anzahl der Praktika auf das Einkommen

ABER: Die von den Absolventen angegebenen Werte (=

Beobachtungswerte) streuen um die Mittelwerte der Faktoren

-> Diese Streuung ist auf andere Einflüsse nicht auf die Anzahl der

Praktika zurückzuführen.

Page 14: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse

Anzahl der Praktika

2.423,00

1 - 2 3 - 5

nicht erklärte Abweichung

erklärte Abweichung

nicht erklärte Abweichung

erklärte Abweichung

Einkommen in €

2.073,54

1.630,01

y

2y

3y

2ky

3ky

gk

g

y

y …Mittelwert der Beobachtungswerte einer Faktorstufe (g); In der Grafik sind die Mittelwerte der Stufen 2 und 3 angegeben

…Beobachtungswert; g= Faktorstufe, k= Nummer des Beobachtungswert innerhalb der Faktorstufe

Page 15: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse

Grundlage des Verfahrens ist die Zerlegung der Gesamtvarianz

in eine Varianz innerhalb der Gruppen und in eine Varianz

zwischen den Gruppen

Gesamtabweichung = Erklärte Abweichung + Nicht erklärte Abweichung

Summe der quad-rierten Gesamt-abweichungen

Summe der quad-rierten Abweichungen zwischen den Faktor-stufen

Summe der quadrierten Abweichungen innerhalb der Faktorstufen

w(ithin)b(etween)t(otal)

2ggk

K

1k

G

1g

2g

G

1g

2gk

K

1k

G

11kg

SSSSSS

)y(y)yyK()y(y

Page 16: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse

ONEWAY ANOVA

Einkommen der ersten Tätigkeit in Euro

4E+007 2 22399443 18,909 ,000

4E+008 349 1184568,5

5E+008 351

Zwischen den Gruppen

Innerhalb der Gruppen

Gesamt

Quadratsumme df

Mittel derQuadrate F Signifikanz

Zwischen den Gruppen: 44798886,31 =

Innerhalb der Gruppen: 413414411,68 =

Gesamt: 458213297,99 =

Abweichungsquadrate

t

w

b

SS

SS

SS

Page 17: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse

ONEWAY ANOVA

Einkommen der ersten Tätigkeit in Euro

4E+007 2 22399443 18,909 ,000

4E+008 349 1184568,5

5E+008 351

Zwischen den Gruppen

Innerhalb der Gruppen

Gesamt

Quadratsumme df

Mittel derQuadrate F Signifikanz

Freiheitsgrade: Zwischen: k – 1 hier: 3 – 1 =Innerhalb: n – k hier: 351 – 3 = W

b

df

df

Page 18: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse

ONEWAY ANOVA

Einkommen der ersten Tätigkeit in Euro

4E+007 2 22399443 18,909 ,000

4E+008 349 1184568,5

5E+008 351

Zwischen den Gruppen

Innerhalb der Gruppen

Gesamt

Quadratsumme df

Mittel derQuadrate F Signifikanz

Bestimmung der Mittel der Quadrate:

w

ww

b

bb

df

SSMS

df

SSMS

1184568,52349

68413414411,

622399443,12

144798886,3

Page 19: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse

ONEWAY ANOVA

Einkommen der ersten Tätigkeit in Euro

4E+007 2 22399443 18,909 ,000

4E+008 349 1184568,5

5E+008 351

Zwischen den Gruppen

Innerhalb der Gruppen

Gesamt

Quadratsumme df

Mittel derQuadrate F Signifikanz

Der empirische F-Wert

18,909MS

MSF

w

bemp

Page 20: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse

Prüfung der statistischen Unabhängigkeit

0Wertαeinmindestens:H

0αααH

εαμy

1

3210

gkggk

:

In Worten: Nullhypothese: bezüglich des Einkommens bestehen keine Unter-

schiede in der Wirkung durch die Anzahl der Praktika Alternativhypothese: Unterschiede sind vorhanden

Die Prüfung erfolgt nun anhand des Vergleichs von empirischen mit dem theoretischen F-Wert. Der theoretische F-Wert ist abzulesen in der F-Werte-Tabelle für das jeweilige Signifikanzniveau (Im Beispiel stets 5 %), mit Hilfe der Freiheitsgrade.

Page 21: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse

Prüfung der statistischen Unabhängigkeit

theoemp FF -> Nullhypothese wird verworfen

Im Beispiel wird die Nullhypothese auch verworfen, d.h. die Anzahl der Praktika haben einen unterschiedlichen Einfluss auf das Einkommen.

Bei SPSS ist diese aufwendige Berechnung unnötig, da hier automatisch die Prüfung der statistischen Unabhängigkeit erfolgt.

0,000 < 0,05 -> Nullhypothese wird verworfen

Page 22: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse

Da die Nullhypothese verworfen wurde und sich das Einkommen signifikant hinsichtlich der Mittelwerte der Anzahl der Praktika unterscheidet, stellt sich nun die Frage:

Welche von den Mittelwerten sich paarweise voneinander unterscheiden?Bzw.

Welche Anzahl von Praktika ist für diese Signifikanz verantwortlich?

Dazu verwendet man Post-hoc-Tests.

Page 23: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse

Post-hoc-Test

SPSS bietet verschiedene Tests an

Im Folgenden soll der Scheffé -Test angewendet werden:

Mehrfachvergleiche

Abhängige Variable: Einkommen der ersten Tätigkeit in Euro

Scheffé-Prozedur

718,794* 122,706 ,000 417,15 1020,44

-74,191 211,388 ,940 -593,84 445,46

-718,794* 122,706 ,000 -1020,44 -417,15

-792,986* 216,323 ,001 -1324,77 -261,20

74,191 211,388 ,940 -445,46 593,84

792,986* 216,323 ,001 261,20 1324,77

(J) praktikumgr1-2 Praktika

3-5 Praktika

kein Praktikum

3-5 Praktika

kein Praktikum

1-2 Praktika

(I) praktikumgrkein Praktikum

1-2 Praktika

3-5 Praktika

MittlereDifferenz (I-J)

Standardfehler Signifikanz Untergrenze Obergrenze

95%-Konfidenzintervall

Die Differenz der Mittelwerte ist auf dem Niveau .05 signifikant.*.

Page 24: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

3. Einfaktorielle Varianzanalyse

Post-hoc-Test

Nur die Gruppe „1 - 2 Praktika“ unterscheidet sich signifikant von den anderen Gruppen

Die Abweichung zwischen den Gruppen „Kein Praktikum“ und „3 - 5 Praktika“ ist nicht signifikant -> offenbar zufällige Abweichungen

Page 25: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4. Zweifaktorielle Varianzanalyse4.1. Problemformulierung

Überprüfung, wie eine abhängige Variable von 2 unabhängigen Variablen ( = Faktoren) beeinflusst wird

Varianzanalyse lässt sich auch mit 2 oder mehr Faktoren und einer metrischen abhängigen Variable durchführen

Untersuchungsanordnung heißt faktorielles Design

Faktor „A“ hat G Stufen und „B“ hat H Stufen insgesamt ergeben sich G x H Faktorstufenkombinationen

zweifaktorielle Varianzanalyse erlaubt die Erfassung des gleichzeitigen Wirksamwerdens zweier Faktoren, indem das Vorliegen von Wechselwirkungen (Interaktionen) getestet wird

Page 26: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4.2. Analyse der Abweichungsquadrate

Gesamtstreuung (SSt)

Streuung zwischen Streuung innerhalb der

den Gruppen (SSb) Gruppen (SSw)

Streuung durch Streuung durch Streuung durch

Faktor A (SSA) Faktor B (SSB) Wechselwirkung

von A und B (SSAxB)

Page 27: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4.2. Analyse der Abweichungsquadrate

daraus folgt:

SSt = SSb + SSw

SSb = SSA + SSB + SSAxB

SSt = SSA + SSB + SSAxB + SSw

Page 28: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4.2. Analyse der Abweichungsquadrate

kombinierte Wirkung der Faktoren auf 1 Zelle setzt sich zusammen aus Gesamtmittelwert μ Wirkung αg Wirkung βh Interaktionswirkung (αβ)gh

yghk = μ + αg + βh + (αβ)gh + εghk yghk = Beobachtungswert μ = Mittelwert der Grundgesamtheit αg = tatsächlicher Einfluss des Faktors A βh = tatsächlicher Einfluss des Faktors B (αβ)gh = tatsächlicher Interaktionseffekt zwischen der g-ten Stufe von α und der h-ten Stufe von β εghk = Zufallseffekt durch nicht im Experiment kontrollierte Einflüsse

Page 29: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4.2. Analyse der Abweichungsquadrate

Gesamtstreuung:

um Einfluss der verschiednen Objekte zu überprüfen, zerlegen wir die Gesamtstreuung in die durch die jeweiligen Effekte erklärte Streuung und die nicht erklärte Reststreuung

G H K _

SSt = ∑ ∑ ∑ (yghk – y)² g=1 h=1 k=1

Page 30: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4.2. Analyse der Abweichungsquadrate

Quadratsummen der Haupteffekte:

die isolierten Effekte von Faktor A und B, die man auch als Haupteffekte bezeichnet, errechnen sich aus den Abweichungen des Zeilen- bzw. Spaltenmittel vom Gesamtmittel

G _ _ SSA = H * K * ∑ (yg – y)² g=1

H _ _ SSB = G * K * ∑ (yh – y)² h=1

G = Zahl der Ausprägungen des Faktors A H = Zahl der Ausprägungen des Faktors B K = Zahl der Elemente in Zelle (g, h) yg = Zeilenmittelwert yh = Spaltenmittelwert

Page 31: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4.2. Analyse der Abweichungsquadrate

Interaktionseffekt: G H _ ^

SSAxB = K * ∑ ∑ (ygh – ygh)² g=1 h=1

K = Zahl der Elemente in Zelle (g, h) G = Zahl der Ausprägungen des Faktors A H = Zahl der Ausprägungen des Faktors B ygh = Mittelwert in Zelle (g, h) (Schätzwert mit Interaktion)

^

ygh = Schätzwert (ohne Interaktion) für Zelle (g,h)

^

Schätzwert ygh ist der Wert, der für die Zelle (g,h) zu erwarten wäre, wenn keine Interaktion vorläge ^ _ _ _

ygh = yg + yh - y Abweichung des tatsächlich beobachteten Mittelwertes von diesem

^

Schätzwert ygh ergibt ein Maß für den Interaktionseffekt

Page 32: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4.2. Analyse der Abweichungsquadrate

Reststreuung:

„Streuung innerhalb der Zellen“

G H K _

SSw = ∑ ∑ ∑ (yghk – ygh)²

g=1 h=1 k=1

Page 33: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4.2. Analyse der Abweichungsquadrate

Freiheitsgrade: (= die um 1 verminderte Anzahl der Faktorstufen)

dfA = G – 1

dfB = H – 1

dfAxB = (G – 1) (H – 1)

dfw = G * H * (K – 1)

dft = G * H * K – 1

dfb = G * H – 1

dft = dfA + dfB + dfAxB + dfw

Page 34: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4.2. Analyse der Abweichungsquadrate

Varianzschätzungen:

Quadratsummen durch Freiheitsgrade dividieren

σ A² = SSA

dfA

bei σ B², σ W² usw. analog

Page 35: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

35

Tests der Zwischensubjekteffekte

Abhängige Variable: Einkommen der ersten Tätigkeit in Euro

82687991,428a 5 16537598 15,237 ,000

323298816,4 1 3,2E+008 297,880 ,000

1692344,008 2 846172,00 ,780 ,459

9461207,013 2 4730603,5 4,359 ,014

197229,283 1 197229,28 ,182 ,670

375525306,6 346 1085333,3

1971665135 352

458213298,0 351

QuelleKorrigiertes Modell

Konstanter Term

praktikumgr

fachricneu

praktikumgr * fachricneu

Fehler

Gesamt

KorrigierteGesamtvariation

Quadratsumme vom Typ III df

Mittel derQuadrate F Signifikanz

R-Quadrat = ,180 (korrigiertes R-Quadrat = ,169)a.

Page 36: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

36

Levene-Test auf Gleichheit der Fehlervarianzena

Abhängige Variable: Einkommen der ersten Tätigkeit in Euro

3,850 5 346 ,002F df1 df2 Signifikanz

Prüft die Nullhypothese, daß die Fehlervarianz der abhängigenVariablen über Gruppen hinweg gleich ist.

Design: Intercept+praktikumgr+fachricneu+praktikumgr* fachricneu

a.

Page 37: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4.3. Prüfung der statistischen Unabhängigkeit

Hypothesen zweifaktorielle Varianzanalyse überprüft 3 verschiedene Nullhypothesen: - die unter den Stufen des Faktors A beobachteten Untersuchungseinheiten gehören Grundgesamtheiten mit den gleichen Mittelwerten an (Ho: μ1 = μ2 = … = μg) - die unter den Stufen des Faktors B beobachteten Untersuchungseinheiten gehören Grundgesamtheiten mit den gleichen Mittelwerten an (Ho: μ1 = μ2 = … = μh) - die Zellenmittelwerte der Faktorstufenkombinationen μgh setzen sich additiv aus den Haupteffekten zusammen (Ho: μgh = μg + μh - μ) oder kurz. zwischen den beiden Faktoren besteht keine Interaktion Nullhypothese: Es gibt keinen Unterschied in den Mittelwerten der Faktor- bzw. Interaktionsstufen

Alternativhypothese H1: Mittelwerte nicht gleich

Page 38: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4.3. Prüfung der statistischen Unabhängigkeit

Signifikanztests:

Nullhypothesen werden geprüft, indem die Varianzen durch die Fehlervarianz geteilt wird und so die F – Werte ermittelt werden

ist empirischer F – Wert größer als kritischer wird Nullhypothese

auf dem 1 oder 5% - Niveau verworfen _ _ σ A² = ∑ (yg - y)² / (G – 1) FA = σ A² / σ w² FB und FAxB analog

kritischer F – Wert: kann einer Tabelle entnommen werden

Page 39: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4.3. Prüfung der statistischen Unabhängigkeit

Varianzaufklärung:

Ermittlung des prozentualen Anteils der Variation in der abhängigen Variablen der auf die beiden Haupteffekte und die Interaktion zurückgeführt werden kann

Faktor A: η = SSA / SSt * 100%

analog für B und AxB

Page 40: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4.4. Post – hoc – Test

Welche Faktorstufen unterscheiden sich im Fall einer signifikanten Wirkung des Faktors (z.B. A) im Einzelnen voneinander?

z.B.: mit Scheffé – Test

Page 41: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

41

Mehrfachvergleiche

Abhängige Variable: Einkommen der ersten Tätigkeit in Euro

Scheffé

718,79* 117,454 ,000 430,05 1007,54

-74,19 202,340 ,935 -571,62 423,24

-718,79* 117,454 ,000 -1007,54 -430,05

-792,99* 207,064 ,001 -1302,03 -283,94

74,19 202,340 ,935 -423,24 571,62

792,99* 207,064 ,001 283,94 1302,03

(J) praktikumgr1-2 Praktika

3-5 Praktika

kein Praktikum

3-5 Praktika

kein Praktikum

1-2 Praktika

(I) praktikumgrkein Praktikum

1-2 Praktika

3-5 Praktika

MittlereDifferenz (I-J)

Standardfehler Signifikanz Untergrenze Obergrenze

95% Konfidenzintervall

Basiert auf beobachteten Mittelwerten.

Die mittlere Differenz ist auf der Stufe ,05 signifikant.*.

Page 42: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

42

Mehrfachvergleiche

Abhängige Variable: Einkommen der ersten Tätigkeit in Euro

Scheffé

-10,96 134,495 ,997 -341,60 319,68

1069,99* 150,370 ,000 700,32 1439,66

10,96 134,495 ,997 -319,68 341,60

1080,95* 134,495 ,000 750,31 1411,59

-1069,99* 150,370 ,000 -1439,66 -700,32

-1080,95* 134,495 ,000 -1411,59 -750,31

(J) FachrichtungneuWirtschaftwissenschaften

Erziehungswissenschaften

Maschinenbau

Erziehungswissenschaften

Maschinenbau

Wirtschaftwissenschaften

(I) FachrichtungneuMaschinenbau

Wirtschaftwissenschaften

Erziehungswissenschaften

MittlereDifferenz (I-J)

Standardfehler Signifikanz Untergrenze Obergrenze

95% Konfidenzintervall

Basiert auf beobachteten Mittelwerten.

Die mittlere Differenz ist auf der Stufe ,05 signifikant.*.

Page 43: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4.5. Grafische Analyse

Ordinale Interaktionen

beide Haupteffekte eindeutiginterpretierbar

a1 a2

b1

b2

b1 b2

a2

a1

Page 44: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4.5. Grafische Analyse

Hybride Interaktionen

Haupteffekt B ist eindeutig interpretierbar; Faktor A sollte nicht interpretiert werden

b1

b2

a1

a2

a1 a2 b1 b2

Page 45: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

4.5. Grafische Analyse

Disordinale Interaktionen

beide Haupteffekte für sich inhaltlich bedeutungslos; Unterschiede zwischen a1 und a2 nur in Verbindung mit den Stufen des Faktors B und Unterschiede zwischen b1 und b2 nur in Verbindung mit den Stufen des Faktors A interpretierbar

b1

b2

b1 b2

a1

a2

a1 a2

Page 46: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

46

Page 47: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

47

Page 48: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

5. Ausgewählte Erweiterungen der Varianzanalyse

1.) Ungleich besetzte Zellen

am Prinzip der Streuungszerlegung ändert sich nichts

Gewichtung der einzelnen Beobachtungswerte!

bei ungleichen Zellenumfängen: Schätzung des harmonischen Mittels aller Zellenumfänge oder allgemeines lineares Modell verwenden

Page 49: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

5. Ausgewählte Erweiterungen der Varianzanalyse

2.) Mehrere Faktoren

Einbeziehung von mehr als zwei Faktoren in die Analyse

dreifaktorielle Varianzanalyse: keine Unterschiede zur zweifaktoriellen Varianzanalyse

Aber: zwei Ebenen verschiedener Wechselwirkungen möglich es gibt Wechselwirkungen zwischen jeweils 2 Faktoren und zusätzlich zwischen allen 3 Faktoren

Page 50: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

5. Ausgewählte Erweiterungen der Varianzanalyse

3.) Multiple Tests

mit multiplen Tests man erhält Auskunft darüber, welche Faktorstufen voneinander abweichen, wenn man mittels F – Tests die Nullhypothese ablehnt

Vergleich einzelner Paare von Mittelwerten oder linearen Kombinationen von Mittelwerten möglich

Page 51: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

5. Ausgewählte Erweiterungen der Varianzanalyse

4.) Unvollständige Versuchspläne

z.B. durch fehlende Werte

nicht alle Zellen besetzt:

bestimmte Vorkehrungen hinsichtlich

der Versuchsanordnung und –

auswertung sind zu treffen

Page 52: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

5. Ausgewählte Erweiterungen der Varianzanalyse

5.) Kovarianzanalyse

Kovariate = metrisch skalierte unabhängige, d.h. erklärende Variable in einem faktoriellen Design

außer den Faktoren gibt es auch Einflussgrößen auf die abhängige Variable, deren Einbeziehung notwendig sein kann

Teil der Gesamtvarianz kann möglicherweise auf die Kovariate zurückgeführt werden

bei Nichterfassung würde sich das zu einer erhöhten Reststreuung führen Vorgehen: zuerst wird der auf die Kovariaten entfallende Varianzteil ermittelt Beobachtungswerte der abhängigen Variablen werden um den durch

die Regressionsanalyse ermittelten Einfluss korrigiert und anschließend der Varianzanalyse unterzogen

dadurch wird rechnerisch der Einfluss der Kovariaten bereinigt

Page 53: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

5. Ausgewählte Erweiterungen der Varianzanalyse

6.) Mehrdimensionale Varianzanalyse

erlaubt Design mit mehr als einer abhängigen Variablen und mehreren Faktoren und Kovariaten

Analyse führt zu allgemeinen linearen Modelansatz, der verschiedene multivariate Verfahren (Varianz-, Regressionsanalyse usw.) auf ihren gemeinsamen Kern

zurückführt

Page 54: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

5. Ausgewählte Erweiterungen der Varianzanalyse

7.) Multiple Classifikation Analysis (MCA)

versucht die Stärke des Einflusses der Haupteffekte zu schätzen Varianzanalyse stellt fest, ob ein Unterschied in den

Einflussstärken der Faktorstufen eines Faktors vorliegt, macht aber keine Aussage über die Stärke der einzelnen Faktorstufen

MCA errechnet Abweichungen der Gruppenmittelwerte vom Gesamtmittelwert und vermittelt so einen Hinweis auf die Stärke der Wirkung

Page 55: Technische Universität Dresden Philosophische Fakultät Institut für Soziologie SS 2007 Forschungsseminar: Berufs Dozent: Dipl.Soz. Mike Kühne Referenten:

Quellen

Backhaus, Klaus u.a. (2003): Multivriate Analysemethoden. Eine Anwendungsorientierte Einführung. 10. überarb. Aufl. Berlin Springer Verlag

Brosius, Felix (1998): SPSS 8: Professionelle Statistik unter Windows

http://www.statistik.wiso.uni-erlangen.de/ download/ Datenanalyse/Vorlesung%20WS0607/d2handout.pdf

Bortz, Jürgen (1999): Statistik für Sozialwissenschaftler, 5. überarb. Aufl., Springer Verlag Berlin

Zöfel, Peter (2002): Statistik verstehen. Ein Begleitbuch zur computergestützten Anwendung, Addison – Wesley Verlag München