Upload
leonore-radtke
View
105
Download
2
Embed Size (px)
Citation preview
Dr. Walter H. Schreiber
Quantitative Methoden IQuantitative Methoden I
Teil 2: Deskriptive StatistikII.C Lineare Korrelations- und Regressionsanalyse
bei zwei intervallskalierten Merkmalen
Vers. 1.0
2
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
MO DI KW
1 44
2 Einführung [W&N, Kap I]
Messtheorie[W&N, Kap II A; B&D Kap 2.3.6]
45
3 Eindimensionale Häufigkeitsverteilungen [W&N, Kap II B]
Eindimensionale Häufigkeitsverteilungen (Forts.)[W&N, Kap II B]
46
4 Eindimensionale Häufigkeitsverteilungen (Forts.)[W&N, Kap II B]
Eindimensionale Häufigkeitsverteilungen (Forts.)[W&N, Kap II B]
47
5 Lineare Korrelations- und Regressionsanalyse bei zwei intervallskalierten Merkmalen[W&N, Kap II C]
Lineare Korrelations- und Regressionsanalyse bei zwei intervallskalierten Merkmalen (Forts.)[W&N, Kap II C]
48
6 Lineare Korrelations- und Regressionsanalyse bei zwei intervallskalierten Merkmalen (Forts.)[W&N, Kap II C]
Multiple lineare Regression bei zwei Prädiktoren [W&N, Kap II E1-3]
49
7 Varianzanalyse[N&W II C]
Varianzanalyse[N&W II C]
50
8 VA: Beispiele [B&D, Kap 9.3.7] Klausur 51
3
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
II.C Lineare Korrelations- und RegressionsanalyseII.C Lineare Korrelations- und RegressionsanalyseZwei intervallskalierte MerkmaleZwei intervallskalierte Merkmale
1. Korrelation
2. Einfache lineare Regression
3. Korrelation und Kausalität
4. Partialkorrelation
Kapitel II.C.2.5 Der Standardschätzfehlerbehandeln wir in diesem Semester nicht
4
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
Beispiel Körpergröße von Vater und Sohn korrelieren hoch
positiv Wegen des o.a. Effekts sind Söhne in Bezug auf den
Mittelwert der Söhne kleiner als die Väter(ein Vater hat eine Größe 2SD über dem Mittelwert; sein Sohn ist mit großer Wahrscheinlichkeit kleiner als 2SD über dem M seiner Gruppe)
II.C.2.6 Der RegressionseffektII.C.2.6 Der Regressionseffekt
Je schwächer die Korrelation zwischen Prädiktor und Kriterium, desto geringer ist die Variabilität der vorhergesagten Kriteriumswerte im Vergleich zur Variabilität der gemessenen Kriteriumswerte Yi
iY
5
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
II.C.2.6 Der RegressionseffektII.C.2.6 Der Regressionseffekt
Je weiter die X-Werte von M(X) entfernt sind Je niedriger die Korrelation zwischen den beiden
Variablen ist.
Der Regressionseffekt ist umso größer:
Für Messwiederholungen gilt entsprechend: Je weiter die individuellen Ausgangswerte vom
Gruppenmittelwert der Erstmessung entfernt sind Je niedriger die Korrelation zwischen den beiden
Messwertreihen ist.
6
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
Regressionseffekt: GrafikRegressionseffekt: Grafik
Quelle: http://www.animatedsoftware.com/statglos/sgregmea.htm
7
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
Eine Korrelation zwischen zwei Variablen ist keine hinreichende Bedingung, um auf kausale Abhängigkeit oder auf eine bestimmte Art von kausaler Abhängigkeit schließen zu können.
II.C.3 Korrelation und KausalitätII.C.3 Korrelation und Kausalität
X Y
Y X
X
YZ
X YZX Y
Mögliche Wirkrichtungen von r≠0
8
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
Das Problem beschäftigt uns auch bei der Untersuchung von Veränderungshypothesen:
Extreme Pretestwerte haben die Tendenz, sich bei einer wiederholten Messung zur Mitte der Merkmalsverteilung hin zu verändern.
II.C.2.6 Der RegressionseffektII.C.2.6 Der Regressionseffekt
Vorsicht:„Will man die differentielle Wirkung eines Treatments an Extremgruppen überprüfen, muss mit Regressionseffekten gerechnet werden“ (Bortz & Döring, 2002, S. 557).
9
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
II.C Lineare Korrelations- und RegressionsanalyseII.C Lineare Korrelations- und RegressionsanalyseZwei intervallskalierte MerkmaleZwei intervallskalierte Merkmale
1. Korrelation
2. Einfache lineare Regression
3. Korrelation und Kausalität
4. Partialkorrelation
10
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
II.C.4 PartialkorrelationII.C.4 Partialkorrelation Die Partialkorrelation gibt an, wie
stark die Korrelation zwischen X und Y wäre, wenn sie von dem vermuteten erzeugenden Effekt von Z ‚bereinigt‘ wird bzw. wenn der vermutete Einfluss von Z nicht bestünde.
Z wird aus der Korrelation von X und Y herauspartialisiert.
11
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
II.C.4 PartialkorrelationII.C.4 Partialkorrelation
GROE_CM
20018016014012010080
MA
TH
E80
70
60
50
40
30
20
10
rGM = .84
12
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
Statistische Kontrolle: Beispiel 3Statistische Kontrolle: Beispiel 3
GROE_CM
20018016014012010080
MA
TH
E80
70
60
50
40
30
20
10
KLASSE
8
5
2
rGM.K = -.07
Alter
Größe
Mathe
13
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
PartialkorrelationPartialkorrelation
X
Y
X
Y
Z r XY.Z
. 2 21 1XY XZ YZ
XY Z
XZ YZ
r r rr
r r
14
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
II.E Das Modell der multiplen Regression...II.E Das Modell der multiplen Regression...
... Ist ein Modell, das die Beziehung aufdeckt zwischen
- einer abhängigen Variable Y und
- einer Gruppe unabhängiger Variablen
... Ist ein Modell, das die Partialbeziehung zwischen 2 Variablen bei Kontrolle der weiteren Variablen analysiert
15
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
Das Modell der multiplen RegressionDas Modell der multiplen Regression
Bivariate Regression
0 1( ) ( )E Y b b X= +
Multiple Regression
0 1 1 2 2( ) ( ) ( ) ( )k kE Y X X X= b + b + b + + bK
YX
YX2
X3
X1
16
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
Das Modell der multiplen RegressionDas Modell der multiplen Regression
Multiple Regression
0 1 1 2 2( ) ( ) ( )E Y X X= b + b + b
Gewicht X1
Fitness Y
Lungenvolumen X2
( ) 1 2( ) 1.8 0.24 ( ) 0.58( )E Y X X= - + - +
17
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
Das Modell der multiplen RegressionDas Modell der multiplen Regression
( ) 1 2( ) 1.8 0.24 ( ) 0.58( )E Y X X= - + - +
Gewicht X1
Fitness Y
Lungenvolumen X2
( ) ( )1 2
ˆ 0.5 0.7Y X XZ Z Z= - +
18
Dr. Walter H. Schreiber
Dr. Walter H. Schreiber
II.E.3 Determinationskoeffizient RII.E.3 Determinationskoeffizient R22
Der multiple Determinationskoeffizient R2 gibt an, wie viel Prozent der Varianz aufgrund der Regressionsgleichung erklärt werden können.
2,
2,
2. ,
.59
.59
.82
Fitness Gewicht
Fitness Lungenvolumen
Fitness Gewicht Lungenvolumen
r
r
R