61
Einführung in die Mehrebenenanalyse mit HLM 6 Einführung in die Mehrebenenanalyse mit HLM 6 AEPF/Universität Jena AEPF/Universität Jena 12 September 2010 12. September 2010 Jun Prof Dr phil Falk Radisch Jun.-Prof. Dr . phil. Falk Radisch

AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Embed Size (px)

Citation preview

Page 1: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Einführung in die Mehrebenenanalyse mit HLM 6Einführung in die Mehrebenenanalyse mit HLM 6

AEPF/Universität JenaAEPF/Universität Jena

12 September 201012. September 2010

Jun Prof Dr phil Falk RadischJun.-Prof. Dr. phil. Falk Radisch

Page 2: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Kontakt

Jun.-Prof. Dr. phil. Falk Radischp

di h@ i l [email protected]

+49 (0) 202.439-3192

Page 3: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Wichtige Literatur und Software

LiteraturDitton, H. (1998). Mehrebenenanalyse. Grundlagen und Anwendungen des Hierarchisch Linearen Modells. Weinheim: Juventa.Bryk, A. S. & Raudenbush, S. W. (1997). Hierarchical Linear Models. Applications and Data Analysis Methods. London: SAGE.Snijders, T. A. B.; Bosker, R. J. (1999): Multilevel Analysis. An introduction to basic and advanced multilevel modeling. London: SAGE.Engel, U. (1998). Einführung in die Mehrebenenanalyse. Grundlagen, Auswertungs‐verfahren und praktische Beispiele. Opladen: Westdeutscher Verlag.Goldstein, H. (1987). Multilevel Models in Educational and Social Research. Oxford: Oxford University Press.Hox, J. (1994). Applied Multilevel Analysis. Amsterdam: TT‐Publikaties.Hox, J. (1998). Multilevel modeling. When and why. In: Balderjahn, I; Mathar, R.; Schader, M. (Eds.). Classification, data analysis, and data highways. New Yorg. Springer. 147‐154Hox, J. (2002). Multilevel Analysis. Techniques and Applications. Mahwah: Erlbaum.Schwetz, H.; Subramanian, S. V. (2005): Einführung in die Mehrebenenanalyse mit MLWin. Von der Regressionsanalyse zum Random‐Slope‐Modell. Landau: Empirische Pädagogik e. V..

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 4: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Wichtige Literatur und Software

Software

HLM (aktuell Version 6.06) ‐ http://www.ssicentral.com/hlm/

MLWin (aktuell Version 2 02) http //wwwmlwin com/MLWin (aktuell Version 2.02) ‐ http://www.mlwin.com/

MPlus (aktuell Version 5) ‐ http://www.statmodel.com/

Statistikpakete wie SAS & SPSS enthalten in optionalen Erweiterungen ebenfalls Module für einfache ML‐Analyseny

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 5: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Gliederung

• Warum Mehrebenenanalysen?– Mögliche Problemlösungsstrategien und ihre Nachteile

• Exkurs: Einfache lineare Regression

• Das Grundprinzip der Mehrebenenanalyse

• Das Ebene 1 – Modell

• Vom Ebene 1 – Modell zum Ebene 2 – Modell

• Das Ebene 2 – Modell 

• Anforderungen an die Datensätze

k• Exkurs: Standardisierung 

• Exkurs: Cross‐Level Effekte/ Wechselwirkungen

E k D V i bl• Exkurs: Dummy‐Variable

• Arbeiten mit HLM

Üb f b• Übungsaufgaben

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 6: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Warum Mehrebenenanalysen?

Sozialwissenschaftliche, psychologische und speziell erziehungswissenschaftliche Daten haben häufig eine hierarchische/ verschachtelte Struktur („nested structure“).

Dies ist immer dann der Fall, wenn einzelne Untersuchungseinheiten eindeutig übergeordneten Gruppen angehören. Dabei sind diese Gruppen beobachtbar und klar definiertdefiniert.

Schüler Klassen Schulen

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 7: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Warum Mehrebenenanalysen?

Die eigentlich notwendige Unabhängigkeit der Beobachtungen ist in hierarchischen Datenstrukturen nicht erfüllt, da die untersuchten Individuen innerhalb der Gruppen oder Aggregateinheiten  gemeinsamen Einflüssen oder Erfahrungen unterliegen, die für die Einheiten eines Aggregats charakteristisch sind.

Schüler einer Schulklasse haben z.B. die gleichen Lehrer, eine bestimmte Art der Sozialbeziehungen miteinander usw Diese Merkmale“ unterscheiden sie gemeinsam vonSozialbeziehungen miteinander usw. Diese „Merkmale“ unterscheiden sie gemeinsam von Schülern anderer Klassen.

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 8: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Warum Mehrebenenanalysen?

Neben natürlichen Hierarchien“ (Schüler‐Klasse‐Schule) gibt es auch solche die durchNeben „natürlichen Hierarchien  (Schüler Klasse Schule) gibt es auch solche, die durch bestimmte Methoden der Datenerhebung oder der Stichprobenziehung entstehen:

Klumpenstichproben ganze Klassen Jahrgänge oder Schulen (Klumpen oder Cluster)Klumpenstichproben: ganze Klassen, Jahrgänge oder Schulen (Klumpen oder Cluster) werden als repräsentativ für die Grundgesamtheit untersucht. (Wiederspricht der Zufallsstichprobe, da nicht jeder Schüler einzeln zufällig gezogen wurde, sondern als Zugehöriger der zufällig gezogenen Klasse usw )Zugehöriger der zufällig gezogenen Klasse usw.).

Längsschnittdaten: Längsschnitte beinhalten ebenfalls eine hierarchische Struktur: Die b h h i k ( b ) i d d h di idBeobachtungen zu mehreren Zeitpunkten (Ebene 1) sind den untersuchten Individuen 

(Ebene 2) zuordenbar

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 9: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Warum Mehrebenenanalysen?

Was passiert, wenn die hierarchische Datenstruktur missachtet wird?

Analysen hierarchischer Daten unter Ignorierung ihrer Mehrebenenstruktur können zwarAnalysen hierarchischer Daten unter Ignorierung ihrer Mehrebenenstruktur können zwar interpretierbare und plausible Ergebnisse hervorbringen, sie führen aber fast unausweichlich zu teilweise gravierenden Fehlschlüssen und sind unter Umständen sogar völlig unbrauchbar!völlig unbrauchbar!

– Warum? –

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 10: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Warum Mehrebenenanalysen?

Ganz allgemein lässt sich sagen, dass Zusammenhänge zwischen den Variablen je Aggregateinheit unterschiedlich aussehen können („wirksame Klassen, nicht wirksame Klassen“). Das wird bei einer einfachen Regression über alle Individuen hinweg missachtet.

Schule 1 Schule 2 Schule 3

isei isei isei isei

Die „herkömmliche“ statistische Auswertung hierarchisch strukturierter Daten (z.B. Varianz‐ oder Regressionsanalysen) bietet 2 Möglichkeiten das Problem zu umgehen:

die Aggregierung von Individualdaten

Schulfreude Schulfreude Schulfreude Schulfreude

die Aggregierung von Individualdatendie Ergänzung von Individualdaten um Aggregatmerkmale

ABER: Ist das sinnvoll?

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 11: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Warum Mehrebenenanalysen?

Aggregation von Individualdaten?

Nach einer Aggregierung sind nur noch Aussagen auf der Gruppenebene (z.B. Schulklassen) möglich, nicht aber mehr auf der Ebene individueller Einheiten (z.B. Schüler). Viele Fragestellungen und Analysen verbieten sich somit von vornherein.

Aggregateinheiten werden irrtümlicherweise als homogen betrachtet.

Die Aggregation von Variablen führt gleichzeitig zu einem Verlust an Varianz, was eine Verringerung der Effektstärke zur Folge haben kann.

Je nach betrachteter Ebene wechselt die Bedeutung vieler Variablen. Schulklima –individuell = persönlich wahrgenommen und aggregiert = Merkmal der Schule. Der 

h l d B d t h lt k b i h d Eff kt i d hi dwechselnde Bedeutungsgehalt kann zu abweichenden Effekten in den verschiedenen Ebenen führen („aggregation bias“, „Robinson‐Effect“, „ökologischer Fehlschluss“).

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 12: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Warum Mehrebenenanalysen?

Die Level 1-Variablen werdenDie Zahl der Fälle wird auf die Anzahl der Level 2 Einheiten reduziert

Die Level 1-Variablen werden z.B. durch Mittelwertsbildung innerhalb der Level 2-2-Einheiten reduziertEinheiten aggregiert

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 13: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Robinson – Effekt/ ökologischer Fehlschluss:

Robinson präsentierte Anfang der 1950er Jahre aggregierte Daten, die den Zusammenhang zwischen dem Anteil an Farbigen und der Analphabetenrate in neun geographischenzwischen dem Anteil an Farbigen und der Analphabetenrate in neun geographischen Regionen der USA in den 1930er Jahren wiedergeben sollten:

Ökologische Korrelation (Korrellation der aggr. Variablen auf Regionalebene) = 0.95

Individual‐Korrelation (Korrelation der Variablen auf Personenebene) = 0.20

Es besteht die Gefahr eines ökologischen Fehlschlusses wenn aufgrund von Ergebnissen die anhand von Aggregateinheiten gewonnen wurden, auf Eigenschaften der Individuen in di A t i h it hl i ddiesen Aggregateinheiten geschlossen wird.

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 14: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Warum Mehrebenenanalysen?

Problemlösung – Disaggregation von Aggregatsmerkmalen?

Die Verwendung von Kontextvariablen auf Individualebene führt schon allein durch die künstlich „aufgeblähte“ Fallzahl der Kontextmerkmale zu signifikantenkünstlich „aufgeblähte  Fallzahl der Kontextmerkmale zu signifikanten Parameterschätzungen! – Denn:

Es kommt zu einer Überschätzung der statistischen Bedeutung der Kontextprädiktoren, da die Standardfehler ihrer Koeffizienten unterschätzt werden. 

Der Standardfehler ist u.a. eine Funktion der Stichprobengröße. Je größer das N einer Stichprobe, desto kleiner der Standardfehler. Der Standardfehler wiederum ist Grundlage der Signifikanztests (z.B. bei Regressionen).

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 15: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Warum Mehrebenenanalysen?

W t d L l 2 P ädiktLevel 1-PrädiktorWerte der Level 2-Prädiktoren sind innerhalb jeder Level 2-Einheit konstantEinheit konstant

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 16: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Warum Mehrebenenanalysen?

Fazit:

Die Aggregation von Individualmerkmalen oder die Disaggregation von Merkmalen der gg g gg gAggregatseinheiten:

• schränkt die Zuverlässigkeit statistischer Schlüsse ein• schränkt die Zuverlässigkeit statistischer Schlüsse ein • führt zu Problemen bei der inhaltlichen Interpretation von Ergebnissen

Aus diesem Grund sind Mehrebenenanalysen mit dem hierarchisch linearen Modell (HLM) dringend angeraten.

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 17: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Einfache lineare Regression

Die Regressionsanalyse dient der Untersuchung von Zusammenhängen zwischen einer abhängigen metrischen Variablen und einer (oder auch mehrerer) unabhängigen metrischen Variablen. 

Sie wird eingesetzt um:• Zusammenhänge zu erkennen und zu erklären• Zusammenhänge zu erkennen und zu erklären,• Werte der abhängigen Variablen zu schätzen bzw. zu prognostizieren.

Es wird davon ausgegangen dass der Zusammenhang zwischen beiden Variablen eineEs wird davon ausgegangen, dass der Zusammenhang zwischen beiden Variablen eine lineare Struktur aufweist. 

Linearität bedeutet dass sich die abhängige Variable Y (Kriterium) und die unabhängigeLinearität bedeutet, dass sich die abhängige Variable Y (Kriterium)  und die unabhängige Variable X (Prädiktor) nur in konstanten Relationen verändern:

constantX ΔYΔ

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 18: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Einfache lineare Regression

Notwendige Voraussetzungen an die Daten: mindestens intervall skaliertmindestens intervall skaliertAusnahme: Binäre/Dichotome Variablen mit nominalem/ordinalem Messniveau (0/1‐kodiert)

Beispielhypothese:Wenn der sozioökonomische Hintergrund der Schülerinnen und Schüler um eine 

d d b h h h d h l d h lbStandardabweichung höher ist, dann ist ihre Leseleistung um mindestens eine halbe Standardabweichung besser.

Kausalitätsannahme:Leseleistung hängt vom sozioökonomischen Hintergrund ab.

Abhängige Variable Unabhängige Variable

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 19: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Einfache lineare Regression

Der durchschnittliche Zusammenhang wird als lineare Funktion geschätzt. Die resultierende Gerade (Regressionsgerade) repräsentiert den optisch nachvollziehbaren Anstieg der Punktewolke. Eine derartige lineare Beziehung wird mathematisch durch die folgende Formel ausgedrückt:Formel ausgedrückt: 

1 Einheit

XββY 10

isei

Ziel der linearen Regression ist es, die P t hät d i h di

XββY 10

Parameter so zu schätzen, dass sich die Gerade der empirischen Punkteverteilung möglichst gut anpasst.

Dazu werden die Abweichungen der individuellen Werte von der Regressionsgeraden betrachtet.

SchulfreudeHLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 20: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Einfache lineare Regression

Die Regressionsgleichung erweitert sich demnach auf:

eXY 10

e Mathematisch entspricht die möglichst gute Anpassung der Regressionsgeraden an die

eXY 10

iseiAnpassung der Regressionsgeraden an die empirische Punktewolke der Minimierung der Summe dieser Residuen.

n

1i

210i

n

1i

2i )(ymin min!e ix

S h lf d

D.h. die Koeffizienten 0 und 1 sollen so gewählt werden, dass die Summe der

Schulfreude quadrierten Residuen minimiert wird. (Methode der kleinsten Fehlerquadrate –KFQ; Ordinary Least Squares – OLS).

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 21: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Einfache lineare Regression

Bedeutung des Fehlerterms/ Quellen des Fehlerterms:

• Theoretische Unterspezifizierung des Modells• Unverfügbare Daten• Intrinsische Zufallskomponente menschlichen Handelns• Sparsamkeit des Modells• Fehlspezifikation der funktionalen Form des ModellsFehlspezifikation der funktionalen Form des Modells 

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 22: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Einfache lineare Regression

Der Parameter b1 beschreibt die Veränderung in Y, wenn sich X1 um den Wert 1 verändert.

Sperrig UND bei mehr als einer unabhängigen Variable sind die Koeffizienten so nicht direkt vergleichbar.

Lösung: Standardisierung der Koeffizienten: XSD1** g g

Der standardisierte Koeffizient gibt an um wie viele Standardabweichungen sich YY

X

SD1*11

Der standardisierte Koeffizient gibt an, um wie viele Standardabweichungen sich Y verändert, wenn sich X1 um eine Standardabweichung ändert.

Immer unter Konstanthaltung aller anderen Prädikatoren/ Regressoren

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 23: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Einfache lineare Regression

Die Regressionsanalyse basiert auf mehreren Annahmen:

• A1: Linearität  → Alle Parameter (Zusammenhänge) sind linear

• A2: Im Mittel ist der Fehler „null“ → E (εi) = 0, für alle i

• A3: Homoskedastizität: – Die Varianz der Fehler ist konstant– Fehlerterme sind unabhängig von den UVs 

• A4: Keine Autokorrelation– Die Fehlerterme sind voneinander unabhängig; keine räumliche Abhängigkeit in der 

StichprobeStichprobe

• A5: Keine exakte Multikollinearität– Die UVs sind untereinander nicht exakt linear voneinander abhängigDie UVs sind untereinander nicht exakt linear voneinander abhängig

• A6: Normalverteilung– Die Fehlerterme sind normalverteilt, also zufälligDie Fehlerterme sind normalverteilt, also zufällig

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 24: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Einfache lineare Regression

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 25: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 26: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Einfache lineare Regression

Zusammenfassung

R i ibt A k ft üb di Stä k i Z hRegression gibt Auskunft über die Stärke eines Zusammenhangs.

Die Kausalität wird vorher festgelegt.

Allgemeine Formel mit einer unabhängigen Variable: 

Y=β0+ β1*X + eβ0 β1

X : unabhängige Variable

Y : abhängige VariableY : abhängige Variable

β0 : Konstante (gibt den um den Einfluss der unabhängigen Variablen korrigierten Mittelwert der abhängigen Variablen an)

β1: Regressionskoeffizient (gibt die Stärke des Einflusses der unabhängigen Variable auf die abhängige Variable an)

e: Residuume: Residuum

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 27: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Das Grundprinzip der Mehrebenenanalyse

Untersucht man hierarchische Daten, sind drei Arten von Effekten von Interesse:

• die Effekte individuumsbezogener Variablendie Effekte individuumsbezogener Variablen

• die Effekte von Aggregatmerkmalen

• Effekte die durch das Zusammenwirken von Individual‐ und Aggregatmerkmalen• Effekte, die durch das Zusammenwirken von Individual und Aggregatmerkmalenzustande kommen (sogenannte cross‐level‐Effekte). 

Kontextprädiktoren

AGGREGATEBENE

Kontextprädiktoren

Schul-/ Klassenmerkmale

INDVIDUALEBENE(Schüler)

(Schulen/ Klassen)Cross - Level - Effekt

Abhängige VariableIndividualprädiktoren

Individualmerkmale

(Schüler)

Individualmerkmale

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 28: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Das Grundprinzip der Mehrebenenanalyse

Grundlage ist die lineare Regression.

Mit der einfachen linearen Regression wird versucht, die Wirkung eines einzelnen Prädiktors vorherzusagen,

i110 eXββY

während die multiple Regression die Wirkung mehrerer Prädiktoren auf eine K i i i bl i iKriteriumsvariable prognostiziert.

ˆinn22110 eXβ...XβXββY

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 29: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Das Grundprinzip der Mehrebenenanalyse

Ziel der Regression ist es, möglichst viel der empirisch vorhandenen Varianz in der abhängigen Variablen zu erklären. 

Im hierarchisch linearen Modell wird die Varianz der abhängigen Variablen in zwei Komponenten zerlegt:

Varianz in der AV

V i i h lb d V i i h dVarianz innerhalb der Cluster (within units)

Varianz zwischen den Clustern (between units)

(Ebene 1 Modell) (Ebene 2 Modell)

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 30: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Das Ebene 1 - Modell

Das Modell der Ebene 1 (Individualebene) entspricht (für einen Prädiktor) dem Modell der einfachen Regression für jede Aggregateinheit. 

In Erweiterung zur „klassischen“ Regression sind die Koeffizienten jetzt doppelt indiziert. Dadurch wird angezeigt, dass es für jede Aggregateinheit j jeweils eine Konstante (intercept) und eine Steigung (slope) gibt.

XββY ijij1j0jij rXββY

Yij = tatsächlicher Wert der AV des Individuums i in der Aggregateinheit jXij = Wert des Ebene‐1Prädiktors für das Individuum i in der Aggr.einheit j0j = Konstante (Intercept) der Regressionsgleichung in der Aggr.einheit j1j = Steigung (Slope) des Ebene‐1 Prädiktors in der Aggregateinheit jr Fehler/ Residuum des Individuum i in der Aggregateinheit jrij = Fehler/ Residuum des Individuum i in der Aggregateinheit j

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 31: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Das Ebene 1 - Modell

Anmerkungen zum Interceptijij1j0jij rXββY

Der Intercept ist bekanntermaßen der Schnittpunkt der Regressionsgeraden mit der Y‐Achse. Er ist also der Wert, den die AV Yij annimmt, wenn alle Prädiktoren gleich Null sind.

Der Wertebereich der meisten Skalen reicht von 1 bis 4. Die errechneten Werte des Intercepts lassen sich also nicht interpretieren.

Um inhaltlich interpretierbare Werte zu erhalten, ist es daher meist sinnvoll, die Prädiktoren zu transformieren. äd to e u t a s o e e

Dies kann entweder im Vorfeld im Zuge der Datenvorbereitung mittels SPSS geschehen: Z‐Standardisierung der VariablenOd b b i d A f h d V i bl i di HLM Gl i h itt l d b idOder aber bei der Aufnahme der Variablen in die HLM‐Gleichung mittels der beiden Varianten: Zentrierung um den Gesamtmittelwert (grand mean centered); Zentrierung um den Gruppenmittelwert (group mean centered)

Achtung: Dadurch entstehen je unterschiedliche Aussagen, die mit der Konstante/dem Intercept möglich sind!

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 32: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Zentrierung

• Grand Mean Zentrierung (Xij – X..)

4,0,

3,5

3 03,0

2,5Gesamt-mittelwert

ters

tütz

ung 2,0

1,5

mpe

tenz

unt

1,0

,5

ID-Numer

110411031101

Kom

0,0

ID Numer

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 33: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Zentrierung

• Group Mean Zentrierung (Xij – X.j)4,0

3,5

3,0

g2,5

2 0

MW 1101MW 1103MW 1104

nter

stüt

zung 2,0

1,5

MW 1104m

pete

nzun 1,0

,5

ID-Numer

110411031101

Kom

0,0

u e

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 34: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Vom Ebene-1-Modell zum Ebene-2-Modell

Das Modell der Ebene 1 unterscheidet sich nur wenig von einer „klassischen einfachen linearen Regression“. 

• Es bewegt sich nur auf der Ebene der Individuen, die allerdings nicht insgesamt, sondern getrennt innerhalb der jeweiligen Aggregateinheiten betrachtet werden.

• Dadurch entsteht eine Vielzahl von Regressionskoeffizienten, was durch den Index j angezeigt wird. 

dl h l d l h• Letztendlich resultiert je ein intercept und slope je Aggregateinheit.

Mit dem Modell der Ebene 2 wird nun versucht, die Varianz in den ‐Koeffizienten durch M k l (W ) d A i h i kläMerkmale (Wj) der Aggregateinheiten zu erklären.

– Die ‐Koeffizienten werden nun die Abhängigen Variablen in den Gleichungen der M k bMakroebene.

– Demnach gibt es so viele Ebene 2‐Gleichungen wie die Ebene 1‐Gleichung Regressionskoeffizienten ‐ s ‐ enthältg

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 35: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Das Ebene-2-Modell

Beispiel:

Zusammenhang zwischen Lesekompetenz und Migration

Vorhersage des Intercepts aus Level 2-Variablen:

Hängt die Lesekompetenz von Grundschülerinnen und Grundschülern vom

uMigranteilγγβ

Hängt die Lesekompetenz von Grundschülerinnen und Grundschülern vom Migrantenanteil der Schulen ab?

ritsexβMigrββasrread01

0jj01000juMigranteilγγβ

ijij2jij1j0jijritsexβMigrββasrread01

uγβ uγβ 1j101j

uγβ Keine Vorhersage der Slopes aus Level 2-Variablen, aber die Slopes dürfen variieren.

2j202juγβ

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 36: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Das Ebene-2-Modell

ijij2jij1j0jij ritsexβMigrββasrread01

0jj01000j uanteilMigrγγβ 1j101j uγβ 2j202j uγβ

00 =  Gesamtmittelwert der Lesekompetenz von  männl. Kindern ohne Migrations‐status an Schulen mit mittl. Migrantenanteil (Migrantenanteil, “zentriert”=0)

01 =  mittl. Differenz im Niveau der Lesekompetenz bei 1% größerem Migrantenanteil01  p g g

10 =  mittlerer Kompetenzunterschied von männl. Schülern mit Migrationsstatus

20 =  mittlerer Kompetenzunterschied von weibl. Schülern ohne  Migrationsstatus

u0j =  Residuum: spezifischer Effekt der Schule j auf Niveau der Lesekompetenz

u1j =  Residuum: spezifischer Effekt der Schule j auf Zusammenhang zwischen  Migrationsstatus d L k tund Lesekompetenz

u2j =  Residuum: spezifischer Effekt der Schule j auf Zusammenhang zwischen  Geschlecht und Lesekompetenz

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 37: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Das zusammengesetzte Modell

Das Makromodell lässt sich in das Mikromodell einsetzen. Das zusammengesetzte Modell für je einen Prädiktor auf Individual‐ und Aggregatebene lautet:

00 = Gesamtmittelwert der AV wenn Ebene 1‐ & 2‐Prädiktor Null sind

ijij1j0jijj11ij10j0100ij rXuuXWγXγWγγY

00

01 = Haupteffekt des Level 2‐Prädiktors W auf den Gruppenmittelwert

10 = Haupteffekt des Level 1‐Prädiktors X über alle Gruppen hinweg

11 = Kombinierter Effekt von Ebene 1‐ & 2‐Prädiktoren („cross‐level‐effect“)

u0j+u1jXi+rij = Zufallsfehler e

Der Zufallsterm hat eine komplexere Form als im üblichen Regressionsmodell.Hier werden gruppenspezifische Fehlerkomponenten berücksichtigt.Die Komponenten u0j und u1j sind für die Schüler innerhalb einer Aggregateinheit (z.B. p 0j 1j  gg g (Klasse oder Schule) gleich, sie variieren aber zwischen den Aggregateinheiten.Heteroskedastizität: Residuum des Slopes ist abhängig von der Ausprägung des Prädiktors

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 38: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Parameter-Schätzung

Zwei Varianten in HLM:

Full Maximum‐Likelihood (FML)• ‐Parameter werden während der Schätzung als feste Größen angenommen  g g(Schätzung der Likelihood in Anhängigkeit von , 2 und );

• ermöglicht Modell‐Gütevergleich genesteter Modelle über Differenzen (2‐Verteilung).

Restricted Maximum‐Likelihood (RML)• realitätsnäher als FML, berücksichtigt die Stichproben‐abhängigkeit der ‐Parameter (Schätzung der Likelihood nur in Abhängigkeit von 2 und );

• in der Praxis sind Unterschiede der Level 1‐Schätzungen gering;• auf Level 2 um so bedeutendere Unterschiede (höhere Werte für qq), je geringer die Anzahl von Level 2‐Einheiten.

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 39: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Modellvoraussetzungen

Zwischen Prädiktoren und Kriteriumsvariable bestehen lineare Beziehungen.

llfük t t∆X q

Fehlerkomponenten der Ebene 1 dürfen nicht in einem systematischen Zusammenhang

qallefürkonstant,∆Y

q

p y gmit den Prädiktoren des Modells stehen.

qallefür0)rCOV(X ijij

Prädiktoren auf der Aggregatebene (Wj) sind unabhängig von den Fehlern (uqj).

q alle für 0,)r,COV(X ijqij

qjsjqjsj u und Walle für 0,)u,COV(W

Fehler des Individual‐ und Aggregatebenenmodells sind unabhängig voneinander.

qalle für 0,)u,COV(r qjij q,),( qjij

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 40: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Modellvoraussetzungen

Die Residuen (Fehler) auf der Individualebene rij haben einen Erwartungswert von 0 und eine Varianz von σ². 

Nach Kontrolle der Prädiktoren auf der Individualebene werden gleiche Fehlervarianzen σ²der Aggregateinheiten vorausgesetzt.

Die Residuen auf der Aggregatebene u0j und uqj sind unabhängig von den rij. Sie sind multivariat normalverteiltmit M = 0.

τ00 ist die Varianz der Intercepts (u0j) zwischen den Aggregateinheiten, τ11 ist die Varianz der Slopes u j zwischen den Aggregateinheiten τ01 ist die entsprechende KovarianzSlopes uqj zwischen den Aggregateinheiten, τ01 ist die entsprechende Kovarianz.Gemeinsam bilden sie die Varianz‐Kovarianz‐Matrix τ. τ darf sich zwischen den untersuchten Gruppen (z.B. Schulen mit und ohne GTS‐Angebot) nicht unterscheiden.Sie repräsentieren die nach Kontrolle von Wj verbleibende Variabilität in den KoeffizientenSie repräsentieren, die nach Kontrolle von Wj verbleibende Variabilität in den Koeffizienten 0j und 1j.

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 41: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Anforderungen an die Datensätze

Die verwendeten Prädiktoren müssen einen definierten Nullpunkt haben (ggf. muss dieser über Zentrierung oder Standardisierung gesetzt werden).

Stichprobengröße (vgl. auch Maas & Hox, 2005):• Die Anzahl der zu schätzenden Parameter darf die Anzahl der Ebene‐2‐Einheiten nicht überschreitenüberschreiten. 

• N=30 Ebene 2‐Einheiten, wenn Haupteffekte untersucht werden sollen• N=50 Ebene 2‐Einheiten, wenn Cross‐Level‐Effekte untersucht werden sollen• Mindestens 10 Fälle pro Aggregateinheit• Mindestens 10 Fälle pro Aggregateinheit

Auf Aggregatebene dürfen keine Missings in den Daten vorliegen. HLM übernimmt nurAuf Aggregatebene dürfen keine Missings in den Daten vorliegen. HLM übernimmt nur Aggregat‐Fälle, die in keiner verwendeten Variablen Missings („listwise“‐Fallausschluss) enthalten. (ggf. sind Missings vorab zu ersetzen).

•Individual‐ und Aggregatdaten müssen in 2 getrennten Datensätzen hinterlegt sein. In beiden muss eine ID‐Variable zur Identifikation der Zugehörigkeit zu den Aggregateinheiten enthalten sein.enthalten sein.

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 42: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Arbeiten mit HLM 6.06

Es gibt verschiedene Möglichkeiten, eine HLM‐Analyse zu planen und durchzuführen.

Eine bewährte Möglichkeit besteht darin, aufgrund einer konkreten Fragestellung schrittweise das HLM‐Modell aufzubauen.

Fragestellung: Beeinflusst der Migrantenanteil der Schulen die Lesekompetenz von Grundschülern zusätzlich zum individuellen EffektLesekompetenz von Grundschülern zusätzlich zum individuellen Effekt

des Migrationshintergrundes?

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 43: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Arbeiten mit HLM 6.06

Grundlage sind die Daten von PIRLS/IGLU2001 für Deutschland

Abrufbar unter: http://timss bc edu/pirls2001i/PIRLS2001 Pubs UG htmlAbrufbar unter: http://timss.bc.edu/pirls2001i/PIRLS2001_Pubs_UG.html

Vorgenommene Veränderungen am Datensatz:Vorgenommene Veränderungen am Datensatz:

1. Kürzung des Datensatzes auf 7.176 Schülerinnen und Schüler (ursprünglich 7633) in 197 Schulen (ursprünglich 211)) ( p g )

2. Reduzierung auf notwendige Variablen

Der Datensatz erlaubt keine belastbaren Schlüsse!

Er stellt nicht die ursprüngliche Datenbasis dar und erlaubt nicht die für belastbare Aussagen notwendigen Analysen! (Plausible Values, Gewichtung etc.)

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 44: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Arbeiten mit HLM 6.06

Vorbereitung der Daten 

Bevor Analysen mit HLM durchgeführt werden können, müssen die Daten meist mit SPSS oder äquivalenten Programmen vorbereitet werden.• StandardisierungStandardisierung• Umkodierung/Transformation/Dichotomisierung• AggregierungE f hl d W• Ersetzen fehlender Werte

Im Beispiel‐Datensatz sind folgende Schritte bereits vorgenommen:• Umkodierung (Dichotomisierung) des Migrationshintergrundes• Umkodierung des Geschlechts• Umkodierung des Geschlechts• Aggregierung des Migrantenanteils• z‐Standardisierung des Migrantenanteils auf Schulebene

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 45: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Arbeiten mit HLM 6.06

1. Programm öffnen2. Neuen MDM File erstellen mittels Import aus SPSS

a) Spezifieren um welches Modell es sich handeln soll (HLM2)a) Spezifieren, um welches Modell es sich handeln soll (HLM2)b) Datenstruktur beschreiben (persons within groups)c) Level-1-Datensatz laden (DatenDresden_L1.sav)d) Level-1-Variablen spezifizieren (idschool als „ID“, itsex, asrrea01, mig_dich,

girl als „in MDM“e) Vorhandene Missings und Umgang vereinbaren ( Yes“ und runninge) Vorhandene Missings und Umgang vereinbaren („Yes und „running

analyses“)f) Level-2-Datensatz laden (Daten Dresden_L2.sav)

) L l 2 V i bl ifi i (id h l l ID“ i t 1 l i MDM“)g) Level-2-Variablen spezifizieren (idschool als „ID“, mig_ant_1 als „in MDM“)h) MDM-Template speichern (als „hlm_dresden_Beispiel1“)i) MDM-File bezeichnen (als hlm_dresden_Beispiel1.mdm)) ( _ _ p )j) „Make MDM“ auslösenk) Deskriptive Statistiken prüfen („Check Stats“ auslösen)l) D “l) „Done“

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 46: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Arbeiten mit HLM 6.06

Jetzt ist HLM bereit, die Analysen mit den aufgenommenen Variablen durchzuführen

Prinzipiell empfiehlt sich immer ein schrittweises Vorgehen:

• Zunächst wird das sogenannte Null‐Modell (One‐Way‐ANOVA) berechnet, um festzustellen, ob überhaupt spezifische Varianz zwischen den Schulen hinsichtlich der Lesekompetenz vorhanden ist.

• Danach wird das Individualebenen‐Modell spezifiziert (Random‐Coefficient‐Model), um zunächst die Varianz auf der Individualebene zu erklären.

• Im dritten Schritt werden der Achsenabschnitt und die Steigungen des Individual‐modells zu abhängigen Variablen  auf der Gruppenebene (Intercepts‐and‐Slopes‐as‐Outcomes‐Model). Im Beispiel allerdings nur der Achsenabschnitt, um zu prüfen, ob die Lesekompetenz durch den Migrantenanteil der Schule beeinflusst wird.

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 47: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Arbeiten mit HLM 6.06

Berechnen einer HLM-ANOVA

1. Outcome-Variable spezifizieren (asrrea01)

2. „Basic Settings“ starten

a) „Title“ vereinbaren (HLM-DresdenBsp1_Anova)

b) Output file name vereinbaren (Pfad\hlm_dresdenbsp1_anova.txt)

c) „OK“) „

3. „Other Settings“ – „Estimation Settings“ – „Weighting“ vornehmen (wgtstdfi vereinbaren)

4. „Run Analysis“ – „Save and Run“ (hlm_dresdenbsp1_anova)

5. „File“ – „View Output“„ „ p

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 48: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Arbeiten mit HLM 6.06

Berechnen des ICC

Die Intra Class Correlation (Intraklassenkorrelationskoeffizent ICC) bezeichnet denDie Intra-Class-Correlation (Intraklassenkorrelationskoeffizent - ICC) bezeichnet den Anteil der Gesamtvarianz, der auf Unterschiede zwischen den Gruppen (im Beispiel zwischen Schulen) entfällt.

Berechnet wird er als Quotient der Varianzkomponenten von u0 und der Summe aus u0 und r:u0 und r:

1630467530 ,

uICC 1630633877467530

,,,

ru

ICC

!!!ACHTUNG!!! Die Berechnung von Varianzanteilen ist nur im Nullmodell zulässig!

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 49: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Arbeiten mit HLM 6.06

Berechnen eines HLM-Random-Coefficient-Model

1. Migrationsstatus (mig_dich) und Geschlecht (girl) als unabhängige Variablen vereinbaren (add variable uncentered)vereinbaren (add variable uncentered)

2. Fehlerterm für 1 und 2 aktivieren

3 Basic Settings“ starten3. „Basic Settings starten

a) „Title“ vereinbaren (HLM-DresdenBsp1_rcm)

b) Output file name vereinbaren (Pfad\hlm_dresdenbsp1_rcm.txt)

c) „OK“

4. „Run Analysis“ – „Save and Run“ („hlm_dresdenbsp1_rcm“)

5. „File“ – „View Output“

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 50: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Arbeiten mit HLM 6.06

Berechnen eines HLM-Intercepts-and-Slopes-as-Outcomes-Model

1. Migrantenanteil (mig_z) als unabhängige Variable für 0 vereinbaren (add variable uncentered)variable uncentered)

2. „Basic Settings“ starten

a) „Title“ vereinbaren (HLM-dresdenbsp1_iso)

b) Output file name vereinbaren (Pfad\hlm dresdenbsp1 iso.txt)) p ( _ p _ )

c) „OK“

3. „Run Analysis“ – „Save and Run“ („hlm_dresdenbsp1_iso“)

4. „File“ – „View Output“

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 51: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Interpretation der Ergebnisse

Es zeigt sich, dass die Lesekompetenz sowohl durch das Geschlecht als auch durch den Migrationsstatus beeinflusst wird. Auch der Migrantenanteil der Schulen wirkt sich auf die Lesekompetenz der Grundschülerinnen und Grundschüler auswirkt sich auf die Lesekompetenz der Grundschülerinnen und Grundschüler aus.

Die immer noch signifikante Streuung der Fehlerterme zeigt an, dass es Einflüsse gibt, die noch nicht spezifiziert wurden. Im Idealfall streuen die Fehlerterme im

ll tä di M d ll i ht h i ifik t D b d t t d ll V i i dvollständigen Modell nicht mehr signifikant. Das bedeutet, dass alle Varianz in der Parameter-Streuung durch die aufgenommenen Variablen erklärt werden konnte.

ANOVA RCM ISOANOVA RCM ISO

Mittlere Lesekompetenz (alle UVs=0) 535,69*** 542,32*** 541,80***

Individuelle Effekte auf die LesekompetenzIndividuelle Effekte auf die Lesekompetenz

Migrationshintergrund vorhanden ‐32,68*** ‐31,69***

Mädchen 11,84*** 11,89***

Schuleffekte auf die Lesekompetenz

Migrantenanteil der Schulen (z‐standardisiert) ‐6,51**

*** 001 ** 01 * 05*** p<.001; ** p<.01 ; * p<.05

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 52: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Standardisierung

Festlegen was es bedeutet, wenn sich X um eine Einheit ändert

„Erleichterung“ bei der Interpretation der Koeffizienteng p

Vergleich der Effekte verschiedener Prädiktoren

Y Y

X ZEbene 1 Ebene 2Ebene 1: Ebene 2:

Wenn sich X um eine Einheit ändert, Wenn sich Z um eine Einheit ändert, ändert sich Y um Einheiten. ändert sich um Einheiten.

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 53: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Standardisierung

Vollständige Z‐Standardisierung ALLER (nicht dichotomen) Prädiktoren und der AV

Eine Einheit = 1 Standardabweichungg

Standardisierung im Nachhinein, wenn die Prädiktoren in Form von Rohwerten einbezogen wurden (Formel: siehe Regression)K hl f Eb 1 i h f Eb 2 dKann sowohl auf Ebene 1 wie auch auf Ebene 2 vorgenommen werdenWenn Ebene 1 Variablen auf Ebene 2 aggregiert werden, hat man die Wahl zwischen der Standardisierung des resultierenden Ebene 2 Prädiktors in Ebene 1‐ oder 2‐Streuung.D it ä d t i h di B d tDamit ändert sich die Bedeutung:

1= „eine SD zwischen den Schülern der Stichprobe“ 

oderoder 

1= „eine SD zwischen den Mittelwerten der Schulen/Klassen“

ACHTUNG: Eine Standardisierung im Nachhinein ist für Cross‐Level‐Wechselwirkungen so nicht möglich.

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 54: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Cross-Level-Effekte / Wechselwirkungen

Wenn Cross‐Level Effektemodelliert werden sollen, dann ist es wichtig immer auch den Haupteffekt der entsprechenden L2‐Variable im Modell zu integrieren.

Die Haupteffekte der Prädiktoren haben eine andere Bedeutung, als wenn ihre Interaktion nicht modelliert wird.

Prädiktoren sind nicht mehr unabhängig voneinander, sondern beziehen sich aufeinander. 

Mit der Interaktion stellt der Koeffizient des einen Prädiktors den erwarteten Wert des slopes dar für den Fall, dass der andere Koeffizient null wäre und umgekehrt.p , g

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 55: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Cross-Level-Effekte / Wechselwirkungen

Wenn 0 keinen sinnvollen Wert darstellt, hat der Regressionskoeffizient des anderen Prädiktors keine substanzielle Bedeutung.

Zentrierung (am Grand Mean) oder Z‐Standardisierungg ( ) g

D K ffi i d i P ädik k d i i d l d K ffi iDer Koeffizient des einen Prädiktors kann dann interpretiert werden als der Koeffizient eines Individuums mit durchschnittlichem Wert („0“)auf dem anderen Prädiktor.

Die Interaktion kann interpretiert werden als Interaktion für Personen, die auf beiden einzelnen Prädiktoren durchschnittliche Werte („0“) aufweisen.

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 56: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Cross-Level-Effekte / Wechselwirkungen

Beispiel:

Abhängige Variable Y = Matheleistungg g g

Ebene 1‐Prädiktor X = Sozioökonomischer Status (SES)

Ebene 2‐Prädiktor Z = Öffentliche vs. katholische Schulen (Sector 0/1)

Wechselwirkungen X*Z = Der Effekt des sozioökonomischen Status unterscheidet sich in Abhängigkeit des Sectors

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 57: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Cross-Level-Effekte / Wechselwirkungen

Beispiel:

The outcome variable is MATHACH

Final estimation of fixed effects

(with robust standard errors)(with robust standard errors)

----------------------------------------------------------------------------

St d d A

In katholischen Schulen liegt der Erwartungswert der Matheleistung von Schüler/innen mit durchschnittlichem SES

In öffentlichen Schulen weisen Schüler/innen pro Anstieg des SES um 1 Einheit knapp 3 Standard Approx.

Fixed Effect Coefficient Error T-ratio d.f. P-value

---------------------------------------------------------------------------For INTRCPT1 B0

Schüler/innen mit durchschnittlichem SES um 2,13 Einheiten höher als in öffentlichen Schulen.

SES um 1 Einheit knapp 3 Einheiten bessere Matheleistungen auf.

For INTRCPT1, B0

INTRCPT2, G00 11.750662 0.218684 53.733 158 0.000

SECTOR, G01 2.128422 0.355700 5.984 158 0.000

F SES l B1

Dieser Effekt ist in katholischen Schulen um 1,31

For SES slope, B1

INTRCPT2, G10 2.958798 0.144092 20.534 158 0.000

SECTOR, G11 -1.313096 0.214271 -6.128 158 0.000

Einheiten geringer.

----------------------------------------------------------------------------

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 58: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Dummy-Variablen

Oft soll die AV nicht nur mit numerischen Prädiktoren (z.B. Intelligenz, SES) vorhergesagt werden, sondern mit der Zugehörigkeit zu bestimmten Gruppen (z.B. Geschlecht, Schulform) resp kategorialen bzw nominalen Daten/VariablenSchulform) – resp. kategorialen bzw. nominalen Daten/Variablen

Diese Gruppenvariablen können sowohl auf Ebene 1 (Geschlecht, Muttersprache) als auch auf Ebene 2 (Schulform, Bundesland) verortet sein.

Für eine einzelne Gruppenvariable können / müssen so viele Dummyvariablen gebildet werden wie es Gruppen gibtwerden, wie es Gruppen gibt.

Jede Dummyvariable ist 1, wenn ein Fall (Schüler / Schule) in der jeweiligen Gruppe ist, und 0, wenn der Fall einer anderen Gruppe angehört.

Wichtig: Denn ansonsten ist der Intercept wieder nicht interpretierbar

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 59: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Dummy-Variablen

Beispiel: Schulform – polytome nominale Variable

Variable Schulform mit 4 Kategorien 4 Dummyvariableng y

h1 = Hauptsch. HS: 1=HS, 0=Rest

2 = Realsch. RS: 1=RS, 0=Rest

3 = Gesamtsch. GS: 1=GS, 0=Rest

4 = Gymnasium GY: 1=GY, 0=Rest

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 60: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Dummy-Variablen

Datentransformationmuss VORAB in SPSS erfolgen.

Alle Dummy‐Variablen in den .mdm Datenfile aufnehmen

Im Modell immer eine Gruppe (Dummy‐Variable) nicht in das Modell aufnehmen:

Grund: Perfekte lineare Abhängigkeit zwischen den Prädiktoren

Ausgelassene Gruppe = ReferenzgruppeAusgelassene Gruppe   Referenzgruppe

Beispiel: die Variable „HS“ wird nicht als Prädiktor aufgenommen; die für die anderen Dummyvariablen geschätzten Werte sind als Unterschied zwischen Hauptschule und der y g pjeweiligen Schulform zu interpretieren.

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch

Page 61: AEPF - Foliensatz der Vorträge - aepf.uni-jena.deJena.pdf · Goldstein, H. (1987). ... HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch. Das Grundprinzip der

Exkurs: Dummy-Variablen

Standardisierung der Dummy‐Variable?

Ist nicht notwendig, da es hier einen festgelegten Nullpunkt gibt.g, g g p g

Eine Einheit hat eine klare inhaltliche Interpretation

Auch aggregierte Dummyvariablen sind ohne Standardisierung zu interpretieren: Eine 0/1‐Kodierung von „Migrant“ wird auf Klassenebene gemittelt zu einer natürlichen Variablen Mi il“„Migrantenanteil“.

Eine Multiplikation mit 100 auf Ebene 2 zu „prozentualer Migrantenanteil“ könnte hier noch hilfreich sein.

HLM-Workshop AEPF/Uni Jena 12.09.2010 Jun.-Prof. Dr. phil. Falk Radisch