Mixture modeling Holger Steinmetz and Peter Schmidt University of Giessen / Germany

Preview:

Citation preview

Mixture modeling

Holger Steinmetz and Peter Schmidt

University of Giessen / Germany

Überblick

Beobachtete vs. unbeobachtete Populationsheterogenität

Konzept der „kategorialen latenten Variable“

Latent class analyse (LCA) und finite mixtures

Anwendungsmöglichkeiten

Ein empirisches Beispiel: latent profile Analyse der 10 Werthaltungen (Schwartz, 1992) und Zusammenhänge mit demografischen Variablen

Beobachtete vs. unbeobachtete Populationsheterogenität

Gibt es Subpopulationen mit unterschiedlichen Parametern?

Parameter: - Antwortwahrscheinlichkeiten- Verteilungsmittelwerte und –varianzen- Modellparameter (Faktorladungen, Regressionskoeffizienten etc.)

Beobachtete Heterogenität- Gruppenzugehörigkeit ist bekannt- Analysen: t-Test, ANOVA, multigroup-Analysen

Beobachtete vs. unbeobachtete Populationsheterogenität

Unbeobachtete Heterogenität: Gruppenzugehörigkeit ist unbekannt

Ziele des mixture modeling:- Wieviele Subpopulationen („latent classes“) gibt es?- Welche Parameter gelten in ihnen?- Zuordnungswahrscheinlichkeiten für die Individuen der Stichprobe

Anwendungsgebiete:- Klinische Psychologie: Psychische Störungen als latente Klassen- Marktforschung: Marktsegmentierung- Pädagogische Psychologie: Mastery-Typen in der Schule

Latent Class Analyse (LCA)

Begründet durch Lazarsfeld und Henry (1968), Goodman (1974), Clogg (1995) u.a.

Dichotome / binäre items (uj)

C U

C = latente kategoriale Variable mit 1, 2, …k Kategorien Ziele / Ergebnis:

- Klassenspezifische Wahrscheinlichkeiten: P(u=1 | c=k)Beispiel zwei Klassen (k = 2):

Pc=1c=1(u = 1) = .85

Pc=2c=2(u = 1) = .40

- Wahrscheinlichkeit der Klassenzugehörigkeit: P(c = k) - Posterior-Wahrscheinlichkeit: P(c=k | u=1)

Latent Class Analyse (LCA)

Erweiterung: Die latente Klassenvariable erklärt die Kovarianz mehrerer Items (lokale stochastische Unabhängigkeit)

C

U1

U2

Latent Class Analyse (LCA)

5% 8%

9% 78%

U1: „Kontollverlust beim Trinken von Alkohol?“

ja nein

ja

nein

U2: „Blackout nach dem Trinken?“

Latent Class Analyse (LCA)

Klasse 1: Normale Trinker

Klasse 2: Problemtrinker

78%9%

8%5%

ja nein

ja

nein

Kontrollverlust

Bla

ckou

t

C

Kontrollverlust

Blackout

Latent Class Analyse (LCA)

78%9%

8%5%

ja nein

ja

nein

Kontrollverlust

Bla

ckou

t C

Kontrollverlu

st

Blackout

86%5%

10%1%

ja nein

ja

nein

Kontrollverlust

Bla

ckou

t

1%9%

11%79%

ja nein

ja

nein

Kontrollverlust

Bla

ckou

tNormale Trinker

Problemtrinker

P(c=k) : .85 .15

Latent Class Analyse (LCA)

Normale Trinker

Problem-trinker

Kontrollverlust .24 .76 1.0

Blackout .39 .61 1.0

Posterior-Wahrscheinlichkeiten P(c=k | u=1)

78%9%

8%5%

ja nein

ja

nein

Kontrollverlust

Bla

ckou

t C

Kontrollverlu

st

Blackout

Latent Profile Analyse (LPA)

LCA mit kontinuierlich verteilten Items Die Klassen unterscheiden sich in ihren Mittelwerten

Quelle: Bauer, D. J., & Curran, P. J. (2004). The integration of continuous and discrete latent variable models: Potential problems and promising opportunities. Psychological Methods, 9 (1), 3-29.

Common factor model

Latent Profile Analyse (LPA)

LCA mit kontinuierlich verteilten Items Die Klassen unterscheiden sich in ihren Mittelwerten

Quelle: Bauer, D. J., & Curran, P. J. (2004). The integration of continuous and discrete latent variable models: Potential problems and promising opportunities. Psychological Methods, 9 (1), 3-29.

Common factor model LPA

Mixture modeling

21

1

2

Mixture modeling

2

2))(5.(

22

1)(

x

exf

Mixture modeling

21

1

2

Mixture modeling

1

)1)(5.(

2

2

2

12

1)(1

x

exf 2

)2)(5.(

2

2

2

22

1)(2

x

exf

21

1

2

Mixture modeling

1

)1)(5.(

2

2

2

12

1)(1

x

exf 2

)2)(5.(

2

2

2

22

1)(2

x

exf

Likelihood für Person i = 1*f1(x) + 2*f2(x)

21

Mixture modeling

1

)1)(5.(

2

2

2

12

1)(1

x

exf 2

)2)(5.(

2

2

2

22

1)(2

x

exf

Likelihood für Person i = 1*f1(x) + 2*f2(x)

1

2

21

1

2

Mixture modeling

1

)1)(5.(

2

2

2

12

1)(1

x

exf 2

)2)(5.(

2

2

2

22

1)(2

x

exf

Likelihood für Person i = 1*f1(x) + 2*f2(x)

21

1

2

Mixture modeling

1

)1)(5.(

2

2

2

12

1)(1

x

exf 2

)2)(5.(

2

2

2

22

1)(2

x

exf

Likelihood für Person i = 1*f1(x) + 2*f2(x)

21

1

2

Mixture modeling

1

)1)(5.(

2

2

2

12

1)(1

x

exf 2

)2)(5.(

2

2

2

22

1)(2

x

exf

Likelihood für Person i = 1*f1(x) + 2*f2(x)

21

1

2

Mixture modeling

1

)1)(5.(

2

2

2

12

1)(1

x

exf 2

)2)(5.(

2

2

2

22

1)(2

x

exf

Likelihood für Person i = 1*f1(x) + 2*f2(x)

21

1

2

Mixture modeling

1

)1)(5.(

2

2

2

12

1)(1

x

exf 2

)2)(5.(

2

2

2

22

1)(2

x

exf

Likelihood für Person i = 1*f1(x) + 2*f2(x)

21

1

2

Mixture modeling

1

))(5.(

2

2

2

12

1)(1 e

xy

ee

xf

2

))(5.(

2

2

2

22

1)(2 e

xy

ee

xf

u1

u2

u3

u4

C

Erweiterungen der finite mixtures

x

Erweiterungen der finite mixtures

Mixture Regressionsanalyse

x2

Y

X1

C=1

C=2u1

u2

u3

u4

y

x1

C

Erweiterungen der finite mixtures

C

Mixture CFA

x1

x2

x3

x4

Erweiterungen der finite mixtures

Mixture SEM

y1

y2

y3

y4

x1

x2

x3

x4

C

Erweiterungen der finite mixtures

Mixture Growth curve model

X T1 X T2 X T3 X T4

Intcpt. Slp

C

Slp2

Evaluation der Klassenanzahl

Fitmaße- Likelihood-ratio test: Nicht anwendbar- Vuong-Lo-Mendell-Rubin LR-Test- BIC = -2 logL + Anzahl der Parameter * ln(n)

Güte der Klassifikation: Entropie

Evaluation der Klassenanzahl

Evaluation der Klassenanzahl

Fitmaße- Likelihood-ratio test: Nicht anwendbar- Vuong-Lo-Mendell-Rubin LR-Test- BIC = -2 logL + Anzahl der Parameter * ln(n)

Güte der Klassifikation: Entropie

Plausbilität

Stichprobe: N = 1677 Personen aus der allgemeinen erwerbstätigen Bevölkerkung

Messinstrument- Portraits Values Questionnaire (Schwartz, 2001)- Demografische Merkmale (Geschlecht, Alter, Bildung)

Ein empirisches Beispiel: Latent profile analyse von Werthaltungen

Ein empirisches Beispiel: Latent profile analyse von Werthaltungen

Universalism

Benevolence

Conformity

Tradition

SecurityPower

Achievement

Hedonism

Stimulation

Self-direction

Self-transcendenceOpenness to Change

ConservationSelf-enhancement

Ein empirisches Beispiel: Latent profile analyse von Werthaltungen

Pow

Ach SD Hed Stim Ben

Uni

Trad

Sec

Con

Bildung dummy2

Geschlecht

Alter

Bildung dummy1

C

Ein empirisches Beispiel: Latent profile analyse von Werthaltungen

-1.5

-1

-0.5

0

0.5

1

1.5

ACH SD HED BEN UNI STIM SEC TRAD POW CON

Latent Class 1

Latent Class 2

Latent Class 3

Latent Class 4

LC1 12%Wichtig: Spaß, Stimulation, Selbstbestimmung Unwichtig: Sicherheit, Tradition und Konformität, Benevolenz, Universalismus

“Hedonisten”

LC2 34% Alles unwichtig “Nihilisten”

LC3 29%Wichtig: Benevolenz, Universalismus, Sicherheit Unwichtig: Leistung, Stimulation, Selbstbestimmung und Macht

“Altruisten”

LC4 25% Alles wichtig “Ja-Sager”

Ein empirisches Beispiel: Latent profile analyse von Werthaltungen

20

25

30

35

40

45

50

55

Hedonisten Nihilisten Altruisten Ja-Sager

Ein empirisches Beispiel: Latent profile analyse von Werthaltungen

10%

16%

29%

40% 40%

14%

21%

30%

Männer Frauen

Hedonisten Nihilisten Altruisten Ja-Sager

Ein empirisches Beispiel: Latent profile analyse von Werthaltungen

3%

21%

9%

39%

32%30%

17%

33%

41%

23%27%26%

Hauptschule Realschule Abitur

Hedonisten Nihilisten Altruisten Ja-Sager

Recommended