35
Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen Faktorenanalyse Bei der Faktorenanalyse unterscheiden wir zwischen der explorativen und der konfirmatorischen Vorgehensweise. Bei ersterer wird eine Vielzahl von Indikatoren auf wenige zu suchende Zieldimensionen oder „theoretische Variablen“ (Konstrukte) reduziert, die wir selbst nicht unmittelbar beobachten können. Hingegen erfolgt bei letzterer die Reduzierung der Indikatoren auf wenige a priori bekannte Zieldimensionen oder „theoretische Variablen“. Beispielsweise unterstellen wir als Soziologen, daß die Schul- und Berufsabschlüsse des Befragten sowie sein Haushaltseinkommen a priori die gemeinsame Zieldimension „sozio-ökonomischer Status“ messen. Zur Veranschaulichung der Grundprinzipien der Faktorenanalyse dient der folgende kleine Datensatz, bei dem Kim und Müller die Einstellungen der amerikanischen Bevölkerung zu unterschiedlichen politischen Zielen erhoben haben. Hierbei sollten die Befragten auf einer 7er Likertskala einschätzen, wie wichtig ihnen jedes einzelne der folgenden politischen Ziele ist. „Die Regierung sollte X 1 : ...mehr Geld für Schulen ausgeben. X 2 : ...mehr Geld für Arbeitsbeschaffungsmaßnahmen ausgeben. X 3 : ...das Großkapital kontrollieren. X 4 : ...die Rassentrennung durch „Busing“ aufheben. X 5 ...für die Einhaltung der Minderheitenquoten auf dem Arbeitsmarkt sorgen („affirmative action“) X 6 ...das Headstart Programm für die Minoritäten ausbauen. (Förderkurse für Ghettokinder)“. (Kim&Müller 1978a, S. 52) Um die Zusammenhänge aller sechs Zielvorgaben zu analysieren, berechnen wir für die 100 Befragten ihre gemeinsame Korrelationsmatrix: X 1 X 2 X 3 X 4 X 5 X 6 X 1 : 1.000 X 2 : 0.560 1.000 X 3 0.480 0.420 1.000 X 4 : 0.224 0.196 0.168 1.000 X 5 : 0.192 0.168 0.144 0.420 1.000 X 6 : 0.160 0.140 0.120 0.350 0.300 1.000 In der obigen Korrelationsmatrix erkennen wir zwei Bündel (Cluster) von Variablengruppen, die relativ hoch untereinander korrelieren. Das erste Cluster bilden die Variablen X 1 , X 2 und X 3 , das zweite die Variablen X 4 , X 5 , X 6 . Rein heuristisch gesehen, scheint der Hauptnenner der ersten drei Zielvorgaben die Wirtschaftspolitik zu sein, während bei den letzten drei Zielen der Schwerpunkt auf „Bürger- und Minderheitenrechten“ liegt.

Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

  • Upload
    doantu

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1

Einführung in die Grundlagen der explorativen Faktorenanalyse

Bei der Faktorenanalyse unterscheiden wir zwischen der explorativen und der konfirmatorischenVorgehensweise. Bei ersterer wird eine Vielzahl von Indikatoren auf wenige zu suchendeZieldimensionen oder „theoretische Variablen“ (Konstrukte) reduziert, die wir selbst nichtunmittelbar beobachten können. Hingegen erfolgt bei letzterer die Reduzierung der Indikatorenauf wenige a priori bekannte Zieldimensionen oder „theoretische Variablen“. Beispielsweiseunterstellen wir als Soziologen, daß die Schul- und Berufsabschlüsse des Befragten sowie seinHaushaltseinkommen a priori die gemeinsame Zieldimension „sozio-ökonomischer Status“messen.

Zur Veranschaulichung der Grundprinzipien der Faktorenanalyse dient der folgende kleineDatensatz, bei dem Kim und Müller die Einstellungen der amerikanischen Bevölkerung zuunterschiedlichen politischen Zielen erhoben haben. Hierbei sollten die Befragten auf einer 7erLikertskala einschätzen, wie wichtig ihnen jedes einzelne der folgenden politischen Ziele ist.

„Die Regierung sollte

X1: ...mehr Geld für Schulen ausgeben. X2: ...mehr Geld für Arbeitsbeschaffungsmaßnahmen ausgeben. X3: ...das Großkapital kontrollieren. X4: ...die Rassentrennung durch „Busing“ aufheben. X5 ...für die Einhaltung der Minderheitenquoten auf dem Arbeitsmarkt sorgen

(„affirmative action“) X6 ...das Headstart Programm für die Minoritäten ausbauen.

(Förderkurse für Ghettokinder)“. (Kim&Müller 1978a, S. 52)

Um die Zusammenhänge aller sechs Zielvorgaben zu analysieren, berechnen wir für die 100Befragten ihre gemeinsame Korrelationsmatrix:

X1 X2 X3 X4 X5 X6

X1: 1.000X2: 0.560 1.000X3 0.480 0.420 1.000X4: 0.224 0.196 0.168 1.000X5: 0.192 0.168 0.144 0.420 1.000X6: 0.160 0.140 0.120 0.350 0.300 1.000

In der obigen Korrelationsmatrix erkennen wir zwei Bündel (Cluster) von Variablengruppen, dierelativ hoch untereinander korrelieren. Das erste Cluster bilden die Variablen X1, X2 und X3, daszweite die Variablen X4, X5, X6. Rein heuristisch gesehen, scheint der Hauptnenner der erstendrei Zielvorgaben die Wirtschaftspolitik zu sein, während bei den letzten drei Zielen derSchwerpunkt auf „Bürger- und Minderheitenrechten“ liegt.

Page 2: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 2

X 1

X 2

X 3

X 4

X 5

X 6

FAKTOR 1

FAKTOR 2

Abbildung1: Darstellung der Interkorrelation der politischen Ziele mit Hilfe vonPfaddiagrammen

Das Ziel der Faktorenanalyse besteht darin, die gefundenen Bündel bivariater Korrelationendurch möglichst wenige „Zieldimensionen“ oder Konstrukte (latente, theoretische Variablen) zuerklären. Nehmen wir den Fall an, daß jedes Variablenbündel jeweils nur eine einzigeZieldimension repräsentiert, so läßt sich die Variablenkonfiguration als Pfaddiagramm dar-stellen. Zur Kennzeichnung der beobachteten Variablen (Indikatoren) dient das eckige Käst-chen, hingegen werden die Faktoren (Konstrukte) als Ellipsen dargestellt. Die Indizierung derKoeffizienten erfolgt nach den Regeln der Pfadanalyse, wobei der erste Index die Pfeilspitzeund der zweite das Pfeilende markieren.

Page 3: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 3

X 1

X 2

X 3

X 4

X 5

X 6

FAKTOR 1

FAKTOR 2

U 1

U 2

U 3

U 4

U 5

U 6b x6 f2

b x5 f2

b x4 f2

b x3 f1

b x2 f1

b x1 f1 d1

d2

d3

d4

d5

d6

Abbildung2: Pfadmodell der Interkorrelation der politischen Ziele unter Berücksichtigungder uniquen Faktoren (Meßfehler)

Gehen wir davon aus, daß alle Indikatoren als z-standardisierte Variablen vorliegen, so lassensich mit Hilfe des von Wright formulierten Grundtheorems der Pfadanalyse die bivariatenKorrelationen zwischen den Indikatoren als über den Faktor vermittelte „Drittvariableneffekte“darstellen. Formal gesehen entspricht die Korrelation zwischen X1 und X2 dem Produkt derKorrelationen zwischen Faktor 1 und X1 sowie Faktor 1 und X2. Damit „erklärt“ der „gemein-same Faktor“ als „theoretische Variable“ (Konstrukt) die beobachtbare Interkorrelation derIndikatoren.

Da wir aber davon ausgehen, daß weder X1 noch X2 den Faktor 1 perfekt messen, enthaltenbeide Variablen Varianzanteile, die sie nicht mit dem gemeinsamen Faktor teilen. Diesen „uni-

Page 4: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 4

1S. Thome 1990, S. 265

quen Faktoren“ oder Meßfehlern entsprechen die Residualpfade des klassischen Pfadmodells.Da wir z-standardisierte Variablen verwenden, hat jeder Indikator jeweils eine Varianz von 1.Damit läßt sich seine Varianz in zwei Bestandteile zerlegen, die jeweils auf den gemeinsamenFaktor sowie den uniquen Faktor im Sinne des „Meßfehlers“ entfallen. In der Abbildung 2 wirdletzterer mit dem Großbuchstaben „U“ bezeichnet. Betrachten wir die beiden Pfadmodelle inAbbildung 2, so enthalten sie bezogen auf jedes Indikatorenpaar die folgenden Annahmen:

1. Der jeweils gemeinsame Faktor korreliert nicht mit den uniquen Faktoren (Meßfehlern), d.h., COV (F1 ,U1 ) = COV (F2 ,U2 ) = 0.

2. Die uniquen Faktoren der Indikatoren, ihre Meßfehler, korrelieren nicht untereinander, d.h., COV (U1 ,U2 ) = 0.

3. Die gemeinsamen Faktoren 1 und 2 korrelieren nicht untereinander, d.h., COV (F1 ,F2 ) =0.

4. Alle beobachteten Indikatoren X1, X2 sind z-standardisiert, d.h., sie verfügen über einenMittel- oder Erwartungswert von Null und eine Varianz von Eins. E (X1 ) = E (X2 ) = 0 und VAR (X1 ) = VAR (X2 ) = 1

Für die Varianzzerlegung der Indikatoren X1 und X2 benötigen wir die folgenden Regeln derErwartungswertrechnung:1

1. Der Erwartungswert einer Konstanten c ist die Konstante selbst.E(c) = c

2. Wenn c eine reelle Zahl und X eine Zufallsvariable mit dem Erwartungswert E(X) ist,dann gilt:

a) E(c*X) = c*E(X)b) E(X + c) = E(X) + c

3. Wenn X und Y Zufallsvariablen mit den entsprechenden Erwartungswerten E(X) undE(Y) sind, dann gilt:

E(X + Y) = E(X) + E(Y)

4. Wenn eine endliche Menge von Zufallsvariablen X k gegeben ist, die alle voneinanderunabhängig sind, so gilt:

E(X1 * X2 * X3 * X4*...*Xk) = E(X1) * E(X2) * E(X3) * E(X4)* ....* E(Xk)

Page 5: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 5

Mit Hilfe der Regeln für Erwartungswerte können wir den Mittelwert, die Varianz und dieKovarianz zweier Variablen folgendermaßen berechnen:

(1) Mittelwert von X1:

x �

�n

i1Xi

n�

1n

� �n

i1Xi

Einführung von E ( ) für 1n

� �n

i1Xi, dann gilt: x � E (X)

(2) Varianz von X1:

VAR (X1) �

�n

i1(Xi � x)2

n�

�n

i1(Xi � E (X))2

n� E (X � E (X))2

(3) Kovarianz von X1 und X2:

COV (X1,X2) �

�n

i1(X1i � X1)�(X2i � X2)

n� E ( (X1i � X1 )�(X2i � X2 ) )

� E ( (X1i � E (X1) )�(X2i � E (X2 ) ) )

(1) Berechnung des Mittelwerts, der Varianz sowie der Kovarianz mit Hilfe derErwartungswertrechnung

Für jeden der in Abbildung 2 enthaltenen Indikatoren können wir eine Strukturgleichung auf-stellen, die wir hier am Beispiel der z-standardisierten Variablen X1 ausführlich lösen. Hierbeifolgen wir dem von Kim&Mueller (1978a, S. 15f.) vorgeschlagenen Lösungsweg.

Page 6: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 6

Strukturgleichung für X1:

X1 � b11�F1 � d1�U1

Für die Varianz von X1 gilt in der Erwartungswertnotation:

VAR (X1) � E (Xi � x1 )2� E (X1 )2

Einsetzen der Strukturgleichung in die Erwartungswertgleichung:

VAR(X1) � E (b11�F1 � d1�U1 )2

Durch Anwendung der 1. Binomialregel erhalten wir:

� E ( (b11�F1)2� (d1�U1)

2� 2�b11�F1�d1�U1 )

Durch Anwendung von Regel 2 können wir b11 und d1 ausfaktorisieren:

� b 211 � E (F1)

2� d 2

1 � E (U1)2� 2�b11�d1�E (F1U1)

Da wir 1. die Erwartungswerte als Varianzen oder Kovarianzen definiert haben

,folgt hieraus: � b 211 � VAR(F1) � d 2

1 � VAR(U1) � 2�b11�d1�COV(F1U1)

Da wir 2. von z�standardisierten Variablen ausgehen und die Unabhängigkeitvon Common� und Unique Factor unterstellen, gilt:

VAR(F1) � VAR(U1) � 1 und COV(F1U1) � 0

VAR(X1) � 1 � b 211 � d 2

1

(2) Varianzzerlegung des Indikators X1 mit Hilfe der Erwartungswertrechnung

Nach der Herleitung in Formel 2 gilt, daß sich im Faktorenmodell die Varianz eines z-stan-dardisierten Indikators in die Summe der quadierten Regressionsgewichte des gemeinsamenFaktors F und des uniquen Faktors U zerlegen läßt. Analog zum Regressionsmodell entsprichthierbei ersterem der Varianzanteil von X, der durch den gemeinsamen Faktor F erklärt wird.Hingegen bildet der quadrierte Regressionskoeffizient des „uniquen Faktors“ den Anteil der fürX spezifischen Varianz ab, der in Bezug auf die Zieldimension des gemeinsamen Faktors alsMeßfehler fungiert. Die Werte der b- und d-Koeffizienten sind folglich definitorisch mitein-ander verknüpft, da folgende Relation gilt:

dk � 1 � bk2

(3) Berechnung des d-Koeffizienten des uniquen Faktors:

Page 7: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 7

Über die Erwartungsrechnung können wir ebenfalls das Regressionsgewicht des gemeinsamenFaktors b11 zur Vorhersage des Indikators X1 näher bestimmen:

b11 � COV (F1X1 ) � E [ (F � F )� (X � X ) ] � E [F1X1 ]

Durch Einsetzten der Strukturgleichung von X erhalten wir:

� E [(F1) � (b11�F1 � d1�U1 ) ]

Durch Ausmultiplizieren erhalten wir:

� E [b11�F 21 � F1�d1�U1 ] � E [b11�F 2

1 ] � E [F1�d1�U1 ]

Durch Ausfaktorisieren der Konstanten erhalten wir:

� b11�E [F 21 ] � d1�E [F1�U1 ] � b11�VAR (F1) � d1�COV (F1U1)

� b11 � rF1X1

(4) Berechnung der Ladung des Indikators auf dem gemeinsamen Faktor

Da wir von z-standardisierten Variablen ausgegangen sind und unterstellt haben, daß dergemeinsame und der unique Faktor voneinander unabhängig sind, können wir dieRegressionskoeffizienten des gemeinsamen Faktors, seine „Ladungen“, als bivariate Korrelatio-nen zwischen ihm und dem jeweiligen Indikator interpretieren.

Mit Hilfe der Erwartungswertrechnung können wir den „Drittvariableneffekt“ des gemeinsamenFaktors bezogen auf die Korrelation der beiden Indikatoren X1 und X2 ableiten. Hierzu müssenwir zunächst für X2 eine separate Strukturgleichung im Einfaktormodell aufstellen:

Page 8: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 8

Strukturgleichungen für X1 und X2:

(1) X1 � b11�F1 � d1 � U1

(2) X2 � b21�F1 � d2 � U2

Die Korrelation rX1X2ist definiert als der gemeinsame Erwartungswert

beider Variablen:

rX1X2� COV (X1,X2 ) � E (X1,X2)

� E [ (b11�F1 � d1�U1 ) � (b21�F1 � d2�U2 ) ]

� E [b11�F1�b21�F1 � b11�F1� d2�U2 � d1�U1�b21�F1 � d1�U1�d2�U2 ]

� E (b11�b21�F12� b11�d2�F1�U2 � d1�b21�F1�U1 � d1�d2�U1�U2 ]

Zerlegung in die Summe der Einzelerwartungswerte undAusfaktorisierung der Konstanten:

� b11�b21�E[F12] � b11�d2�E[F1�U2 ] � d1�b21�E [F1�U1 ] � d1�d2�E[U1�U2 ]

� b11�b21�VAR (F1) � b11�d2�COV (F1�U2 ) � d1�b21�COV (F1�U1 )� d1�d2�COV (U1�U2 )

� b11 � b21

(5) Zerlegung der Interkorrelation von X1 und X2 im Einfaktormodell mit Hilfe derErwartungswertrechnung

Folglich läßt sich die Korrelation zwischen X1 und X2 über das Produkt der zugehörigen Ladun-gen auf dem gemeinsamen Faktor erklären. In der Terminologie der Pfadanalyse bedeutet dies,daß die bivariate Korrelation der Indikatoren durch den „Drittvariableneffekt“ vollständigaufgehoben wird. Das in Abbildung 2 enthaltene Faktorenmodell können wir über die folgendensechs Strukturgleichungen vollständig spezifizieren:

Page 9: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 9

Pfadmodell 1:

(1.1) X1 � b11�Faktor1 � d1�U1

(1.2) X2 � b21�Faktor1 � d2�U2

(1.3) X3 � b31�Faktor1 � d3�U3

Pfadmodell 2:

(2.1) X4 � b42�Faktor2 � d4�U4

(2.2) X5 � b52�Faktor2 � d5�U5

(2.3) X6 � b62�Faktor2 � d6�U6

(6) Strukturgleichungen der Einfaktorenmodelle in Abbildung 2

Wie bereits mit Hilfe der Erwartungswertgleichung ausführlich gezeigt worden ist, handelt essich bei den b-Koeffizienten um die sogenannten „Faktorladungen“, d.h. um die Korrelationenzwischen dem „gemeinsamen Faktor“ und den Variablen XK. Da sie auf den Korrelationen derIndikatoren beruhen, verfügen sie ebenfalls über einen Wertebereich von +1 bis -1. In Ab-bildung 2 gehen wir von einem Spezialfall der Faktorenanalyse aus, nämlich dem Vorliegeneiner sogenannten „Einfachstruktur der Faktorladungen“. Sie besagt nach Thurstone, daßjede Variable (Indikator) möglichst nur auf einem Faktor laden soll. Im Sinne der Opera-tionalisierung theoretischer Konstrukte bedeutet dies, daß die verwendeten Indikatoren mög-lichst nur ihren theoretischen Begriff als Zieldimension und keinen anderen als Fremddimensionmessen sollen. Die Forschungspraxis zeigt aber, daß dieser Fall eher unwahrscheinlich ist. Umdies zu überprüfen, müssen wir das Pfadmodell in Abbildung 2 dahingehend erweitern, daßjeder Indikator XK nicht nur seine Zieldimension sondern auch die Fremddimension eineszweiten Faktors mißt. Nehmen wir weiterhin an, daß beide Faktoren unabhängig voneinandersind, so setzt sich die Varianz jedes Indikators aus der Summe der quadrierten Ladungen dergemeinsamen Faktoren F1 und F2 sowie der des uniquen Faktors (Meßfehler) zusammen.

(1.1) X1 � b11�Faktor1 � b12�Faktor2 � d1�U1

(1.2) X2 � b21�Faktor1 � b22�Faktor2 � d2�U2

(1.3) X3 � b31�Faktor1 � b32�Faktor2 � d3�U3

(2.1) X4 � b41�Faktor1 � b42�Faktor2 � d4�U4

(2.2) X5 � b51�Faktor1 � b52�Faktor2 � d5�U5

(2.3) X6 � b61�Faktor1 � b62�Faktor2 � d6�U6

(7) Lineares Gleichungssystem der Hauptachsenmethode der Faktorenanalyse

Page 10: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 10

Abbildung3: Pfadmodell des Hauptachsenverfahrens der Faktorenanalyse

In der Abbildung 3 werden die „Ladungen“ des 1. Faktors als durchgezogene und diejenigen des2. Faktors als gestrichelte Pfeile dargestellt. Diesem Pfadmodell entspricht das folgende lineareGleichungssystem der „Hauptachsenmethode“ der Faktorenanalyse. Sie läßt ausdrücklichMeßfehler zu, die in der Terminologie der Faktorenanalyse als unique Ladungen bezeichnetwerden. Hieraus folgt, daß die gemeinsamen Faktoren die Varianz eines Indikators nicht voll-ständig erklären können. Somit sinkt der Anteil der durch die gemeinsamen Faktoren „gebunde-nen Varianz“ deutlich unter den Wert von Eins. Im Gegensatz hierzu ignoriert die „Hauptkomponentenmethode“ völlig das Vorliegen vonuniquen Ladungen oder Meßfehlern. Sie beschränkt sich bei der Varianzzerlegung der beob-achteten Indikatoren allein auf die Summe der Ladungsgewichte der gemeinsamen Faktoren. Sie behandelt daher Meßfehler als „reinen Informationsverlust“. Ihr entspricht das Pfadmodell

Page 11: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 11

in Abbildung 4 sowie das zugehörige lineare Gleichungssystem in Formel 8.

(1.1) X1 � b11�Faktor1 � b12�Faktor2

(1.2) X2 � b21�Faktor1 � b22�Faktor2

(1.3) X3 � b31�Faktor1 � b32�Faktor2

(2.1) X4 � b41�Faktor1 � b42�Faktor2

(2.2) X5 � b51�Faktor1 � b52�Faktor2

(2.3) X6 � b61�Faktor1 � b62�Faktor2

(8) Lineares Gleichungssystem der Hauptkomponentenmethode der Faktorenanalyse

Abbildung4: Pfadmodell der Hauptkomponentenmethode der Faktorenanalyse

Page 12: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 12

Der Hauptkomponentenmethode entspricht das Pfadmodell in Abbildung 4. Beide Verfahrenunterscheiden sich deutlich bei der Interpretation der Faktoren. Hierbei geht die Hauptkompo-nentenlösung von der folgenden Fragestellung aus:

„Wie lassen sich die auf einen Faktor hoch ladenden Variablen durch einen Sammel-begriff (Komponente) zusammenfassen ?“ (Backhaus u.a. 1994, S. 222)

Hingegen besteht das Ziel des Hauptachsenverfahrens darin, die Interkorrelation der Indikatorenkausal zu erklären. Daher lautet die bei der Interpretation der Faktoren zu beantwortende Fragefolgendermaßen:

„Wie läßt sich die Ursache bezeichnen, die für die hohen Ladungen der Variablen aufdiesem Faktor verantwortlich ist ? “ (a.a.O.)

Bei beiden Lösungsverfahren läßt sich die Korrelation zwischen zwei Indikatoren, beispiels-weise X1 und X2, in die Summe der Produkte der zugehörigen Ladungen beider Faktorenzerlegen und somit auch reproduzieren.

rX1X2� bX1F1

� bX2F1� bX1F2

� bX2F2

(9) Zerlegung der Indikatorkorrelation im Zweifaktorenmodell

Mit Hilfe der Matrixalgebra verallgemeinert Thurstone die Gleichung 9 in seinem Fundamental-theorem der Faktorenanalyse. Die Korrelationsmatrix der beobachteten Indikatoren ergibt sichaus dem Matrizenprodukt der Faktorladungsmatrix und ihrer Transponierten, deren Elemente ander Hauptdiagonalen gespiegelt worden sind.

Rij � B � B �

[k;k] [k;r] [r;k]

R: KorrelationsmatrixB: FaktorladungsmatrixB �: Transponierte der Faktorladungsmatrixi: Zeilenindex der Korrelationsmatrixj: Spaltenindex der Korrelationsmatrixk: Anzahl der Indikatoren/Variablenr: Anzahl der gemeinsamen Faktoren

(10) Thurstones Grundtheorem der Faktorenanalyse

Page 13: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 13

1 rX1X2

rX2 X11

bX1F1bX1 F2

bX2F1bX2 F2

bX1F1bX2 F1

bX1F2bX2 F2

R � B � B �

rX1X2� bX1 F1

�bX2F1� bX1 F2

�bX2F2

(11) Thurstone Grundtheorem der Faktorenanalyse für das zwei Faktoren zwei IndikatorenModell

Für unser Modell mit zwei Indikatoren und zwei gemeinsamen Faktoren sehen die Faktorla-dungsmatrix B und ihre Transponierte B' folgendermaßen aus:

Die zu X1 und X2 gehörende Korrelation erhalten wir, indem wir die erste Zeile der B-Matrix aufdie zweite Spalte der B'-Matrix klappen, die Elemente paarweise multiplizieren und anschlie-ßend aufaddieren. Wir erhalten dasselbe Ergebnisse wie in unserer Pfadanalyse.

Bei der zweifaktoriellen Lösung setzt sich die Kommunalität eines Indikators aus der Summeseiner quadrierten Faktorladungen auf beiden Faktoren zusammen. Für den Indikator X1 bei-spielsweise berechnen wir den durch seine Faktoren erklärten Varianzanteil h² folgendermaßen:

Kommunalität von X1: h² (X1) � b 2X1F1

� b 2X1F2

(12) Berechnung der Kommunalität eines Indikators im Zweifaktorenmodell

Die numerische Vorgehensweise beider Verfahren besteht darin, die Ladungskoeffizienten desersten Faktors so zu wählen, daß dieser Faktor ein Maximum der Gesamtvarianz der Variablen(Indikatoren) erfaßt. Anschließend werden die Ladungskoeffizienten des zweiten Faktors, dervom ersten statistisch unabhängig ist, so bestimmt, daß er ebenfalls ein Maximum der verblei-benden Restvarianz erfaßt. Wir können mit diesem Lösungsalgorithmus solange fortfahren bisdie gesamte Varianz der Indikatoren durch gemeinsame Faktoren aufgeklärt worden ist. Diesführt aber zu keinem Erkenntnisfortschritt, da wir hierzu dieselbe Anzahl gemeinsamer Faktorenwie verwendeter Indikatoren benötigen. In diesem Fall liegt keine Datenreduktion vor. Daherbenötigen wir zusätzliche Kriterien, die uns formal gestatten, den durch die Einführung gemein-samer Faktoren erzielten Informationsgewinn zu bestimmen. Umgekehrt lautet die Fragestel-lung, wieviel gemeinsame Faktoren oder Dimensionen benötigen wir, um die Interkorrelationender Indikatoren hinreichend gut zu beschreiben. Hierzu bietet die Faktorenanalyse alsEntscheidungskriterien den Eigenwert des Faktors und die Kommunalität des Indikators an.Beim Eigenwert des Faktors handelt es sich um die Summe seiner quadrierten Ladungen auf denIndikatoren X1 bis X6.

Page 14: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 14

Eigenwert des Faktors Fk (�) � �K

j1bjk

2

Anteil der durch den Faktor Fk erklärten Gesamtvarianz der Indikatoren

�k

j1bjk

2

K

K: Anzahl der Indikatorenj: Laufindex der Variablen (Indikatoren )k: Laufindex der gemeinsamen Faktoren

(13) Berechnung des Eigenwerts und des Anteils der Gesamtvarianzaufklärung einesFaktors

Hingegen beschreibt die Kommunalität analog zum Determinationskoeffizienten derRegressionsanalyse die Anpassungsgüte der Faktorlösung auf der Ebene der einzelnen Indikato-ren. Sie gibt jeweils für jeden Indikator an, wieviel Prozent seiner Varianz durch die gemein-samen Faktoren gebunden oder „erklärt“ wird.

Kommunalität des Indikators XJ (h 2) � �L

k1bjk

2

L: Anzahl der gemeinsamen Faktoren

(14) Berechnung der Indikatorkommunalität im Mehrfaktorenmodell

Aus der Kombination beider statistischer Größen können wir Kriterien ableiten, um die formaleGüte einer Faktorenlösung zu bestimmen. Eine „gute Faktorenlösung“ sollte erstens mit mög-lichst wenigen gemeinsamen Faktoren einen möglichst großen Anteil der Gesamtvarianz derIndikatoren binden. Sie sollte zweitens auf der Ebene der einzelnen Indikatoren einen hohenAnteil ihrer Varianz erklären, d.h., sie sollte hohe Kommunalitäten aufweisen. Beide Kriteriensind nicht unabhängig voneinander, da wir nur dann hohe Kommunalitäten vorfinden, wenn dieEigenwerte der gemeinsamen Faktoren hoch sind. Daher dient das zweite Kriterium eher dazu,schrittweise Variablen bei der Faktorenlösung auszuschließen, deren Varianz die gemeinsamenFaktoren nur unzureichend aufklären. Dies bedeutet zumeist, daß sie mit den anderen Indikato-ren nicht korrelieren und daher eigene Fremddimensionen messen.Eine Besonderheit des Hauptachsenverfahrens besteht darin, daß neben den gemeinsamen unduniquen Ladungen der Indikatoren auch ihre Kommunalitäten geschätzt werden müssen. Hierbeiist das zugehörige lineare Gleichungssystem unterbestimmt. Das heißt, wir müssen in unseremBeispiel bei zwei Faktoren und sechs Indikatoren 18 Ladungskoeffizienten in sechs Gleichungen

Page 15: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 15

ermitteln, obwohl uns hierzu nur 15 Korrelationen zur Verfügung stehen. Da sich die uniquenLadungen des Indikators aus seiner Kommunalität und seinen direkten Ladungen auf dengemeinsamen Faktoren berechnen lassen, benötigen wir als Ausgangspunkt für unser iterativesLösungsverfahren eine Schätzung für die Kommunalitäten der Indikatoren.

Berechnung des uniquen Faktorladungskoeffizienten für den Indikator Xk

dk � h 2k � (b 2

kF1� b 2

kF2)

Startwerte für die Hauptachsenlösung:

h 2k � R 2 von XK auf alle anderen Indikatoren

(15) Berechnung der Startwerte für die Kommunalitäten im Hauptachsenmodell

SPSSfWin verwendet als Kommunalitätsschätzer den multiplen Determinationskoeffizientendes Regressionsmodells der betrachteten Variablen auf alle sonstigen Indikatoren des Sets.Hingegen setzt SPSSfWin bei der Hauptkomponentenlösung den Wert 1 für die Kommunalitätein, da es implizit davon ausgeht, daß so viele Hauptkomponenten gezogen werden wie Indika-toren vorhanden sind.

Um das Eigenwert- und Kommunalitätskriterium auf unseren Beispieldatensatz der politischenZielpräferenzen anwenden zu können, müssen wir zunächst mit SPSSfWin eine Faktorenanalysein Form der Hauptkomponenten- oder Hauptachsenlösung berechnen. Da wir innerhalb desMenusystems Korrelationsmatrizen nicht direkt einlesen können, geben wir die entsprechendenSPSS-Befehle im Syntaxfenster ein und lassen sie dort abarbeiten. Korrelations-, Kovarianz-oder Distanzmatrizen lesen wir in SPSSfWin mit Hilfe des MATRIX DATA-Befehls direkt ein.Hierfür definieren wir zunächst mit der VARIABLES-Anweisung die Zeilen der Matrix. Mit derFILE-Anweisung geben wir an, ob wir die Matrix aus einer externen Datei oder direkt in unsererSteuerdatei einlesen wollen (INLINE), wobei wir sie selbst zwischen eine BEGIN DATA undEND DATA-Anweisung schreiben. Mit der FORMAT-Anweisung legen wir das Eingabeformatund den Typ der Matrix fest. In unserem Fall lesen wir die Matrix im „freien Format“ (FREE)ein, wobei wir ihre Elemente durch Leerzeichen trennen. Als Typ haben wir eine untereDreiecksmatrix (LOWER) gewählt, die durch die Hauptdiagonale (DIAGONAL) begrenzt wird.Den Stichprobenumfang legen wir abschließend mit der N=-Anweisung fest (N=100). Da wirunsere Stichprobeninformation bereits in Form einer Korrelatonsmatrix in SPSSfWin-Daten-editor vorliegen haben, geben wir dies beim FACTOR-Befehl durch die Anweisung MA-TRIX=IN (COR=*) explizit an.

Page 16: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 16

SPSSfWin-Befehls-/ Syntaxdatei:

TITLE 'Meth.V: KIM&MUELLER: 1978a, S. 53'.SUBTITLE 'Politische Einstellungen USA: Die Regierung sollte..'.SET DECIMALS=DOT.MATRIX DATA VARIABLES=v1 v2 v3 v4 v5 v6/FILE=INLINE/FORMAT=FREE LOWER DIAGONAL/CONTENTS=CORR/N=100.BEGIN DATA. 1.000 0.560 1.000 0.480 0.420 1.000 0.224 0.196 0.168 1.000 0.192 0.168 0.144 0.420 1.000 0.160 0.140 0.120 0.350 0.300 1.000END DATA.

VARIABLE LABELS v1 'mehr Geld für Schulen'/ v2 'mehr Geld für Arbeitsbeschaffung'/ v3 'sollte Großkapital kontrollieren'/ v4 'Rassentrennung durch Busing aufheben'/ v5 'für afirmativ action auf dem Arbeitsmarkt sorgen'/ v6 'das Headstart Programm ausbauen'.

* Berechnung der Hauptkomponentenlösung.* Kaiserkriterium: Anzahl der Faktoren mit Eigenwerten > 1.* Varimax-Rotation.

FACTOR /MATRIX=IN (COR=*) /ANALYSIS=v1 to v6/PRINT DEFAULT CORRELATION KMO AIC/CRITERIA ITERATE (100)/FORMAT SORT/EXTRACTION PC /ROTATION VARIMAX/PLOT=ROTATION.

* Berechnung der Hauptachsenlösung.* Kaiserkriterium: Anzahl der Faktoren mit Eigenwerten > 1.* Varimax-Rotation.

FACTOR /MATRIX=IN (COR=*) /ANALYSIS=v1 to v6/PRINT DEFAULT CORRELATION /CRITERIA ITERATE (100)/FORMAT SORT/EXTRACTION PAF /ROTATION VARIMAX/PLOT=ROTATION.

Die folgende Übersichtstabelle enthält die unrotierten Ladungsmatrizen der zweifaktoriellenHauptkomponenten- und Hauptachsenlösung der Faktorenanalyse. Summieren wir jeweils diequadrierten Ladungskoeffizienten pro Faktor über die Zeilen, so erhalten wir den zugehörigenEigenwert des Faktors (�). Er gibt den Anteil der Gesamtvarianz an, der jeweils durch denbetrachteten gemeinsamen Faktor geklärt oder „gebunden“ wird. Dividieren wir diesen Anteildurch die Anzahl der benutzten Indikatoren, so erhalten wir den relativen Erklärungsbeitrag desFaktors.

Page 17: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 17

Tab.1: Vergleich der Ladungsmatrizen der Hauptkomponenten- und Hauptachsen-lösung der Faktorenanalyse politischer Zielpräferenzen(unrotierte Ladungen)

Hauptkomponentenlösung Hauptachsenlösung

Variable: Faktor 1 Faktor 2 h² Faktor 1 Faktor 2 h²

X 1 +0,747 - 0,395 0,713 +0,731 - 0,320 0,637

X 2 +0,706 - 0,409 0,666 +0,642 - 0,282 0,492

X 3 +0,651 - 0,417 0,598 +0,550 - 0,241 0,360

X 4 +0,595 +0,519 0,623 +0,513 +0,473 0,487

X 5 +0,548 +0,529 0,581 +0,441 +0,409 0,362

X 6 +0,488 +0,526 0,514 +0,367 +0,340 0,251

Eigen-wert (�) = 2,372 1,323 1,842 0,746

AnteilerklärterVarianz =

2,372 / 6 =

0,395

1,323 / 6 = 0,221

1,843 / 6 =

0,307

0,746 / 6 =

0,124

Kumulier-ter Anteil= 0,395 0,616 0,307 0,431

Wenn wir die Ladungsmatrizen der Hauptkomponenten- und Hauptachsenlösung vergleichen,so zeigt sich dreierlei. Erstens fallen die Faktorladungen, Kommunalitäten sowie Eigenwerte derHauptachsenlösung deutlich niedriger aus als diejenigen des Hauptkomponentenmodell. Dies istdarauf zurückzuführen, daß die Hauptachsenlösung explizit unique Faktoren im Sinne vonMeßfehlern zuläßt und daher bei der Schätzung der Kommunalitäten von einer Varianzauf-klärung pro Indikator von weniger als 100% ausgeht. Im Gegensatz hierzu läßt dieHauptkomponentenlösung keine Meßfehler zu und geht von einer vollständigen Varianzauf-klärung aus. In unserem zweifaktoriellen Modell betrachtet letztere die nicht auf die gemein-samen Faktoren entfallenden Varianzanteile der Indikatoren als Informationsverlust. Zweitenserreicht weder die Hauptkomponenten- noch Hauptachsenlösung die von uns angestrebteEinfachstruktur. Insbesondere die Indikatoren X4, X5 und X6 laden bei beiden Lösungen auf denbeiden Faktoren nahezu gleich hoch. Drittens finden wir bei beiden Lösungen für die Indikato-ren X1, X2 und X3 jeweils auf dem zweiten Faktor negative Ladungen. In der Terminologie derFaktorenanalyse wird dieser Faktor als bipolar bezeichnet, hingegen läßt sich der erste Faktormit seinen Ladungen ohne Vorzeichenwechsel als unipolar charakterisieren. Die hohen Doppel-ladungen und negativen Vorzeichen auf dem zweiten Faktor erschweren die inhaltliche Inter-pretation der Faktoren erheblich. Hingegen läßt sich die formale Güte der Faktorenmodelle anden Kommunalitäten und Eigenwerten direkt ablesen. Die zweifaktorielle Hauptkomponentenlö-

Page 18: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 18

sung erklärt insgesamt 61,6% der Gesamtvarianz der Indikatoren, wobei 39,% auf den erstenund 22,1% auf den zweiten Faktor entfallen. Im Hauptachsenmodell binden beide Faktorenzusammen 43,1 % der Gesamtvarianz, wozu der erste und zweite Faktor 30,7% bzw. 12,4%beitragen. Diese insgesamt geringere Modellanpassung ist darauf zurückzuführen, daß dasHauptachsenmodell von sehr viel restriktiveren Modellannahmen ausgeht. Für beide Faktorenlö-sungen gilt gleichermaßen, daß sich ihre unrotierten Ladungsmatrizen einer inhaltlichen Inter-pretation aufgrund der beschriebenen Handicaps weitgehend entziehen.

Die Rotation der Faktoren

Um sich das Rotationsproblematik der Faktorenanalyse zu veranschaulichen, empfiehlt es sich,von einer graphischen Betrachtung auszugehen. Jede Korrelation zweier Variablen r X1 X2 läßtsich als Winkel zwischen den von ihnen aufgespannten Einheitsvektoren darstellen. Hierbei giltfolgende Relation:

rX1X2� cos (�) oder � � arccos (rX1X2

)

�: Winkel zwischen den Einheitsvektoren von X1 und X2 in Grad arccos: Arkus�Kosinus�Funktion

(16) Winkeltransformation der Korrelation zwischen X1 und X2

Die Faktorenanalyse legt den ersten Faktor so durch die von den Indikatoren gebildete Punkt-wolke, daß er das Maximum der in ihnen enthaltenen Varianz erfaßt. Der zu ihm senkrechtestehende zweite Faktor so bestimmt, daß er ein Maximum der verbleibenden Restvarianz erfaßt.Beide Faktoren spannen dann ein neues Achsenkreuz im euklidischen Raum auf, wobei dieFaktorladungskoeffizienten der einzelnen Variablen ihren Koordinaten im reduziertenMerkmalsraum entsprechen. Da es sich bei den Faktorladungen um die Korrelationen zwischenden Indikatoren und ihrem Faktor handelt, können wir über die Arkus-Kosinus-Funktion derFaktorladung ebenfalls den zugehörigen Winkel zwischen der Variablen und ihrem Faktorberechnen. In der Abbildung 5 werden sechs Variablen im zweidimensionalen Faktorraumdargestellt. Alle sechs Variablen weisen auf beiden Faktoren relativ niedrige Ladungen auf, wobei dieletzten drei Indikatoren negativ auf dem zweiten Faktor laden. Dies erschwert eindeutig dieInterpretation der Faktorladungen, wobei sich die Faktoren inhaltlich kaum identifizieren lassen.Abhilfe bei diesem Interpretationsproblem leisten die sogenannten Rotationsverfahren, die dasorthogonale Achsenkreuz der Faktorenlösung nach vorgegebenen mathematischen Kriteriendrehen. Wie Bortz (1989, S. 637) gezeigt hat, beeinflußt die Rotation des Achsenkreuzes dieFiguration der Indikatoren im euklidischen Raum nicht, sondern die Rotation spiegelt die Varia-blen nur auf den neuen Achsen wider. Dreht man in Abbildung 5 das von den zwei Faktorengebildet Achsenkreuz im Antiuhrzeigersinn dergestalt, daß die Achse des ersten Faktors durchdie unteren drei Indikatoren verläuft, so vereinfacht sich die zugehörige Ladungsstruktur erheb-lich. Während die unteren drei Indikatoren nunmehr auf dem gedrehten ersten Faktor hochladen,

Page 19: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 19

tuen dies die oberen drei auf dem zweiten Faktor. Umgekehrt reduzieren sich ihre jeweiligenKreuzladungen fast auf Null. Wir erhalten folglich eine eindeutig interpretierbare Faktoren-struktur, wobei die oberen drei Indikatoren den zweiten rotierten Faktor kennzeichnen, währenddie unteren drei Indikatoren den ersten rotierten Faktor prägen. Bei einer größeren Anzahl vonIndikatoren und damit auch von Faktoren erweist sich dieses graphische Vorgehen als unge-eignet, da dann mehrdimensionale Drehungen durchgeführt werden müssen. Abhilfe leistenhierbei numerische Verfahren, die den Winkel zwischen der Ausgangs- und rotierten Faktoren-achse dergestalt bestimmen, daß wir eine interpretierbare Einfachstruktur erhalten.

Nichtrotierte Hauptkomponentenlösung

Komponente 1

1,0,50,0-,5-1,0

Kom

pone

nte

2

1,0

,5

0,0

-,5

-1,0

für afirmativ action

mehr geld für schule

Abbildung5: Graphische Darstellung der unrotierten Faktorladungen

In der soziologischen Forschungspraxis hat sich vor allem die Varimax-Rotation durchgesetzt,welche die Faktorladungsmatrix spaltenweise vereinfacht. Hingegen tut dies die Quatrimax-Rotation zeilenweise. Beide numerische Verfahren versuchen den Winkel zwischen derursprünglichen und der rotierten Faktorachse so zu bestimmen, daß die Varianz der quadriertenFaktorladungen entweder spalten- oder zeilenweise maximiert wird. Hierbei besteht das Zieljeweils darin, eine möglichst einfache Faktorenstruktur, die sogenannte „Einfachstruktur“ zufinden. In diesem Fall lädt jeder Indikator nur auf einem Faktor. In diesem Fall ist die Kommu-nalität des entsprechenden Indikator gleich seiner quadrierten Faktorladung. Da dies nur einidealtypischer Fall ist, benötigen wir eine Maßzahl zur Bestimmung der Einfachheit der Fakto-renstruktur. Hierzu bietet sich die Varianz der quadrierten Faktorladungen an, die auch als Maß

Page 20: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 20

der „faktoriellen Komplexität einer Variablen“ bezeichnet wird. Sie erreicht dann ihr Maximum,wenn die quadrierte Ladung eines Faktor auf einer Variablen nahezu deren gesamte Kommunali-tät erfaßt. In diesem Fall erreicht die Ladungsmatrix bezogen auf ihre Zeilen (Indikatoren) ihrehöchstes Maß an Einfachheit.

Varianz der quadrierten Ladungskoeffizienten b 2ij :

q �1r

�r

j1(b 2

ij � b 2ij )2

�r

j1(b 4

ij )

r�

�r

j1b 2

ij

2

r 2

r: Anzahl der gemeinsamen Faktoren

i: Zeilenindex der Faktorladungsmatrix

j: Spaltenindex der Faktorladungsmatrix

(17) Berechnung der faktoriellen Komplexität (Holm 1976, S.104)

Verallgemeinern wir dieses Varianzmaß für alle verwendeten Indikatoren, so haben wir dieSumme aller zeilenweisen Einzelvarianzen der quadrierten Faktorladungen zu bilden.

Q � �n

i1qi � �

n

i1

�r

j1(b 4

ij )

r�

�r

j1b 2

ij

2

r 2

i: Zeilenindex der Ladungsmatrix

n: Anzahl der Indikatoren

(18) Zeilenweise Bestimmung der Gesamtvarianz der quadrierten Faktorladungen Q

Nach der numerischen Bestimmung der unrotierten Faktorlösung stehen die Anzahl der gemein-samen Faktoren r und die Kommunalitäten der Indikatoren fest. Damit können wir die obigeOptimierungsgleichung schrittweise vereinfachen.

Page 21: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 21

(.1) �r

j1b 2

ij � hi2

(.2) r � Anzahl der gezogenen Faktoren

Alle Konstanten fallen aus dem Maximierungskriterium heraus.

(.3) Q � �n

i1�r

j1bij

4� Maximum

(19) Berechnung der Optimierungsgleichung der Quartimax-Rotation

Von dem in Gleichung 19.3 enthalten Exponenten leitet sich die Bezeichnung Quartimax-Rota-tion ab. In der Anwendungspraxis führt sie aber dazu, daß die Faktorladungsstruktur bezogenauf die einzelnen Indikatoren stark vereinfacht wird. Die Varianzen der Indikatoren werdendurch möglichst wenige gemeinsame Faktoren, zumeist einem „Generalfaktor“, reproduziert.Dies führt dazu, daß zwar einige wenige Indikatoren auf diesem Faktor hochladen; die Mehrzahlder Indikatoren auf ihm jedoch sehr niedrig lädt. Damit erzielen wir zwar eine Varianzmaximie-rung nur auf dem Generalfaktor, die anderen Faktoren lassen sich aber inhaltlich kaum inter-pretieren.Im Gegensatz hierzu vereinfacht das sogenannte Varimax-Verfahren die Ladungsmatrix simul-tan für alle Faktoren. Hierbei maximiert es die Varianz der quadrierten Ladungskoeffizientenspaltenweise. Das hierbei zu maximierende Varianzkriterium lautet folgendermaßen:

Spaltenweise Bestimmung der Gesamtvarianz der quadriertenFaktorladungen V: Varimaxrotation mit Kaisernormalisierung

Vj � �r

j1vj �

1n

�r

j1�n

i1(b 2

ij /hi2)2

�1

n 2�n

i1(b 2

ij / hi2 )

2

� Maximum

i: Zeilenindex der Ladungsmatrix

j: SpaltenindexderLadungsmatrix

n: Anzahl der Indikatoren

r: Anzahl der gemeinsamen Faktoren

h 2i : Kommunalität des Indikators i

(20) Optimierungsgleichung der Varimax-Rotation (Holm 1976, S. 104)

Page 22: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 22

Um den Einfluß hoher Ladungen der ursprünglich unrotierten Faktorenlösung zu reduzieren,werden in der obigen Optimierungsgleich zumeist „normalisierte Faktorladungen“ verwendet.Man erhält sie, indem man die Ladung eines gemeinsamen Faktors durch die Kommunalität derbetreffenden Variable dividiert. Kaiser (1958) wies nach, daß die Varimax-Methode in zweierleiHinsicht der Quartimax-Methode überlegen ist. Sie führt erstens zu einer klareren Trennung derFaktorladungen. Wird anschließend die Anzahl der zu analysierenden Items reduziert, so re-produziert zweitens die Varimax-Methode meistens die zuvor gefundene Faktorenstruktur. Sieerweist sich hierbei als wesentlich stabiler als das Quartimax-Verfahren.Das Equimax-Verfahren stellt einen Kompromiß zwischen dem Quartimax- und Varimax-Verfahren dar, da die Varianz der Ladungsmatrix simultan entlang der Zeilen und Spaltenoptimiert werden soll. Auf das Equimax-Verfahren wird im Folgenden nicht näher eingegangen.Die folgende Tabelle stellt die rotierten Faktorladungen der Hauptkomponenten- und Haupt-achsenmethode für unsere politischen Zielpräferenzen gegenüber.

Tab.2: Vergleich der Varimax-rotierten Ladungsmatrizen der Hauptkomponenten-und Hauptachsenlösung der Faktorenanalyse politischer Zielpräferenzen

Hauptkomponentenlösung Hauptachsenlösung

Variable: Faktor 1 Faktor 2 h² Faktor 1 Faktor 2 h²

X 1 +0,831 +0,149 0,713 +0,781 +0,164 0,637

X 2 +0,808 +0,113 0,666 +0,686 +0,143 0,492

X 3 +0,770 +0,072 0,598 +0,588 +0,122 0,360

X 4 +0,149 +0,775 0,623 +0,144 +0,683 0,487

X 5 +0,105 +0,755 0,581 +0,122 +0,589 0,362

X 6 +0,060 +0,715 0,514 +0,102 +0,490 0,251

Vergleicht man die rotierten Ladungsmatrizen beider Faktorlösungen, so zeigt sich, daß beidedieselben Variablengruppen (Cluster) identifizieren. Bei beiden Verfahren laden die ersten dreiVariablen hoch auf dem ersten Faktor und die letzten drei hoch auf dem zweiten Faktor, wobeisie jeweils sehr niedrige „Kreuz- oder Fremdladungen“ aufweisen. Somit ist es uns gelungeneine „Einfachstruktur“ im Sinne Thurstone zu identifizieren. Hierbei bildet der erste Faktoreindeutig wirtschaftliche Zielpräferenzen ab, während der zweite Faktor eindeutig Bürger- undMinderheitenrechte thematisiert. Die Faktorladungen der Hauptachsenlösung fallen zwar imDurchschnitt gesehen niedriger aus als diejenigen der Hauptkomponentenlösung, sie identifizie-ren aber dieselben inhaltlichen Faktoren. Zur inhaltlichen Charakterisierung eines Faktor werdenbeim Vorliegen einer Einfachstruktur nur rotierte Ladungen herangezogen, die größer als Betrag0,30 ausfallen. Variablen, die den Faktor inhaltlich bestimmen, sollten Ladungen aufweisen, diegrößer als Betrag 0,50 oder 0,60 ausfallen. Letzteres Kriterium wird je nach Rigidität desmethodologischen Standpunkts gewählt.

Page 23: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 23

Komponentendiagramm im rotierten Raum

Komponente 1

1,0,50,0-,5-1,0

Kom

pone

nte

2

1,0

,5

0,0

-,5

-1,0

das headstart prografür afirmativ actionrassentrennung durch

sollte großkapital kmehr geld für arbeit

mehr geld für schule

Abbildung6: Faktorladungsplot der Hauptkomponentenlösung nach der Varimax-Rotation

Faktordiagramm im gedrehten Faktorbereich

Faktor 1

1,0,50,0-,5-1,0

Fak

tor

2

1,0

,5

0,0

-,5

-1,0

das headstart progra

für afirmativ action

rassentrennung durch

sollte großkapital kmehr geld für arbeitmehr geld für schule

Abbildung7: Faktorladungsplot der Hauptachsenlösung nach der Varimax-Rotation

Page 24: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 24

Abhängige oder oblique Faktoren

Bis jetzt sind wir davon ausgegangen, daß unsere identifizierten Faktoren statistisch voneinanderunabhängig sind. In der Terminologie der Faktorenanalyse spricht man in diesem Fall vonorthogonalen Faktoren. Diese restriktive Annahme läßt sich oftmals in der Forschungspraxisnicht aufrechterhalten. Stellen wir uns vor, wir haben zwei Itemsets zur Messung vonFremdenfeindlichkeit und Rechtsradikalismus entwickelt und sie von einer Bevölkerungsstich-probe bewerten lassen. Auf der theoretischen Ebene hängen beide Zieldimension sehr engzusammen, da zur rechtsextremen Ideologie eine ausgesprochene Fremdenfeindlichkeit gehört.

Abbildung8: Pfadmodell für die Faktorenlösung mit abhängigen Faktoren(Oblique Rotation)

Page 25: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 25

Im klassischen Faktorenmodell wird dieser Zusammenhang negiert, da wir die Orthogonalitätder Faktoren unterstellen müssen. Wollen wir aber die Abhängigkeit der Zieldimensionenberücksichtigen, so müssen wir ein Modell mit abhängigen Faktoren schätzen. Dies hat be-sondere Implikationen für die Varianzzerlegung der Indikatoren, die Berechnung der Kommuna-litäten sowie die Korrelationszerlegung zweier Indikatoren. Hierzu können wir unsere In-strumente der Pfadanalyse verwenden. In der Abbildung 8 können wir die Varianz des z-stan-dardisierten Indikators X1 wiederum in die Erklärungsanteile der gemeinsamen Faktoren und desuniquen Faktors zerlegen. Wir müssen aber beachten, daß wir uns durch die Interkorrelation derFaktoren F1 und F2 einen nichtkausalen korrelativen Effekt einhandeln. Letzterer muß bei derVarianzzerlegung und der Berechnung der Kommunalität explizit berücksichtigt werden. Diesgeschieht folgendermaßen:

VAR (X1) � (b 2X1F1

� b 2X1F2

� 2�bX1F1� bX1F2

�rF1F2) � d 2

1

h 2 (X1) � (b 2X1F1

� b 2X1F2

� 2�bX1F1� bX1F2

�rF1F2)

(21) Varianzzerlegung und Kommunalitäten eines Indikators im obliquen Faktorenmodell

Die Interkorrelation der Faktoren erschwert ebenfalls die Zerlegung der beobachteten Korrela-tion r zwischen X1 und X2, da hierbei ebenfalls die nichtkausalen korrelativen Effekte berück-sichtigt werden müssen. Dies läßt am Beispiel der Variablen X1 und X2 folgendermaßenveranschaulichen:

rX1X2� bX1F1

�bX2F1� bX1F2

�bX2F2

� bX1F1� rF1F2

� bX2F2

� bX2F1� rF1F2

� bX1F2

(22) Zerlegung der Interkorrelation zweier Indikatoren im obliquen Faktorenmodell

Bei abhängigen Faktoren erweitert Thurstone sein Grundtheorem der Faktorenanalyse um dieKorrelationsmatrix der gemeinsamen Faktoren.

Page 26: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 26

1 rX1X2

rX2 X11

bX1F1bX1 F2

bX2F1bX2 F2

1 rF1F2

rF2 F11

bX1 F1bX2F1

bX1 F2bX2F2

R � B � C � B �

C: Korrelationsmatrix der Faktoren

(23) Thurstones Grundtheorem für oblique Faktoren

Die Interkorrelation der Faktoren führt ebenfalls dazu, daß sie bei die Berechnung der Faktor-ladungen im Sinne der Korrelation zwischen Faktor und Indikator ausdrücklich berücksichtigtwerden muß.

Faktorladung als Korrelation zwischen Faktor und Indikator:

rF1 X1� bX1F1

� rF1 F2� bX1F2

Pattern�Matrix enthält alle direkten Faktorladungen bXi Fj

(Achsenparallele Projektion der Koordinaten)

Structure�Matrix enthält die Gesamtkorrelation zwischen derVariablen/Item Xi und dem Faktor Fj: rXi Fj

(Orthogonale Projektion der Koordinaten)

(24) Direkte und Gesamtkorrelation zwischen Indikator und Faktor im obliquenFaktorenmodell

Dies führt dazu, daß wir bei der obliquen Faktorenlösung zwei unterschiedliche Ladungs-matrizen erhalten, die eigentliche Pattern- und die Structure-Matrix. Die Structure-Matrixenthält die Gesamtkorrelation zwischen Indikator und Faktor, die sich aus der Summe desdirekten und indirekten Effekts ergibt. Hingegen enthält die Pattern-Matrix nur die direktenLadungen des Faktors auf seinen Indikatoren. Sie eignet sich daher für die inhaltliche Inter-pretation der Faktoren. Zur graphischen Darstellung in Form der Faktorladungsplots und zurinhaltlichen Interpretation werden nur die Ladungskoeffizienten der Pattern-Matrix verwendet.

Um für unsere politischen Zielpräferenzen eine oblique Faktorenlösung zu schätzen, müssen wirden SPSSfWin FACTOR-Befehl folgendermaßen ändern:

Page 27: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 27

SPSSfWin-Befehlssyntax:

* Berechnung der Hauptkomponentenlösung.* Kaiserkriterium: Anzahl der Faktoren mit Eigenwerten > 1.* Obligque Rotation (Abhängigkeit der Faktoren wird unterstellt.

FACTOR /MATRIX=IN (COR=*) /ANALYSIS=v1 to v6/PRINT DEFAULT CORRELATION /CRITERIA ITERATE (100)/FORMAT SORT/EXTRACTION PC /ROTATION OBLIMIN/PLOT=ROTATION.

Im Rahmen der klassischen Faktorenanalyse können wir die Abhängigkeit unserer Faktorennicht direkt schätzen, sondern sie wird erst durch eine nichtorthogonale Rotation im nachhineinermittelt. Hierbei wird der Winkel zwischen den Faktorachsen solange verkleinert bzw. ver-größert bis das folgende Minimierungskriterium für die Faktorladungen der unrotierten La-dungsmatrix erfüllt ist. Den Ausgangspunkt für die Rotation bildet zumeist eine Hauptkompo-nentenlösung. Ihre ursprüngliche Faktorladungsmatrix wird dann anschließend rotiert. In derLogik der klassischen Faktorenanalyse macht dieses Vorgehen Sinn, da hohe Kreuzladungenzweier „orthogonaler Faktoren“ darauf hinweisen, daß der Indikator beide Faktoren gleichzeitigmißt. Wenn der Indikator sie gleichzeitig mißt, müssen die zugehörigen Faktoren aus inhaltli-cher Sicht etwas gemeinsam haben. Wenn wir nun die Interkorrelation der Faktoren ausdrück-lich berücksichtigen, sollte sich die Ladungsstruktur wieder vereinfachen, da wir die Quelle derKreuzladungen statistisch kontrollieren.

Minimierungskriterium des direkten OBLIMIN�Verfahrens in SPSSfWin

V � �r

j<q�n

i1b 2

ij �b 2iq �

n� �

n

i1b 2

ij � �n

i1b 2

iq � Minimum

Arminger (1979,S.107) empfiehlt die Kaisernormalisierungder unrotierten Ladungsmatrix B:

B �� �

r

j<q�n

i1

bij

hi

2

biq

hi

2

Legende:

j ,q ,r: Laufindizes der Faktorenj ,n: Laufindizes der Variablen/Indikatoren

b 2ij : Quadrierte Faktorladungskoeffizient der Variablen i auf Faktor j

b 2iq: Quadrierte Faktorladungskoeffizient der Variablen i auf Faktor q

hi: Quadratwurzel der Kommunalität der Variablen i�: Durchschnittliches Ausmaß der Faktorinterkorrelation

Page 28: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 28

Nie u.a. (1975, S. 486) geben für das Abhängigkeitskriterium � die folgenden Orientierungs-werte an. Norusis (1993, S. 79) weist daraufhin, daß SPSSfWin nur �-Werte kleiner oder gleich+0,8 akzeptiert. Anderfalls setzt es für das �-Kriterium die Voreinstellung Null ein.

Tab.3 : Delta (�)-Werte bei der schiefwinkeligen Rotation

0 < � � 0,8 Hohe Korrelation der Faktoren

� = 0 Mäßige Korrelation der Faktoren (Voreinstellung)

- 5,0 � � � - 0,5 Schwache Korrelation der Faktoren

� � - 5,0 Orthogonale Faktorlösung (Korrelation ist Null)

Problematisch ist dieses Vorgehen aus zwei Gesichtspunkten. Zum einen können wir dieInterkorrelation der Faktoren nicht direkt schätzen, sondern wir ermitteln sie durch eine nach-trägliche Transformation unserer ursprünglichen Ladungsmatrix. Hierzu geben wir indirekt überdas Delta-Kriterium sogar das Ausmaß ihrer Abhängigkeit vor. Zum anderen konfundieren wirauf der Meßebene weiterhin die Indikatoren der beiden Konstrukte, indem wir Kreuzladungenzulassen. Beide Probleme kann erst der LISREL-Ansatz von Jöreskog&Sörbom (1993) adäquatlösen.

Wir erhalten nach der erfolgreichen obliquen Rotation die folgenden Pattern- und Strukturen-Matrizen:

Pattern Matrix: Strukturen Matrix:

Factor 1 Factor 2 Factor 1 Factor 2

V1 .83385 .03753 V1 .84386 .25994V2 .81510 .00333 V2 .81599 .22074V3 .78116 -.03313 V3 .77232 .17523

V4 .04462 .77620 V4 .25166 .78810V5 .00301 .76117 V5 .20604 .76197V6 -.03804 .72637 V6 .15571 .71623

Factor Correlation Matrix:

Factor 1 Factor 2

Factor 1 1.00000Factor 2 .26673 1.00000

Wenden wir die vorgestellte Arcus-Kosinus-Transformation für die geschätzte Korrelation derFaktoren von r F1 F2 = +0,267 an, so erhalten wir einen geschätzten Winkel von 74 Grad und 30

Page 29: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 29

Minuten zwischen den beiden rotierten Faktorachsen. Betrachten wir die Faktorladungen derStrukturen-Matrix, so zeigt sich, daß erstens die bereits bekannte Einfachstruktur reproduziertwird und daß zweitens die Ladungen auf dem zweiten Faktor etwas höher ausfallen. Betrachtenwir den zugehörigen Faktorladungsplot der Patternmatrix, deren Elemente SPSSfWin fälsch-licherweise in ein rechtwinkeliges Koordinatensystem abträgt, so zeigt sich, daß die Indikatorennunmehr auf den Achsen liegen.

Komponentendiagramm der obliquen Rotation

Komponente 1

1,0,50,0-,5-1,0

Kom

pone

nte

2

1,0

,5

0,0

-,5

-1,0

das headstart prografür afirmativ actionrassentrennung durch

sollte großkapital kmehr geld für arbeit

mehr geld für schule

Abbildung9: Faktorladungsplot der Patternmatrix der Hauptkomponentenlösung nach obiquerRotation mit maximaler Abhängigkeit der Faktoren

Kim und Mueller (1978a, S. 57) stellen in der folgenden Abbildung 10 gleichzeitig die Varimax-rotation der Patternmatrix und ihre sich anschließende oblique Rotation korrekt dar. Hierbeibezeichnen die Abkürzungen F1 und F2 die orthogonalen Faktoren vor der Rotation. Mit F1' undF2' bezeichnen sie die Varimax-rotierten Faktoren, die ebenfalls unkorreliert sind. Hingegenmarkieren die Kürzel F1'' und F2'' die korrelierten Faktoren F1 und F2 nach ihrer obliquen Rota-tion. Nunmehr liegen die ersten und letzten drei Indikatoren politischer Ziele auf den Faktor-achsen, wobei diese einen Winkel von 74° 30' aufspannen. Dies entspricht einer Korrelation derFaktoren von +0,267.

Page 30: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 30

Page 31: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 31

2 S. Kim&Mueller 1978b, S. 74

Frequently Asked Questions:

1. Welches Meßniveau müssen die Variablen (Indikatoren) aufweisen ?

Die klassische Faktorenanalyse wurde für intervallskalierte Variablen entwickelt. In der For-schungspraxis reichen hierzu bereits Likert-Rating-Skalen aus, die mindestens vier Ausprägun-gen aufweisen.2 Arminger (1979, S. 159) vertritt die Ansicht, daß Faktorenanalysen auch mitDummyvariablen gerechnet werden können, sofern wir für die Relationen der dichotomenIndikatoren zu ihren gemeinsamen Faktoren ein linear-additives Modell unterstellen können.

„Da der Korrelationskoeffizient zwischen 0,1 kodierten Variablen identisch ist mit dem �-Koeffizienten der Tabellenanalyse der Vierfeldertafel ... , ergibt sich die Faktorenanalyse vondichotomen Daten als Faktorisierung der entsprechenden �-Koeffizienten. Auf eine orthogonaleLösung können die üblichen Rotationsverfahren angewendet werden. Voraussetzung derVerwendung der �-Koeffizienten ist die Annahme der Linearität [der gemeinsamen Faktorla-dungen, W.L.], worauf McDonald (1967) besonders hinweist.“ (Arminger 1979, S. 159)

2. Wieviel Indikatoren/Variablen benötigt man, um einen Faktor sinnvoll zu bestimmen?

Thurstone (1947) empfiehlt, für jeden „substanztheoretisch“ zu erwartenden Faktor mindestensdrei Indikatoren zu verwenden. Bei konfirmatorischen Analysen reichen bereits zwei Indikatorenpro Faktor aus. Zusätzliche Indikatoren erhöhen den Informationsgehalt und die Stabilität derFaktorenlösung.

„In general, the greater the ratio of the number of variables to the number of underlyingfactors, the more informative the factor analysis is. But what is crucial is not the overall ratio,but the number of variables for each factor. Some authors (Thurstone) recommand at least threevariables for each factor for a good resolution of the dimensionality issue“ (Kim&Mueller1978b. S. 68).

Es besteht zu mindest Konsens darüber, daß man bei einer vorgegebenen Faktorenzahl minde-stens doppelt soviele Indiktoren für die Analyse auswählen sollte.

3. Wieviel gemeinsame Faktoren sollte man aus einem Indikatorenset ziehen ?

Für die Beantwortung dieser Frage ist es von entscheidender Bedeutung, ob wir konfirmatorischoder explorativ bei unserer Datenanalyse vorgehen. Bei der konfirmatorischen Vorgehensweise, die zumeist zur Faktorvalidierung einer Operationalisierung dient, ergibt sich die Mindest-anzahl der gemeinsamen Faktoren aus der Anzahl der operationalisierten Konstrukte. In diesemFall gehen wir davon aus, daß nur die Zieldimensionen gemessen worden sind. Hinter jedemzusätzlich gezogenen Faktor verbirgt sich dann eine Fremddimension, die es inhaltlich zu

Page 32: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 32

Likelihood�Ratio��2�Anpassungstest:

LR��2�Testgröße � n� ln |C |� ln |R |� trace (RC 1 )�k

Anzahl der Freiheitsgrade (F.G.):

F.G. �12

� (k�r )2� (k�r )

n: StichprobenumfangC: FF �

� U² (Reproduzierte Kovarianz�/Korrelationsmatrix)F: Matrix der FaktorladungenU²: Varianz Meßfehler (Unique Varianz)R: BeobachteteKovarianz�/Korrelationsmatrixk: Anzahl der Indikatorenr: Anzahl der Faktoren

(25) Berechnung der Prüfgröße des Likelihood-Ratio-�²-Tests

n � k � 1 � 50

(26) Daumenregel für die Anwendung des Likelihood-Ratio-�²-Anpassungstest

bestimmen gilt. Beim explorativen Vorgehen haben wir keine substanztheoretischen Kriterienan der Hand, die uns eine Faktorenanzahl vorgeben. Wir sind ausschließlich auf formaleKriterien angewiesen, um eine Faktorenlösung zu finden, die hinreichend gut die Daten be-schreibt. Inferenzstatistisch läßt sich die notwendige Faktorenanzahl mit Hilfe des Likelihood-Ratio-�²-Anpassungstests bestimmen. Hierbei vergleicht man die modellimmanent reproduzierteKorrelationsmatrix mit der beobachteten Korrelationsmatrix der Indikatoren. Die Summe ihrerDifferenzen ist approximativ �²-verteilt mit der zugehörigen Anzahl von Freiheitsgraden.

Die Nullhypothese dieses LR-�²-Anpassungstests für große Stichproben besagt, daß sich diemodellimmanent reproduzierte Korrelations-/Kovarianzmatrix statistisch nicht signifikant vonder beobachteten Matrix der Indikatoren unterscheidet. Erweist sich die zugehörige Prüfgrößeals signifikant, so muß die Nullhypothese verworfen werden. Dies bedeutet, daß die gemein-samen Faktoren die vorgegebene Korrelations-/Kovarianzstruktur nicht hinreichend erfassen.Wir müssen daher mindestens einen weiteren gemeinsamen Faktor ziehen und einen weiterenLR-�²-Test berechnen lassen. Hierbei gilt, daß je größer der Stichprobenumfang ist, desto besserfällt die Approximation der Prüfgröße an die �²-Verteilung aus. Lawley und Maxwell (1971)halten den Test für angemessen, wenn der Stichprobenumfang die Indikatorenzahl um 51 Fälleübersteigt.

Der LR-�²-Test unterstellt, daß die Indikatoren multinormalverteilt sind. Da dies nur selten derFall ist, benötigen wir „praktische Kriterien“ für die Bestimmung der notwendigen Faktoren-anzahl. Dies erweitert den Anwendungsbereich der Faktorenanalyse beträchtlich, da sie selbst

Page 33: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 33

die Multinormalverteilung der Indikatoren nicht voraussetzt. In der Forschungspraxis hat sichweitgehend das von Kaiser entwickelte Eigenwertkriterium durchgesetzt, das besagt, daß nurdiejenigen Faktoren zu ziehen seien, deren Eigenwerte und damit deren Varianz größer als Einsausfällt. Dies besagt, daß nur diejenigen Faktoren „praktisch bedeutsam“ sind, die mehr Varianzals jeder einzelne Indikator erfassen. Dieses Kriterium ist äquivalent zu der Forderung, daß jederpraktisch bedeutsame Faktor mehr Varianz erklären müsse als a priori zu erwarten sei. Diezugehörige Baseline erhalten wir, indem wir 1 oder 100 durch die Anzahl der Faktoren dividie-ren, je nach dem ob wir den Anteilswert oder den Prozentsatz der Varianzaufklärung betrachten.

Ergänzend hierzu bietet sich der von Cattell (1965a,b) entwickelte Scree-Test („Geröll-Test“)an, der auf einer graphischen Analyse des Verlaufs der Eigenwerte beruht. Hierbei legt manzunächst durch zwei benachbarte Eigenwerte jeweils eine Gerade und stoppt dann die Faktori-sierung, wenn sich die Steigung der Geraden dem Wert Null nähert.

Abbildung11: Anwendung des Scree-Tests nach Cattel (Kim&Mueller 1978b, S. 45)

Dem Augenschein zur Folge nimmt in Abbildung 11 die Steigung der Geraden spätestens nachdem fünften Faktor dramatisch ab und nähert sich zunehmend der X-Achse. Daher solltengemäß der Daumenregel von Cattel nicht mehr als fünf Faktoren aus der Korrelationsmatrixgezogen werden. Wendet man auf das obige Beispiel das Kaiser-Eigenwert-Kriterium an, soverfehlt der fünfte Faktor die Eigenwertgrenze von Eins nur knapp. Daher sollte man stets beideKriterien bei der Festlegung der notwendigen Faktorenanzahl beachten.

Page 34: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 34

4. Welche Bedeutung haben die Vorzeichen der Faktorladungen ?

Das Vorzeichen selbst besitzt keine eigene Bedeutung und sollte daher keineswegs zur Be-stimmung der Ladungsstärke des Indikators auf dem zugehörigen Faktor verwendet werden. InBezug auf die zum selben Faktor gehörenden anderen Variablen mit positiven Vorzeichenbedeutet ein negatives Vorzeichen, daß der jeweilige Indikator mit dem Faktor negativ verbun-den ist. Im Sinne des vorgestellten Pfadmodells bedeutet dies, daß der betreffende Indikator zu-mindest mit einem weiteren Indikator seines Sets negativ korreliert ist. Daher empfiehlt es sich,vor der Faktorenanalyse alle Items in Richtung der vorgegebenen Zieldimension umzucodieren.

5. Kann man von der tatsächlichen Unabhängigkeit zweier Faktoren ausgehen, wenn diesdurch eine orthogonale oder oblique Faktorenanalyse belegt ist ?

Die Antwort lautet nein. Da die Grundannahme der Faktorenanalyse lautet, daß die latentenFaktoren statistisch unabhängig voneinander sind, im geometrischen Sinn bedeutet dies, daß ihrezugehörigen Achsen in einem Winkel von 90° zueinander stehen, kann das Verfahren dieseAnnahme selbst nicht testen. Selbst die oblique Rotation eignet sich dazu nicht, da sie erstensauf einer orthogonalen Hauptkomponentenlösung basiert und zweitens der Forscher über das �-Kriterium das Ausmaß der Abhängigkeit der Faktoren selbst vorgeben muß. Eine echte Tren-nung und damit separate Schätzung der Faktorladungen und der Faktorkorrelation gestattet erstder von Jöreskog &Sörbom entwickelte LISREL-Ansatz („Lineare Strukturgleichungsmodelle“).

Literaturverzeichnis:

Arminger, Gerhard (1979): Faktorenanalyse. Stuttgart: Teubner

Backhaus, Klaus, Erwachsen, Bernd, Pinke,Welf ,& Weiber, Rolf (19947): Multivariate Analysemethoden. Eine anwendungs-

orientierte Einführung. Berlin: Springer, S. 189-259

Bortz, Jürgen (19893): Statistik für Sozialwissenschaftler. Berlin: Sprin-ger

Cattell, R.B (1965a): Factor analysis: an introduction to essentials. (I)Purpose and underlying models. In: Biometrica21, S. 190-215

Cattell, R.B (1965b): Factor analysis: an introduction to essentials. (II)The role of factor analyis in research. In:Biometrica 21, S. 405-435

Holm, Kurt (1976): Die Befragung 3. Die Faktorenanalyse. München,Francke

Page 35: Einführung in die Grundlagen der explorativen Faktorenanalyse · Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 1 Einführung in die Grundlagen der explorativen

Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999 - 35

Jöreskog, Karl G. & Sörbom, Dag (1993): LISREL 8 User´s Reference Guide. Chicago, Ill.:Scientific Software International

Kaiser, H. F. (1958): The varimax criterion for analytic rotation in fac-tor analysis. In: Psychometrica 23, S. 187-200

Kaiser, H.F. (1974): An index of factorial simplicity. In: Psychometri-ka, 39, S. 31- 36

Kim, Jae-On & Mueller, Charles W.(1978a): Introduction to factor analyses. What it is and how

to do it. Newbury Park,Ca:SAGEKim, Jae-On & Mueller, Charles W.(1978b): Factor analysis. Statistical methods and practical

issues. Newbury Park,Ca: SAGE

Lawley, D.N. & Maxwell, A.E.(1971): Factor analysis as a statistical method. London:Butterworth and Co.

Norusis, Marija J. (1993): SPSS for Windows. Professional Statistics.Release 6.0. Chicago, Ill.: SPSS Inc. S. 47-81

Thome, Helmut (1991): Grundkonzepte der explorativen Faktorenanalyse.In: Historical Social Research / HistorischeSozialforschung, Vol.16

Thurstone, L.L. (1947): Multiple factor analysis. Chicago, Ill.: Universityof Chicago Press