28
Faktorenanalyse

Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Embed Size (px)

Citation preview

Page 1: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Faktorenanalyse

Page 2: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

explorative vs. konfirmatorische Faktorenanalyse

• Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen (Schleifen) wird nach der besten Lösung gesucht.

• Konfirmatorische FA überprüfen, ob empirisch erhobene Daten ein bestehendes theoretisches Modell bestätigen oder verwerfen. Alternativ kann eine explorative FA an einer anderen Stichprobe „kreuzvalidiert“ werden.

Page 3: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Faktorenanalyse: Was und wozu?

• Der Begriff Faktorenanalyse umfasst eine Gruppe multivariater Analyseverfahren, mit denen zugrundeliegende gemeinsame Dimensionen von Variablenmengen (z.B. Fragebogenitems) untersucht werden.

• Die Faktorenanalyse führt zu einer Datenreduktion: Die Variation in einer Vielzahl von Variablen wird auf eine geringere Zahl von gemeinsamen Faktoren zurückgeführt.

Page 4: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Exploratorische Faktorenanalyse

• Bei einer exploratorischen Faktorenanalyse existieren im „Idealfall“ keine Annahmen darüber, wie viele Faktoren den Variablen zugrunde liegen und welche Struktur die Zusammenhänge zwischen den Variablen haben.

• In der Praxis ist das natürlich fast nie der Fall; z.B. vermuten wir vorab, dass unseren Fragebögen nur eine einzige latente Dimension zugrunde liegt.

Page 5: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Exploratorische Faktorenanalyse

• Im Rahmen der exploratorischen Faktorenanalyse gehen wir, der Natur der Methode entsprechend, trotzdem „naiv“ vor. Die Fragen, welche am Ende der Analyse beantwortet sein sollen, sind:

• Wie viele Faktoren sind angemessen, um die Zusammenhänge zwischen den untersuchten Variablen zu erklären?

• Welche der Faktoren beeinflussen welche meiner Variablen?

Page 6: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Faktorenanalyse im Bild

Faktoren: latent (rund)

Items: manifest (eckig)

Page 7: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Voraussetzungen der Faktorenanalyse

• intervallskalierte Variablen

• normalverteilte Variablen

• n pro Variable mindestens 3

• substanzielle Korrelationen im Datensatz

• dichotome Variablen (0/1) mit Einschränkungen verwendbar

Page 8: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

• viele Variablen werden durch wenige Faktoren ersetzt

• ein Faktor enthält die Information mehrerer Variablen

• Faktor: theoretische Variable oder Konstrukt, das allen wechselseitig hoch korrelierenden Variablen zu Grundeliegt

• Ergebnis der Faktorenanalyse: wechselseitig voneinander unabhängige Faktoren, die die Zusammenhänge zwischen den Variablen beschreiben oder erklären

Wesentliche Konzepte der Faktorenanalyse: Faktor

Page 9: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Wesentliche Konzepte der Faktorenanalyse: Faktorladung

• Korrelation einer Variablen mit einem Faktor

• Wertebereich: -1 bis +1

• „Variable lädt hoch oder niedrig auf diesem Faktor“

• über die Faktorladungen wird definiert, welche Variable zu welchem Faktor „gehört“ und damit auch, was jeder Faktor bedeutet

Page 10: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Wesentliche Konzepte der Faktorenanalyse: Kommunalität

• Die Kommunalität einer Variablen gibt an, in welchem Ausmaß die Varianz dieser Variablen durch die Faktoren erfasst / erklärt / aufgeklärt wird.

• Summe der quadrierten Ladungen einer Variablen über alle Faktoren

• Maximum: 1 (da die Gesamtvarianz jeder Variablen auf 1normiert ist)

Page 11: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

wesentliche Konzepte der Faktorenanalyse: Faktorwert

• kennzeichnet die Position einer Person auf einem Faktor

• Wertebereich: standardisierte Werte mitM = 0, s = 1 (pro Faktor).

• Wie sehr weist eine Person die Eigenschaften des Faktors auf?

Page 12: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Wesentliche Konzepte der Faktorenanalyse: Eigenwert Faktor• gibt an, wie viel von der Gesamtvarianz

aller Variablen durch diesen Faktor erklärt wird

• Summe der quadrierten Ladungen aller Variablen auf diesem Faktor

• 0 - Max: (entspricht der Anzahl an Variablen)

Page 13: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

SchematischeVeranschaulichungder Beziehungenvon Faktorladungen,Kommunalitäten undEigenwerten anhanddes Ladungsmustersvon vierVariablen auf zweiFaktoren.

Ladungsmatrix A

Page 14: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Fundamentaltheorem der Faktorenanalyse

• Ein beobachteter (standardisierter) Wert zij einer Person i in Variable j kann in eine Linearkombination aus den mit den Faktorladungen akj gewichteten Faktorwerten fik und einer Fehlerkomponente eij zerlegt werden.

• Gleichung für Person i:

zij=aj fi +aj fi2+ajk fik+...+ajq fiq+eij

• zij = der Wert der Person i in der beobachteten Variablen j;• ajk = Ladung der Variablen j auf Faktor k;• fik= Faktorwert der Person i in Faktor k;• eij = durch die Faktoren nicht erklärte Fehlerkomponente;• q = Anzahl der Faktoren (k = 1, …, q)

Page 15: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Faktorenextraktion

• Die Faktorenextraktion erfolgt nach dem Kriterium, dass jeder Faktor sukzessiv so viel Varianz in den untersuchten Variablen erklärt wie möglich.

• Jeder neue Faktor erklärt dabei nur Varianz, die von den zuvor extrahierten Faktoren nicht erklärt wurde.

• Zur Faktorenextraktion stehen verschiedene Verfahren zur Verfügung. Die beiden bedeutendsten sind die Hauptkomponentenanalyse (principal components analysis, PCA) und die Hauptachsenanalyse (principal axes factor analysis, PFA).

• Beide Verfahren unterscheiden sich vor allem hinsichtlich der Annahmen bezüglich der durch die Faktoren in den Variablen erklärbaren Varianz.

Page 16: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Bestimmung der Faktorzahl I

• Kaiser-Guttman-Regel (Eigenwertkriterium)–Alle Faktoren mit einem Eigenwert größer 1 werden aufgenommen.

–Somit erklärt ein Faktor immer mehr Varianz als eine ursprüngliche Variable.

Page 17: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

• Kriterium der extrahierten Varianz–Durch Vorüberlegungen kann festgelegt werden, wie groß der Anteil der extrahierten Varianz durch die aufgenommenen Faktoren sein soll.

Bestimmung der Faktorzahl II

Page 18: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Erklärte Gesamtvarianz

5.262 35.083 35.083

1.636 10.908 45.991

1.477 9.849 55.840

1.219 8.126 63.966

1.112 7.412 71.378

.841 5.605 76.983

.650 4.335 81.318

.585 3.902 85.220

.534 3.560 88.780

.485 3.231 92.011

.357 2.381 94.392

.259 1.728 96.120

.243 1.619 97.739

.182 1.211 98.950

.157 1.050 100.000

Komponente1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

Gesamt % der Varianz Kumulierte %

Anfängliche Eigenwerte

Extraktionsmethode: Hauptkomponentenanalyse.

Eigenwerte

3 Faktoren klären über 50% der Merkmals-varianz auf.

10 Faktoren klären über 90% der Merkmalsvarianz auf.

Kaiser-Guttman Kriterium

Page 19: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

• Screeplot–Über den „Knick“ im

Verlauf der Eigenwerte wird entschieden, wie viele Faktoren extrahiert werden.

–Im Beispiel würde man sich für 2 Faktoren entscheiden.

Screeplot

Faktor

1110987654321

Eig

enw

ert

4

3

2

1

0

Bestimmung der Faktorzahl III

Page 20: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Das Rotationsproblem

• Die Position der Faktoren ist zunächst nach Maximierung der Varianzaufklärung gewählt.

• Nach Bestimmung von Zahl (und Lage) der Faktoren ist eine Rotation um den Ursprung ohne Informationsverlust möglich.

• Ziel: Einfachstruktur, d.h. hohe Ladung der Faktoren auf einigen Variablen, niedrige auf den anderen.

Page 21: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Vor der Rotation

Variablen sind nur schwer zuzuordnen

Komponentenmatrixa

,799

,663

,786

,772

,371 -,562

,354

,376 ,619

,650 -,401

-,496 ,590

,358 ,756

,500 ,618

Psi

Astrologie

Hexen

Spiritismus

traditionell religioes

alternativ religioes

Offenheit

Neurotizismus

Lebenszufriedenheit

Leistungsbereitschaft

Sensation seeking

1 2 3

Komponente

Extraktionsmethode: Hauptkomponentenanalyse.

3 Komponenten extrahierta.

Page 22: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Nach der Rotation

Problem der Zuordnung nur noch bei der Variablen Leistungsbereitschaft

Rotierte Komponentenmatrixa

,841

,634

,779

,801

,610

,308

,653 ,313

,338 ,671

-,771

,635 -,544

,787

Psi

Astrologie

Hexen

Spiritismus

traditionell religioes

alternativ religioes

Offenheit

Neurotizismus

Lebenszufriedenheit

Leistungsbereitschaft

Sensation seeking

1 2 3

Komponente

Extraktionsmethode: Hauptkomponentenanalyse. Rotationsmethode: Varimax mit Kaiser-Normalisierung.

Die Rotation ist in 6 Iterationen konvergiert.a.

Page 23: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Rotationsvarianten

Orthogonale Rotation:Die Faktoren werden rechtwinklig rotiert.Vorteil: Faktoren sind voneinander unabhängig.

Oblique Rotation:Die Faktoren werden schiefwinklig rotiert.Vorteil: Über die Faktoren kann eine Faktorenanalyse zweiter Ordnung berechnet werden.

Page 24: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Faktorenrotation

Gebräuchliche orthogonale Rotationstechniken• Varimax: Maximiert die Varianz der quadrierten

Faktorladungen innerhalb der Faktoren. Varimax ist der am häufigsten verwendete orthogonale Rotationsalgorithmus.

• Quartimax: Maximiert die Summe der vierten Potenz aller Faktorladungen. Es wird angestrebt, einen Faktor mit vielen hohen und mittleren Ladungen sowie verbleibende Faktoren mit wenigen hohen und sonst niedrigen Ladungen zu erhalten. Dieses Verfahren kann angezeigt sein, wenn ein gemeinsamer Generalfaktor erwartet wird.

Page 25: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Faktorenrotation

Gebräuchliche oblique Rotationstechniken• Promax: Dieser Algorithmus startet mit einer

orthogonalen Rotation und transformiert die Faktoren anschließend in eine oblique Lösung mit dem Ziel, die absoluten Werte der Primärladungen zu maximieren und die Sekundärladungen gegen Null gehen zu lassen

• Direct Oblimin: Ein Rotationsalgorithmus, der die simultane Optimierung eines orthogonalen und eines obliquen Rotationskriteriums anstrebt.

• Bei beiden obliquen Rotationsverfahren kann die Höhe der Faktorinterkorrelationen vom Benutzer beeinflusst werden.

Page 26: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Interpretation der Faktoren

• Die berechneten Faktoren müssen inhaltlich interpretiert werden.

• Die Faktorenanalyse bietet die Faktorladungen der Variablen an, kann Faktoren aber nicht benennen oder interpretieren.

Page 27: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Formen der FA

• „Kommunalitätsproblem“: Wie viel Varianz von jeder Variablen wird zu Beginn der FA aufgeklärt, also bevor die endgültige Lage der Faktoren bekannt ist?Wenn die Variable selbst als Faktor berücksichtigt wird: 100%

h² = 1Wenn nur die anderen Variablen berücksichtigt werden: weniger

h² < 1

• Bei der Hauptkomponentenanalyse (PCA = Principal Component Analysis) wird zu Beginn des Optimierungsprozesses eine Kommunalität von 1 angenommen.

• Bei der Hauptachsenanalyse wird zu Beginn des Optimierungsprozesses die Kommunalität für jede Variable geschätzt

Page 28: Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen

Zusammenfassung

• Kommunalitäten: Summe der quadrierten Korrelationen einer Variable mit allen Faktoren; Prozentsatz der durch alle Faktoren beschriebenen Varianz einer Variablen

• Faktorladungen: Korrelation einer Variablen mit einem Faktor

• Faktorwerte: Kennzeichnet die Ausprägung eines Faktors für eine Person

• Eigenwert: Gesamtvarianz aller Variablen, die durch den Faktor aufgeklärt wird