78
Multivariate Analysemethoden, Dozent: Dr. Thomas Schäfer 29.05.2012 Alexander Allnoch, Markus Burkhardt & Vivien Röder

Multivariate Analysemethoden, Dozent: Dr. Thomas … · 2012-05-30 · Grundlagen –Faktorenanalyse 3. Nutzungsdimensionen von Musik -unsere ... Ziele der Faktorenanalyse:-datenreduzierendes

Embed Size (px)

Citation preview

Multivariate Analysemethoden,

Dozent: Dr. Thomas Schäfer

29.05.2012Alexander Allnoch, Markus Burkhardt & Vivien Röder

1. Einführung

2. Grundlagen – Faktorenanalyse

3. Nutzungsdimensionen von Musik - unsere

Untersuchung

4. Explorative Faktorenanalyse mit SPSS am Beispiel

unserer Musik-Erhebung

5. Konfirmatorische Faktorenanalyse

Faktorenanalyse…

� Was wisst ihr schon?

(aus Vorlesungen, Bachelorarbeit, eigenem

Literaturstudium aus intrinsischem

Interesse heraus…)

Ziele der Faktorenanalyse:

- datenreduzierendes Verfahren

-> viele Variablen zu wenigen hypothetischen

Faktoren zusammenfassen

- Prüfung von Theorien

- Testentwicklung

-> Ursprung: Spearman: Intelligenzstrukturtheorien

1. Einführung

2. Grundlagen – Faktorenanalyse

3. Nutzungsdimensionen von Musik - unsere

Untersuchung

4. Explorative Faktorenanalyse mit SPSS am Beispiel

unserer Musik-Erhebung

5. Konfirmatorische Faktorenanalyse

1. Einführung

2. Grundlagen 2. Grundlagen 2. Grundlagen 2. Grundlagen –––– FaktorenanalyseFaktorenanalyseFaktorenanalyseFaktorenanalyse

a) Korrelationsmatrix

b) Hauptachsenbestimmung

c) Faktorenextraktion

d) Rotation

e) Ergebnisinterpretation

3. …

� Variable (oder Item) besteht aus:

� 1… spezifischem Anteil

� 2… Teil, den sie mit anderen Variablen gemeinsam hat

� 3… Messfehler / unerklärten Teil

Ich höre Musik, … weil sie Trost spendet

Messfehler

„Trost“- Teil (spezifisch)

Emotionaler – Teil (gemeinsam)

unerklärter

Teil

gemein-

samer Teil

spezifischer

Teil

M1

Folie 7

M1 warum das VENN Dieagramm blau?Markus; 28.05.2012

Interessant ist der (Varianz-) Anteil, den verschiedene Variablen gemeinsam haben...

... denn der geht auf einen gemeinsamen, „dahinter-liegenden“ Faktor zurück

Ich höre Musik, Ich höre Musik,

…weil sie Trost spendet … weil sie mir Mut macht

unerklärter

Teil

gemein-

samer Teil

spezifischer

Teil

unerklärter

Teil

gemeinsamer

Teil

Mut

Bei einer großen gemeinsamen Anteil korrelieren beide Variablen (Items)______ miteinander.

Ich höre Musik, Ich höre Musik,

…weil sie Trost spendet … weil sie mir Mut macht

unerklärter

Teil

gemein-

samer Teil

spezifischer

Teil

unerklärter

Teil

gemeinsamer

Teil

Mut

Merke:

Die Grundlage für eine FA bildet die (empirische) Produkt - Moment – Korrelationsmatrix

…denn hier werden die linearen Zusammenhänge (also der gemeinsame Anteil der Variablen) sichtbar

� Im Folgenden Bsp. mit 3 Variablen da dies noch darstellbar.

FA i.d.R. mit sehr viel mehr Variablen!

� Korrelation aller 3 Variablen als Streudiagramm in einem 3-Dimensionalen Koordinatensystem.

� Beschreibung der 3D- Punktewolke mittels Hauptachsen (≙ Faktoren)

� 3 Geraden entsprechen mathematisch 3 mathematisch 3 mathematisch 3 mathematisch 3 Vektoren,Vektoren,Vektoren,Vektoren, die senkrecht aufeinander stehen

in diesen Vektoren muss natürlich auch die Korrelation „drin stecken“

Kor (x;y) = cos ∢ xy

3 Variablen -> 3 Hauptachsen -> 3 Faktoren

Was ist daran das Problem bzgl. des Ziels der FA?

Ziel der FA ist es Informationen zu reduzieren.

Es müssen also einige wenige Faktoren ausgewählt werden (genaueres später).

- Verschiedene Analyseformen- Verschiedene Entscheidungskriterien

z.B. - Screeplot- Kaiserkriterium

Die Anzahl der Faktoren bestimmt letztlich der Forscher!

- Statistik als Entscheidungs- und Begründungshilfe

Merke:

Je weniger Faktoren umso geringer die erklärte Varianz aller Variablen

„Wie die Erfahrung gezeigt hat, wird ein kreativer Sozialwissenschaftler für fast jede Faktorenstruktur eine scheinbar plausible Erklärung finden.“ (Diehl & Kohr, 1994 S.373)

Statistik-Programme „suchen“ selbst die günstigste Faktorenstruktur

Drehung des n-dimensionalen-Koordinatensystems zur Optimierung.

PS: in der Prä-SPSS-Ära haben die Psychologen dafür wochenlang gerechnet!

unrotiert

rotiert

Merke:

Rotation dient dazu, dass eine Variable möglichst hoch mit einem Faktor korreliert (und nicht gleichmäßig mit allen Faktoren)

� Einfachstruktur

Verschiedene Verfahren:

- rechtwinklige Rotation -> häufigstes Verfahren

(Faktoren sind unkorreliert) „VARIMAX“

- schiefwinklige Rotation

(Faktoren sind korreliert)

-> schwer zu interpretieren „Oblimin-Rotation“

Beispiel:

6 Items und 2 Faktoren

Musiknutzung: 1… Aktivation

2… Emotion

Merke:

Faktorladung: Korrelation einer Variable v mit dem Faktor f

Die Berechnung der Faktorladungen macht das Statistik-Programm, da sehr komplex…

Faktorladung ² ergibt das Bestimmtheitsmaß…

Wie lässt sich das interpretieren?

.019² = .0004 .608²= .39

.019² + .608²= .3904

->39,04% der Varianz im Item „gefühlewiederfinden“ können mit den 2 Faktoren erklärt werden = Kommunalität des Items

² ²

Merke:

Kommunalität

Ist der Anteil der Varianz EINER Variable der durch ALLE Faktoren erklärt werden kann

Jetzt wissen wir aber nur etwas über die Variable…

… uns interessiert aber auch die Güte der Faktoren

.019² + .043² + … + .522² + .593² = 1,500

… uns interessiert aber auch die Güte der Faktoren

.019² + .043² + … + .522² + .593² = 1,500

= Eigenwert des Faktors 1

Problem: Je mehr Items, umso größer der Eigenwert

- daher : Erklärungskraft das Faktors an Gesamtvarianz

= Eigenwert ∑ (max. Faktorladungen²)

= EigenwertAnzahl der Variablen

Merke:

Die Bedeutsamkeit eines Faktors ergibt sich aus dem Anteil des Eigenwertes an der Gesamtvarianz (Erklärbare Varianz).

-> Aussage zur Güte und Bedeutung des Faktors

Die Erklärungskraft aller extrahierten Faktoren ergibt sich aus ihrer Summe…

(1,5 + 1,36)=0,48

6

Merke:

Die Varianzaufklärung der Faktorenanalyse ist

= SUMME (Eigenwerte/ Anzahl der Items)

= SUMME (Kommunalitäten / Anzahl der Items)

Selten angegeben

Faktorwert: Ausprägung eine Person (i) auf dem Faktor (f).

(Im Gegensatz zum Summenscore gewichtet)

(Aus der Präsentation von Wagner, Reichel und Drescher, 2010)

1. Einführung

2. Grundlagen – Faktorenanalyse

3. Nutzungsdimensionen von Musik - unsere

Untersuchung

4. Explorative Faktorenanalyse mit SPSS am Beispiel

unserer Musik-Erhebung

5. Konfirmatorische Faktorenanalyse

� Warum hören Menschen Musik?

Das Warum ist auch eine Frage nach den Funktionen von Musik

- viele theoretische Arbeiten - wenig empirische Arbeiten

� Funktionen von Musik (z.B. Schäfer & Sedlmeier, 2009; Behne, 2009)

� Wieso ist bietet sich hier eine Faktorenanalyse an?

Itempool aus 139 Items von Schäfer und Städtlerbereitgestellt

23 augenscheinvalide Items der Faktoren

zum Thema - Aktivation / Beruhigung

- Gefühlsregulation

Fragen im Format:

Ich höre Musik, … weil sie mich beruhigt.

… weil ich mich dann fitter fühle.

Wie sehr würden Sie dieser Aussage zustimmen?

0 überhaupt nicht--- bis --- 6 voll und ganz

(+ Demografische Variablen)

N = 68

Alter M=23.46 (SD= 7.04, Range: 13-48)

Geschlecht w= 61.8% m= 38.2%

2 Erhebungen; a) Psychologie Studenten

b) Diskothek

1. Einführung

2. Grundlagen – Faktorenanalyse

3. Nutzungsdimensionen von Musik - unsere

Untersuchung

4. Explorative Faktorenanalyse mit SPSS am Beispiel

unserer Musik-Erhebung

5. Konfirmatorische Faktorenanalyse

� Exploratorische Exploratorische Exploratorische Exploratorische FAFAFAFAFaktoren auf Grundlage empirischer Daten herausfinden (‚probieren‘)� hypothesen-/ modellgenerierend� SPSS

� KonfirmatorischeKonfirmatorischeKonfirmatorischeKonfirmatorische FAFAFAFAgründliche theoretische Überlegungen �Überprüfung einer Faktorstruktur (SGM)� hypothesen-/ modelltestend� AMOS

a) lineare Zusammenhänge zwischenItems

b) intervallskalierte Daten

c) Stichprobengröße ausreichend groß

d) Hinreichend gute Werte in KMO, Bartlett & MSA

a) lineare Zusammenhänge zwischen Items

einzelne Streudiagramme oderStreudiagrammmatrix- beides hat Vor- & Nachteile…

a) lineare Zusammenhänge zwischen Items

SPSS � Diagramme� Diagramm-

erstellung

a) lineare Zusammenhänge zwischen Items

d) Hinreichend gute Werte bei KMO, Bartlett, MSA

KMO nicht unter 0.5 (Werte zw. 0 & 1 mgl)

MSA (Measure of sampling adequacy) ≈ KMO

BartlettH0:Korrelationsmatrix R = Einheitsmatrix Emit Nullkorrelation � wollen wir nicht! Test sollte signifikant werden!

d) Hinreichend gute Werte bei KMO, Bartlett, MSA

d) Hinreichend gute Werte bei KMO, Bartlett, MSA

Unsere SP:

� KMO .725

� Bartlett: p<.001

� MSA zw. .502 & .861

KMO bzw. MSA …> .9……sehr gut> .8……gut> .7……mittel> .6……mäßig> .5……schlecht< .5……von FA wird abgeraten

(Bühner, 2004; S. 170)

a) Korrelationsmatrix erstellen

b) Faktoren extrahieren

c) Kommunalitäten bestimmen

d) Faktorenanzahl bestimmen

e) Faktoren interpretieren

f) Faktorwerte bestimmen

Bühner, 2004; Zöfel, 2003

� Idee: hoch miteinander korrelierende Variablen

entstammen einem übergeordneten Faktor

� sofern keine hohen Korrelationen � FA nicht

sinnvoll

� Schauen, ob Zusammenhänge linear sind

(Voraussetzungsprüfung)

� Extraktionsmethoden:

◦ Hauptachsenanalyse (PFA)

◦ Maximum-Likelihood-Analyse (ML)

◦ Hauptkomponentenanalyse (PCA)

(nur Datenreduktion & Beschreibung der Items)

Bühner, 2004; Zöfel, 2003

Faktorenanalytische Methoden (wollen Zusammenhänge zw. Items ursächlich erklären)

� In der Praxis nicht so bedeutsam (spuckt SPSS

automatisch mit aus)

� Wichtig, ob Hauptachsenanalyse (PFA) oder

Hauptkomponentenanalyse (PCA)

PFA: gibt einen Fehler � hj² < 1

PCA: kein Fehler � hj² = max. 1

Bühner, 2004; Zöfel, 2003

� Eigenwerte � Kriterium für Anzahl der zu

extrahierenden Faktoren

� Zur Beantwortung der Frage „Wie viele Faktoren“

existieren verschiedene Verfahren:

◦ Kaiser Kriterium

◦ Scree Plot

◦ Parallelanalyse

Bühner, 2004; Zöfel, 2003

Kaiser Kriterium

◦ Extrahiert werden alle Faktoren mit einem

Eigenwert > 1

?? Warum ??

� erklärt mehr Varianz als eine einzelne Variable

◦ Problem: häufig Überschätzung der

Faktorenanzahl

Scree Plot = Geröllplot

◦ Faktoren nach Größe der Eigenwerte geordnet �

asymptodische Annäherung an x-Achse

◦ Steiles Stück:

wichtige Faktoren

Parallelanalyse

◦ Um Problem zu lösen, dass Eigenwerte > 1 per Zufall

entstehen können

◦ Generierung von Zufallsdaten � Faktoren extrahieren

◦ Faktoren aus Originaldaten mit größeren Eigenwerten

als bei Zufallsdaten werden extrahiert

� Inhaltliche Begründung der Zusammenfassung

einzelner Items

� Faktoreninterpretation liegt beim Forscher

Bsp. Funktionen von Musik � F1: entspannen/

Aktivation, F2: Gefühle verarbeiten …

Bühner, 2004; Zöfel, 2003

� Kann standardisierte Werte der Personen auf den

einzelnen Faktoren berechnen

bei Hauptachsenanalyse � Schätzverfahren

� In SPSS: erhalte neue Variablen

Bühner, 2004; Zöfel, 2003

� Interpretation des SPSS Outputs

� Blinder Empirismus – theoretische

Überlegungen??

� Ähnlichkeit der Itemantworten durch SP

mitbestimmt � ☺ FA mit Daten verschiedener

SP � Ergebnisvergleich

1. Einführung

2. Grundlagen – Faktorenanalyse

3. Nutzungsdimensionen von Musik - unsere

Untersuchung

4. Explorative Faktorenanalyse mit SPSS am Beispiel

unserer Musik-Erhebung

5. Konfirmatorische Faktorenanalyse

� Theoretische Annahmen bezüglich ◦ Anzahl & Bedeutung der Faktoren◦ Zuordnung der Items zu Faktoren◦ Beziehung zw. den Faktoren

� ?? Wenn ich alles schon weiß – wieso mache ich dann überhaupt noch eine FA ??

� modell-/ hypothesentestendEmpirie = theoretische Annahmen?Welches Modell hat den besseren Fit

� Mit SPSS nicht möglich◦ ?? Aber ich kann doch die Anzahl an zu

extrahierenden Faktoren bestimmen ??◦ Ja, aber nicht die Zuordnung der Variablen zu den

Faktoren & auch nicht die Beziehung der Faktoren untereinander

� ??Per Hand rechnen??◦ Nein – bspw. mit AMOS

� So sieht das dann aus:

� ?? Woran erinnert euch das??

� SGMSGMSGMSGM � nächste Woche

Item 7

Faktor 1

Item 1 Item 3Item 2 Item 6 Item 4 Item 5

Faktor 2

e1 e2 e3 e4 e5 e7e6

EFAEFAEFAEFA CFACFACFACFA

Datenreduktion Ziel Datenreduktion

Hypothesengenerierend Zweck Hypothesenprüfend

Basierend auf Daten Zuordnung Item-Faktor Theoriegeleitet

Basierend auf Daten Faktorenanzahl Theoriegeleitet

Je nach Rotation (orthogonal, oblique)

Korrelation der Faktoren

Theoriegeleitet

Post hoc Faktoreninterpretation Theoriegeleitet a-priori

Habe nur das eine gefundene Modell

Vergleich verschiedener Modelle

Mittels Gütemaßen (X²,CFI, RMSEA …)

� Ziel FA: Datenreduktion � mit möglichst wenig

Dimensionen möglichst viel Varianz erklären können

� EFA zur Hypothesengenerierung, CFA zur -

überprüfung

� Grundlage: Korrelationsmatrix zw. den Variablen

� Subjektiver Anteile des Verfahrens (u.a. bei

Interpretation des Verfahrens)

Merke:

Vielen Dank für Eure Aufmerksamkeit

Backhaus, K., Erichson, B., Plinke, W. & Weiber, R. (2006). Multivariate Analysmethoden. Berlin: Springer. Kap. 5

Behne, K., E. (2009). Musikerleben im Jugendalter. Köthen: Conbrio.

Bühner, M. (2004). Einführung in die Test- und Fragbogenkonstruktion. München: Pearson. Kap. 5 & 6

Diehl, J., M., & Kohr, H., U. (1994). Deskriptive Statistik. Eschborn: Klotz.

Leonhart, R. (2009). Lehrbuch Statistik. Bern: Horgefe.

Schäfer, T., & Sedlmeier, P. (2009). From the functions of music to music preference. Psychology Of Music, 37(3), 279-300. doi:10.1177/0305735608097247

Zöfel, P. (2003). Statistik für Psychologen im Klartext. München: Pearson Studium. Kap. 13