Transcript
Page 1: Einführung in die Datenanalyse

Einführung in die Datenanalyse

Page 2: Einführung in die Datenanalyse

Die DatenmatrixStruktur einer Datenmatrix

Untersuchungseinheit

Variablen

1 2 3 4 … m

1 X11 X12 X13 X14 … X1m

2 X21 X22 X23 X24 … X2m

3 X31 X32 X33 X34 … X3m

… … … … … … …

n Xn1 Xn2 Xn3 Xn4 … Xnm

Page 3: Einführung in die Datenanalyse

X

X

X

X

XXX

X

XXX

X

Vom Fragebogen zur Datenmatrix

Page 4: Einführung in die Datenanalyse

Vom Fragebogen zur Datenmatrix

X

X

X

X

XXX

X

XXX

X

Page 5: Einführung in die Datenanalyse

Randauszählung bzw. univariate Analyse I: absolute Häufigkeit

Page 6: Einführung in die Datenanalyse

Randauszählung bzw. univariate Analyse II: relative Häufigkeit

Page 7: Einführung in die Datenanalyse

VAR00001

6 40,0 40,0 40,0

4 26,7 26,7 66,7

3 20,0 20,0 86,7

2 13,3 13,3 100,0

15 100,0 100,0

1,00 stimme sehr zu

2,00 stimme eher zu

3,00 stimmer eher nichtzu

4,00 stimme gar nicht zu

Gesamt

Gültig

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

VAR00001

6 30,0 40,0 40,0

4 20,0 26,7 66,7

3 15,0 20,0 86,7

2 10,0 13,3 100,0

15 75,0 100,0

5 25,0

20 100,0

1,00 stimme sehr zu

2,00 stimme eher zu

3,00 stimmer eher nichtzu

4,00 stimme gar nicht zu

Gesamt

Gültig

,00 keine AngabeFehlend

Gesamt

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

Randauszählung bzw. univariate Analyse III: Häufigkeitstabellen

Beispiel für eine Tabelle mit fehlenden Werten

Page 8: Einführung in die Datenanalyse

Lage- und Streuparameter nach Skalenniveau

Skalenniveau nominal ordinal intervall ratio

Lageparameter

Modus X X X X

Median - X X X

arithmetisches Mittel - - X X

Streuungsparameter

relativer Informationsgehalt X X X X

Interquartilsabstand - X X X

Varianz/Standardabweichung - - X X

Variationskoeffizient - - X X

• Parameter drücken Verteilung in einer einzigen Zahl aus• Lageparameter: was ist der typische Wert der Verteilung?• Streuparameter: wie typisch ist dieser Wert für die Verteilung?

Page 9: Einführung in die Datenanalyse

• Modus: die häufigste Merkmalsausprägung

• Median: teilt eine der Größe nach geordnete Reihe in zwei Hälften

– ungerade Fallzahl:

– gerade Fallzahl:

• arithmetisches Mittel:

– ungruppierte Daten:

– gruppierte Daten:

2

1~

nxx

2~ 1

22

nn xxx

n

xx

n

ii

1

n

fxx

kx

n

kk )(

1

Lageparametermaxxxh h

(bei mehrfach vorkommenden Messwerten)

Page 10: Einführung in die Datenanalyse

• relativer Informationsgehalt:

• Interquartilsabstand:

• Varianz:

mittlere Summe der Abweichungsquadrate aller Messwerte vom arithmetischen Mittel

• Standardabweichung:

n

xxs

n

ii

1

2

2

)(

Streuparameter

n

xxss

n

ii

1

2

2

)(

k

i ii ffH

1

1lg

13 QQQ

Page 11: Einführung in die Datenanalyse

Beispiel: Lage- und Streuparameter

Page 12: Einführung in die Datenanalyse

Subgruppen- oder bivariate Analyse: Kreuztabelle

VAR00004 Parteimitglied * VAR00003 SES Kreuztabelle

5 4 1 1 0 11

83,3% 66,7% 50,0% 25,0% ,0% 55,0%

1 2 1 3 2 9

16,7% 33,3% 50,0% 75,0% 100,0% 45,0%

6 6 2 4 2 20

100,0% 100,0% 100,0% 100,0% 100,0% 100,0%

Anzahl

% von VAR00003 SES

Anzahl

% von VAR00003 SES

Anzahl

% von VAR00003 SES

,00 nein

1,00 ja

VAR00004 Parteimitglied

Gesamt

1,00 2,00 3,00 4,00 5,00

VAR00003 SES

Gesamt

Page 13: Einführung in die Datenanalyse

Subgruppen- oder bivariate Analyse III: Mittelwertvergleich


Recommended