13
Einführung in die Datenanalyse

Einführung in die Datenanalyse

Embed Size (px)

DESCRIPTION

Einführung in die Datenanalyse. Die Datenmatrix. Struktur einer Datenmatrix. Vom Fragebogen zur Datenmatrix. X. X. X. X. X. X. X. X. X. X. X. X. Vom Fragebogen zur Datenmatrix. X. X. X. X. X. X. X. X. X. X. X. X. - PowerPoint PPT Presentation

Citation preview

Page 1: Einführung in die Datenanalyse

Einführung in die Datenanalyse

Page 2: Einführung in die Datenanalyse

Die DatenmatrixStruktur einer Datenmatrix

Untersuchungseinheit

Variablen

1 2 3 4 … m

1 X11 X12 X13 X14 … X1m

2 X21 X22 X23 X24 … X2m

3 X31 X32 X33 X34 … X3m

… … … … … … …

n Xn1 Xn2 Xn3 Xn4 … Xnm

Page 3: Einführung in die Datenanalyse

X

X

X

X

XXX

X

XXX

X

Vom Fragebogen zur Datenmatrix

Page 4: Einführung in die Datenanalyse

Vom Fragebogen zur Datenmatrix

X

X

X

X

XXX

X

XXX

X

Page 5: Einführung in die Datenanalyse

Randauszählung bzw. univariate Analyse I: absolute Häufigkeit

Page 6: Einführung in die Datenanalyse

Randauszählung bzw. univariate Analyse II: relative Häufigkeit

Page 7: Einführung in die Datenanalyse

VAR00001

6 40,0 40,0 40,0

4 26,7 26,7 66,7

3 20,0 20,0 86,7

2 13,3 13,3 100,0

15 100,0 100,0

1,00 stimme sehr zu

2,00 stimme eher zu

3,00 stimmer eher nichtzu

4,00 stimme gar nicht zu

Gesamt

Gültig

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

VAR00001

6 30,0 40,0 40,0

4 20,0 26,7 66,7

3 15,0 20,0 86,7

2 10,0 13,3 100,0

15 75,0 100,0

5 25,0

20 100,0

1,00 stimme sehr zu

2,00 stimme eher zu

3,00 stimmer eher nichtzu

4,00 stimme gar nicht zu

Gesamt

Gültig

,00 keine AngabeFehlend

Gesamt

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

Randauszählung bzw. univariate Analyse III: Häufigkeitstabellen

Beispiel für eine Tabelle mit fehlenden Werten

Page 8: Einführung in die Datenanalyse

Lage- und Streuparameter nach Skalenniveau

Skalenniveau nominal ordinal intervall ratio

Lageparameter

Modus X X X X

Median - X X X

arithmetisches Mittel - - X X

Streuungsparameter

relativer Informationsgehalt X X X X

Interquartilsabstand - X X X

Varianz/Standardabweichung - - X X

Variationskoeffizient - - X X

• Parameter drücken Verteilung in einer einzigen Zahl aus• Lageparameter: was ist der typische Wert der Verteilung?• Streuparameter: wie typisch ist dieser Wert für die Verteilung?

Page 9: Einführung in die Datenanalyse

• Modus: die häufigste Merkmalsausprägung

• Median: teilt eine der Größe nach geordnete Reihe in zwei Hälften

– ungerade Fallzahl:

– gerade Fallzahl:

• arithmetisches Mittel:

– ungruppierte Daten:

– gruppierte Daten:

2

1~

nxx

2~ 1

22

nn xxx

n

xx

n

ii

1

n

fxx

kx

n

kk )(

1

Lageparametermaxxxh h

(bei mehrfach vorkommenden Messwerten)

Page 10: Einführung in die Datenanalyse

• relativer Informationsgehalt:

• Interquartilsabstand:

• Varianz:

mittlere Summe der Abweichungsquadrate aller Messwerte vom arithmetischen Mittel

• Standardabweichung:

n

xxs

n

ii

1

2

2

)(

Streuparameter

n

xxss

n

ii

1

2

2

)(

k

i ii ffH

1

1lg

13 QQQ

Page 11: Einführung in die Datenanalyse

Beispiel: Lage- und Streuparameter

Page 12: Einführung in die Datenanalyse

Subgruppen- oder bivariate Analyse: Kreuztabelle

VAR00004 Parteimitglied * VAR00003 SES Kreuztabelle

5 4 1 1 0 11

83,3% 66,7% 50,0% 25,0% ,0% 55,0%

1 2 1 3 2 9

16,7% 33,3% 50,0% 75,0% 100,0% 45,0%

6 6 2 4 2 20

100,0% 100,0% 100,0% 100,0% 100,0% 100,0%

Anzahl

% von VAR00003 SES

Anzahl

% von VAR00003 SES

Anzahl

% von VAR00003 SES

,00 nein

1,00 ja

VAR00004 Parteimitglied

Gesamt

1,00 2,00 3,00 4,00 5,00

VAR00003 SES

Gesamt

Page 13: Einführung in die Datenanalyse

Subgruppen- oder bivariate Analyse III: Mittelwertvergleich