Einführung in die Datenanalyse

Preview:

DESCRIPTION

Einführung in die Datenanalyse. Die Datenmatrix. Struktur einer Datenmatrix. Vom Fragebogen zur Datenmatrix. X. X. X. X. X. X. X. X. X. X. X. X. Vom Fragebogen zur Datenmatrix. X. X. X. X. X. X. X. X. X. X. X. X. - PowerPoint PPT Presentation

Citation preview

Einführung in die Datenanalyse

Die DatenmatrixStruktur einer Datenmatrix

Untersuchungseinheit

Variablen

1 2 3 4 … m

1 X11 X12 X13 X14 … X1m

2 X21 X22 X23 X24 … X2m

3 X31 X32 X33 X34 … X3m

… … … … … … …

n Xn1 Xn2 Xn3 Xn4 … Xnm

X

X

X

X

XXX

X

XXX

X

Vom Fragebogen zur Datenmatrix

Vom Fragebogen zur Datenmatrix

X

X

X

X

XXX

X

XXX

X

Randauszählung bzw. univariate Analyse I: absolute Häufigkeit

Randauszählung bzw. univariate Analyse II: relative Häufigkeit

VAR00001

6 40,0 40,0 40,0

4 26,7 26,7 66,7

3 20,0 20,0 86,7

2 13,3 13,3 100,0

15 100,0 100,0

1,00 stimme sehr zu

2,00 stimme eher zu

3,00 stimmer eher nichtzu

4,00 stimme gar nicht zu

Gesamt

Gültig

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

VAR00001

6 30,0 40,0 40,0

4 20,0 26,7 66,7

3 15,0 20,0 86,7

2 10,0 13,3 100,0

15 75,0 100,0

5 25,0

20 100,0

1,00 stimme sehr zu

2,00 stimme eher zu

3,00 stimmer eher nichtzu

4,00 stimme gar nicht zu

Gesamt

Gültig

,00 keine AngabeFehlend

Gesamt

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

Randauszählung bzw. univariate Analyse III: Häufigkeitstabellen

Beispiel für eine Tabelle mit fehlenden Werten

Lage- und Streuparameter nach Skalenniveau

Skalenniveau nominal ordinal intervall ratio

Lageparameter

Modus X X X X

Median - X X X

arithmetisches Mittel - - X X

Streuungsparameter

relativer Informationsgehalt X X X X

Interquartilsabstand - X X X

Varianz/Standardabweichung - - X X

Variationskoeffizient - - X X

• Parameter drücken Verteilung in einer einzigen Zahl aus• Lageparameter: was ist der typische Wert der Verteilung?• Streuparameter: wie typisch ist dieser Wert für die Verteilung?

• Modus: die häufigste Merkmalsausprägung

• Median: teilt eine der Größe nach geordnete Reihe in zwei Hälften

– ungerade Fallzahl:

– gerade Fallzahl:

• arithmetisches Mittel:

– ungruppierte Daten:

– gruppierte Daten:

2

1~

nxx

2~ 1

22

nn xxx

n

xx

n

ii

1

n

fxx

kx

n

kk )(

1

Lageparametermaxxxh h

(bei mehrfach vorkommenden Messwerten)

• relativer Informationsgehalt:

• Interquartilsabstand:

• Varianz:

mittlere Summe der Abweichungsquadrate aller Messwerte vom arithmetischen Mittel

• Standardabweichung:

n

xxs

n

ii

1

2

2

)(

Streuparameter

n

xxss

n

ii

1

2

2

)(

k

i ii ffH

1

1lg

13 QQQ

Beispiel: Lage- und Streuparameter

Subgruppen- oder bivariate Analyse: Kreuztabelle

VAR00004 Parteimitglied * VAR00003 SES Kreuztabelle

5 4 1 1 0 11

83,3% 66,7% 50,0% 25,0% ,0% 55,0%

1 2 1 3 2 9

16,7% 33,3% 50,0% 75,0% 100,0% 45,0%

6 6 2 4 2 20

100,0% 100,0% 100,0% 100,0% 100,0% 100,0%

Anzahl

% von VAR00003 SES

Anzahl

% von VAR00003 SES

Anzahl

% von VAR00003 SES

,00 nein

1,00 ja

VAR00004 Parteimitglied

Gesamt

1,00 2,00 3,00 4,00 5,00

VAR00003 SES

Gesamt

Subgruppen- oder bivariate Analyse III: Mittelwertvergleich

Recommended