Upload
daria-murphy
View
46
Download
2
Embed Size (px)
DESCRIPTION
Einführung in die Datenanalyse. Die Datenmatrix. Struktur einer Datenmatrix. Vom Fragebogen zur Datenmatrix. X. X. X. X. X. X. X. X. X. X. X. X. Vom Fragebogen zur Datenmatrix. X. X. X. X. X. X. X. X. X. X. X. X. - PowerPoint PPT Presentation
Citation preview
Einführung in die Datenanalyse
Die DatenmatrixStruktur einer Datenmatrix
Untersuchungseinheit
Variablen
1 2 3 4 … m
1 X11 X12 X13 X14 … X1m
2 X21 X22 X23 X24 … X2m
3 X31 X32 X33 X34 … X3m
… … … … … … …
n Xn1 Xn2 Xn3 Xn4 … Xnm
X
X
X
X
XXX
X
XXX
X
Vom Fragebogen zur Datenmatrix
Vom Fragebogen zur Datenmatrix
X
X
X
X
XXX
X
XXX
X
Randauszählung bzw. univariate Analyse I: absolute Häufigkeit
Randauszählung bzw. univariate Analyse II: relative Häufigkeit
VAR00001
6 40,0 40,0 40,0
4 26,7 26,7 66,7
3 20,0 20,0 86,7
2 13,3 13,3 100,0
15 100,0 100,0
1,00 stimme sehr zu
2,00 stimme eher zu
3,00 stimmer eher nichtzu
4,00 stimme gar nicht zu
Gesamt
Gültig
Häufigkeit ProzentGültige
ProzenteKumulierteProzente
VAR00001
6 30,0 40,0 40,0
4 20,0 26,7 66,7
3 15,0 20,0 86,7
2 10,0 13,3 100,0
15 75,0 100,0
5 25,0
20 100,0
1,00 stimme sehr zu
2,00 stimme eher zu
3,00 stimmer eher nichtzu
4,00 stimme gar nicht zu
Gesamt
Gültig
,00 keine AngabeFehlend
Gesamt
Häufigkeit ProzentGültige
ProzenteKumulierteProzente
Randauszählung bzw. univariate Analyse III: Häufigkeitstabellen
Beispiel für eine Tabelle mit fehlenden Werten
Lage- und Streuparameter nach Skalenniveau
Skalenniveau nominal ordinal intervall ratio
Lageparameter
Modus X X X X
Median - X X X
arithmetisches Mittel - - X X
Streuungsparameter
relativer Informationsgehalt X X X X
Interquartilsabstand - X X X
Varianz/Standardabweichung - - X X
Variationskoeffizient - - X X
• Parameter drücken Verteilung in einer einzigen Zahl aus• Lageparameter: was ist der typische Wert der Verteilung?• Streuparameter: wie typisch ist dieser Wert für die Verteilung?
• Modus: die häufigste Merkmalsausprägung
• Median: teilt eine der Größe nach geordnete Reihe in zwei Hälften
– ungerade Fallzahl:
– gerade Fallzahl:
• arithmetisches Mittel:
– ungruppierte Daten:
– gruppierte Daten:
2
1~
nxx
2~ 1
22
nn xxx
n
xx
n
ii
1
n
fxx
kx
n
kk )(
1
Lageparametermaxxxh h
(bei mehrfach vorkommenden Messwerten)
• relativer Informationsgehalt:
• Interquartilsabstand:
• Varianz:
mittlere Summe der Abweichungsquadrate aller Messwerte vom arithmetischen Mittel
• Standardabweichung:
n
xxs
n
ii
1
2
2
)(
Streuparameter
n
xxss
n
ii
1
2
2
)(
k
i ii ffH
1
1lg
13 QQQ
Beispiel: Lage- und Streuparameter
Subgruppen- oder bivariate Analyse: Kreuztabelle
VAR00004 Parteimitglied * VAR00003 SES Kreuztabelle
5 4 1 1 0 11
83,3% 66,7% 50,0% 25,0% ,0% 55,0%
1 2 1 3 2 9
16,7% 33,3% 50,0% 75,0% 100,0% 45,0%
6 6 2 4 2 20
100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
Anzahl
% von VAR00003 SES
Anzahl
% von VAR00003 SES
Anzahl
% von VAR00003 SES
,00 nein
1,00 ja
VAR00004 Parteimitglied
Gesamt
1,00 2,00 3,00 4,00 5,00
VAR00003 SES
Gesamt
Subgruppen- oder bivariate Analyse III: Mittelwertvergleich