22
08.06.05 08.06.05 Datentransformation und Datentransformation und deskriptive Statistik III deskriptive Statistik III

08.06.05 Datentransformation und deskriptive Statistik III

Embed Size (px)

Citation preview

Page 1: 08.06.05 Datentransformation und deskriptive Statistik III

08.06.05 08.06.05 Datentransformation und Datentransformation und

deskriptive Statistik IIIdeskriptive Statistik III

Page 2: 08.06.05 Datentransformation und deskriptive Statistik III

ÜberblickÜberblick

1. Beispiel und Übungsaufgabe zum RECODE-1. Beispiel und Übungsaufgabe zum RECODE-BefehlBefehl

2. Beispiele und Übungsaufgabe zum COMPUTE-2. Beispiele und Übungsaufgabe zum COMPUTE-BefehlBefehl

Page 3: 08.06.05 Datentransformation und deskriptive Statistik III

RECODE INTORECODE INTO

Page 4: 08.06.05 Datentransformation und deskriptive Statistik III

Beispiel 1: Dichotomisierung der Variable Beispiel 1: Dichotomisierung der Variable

„vjahr“ „vjahr“

Die Variable vjahr soll in die neue, dichotome Die Variable vjahr soll in die neue, dichotome Variable „altgrup“ umkodiert werden. Variable „altgrup“ umkodiert werden.

Die neue Variable soll zwei Werte aufweisen: Die neue Variable soll zwei Werte aufweisen: - Dem Wert 1 sollen alle Fälle bis Jahrgang 1949 Dem Wert 1 sollen alle Fälle bis Jahrgang 1949

zugeordnet werden. Das Label für den Wert 1 zugeordnet werden. Das Label für den Wert 1 soll ‚ältere‘ lauten,soll ‚ältere‘ lauten,

- Dem Wert 2 sollen alle Fälle ab Jahrgang 1950 Dem Wert 2 sollen alle Fälle ab Jahrgang 1950 zugeordnet werden. Das Label für den Wert 2 zugeordnet werden. Das Label für den Wert 2 soll das Label ‚ältere‘ erhaltensoll das Label ‚ältere‘ erhalten

Die neue Variable „altgrup“ soll das Label: Die neue Variable „altgrup“ soll das Label: ‚Altersgruppen, dichotom ‘ bekommen.‚Altersgruppen, dichotom ‘ bekommen.

Page 5: 08.06.05 Datentransformation und deskriptive Statistik III

Beispiel 1: Dichotomisierung der Variable Beispiel 1: Dichotomisierung der Variable „vjahr“ „vjahr“

Page 6: 08.06.05 Datentransformation und deskriptive Statistik III

Beispiel 1: Dichotomisierung der Variable Beispiel 1: Dichotomisierung der Variable „vjahr“ „vjahr“

altgrup Altersgruppen, dichotom

777 46,7 46,7 46,7

888 53,3 53,3 100,0

1665 100,0 100,0

1,00 Ältere

2,00 Jüngere

Gesamt

GültigHäufigkeit Prozent

GültigeProzente

KumulierteProzente

Page 7: 08.06.05 Datentransformation und deskriptive Statistik III

Übungsaufgabe 1 (s. Beispielblatt)Übungsaufgabe 1 (s. Beispielblatt)

Die Variable vpid soll in die neue, dichotome Variable Die Variable vpid soll in die neue, dichotome Variable „pid“ umkodiert werden. „pid“ umkodiert werden.

Die neue Variable soll zwei Werte aufweisen: Die neue Variable soll zwei Werte aufweisen: - Die Werte 1-9 sollen zu „1“, zusammengefasst werden Die Werte 1-9 sollen zu „1“, zusammengefasst werden - die Werte 96 und 98 sollen zu „0“ zusammengefasst die Werte 96 und 98 sollen zu „0“ zusammengefasst

werden.werden.- der Wert 99 soll als systembedingter fehlender Wert der Wert 99 soll als systembedingter fehlender Wert

definiert werden (99=sysmis),definiert werden (99=sysmis),

Die neue Variable „pid“ soll das Label: ‚Existenz Die neue Variable „pid“ soll das Label: ‚Existenz Parteibindung‘ bekommenParteibindung‘ bekommen

Der Wert 1 soll das Label ‚Partebindung vorhanden‘ und Der Wert 1 soll das Label ‚Partebindung vorhanden‘ und der Wert 0 das Label ‚keine Parteibindung‘ erhaltender Wert 0 das Label ‚keine Parteibindung‘ erhalten

Page 8: 08.06.05 Datentransformation und deskriptive Statistik III

Beispiel 2Beispiel 2

Die Variable v170d (Politik ist zu kompliziert) soll Die Variable v170d (Politik ist zu kompliziert) soll in der Bedeutung und in ihren Werten in der Bedeutung und in ihren Werten umgedreht werden. umgedreht werden.

fre v170d v170i v170l.fre v170d v170i v170l.

Page 9: 08.06.05 Datentransformation und deskriptive Statistik III

Beispiel 2Beispiel 2

Die Variable v170d (Politik ist zu kompliziert) soll Die Variable v170d (Politik ist zu kompliziert) soll in der Bedeutung und in ihren Werten in der Bedeutung und in ihren Werten umgedreht werden. umgedreht werden.

v170d Politik ist zu kompliziert

286 17,2 17,2 17,2

458 27,5 27,5 44,7

485 29,1 29,1 73,8

260 15,6 15,6 89,4

142 8,5 8,5 98,0

22 1,3 1,3 99,3

12 ,7 ,7 100,0

1665 100,0 100,0

1 stimme überhauptnicht zu

2 stimme eher nicht zu

3 stimme teils zu/teilsnicht zu

4 stimme eher zu

5 stimme voll undganz zu

8 w.n.

9 k.A.

Gesamt

GültigHäufigkeit Prozent

GültigeProzente

KumulierteProzente

Page 10: 08.06.05 Datentransformation und deskriptive Statistik III

Beispiel 2Beispiel 2

Mit folgendem Befehl werden die Werte Mit folgendem Befehl werden die Werte umkodiert und die neue Variable v170d_um umkodiert und die neue Variable v170d_um erstellt:erstellt:

recode v170d (1=5) (2=4) (4=2) (5=1) recode v170d (1=5) (2=4) (4=2) (5=1) (else=copy) into v170d_um.(else=copy) into v170d_um.

Im nächsten Schritt muss die Bedeutung der Im nächsten Schritt muss die Bedeutung der Variable umgedreht werden:Variable umgedreht werden:

var lab v170d_um 'Politik ist nicht zu var lab v170d_um 'Politik ist nicht zu kompliziert'.kompliziert'.

  

Page 11: 08.06.05 Datentransformation und deskriptive Statistik III

Beispiel 2Beispiel 2

Dann werden die Wertelabels vergeben, sie Dann werden die Wertelabels vergeben, sie werden nicht verändert:werden nicht verändert:

val lab v170d_um val lab v170d_um 1'stimme überhaupt nicht zu‘1'stimme überhaupt nicht zu‘5'stimme voll und ganz zu'.5'stimme voll und ganz zu'.

Page 12: 08.06.05 Datentransformation und deskriptive Statistik III

Beispiel 2Beispiel 2

Die Ursprungsvariable v170d und die neue Die Ursprungsvariable v170d und die neue Variable v170d_um im VergleichVariable v170d_um im Vergleich

v170d_um Politik ist nicht zu kompliziert

142 8,5

260 15,6

485 29,1

458 27,5

286 17,2

22 1,3

12 ,7

1665 100,0

1,00 stimmeüberhaupt nicht zu

2,00

3,00

4,00

5,00 stimme vollund ganz zu

8,00

9,00

Gesamt

GültigHäufigkeit Prozent

v170d Politik ist zu kompliziert

286 17,2

458 27,5

485 29,1

260 15,6

142 8,5

22 1,3

12 ,7

1665 100,0

1 stimme überhauptnicht zu

2 stimme eher nicht zu

3 stimme teils zu/teilsnicht zu

4 stimme eher zu

5 stimme voll undganz zu

8 w.n.

9 k.A.

Gesamt

GültigHäufigkeit Prozent

Page 13: 08.06.05 Datentransformation und deskriptive Statistik III

COMPUTECOMPUTE

Page 14: 08.06.05 Datentransformation und deskriptive Statistik III

Beispiel 3: IndexerstellungBeispiel 3: Indexerstellung

Es soll eine neue Variable, ein Index „parverdr“ Es soll eine neue Variable, ein Index „parverdr“ (Variablenname) mit dem Variablenlabel (Variablenname) mit dem Variablenlabel „Parteienverdrossenheit“ erstellt werden. „Parteienverdrossenheit“ erstellt werden.

Dazu werden die Variablen v130a, v130b, v130f Dazu werden die Variablen v130a, v130b, v130f und v130k zusammengefasst. Die neue Variable und v130k zusammengefasst. Die neue Variable „parverdr“ hat einen Wertebereich von 4 bis 20. „parverdr“ hat einen Wertebereich von 4 bis 20. Der Wert 4 steht für die niedrigste Der Wert 4 steht für die niedrigste Verdrossenheit, der Wert 20 steht für höchste Verdrossenheit, der Wert 20 steht für höchste Verdrossenheit.Verdrossenheit.

Vor der Erstellung der neuen Variable, müssen Vor der Erstellung der neuen Variable, müssen die fehlenden Werte definiert werden.die fehlenden Werte definiert werden.

Page 15: 08.06.05 Datentransformation und deskriptive Statistik III

Beispiel 3 Beispiel 3

Page 16: 08.06.05 Datentransformation und deskriptive Statistik III

Beispiel 3 Beispiel 3

Page 17: 08.06.05 Datentransformation und deskriptive Statistik III

Beispiel 3 Beispiel 3

Page 18: 08.06.05 Datentransformation und deskriptive Statistik III

Beispiel 3 Beispiel 3

Page 19: 08.06.05 Datentransformation und deskriptive Statistik III

parverdr Parteienverdrossenheit

8 ,5 ,5 ,5

3 ,2 ,2 ,7

11 ,7 ,7 1,4

24 1,4 1,6 3,0

35 2,1 2,3 5,2

54 3,2 3,5 8,7

92 5,5 6,0 14,7

116 7,0 7,5 22,2

188 11,3 12,2 34,4

138 8,3 8,9 43,3

174 10,5 11,3 54,6

165 9,9 10,7 65,2

142 8,5 9,2 74,4

117 7,0 7,6 82,0

97 5,8 6,3 88,3

86 5,2 5,6 93,9

95 5,7 6,1 100,0

1545 92,8 100,0

120 7,2

1665 100,0

4,00 niedrigeVerdrossenheit

5,00

6,00

7,00

8,00

9,00

10,00

11,00

12,00

13,00

14,00

15,00

16,00

17,00

18,00

19,00

20,00 hoheVerdrossenheit

Gesamt

Gültig

SystemFehlend

Gesamt

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

Page 20: 08.06.05 Datentransformation und deskriptive Statistik III
Page 21: 08.06.05 Datentransformation und deskriptive Statistik III
Page 22: 08.06.05 Datentransformation und deskriptive Statistik III