25
German Stata User Meeting 2003 Tabellierung von Tabellierung von Mehrfachantwort- Mehrfachantwort- gruppen gruppen Zwei neue Programme Zwei neue Programme Hilde Schaeper / [email protected]

German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / [email protected]

Embed Size (px)

Citation preview

Page 1: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

German Stata User Meeting 2003

Tabellierung vonTabellierung von

Mehrfachantwort-Mehrfachantwort-

gruppengruppen

Zwei neue ProgrammeZwei neue Programme

Hilde Schaeper / [email protected]

Page 2: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

2German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

Bei HIS: Zwei Arten der Kodierung von Mehrfachantwortfragen

1. Set von binären Variablen

In welchem Rahmen haben Sie während Ihres Studiums an folgenden Lehr- und Lernformen aktiv mitgewirkt? (Mehrfachnennung möglich)

Ich habe in Gruppen an der Bearbeitung von Studienaufgaben mitgewirkt

Ich habe in praxis-/forschungsorientieten Projektstudien mitgearbeitet

Ich habe in kooperativen Studienprojekten von Hochschule und Betrieben/Dienststellen gearbeitet

Ich habe freiwillige betriebliche Praktika absolviert

Ich habe in internationalen Zusammenhängen studiert

Ich war als Tutor/Tutorin eingesetzt

lform2

lform1

lform3

lform4

lform5

lform6

Page 3: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

3German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

2. Set von polytomen Merkmalen

In welchen Fächern haben Sie Ihre Abitur-prüfung abgelegt?

LK1 LK2 GK1 GK2

Mathematik 1

Physik 2

Chemie 3

Biologie 4

Geographie 5

Deutsch 6

Englisch 7

Französisch 8

Spanisch 9

Geschichte 10

Sozialkunde 11

usw. fach1 fach2 fach3 fach4

Haben Sie neben den für das Studium erfor-derlichen Lehrveranstaltungen auch Veran-staltungen innerhalb oder außerhalb der Hochschule speziell mit dem Ziel der Ver-besserung der Berufschancen besucht?

ja 1

nein 2

Wenn ja, welche?

1.

2.

3.

lv1 lv2 lv3

Page 4: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

4German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

Die SPSS-Prozedur <mult response> (Beispiele)

1. univariate Verteilung dichotomer Mehrfachantwortvariablen

mult response groups=lehrform(lform1 to lform9 (1)) /freq=lehrform.

Mehrfachantworten  Group LEHRFORM (Value tabulated = 1)

Dichotomy label

Formen: Gruppen Formen: Projektstudien Formen: koop. Studienprojekte Formen: freiwillige Praktika Formen: internationales StudiumFormen: Tutor/in

--- snip ---

Name

LFORM1LFORM2LFORM3LFORM4LFORM5LFORM6

Count

5997 2557 814 2910 1432 1399

Pct of Responses

26,4 11,2 3,6 12,8 6,3

6,2

Pct of Cases

77,4 33,0 10,5 37,5 18,5 18,0

------- ----- -----Total responses 22728 100,0 293,2

350 missing cases; 7.752 valid cases

Page 5: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

5German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

2. bivariate Verteilung dichotomer Mehrfachantwortvariablen

GESCHL

Count |männlich weiblich Row pct | Row Col pct | Total | 1 | 2 |LEHRFORM --------+--------+--------+ LFORM1 | 2490 | 3507 | 5997 Formen: Gruppen | 41,5 | 58,5 | 77,4 | 78,2 | 76,8 | +--------+--------+ LFORM2 | 1074 | 1483 | 2557 Formen: Projektstudi | 42,0 | 58,0 | 33,0 | 33,7 | 32,5 | +--------+--------+ --- snip --- +--------+--------+ Column 3186 4566 7752 Total 41,1 58,9 100,0

Percents and totals based on respondents

7.752 valid cases; 350 missing cases

Page 6: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

6German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

3. Tabellierung polytomer Mehrfachantwortvariablen

mult response groups=lehrveranst(lv1 to lv3 (1, 99))/freq=lehrveranst.

Mehrfachantworten Group LEHRVERA Pct of Pct ofCategory label Code Count Responses Cases

Einsatz von EDV(-Programmen), Programmie 1 399 8,3 12,5techn. Grundlagen der DV 2 26 ,5 ,8EDV allgemein 3 80 1,7 2,5Wirschaftsveranstaltungen 4 358 7,4 11,2Jura-Veranstaltungen 5 94 1,9 3,0Regionalstudien 6 11 ,2 ,3Veranstaltungen zur Ökologie 7 33 ,7 1,0(Fremd-)Sprachenveranstaltungen 8 960 19,9 30,2Zusatzzertifikate 9 224 4,6 7,0

--- snip ---

Sonstiges 99 53 1,1 1,7 ------- ----- ----- Total responses 4826 100,0 151,6

4.919 missing cases; 3.183 valid cases

Page 7: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

7German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

Tabellierung von Mehrfachantwortvariablen in Stata

1. Dichotome Mehrfachantwortvariablen

a) <tabstat> (interner Ado-File)

tabstat lform1-lform6 [aw=gewinsg], statistics(mean count) /// columns(statistics) format(%3.1f)

variable | mean N------------+-------------------- lform1 | 75,5 7752,0 lform2 | 31,3 7752,0 lform3 | 10,1 7752,0 lform4 | 37,3 7752,0 lform5 | 18,3 7752,0 lform6 | 18,0 7752,0---------------------------------

Page 8: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

8German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

a) <tabstat> mit by()-Option

tabstat lform1-lform3 [aw=gewinsg], statistics(mean count) /// columns(statistics) format(%3.1f) by(geschl)

Summary for variables: lform1 lform2 lform3 by categories of: geschl (Geschlecht)

geschl | mean N----------------+-------------------- männlich | 77,2 3186,0 | 31,6 3186,0 | 10,7 3186,0----------------+-------------------- weiblich | 73,5 4566,0 | 30,9 4566,0 | 9,4 4566,0----------------+-------------------- Total | 75,5 7752,0 | 31,3 7752,0 | 10,1 7752,0-------------------------------------

Page 9: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

9German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

Eigenschaften von <tabstat>

Übersichtlichkeit

Gewichte (aweights, fweights)

Formatierung der Statistiken

Präfix „by ... :“

Option by()

keine absoluten Häufig-keiten für „genannt“

keine Variablenetiketten

Formatanweisung gilt füralle Statistiken

für Prozentwerte ist vorhe-rige Rekodierung notwendig

Variablen müssen als Indi-katorvariablen vorliegen

keine Ausgabe in Formvon Kreuztabellen

Page 10: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

10German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

b) <tabcond> (externer Ado-File)

tabcond variables lform1-lform9, cond("@==1")

-------------------------------------------- Variable | @==1--------------------------------+----------- Formen: Gruppen | 5997 Formen: Projektstudien | 2557 Formen: koop. Studienprojekte | 814 Formen: freiwillige Praktika | 2910 Formen: international | 1432 Formen: Tutor/in | 1399Formen: Studiengruppen geleitet | 603 Formen: Lernprogramme genutzt | 1387 Formen: Recheche mit PC | 5629--------------------------------------------

Page 11: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

11German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

Eigenschaften

Übersichtlichkeit

prozentuale Häufigkeiten auf Basis der Fälle und Antworten

Variablennamen u. -etiketten

Formatierung der Statistiken

Gewichte (aweight, iweight, fweight)

Definition von bis zu zwei „missing values“

Spezifikation des für die Tabellierung zu benutzenden Wertes

c) <mrditab> (neuer externer Ado-File)

Syntax

mrditab varlist [weight] [if exp] [in range][, response(integer) missing(integer) format(%fmt)]

Präfix „by ... :“, „if“-Bedingung und „in“-Bedingung

keine Ausgabe von Kreuztabellen

nur numerische Variablen

Page 12: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

12German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

c) <mrditab> (Beispiel ohne Optionen)

. qui mvdecode lform1-lform9, mv(-1)

. mrditab lform1-lform4

variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+-------------------------------lform1 Formen: Gruppen | 5997 77,4 48,8 |lform2 Formen: Projektstudien| 2557 33,0 20,8 |lform3 Formen: koop. Studienp| 814 10,5 6,6 rojekte |lform4 Formen: freiwillige Pr| 2910 37,5 23,7 aktika |------------------------------------------------------------------valid cases (unweighted): 7752missing cases (unweighted): 350total responses (unweighted): 12278

Page 13: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

13German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

c) <mrditab> (Beispiel mit Formatoption)

. qui mvdecode lform1-lform9, mv(-1)

. mrditab lform1-lform4, format(%5.2f)

variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+-------------------------------lform1 Formen: Gruppen | 5997 77,36 48,84 |lform2 Formen: Projektstudien| 2557 32,99 20,83 |lform3 Formen: koop. Studienp| 814 10,50 6,63 rojekte |lform4 Formen: freiwillige Pr| 2910 37,54 23,70 aktika |------------------------------------------------------------------valid cases (unweighted): 7752missing cases (unweighted): 350total responses (unweighted): 12278

Page 14: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

14German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

c) <mrditab> (Beispiel mit Gewichtsanweisung)

. qui mvdecode lform1-lform9, mv(-1)

. mrditab lform1-lform4 [aw=gewinsg], format(%5.2f)

!!!weighted analysis using aweight = gewinsg!!!

variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+-------------------------------lform1 Formen: Gruppen | 5828 75,46 47,46 |lform2 Formen: Projektstudien| 2415 31,27 19,67 |lform3 Formen: koop. Studienp| 777 10,06 6,33 rojekte |lform4 Formen: freiwillige Pr| 2881 37,30 23,46 aktika |------------------------------------------------------------------valid cases (unweighted): 7752missing cases (unweighted): 350total responses (unweighted): 12278

Page 15: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

15German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

c) <mrditab> (Beispiel mit Missing-Option)

. mrditab lform1-lform4, mis(-1)

variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+-------------------------------lform1 Formen: Gruppen | 5997 77,4 48,8 |lform2 Formen: Projektstudien| 2557 33,0 20,8 |lform3 Formen: koop. Studienp| 814 10,5 6,6 rojekte |lform4 Formen: freiwillige Pr| 2910 37,5 23,7 aktika |------------------------------------------------------------------valid cases (unweighted): 7752missing cases (unweighted): 350total responses (unweighted): 12278

Page 16: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

16German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

c) <mrditab> (Beispiel mit Response-Option)

. qui recode lform1-lform9 (1=2)(0=1)(-1=.)

. mrditab lform1-lform4, response(2)

variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+-------------------------------lform1 Formen: Gruppen | 5997 77,4 48,8 |lform2 Formen: Projektstudien| 2557 33,0 20,8 |lform3 Formen: koop. Studienp| 814 10,5 6,6 rojekte |lform4 Formen: freiwillige Pr| 2910 37,5 23,7 aktika |------------------------------------------------------------------valid cases (unweighted): 7752missing cases (unweighted): 350total responses (unweighted): 12278

Page 17: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

17German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

Tabellierung von Mehrfachantwortvariablen in Stata

2. Polytome Mehrfachantwortvariablen

a) <mrdum> (externer Ado-File)

mrdum lv1-lv3, stub(lv) response(1 2 3 4) labels

--------------------------------------------------------------------- responses | code present percent-----------------------------------------+---------------------------Einsatz von EDV(-Programmen), Programmie | 399 12,54 techn. Grundlagen der DV | 26 0,82 EDV allgemein | 80 2,51 Wirschaftsveranstaltungen | 358 11,25---------------------------------------------------------------------Cases with at least one response : 3183 (39.29 %) Completely missing : 4919

Total cases : 8102

Variables created for 4 possible responses + 1 for missing

Page 18: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

18German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

Eigenschaften von <mrdum>

Übersichtstabelle der abso-luten und prozentualen Häufigkeiten

(Kreuz-)Tabellierung der re-sultierenden Dummy-Variab-len

keine Übersichtstabelle unter Verwendung von Gewichten

bei Verwendung von Gewich-ten oder Erstellen von Kreuz-tabellen : zweistufiges Vor-gehen erforderlich

Page 19: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

19German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

b) <mtab> (externer Ado-File)

mtab lv1-lv3

Overall Between Within respset | Freq. Percent Freq. Percent Percent----------+----------------------------------------------------- Einsatz | 399 8,27 399 12,54 51,42 techn. G | 26 0,54 26 0,82 50,00 EDV allg | 80 1,66 80 2,51 47,06 Wirschaf | 358 7,42 358 11,25 52,65 Jura-Ver | 94 1,95 94 2,95 50,00 Regional | 11 0,23 11 0,35 45,83 Veransta | 33 0,68 33 1,04 47,83

--- snip ---

Kontakte | 51 1,06 51 1,60 54,26 zusätzl. | 16 0,33 16 0,50 69,57 sonstige | 53 1,10 53 1,67 49,53 ---------+----------------------------------------------------- Total | 4826 100,00 4826 151,62 55,74 (n = 3183)

pct. responses pct. cases

Page 20: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

20German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

Eigenschaften von <mtab>

übersichtliche Tabellierungder absoluten und prozentu-alen Häufigkeiten

Prozentuierung sowohl aufBasis der Antworten als auchauf Basis der Beobachtungen

keine Gewichte

keine Kreuztabellen

kein Präfix „by ...:“

Page 21: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

21German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

Eigenschaften

Übersichtlichkeit

ein- und zweidimensionale Häufigkeitstabellen

absol. Häufigkeiten, Spaltenprozente, Zeilenprozente (wählbar)

Formatierung der Statistiken

Gewichte (aweight, iweight, fweight)

Präfix „by ... :“, „if“-Bedingung und „in“-Bedingung

c) <mrtab> (neuer externer Ado-File)

Syntax

mrtab varlist [weight] [if exp] [in range] [, by(varname) format(%fmt) center count column row name(varname)]

keine Ausgabe von Randverteilungen

nur numerische Variablen

keine Spaltenvariablen mit negativen Werten

Page 22: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

22German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

c) <mrtab> (Beispiel für eindimensionale Häufigkeitstabellen)

. mrtab lv1-lv3, count col

----------------------------------------------------------------- respset | count col. pct-----------------------------------------+-----------------------Einsatz von EDV(-Programmen), Programmie | 399 12,5 techn. Grundlagen der DV | 26 0,8 EDV allgemein | 80 2,5 (Fremd-)Sprachenveranstaltungen | 960 30,2 Rhetorikkurse, Persönlichkeitstraining | 386 12,1 Veranstaltungen im eigenen Fach | 1060 33,3 Veranstaltungen im anderen Fach | 299 9,4 sonstiges | 1431 45,0-----------------------------------------------------------------valid cases (unweighted) 3183missing cases (unweighted) 4919

Page 23: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

23German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

c) <mrtab> (Beispiel mit name-Option)

. mrtab lv1-lv3, count col name(lehrveranstaltungen)

----------------------------------------------------------------- lehrveranstaltungen | count col. pct-----------------------------------------+-----------------------Einsatz von EDV(-Programmen), Programmie | 399 12,5 techn. Grundlagen der DV | 26 0,8 EDV allgemein | 80 2,5 (Fremd-)Sprachenveranstaltungen | 960 30,2 Rhetorikkurse, Persönlichkeitstraining | 386 12,1 Veranstaltungen im eigenen Fach | 1060 33,3 Veranstaltungen im anderen Fach | 299 9,4 sonstiges | 1431 45,0-----------------------------------------------------------------valid cases (unweighted) 3183missing cases (unweighted) 4919

Page 24: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

24German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

c) <mrtab> (Beispiel für Kreuztabellen (by-Option)). mrtab lv1-lv3 [aw=gewinsg], count col row by(geschl) /// name(lehrveranstaltungen)

!!!weighted analysis using aweight = gewinsg!!!+--------------------------------+| cell content ||--------------------------------|| 1. frequency || 2. row percent || 3. column percent (of cases) |+--------------------------------+----------------------------------------------------------------- | Geschlecht lehrveranstaltungen | männlich weiblich-----------------------------------------+-----------------------Einsatz von EDV(-Programmen), Programmie | 206 199 | 50,9 49,1 | 12,4 13,0 --- snip --- -----------------------------------------------------------------valid cases (unweighted) 1 = "männlich" 1294valid cases (unweighted) 2 = "weiblich" 1889missing cases (unweighted) 4919

Page 25: German Stata User Meeting 2003 Tabellierung von Mehrfachantwort-gruppen Zwei neue Programme Hilde Schaeper / schaeper@his.de

25German Stata User Meeting, 12.08.2003

Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen

Behandlung von identischen Wertenbei polytomen Mehrfachantwortvariablen

Beispielsdatensatz

id abifach1 abifach2 abifach3 abifach4

1 Biologie Deutsch Englisch sonst. Sprache

2 Deutsch Mathematik sonst. Sprache sonst. Sprache

Auswertung mit „mult response“

Pct ofCategory label Count Cases

Biologie 1 50,0Deutsch 2 100,0Englisch 1 50,0Mathematik 1 50,0sonst. Sprachen 3 150,0

Auswertung mit <mrtab>

---------------------------------- Abiturfächer | count col. pct ----------------+----------------- Biologie | 1 50,0 Deutsch | 2 100,0 Englisch | 1 50,0 Mathematik | 1 50,0 sonst. Sprachen | 2 100,0

----------------------------------