35
Statistik mit Stata -1- Übung Statistik I – Statistik mit Stata SS07 - 30.04.2007 3. Stata-Grundlagen II und Univariate Statistiken I Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: Di. 15-16 Uhr [email protected]

Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Embed Size (px)

Citation preview

Page 1: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 1 -

Übung Statistik I – Statistik mit StataSS07 - 30.04.2007

3. Stata-Grundlagen II und Univariate Statistiken I

Andrea Kummerer (M.A.)

Oec R. I-53

Sprechstunde: Di. 15-16 Uhr

[email protected]

Page 2: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 2 -

Überblick

1. Sonstiges

2. Besprechung der Hausaufgaben

3. Befehlsstruktur und -abkürzungen

4. Die Stata-Hilfe und Fehlermeldungen

5. Befehle zur Datenübersicht

6. Univariate Statistik I: Häufigkeitstabellen

7. Datentransformationen I: Codes, Fehlende Werte und Label

8. Hausaufgaben

Page 3: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 3 -

1. Sonstiges

• Die Klausur `Statistik mit Stata´ findet am 16.07.07 von 14:15 bis15:45 Uhr statt.

• Es gibt auf den WiSoRZ-Rechnern zwei persönliche Laufwerke, die den gleichen Inhalt haben: N:\ und W:\

�Nicht davon irritieren lassen! Ich versuche einheitlich W:\ zu benutzen, ist aber egal.

• Es gibt keine Studentenversion von Stata.

• Wir arbeiten heute mit dem Datensatz allbus_ueb1.dta. Also: Kopiere den Datensatz allbus_ueb1.dta (WiSoRZ > Lehre on 'Jeder-Lehre (Ug-uxwscip-s2)'(V:) > Stata > Datensätze > Ueb04_30 > allbus_ueb1.dta ) in deinen persönlichen Stata Ordner (WiSoRZ > [Name] on 'ug-uxwscip-s3\Benutzer'(W:) > Stata > Datensätze ) und öffne den Datensatz in Stata.

Page 4: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 4 -

2. Besprechung der Hausaufgaben

• Fragen zu den Hausaufgaben?

• Was seit letzter Std. bekannt sein sollte:

�Updaten von Stata (update bzw. update query),

�Arbeitsspeicher von Stata vergrößern (set memory600m)

�Eingeben (input), öffnen (use), `schließen´ (clear), und speichern (save) von Daten in Stata

�Verzeichnisnavigation durch pwd, cd und dir

�Überblick über die Daten verschaffen: describe

�Stata schließen: exit

Page 5: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 5 -

• Wichtigeste Informationen aus dem Codebook zum ALLBUS 2006:– Der ALLBUS-Datensatz weist überrepräsentativ viele

Fälle aus Ostdeutschland auf (oversample).– ALLBUS 2006 liegt Personen- und keine Haushalts-

stichprobe zugrunde, daher ist Repräsentativität bei Aussagen auf Haushaltsebene nicht zwingend gegeben.

• Vorschlag der Autoren dazu: Gewichtung (West-Ost Gewicht enthalten in: v735).

• Was heißt das? � Im Fall des Ost-oversamples: Anteil Personen aus

Westdeutschland wird `künstlich erhöht´, indem jeder westdeutsche Fall aus mit einer Zahl >1 multipliziert wird. Dadurch sollte sich im Idealfall eine repräsentative Verteilung hinsichtlich des Erhebungsgebiets ergeben.

Page 6: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 6 -

• Gegenüberstellung Erhebungsgebiet ungewichtet und gewichtet

• Inwiefern ist das keine Lösung?

�Problematisch bei der Verwendung von Gewichten ist, dass sie nur hinsichtlich des Gewichtungsmerkmals zu Aussagen entsprechend der tatsächlichen Verteilung in der Grundgesamtheit (bzw. im Mikrozensus) führen.

• Wichtig ist in diesem Zusammenhang: Immer dokumentieren ob man nun gewichtete oder ungewichtete Stichprobe verwendet hat!

Page 7: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 7 -

3. Befehlsstruktur und -abkürzungen• Vereinfachte Befehlsstruktur:

... command [varlist] ... [, options]

Aufzählung von Variablen, auf die die Ausführung des Befehls eingeschränkt wird (weitere Informationen: help varlist)

• Beispiele:

�Befehl bezieht sich auf mehrere Variablen:

describe v4 v22 v33 v107

�Befehl mit Optionen: describe, simple

�Befehl mit Unterbefehl: tab v4 [iweight=v735]

�Ein Präfix ist im Grunde eine vorrangestellte Bedingung

Befehl

Befehls-Optionen

Verschiedene Bedingungen die den Bezugrahmen des Befehls i.d.R begrenzenPräfix

Page 8: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 8 -

• Ein Stata-Befehl endet durch einen Zeilenwechsel

• Erinnerung: Stata ist case-sensitive (unterscheidet zwischen Groß- und Kleinschreibung)

• Befehlszeilen die länger als 75 Zeichen sind sollten vermieden werden

• Folgendes interpretiert Stata als Kommentar (Text den Stata ignorieren soll):

�Zeilen die mit einem * beginnen

�Text der zwischen /* und */ steht

�Text der nach // folgt

• Befehle können abgekürzt werden. Dies erleichtert zwar das Tippen, zu Beachten ist aber: Sehr kurz ist ab und zu auch sehr unverständlich. Bsp: Statt den Befehl describe auszuschreiben reicht die Eingabe des Buchstabens: d

Page 9: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 9 -

4. Die Stata-Hilfe und Fehlermeldungen

Die Stata-Hilfe

• Mit dem Befehl help erhält man eine Aufstellung von Hilfen nach Kategorien (z.B. Basics oder Graphics).

• Der Befehl help in Kombination mit einem Stata-Befehl, z.B. help describe gibt eine Übersicht über den Befehlsaufbau, mögliche Unterbefehle und Optionen, eine detaillierte Beschreibung des Befehls sowie Beispiele und Hinweise auf weitere Informationen zu dem Befehl.

• Der Befehl search ermöglicht die Suche nach statistischen Stichwörtern. Stata greift hier auf verschiedenen Ressourcen zurück (z.B. ReferenceManuals, FAQs zu Stata, etc.); mit search [Stichwort], all werden außerdem noch einige Internet-Ressourcen durchsucht.

Page 10: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 10 -

• Auch die Hilfe-Dateien werden beim Update von Stata auf den neuesten Stand gebracht (auch deswegen ist ein regelmäßiges Update sehr wichtig).

• In jedem Hilfedokument ist eine Quelle angegeben. So stehen z.B. [R] für Stata Base Reference Manual, [U] für Stata User`s Guide, [D] für Data Management ReferenceManual und [SJ] für Stata Journal, usw. (vgl. www.stata.com/bookstore)

• Beispiele:

�help

�help describe

�search quantile, all ���� Übung

Page 11: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 11 -

Fehlermeldungen

• Bsp:

• Neben dem Fehlerkommentar gibt Stata hier auch ein Kürzel für den entstandenen Fehler an: r(4) . Nach Klick auf r(4) öffnet sich folgendes Fenster:

Definition von Missing Values (der Datensatz wird verändert)Stata beenden

Stata lässt sich nicht beenden mit der Begründung, dass die Daten so wie sie sich zur Zeit im Arbeitsspeicher befinden (also mit der Veränderung durch obige Missing-Definition) verloren gehen würden.

Page 12: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 12 -

• Also Lösung des Problems: Daten speichern (save) oder Arbeitsspeicher leeren (clear).

• Nicht immer sind dabei die Angaben zur Fehlermeldung so klar wie in diesem Fall.

• Fehler können schnell passieren. Daher: Fehlermeldung anschauen und/oder eingegebene Befehle insb. auf korrekte Syntax gründlich kontrollieren!

Page 13: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 13 -

5. Befehle zur Datenübersicht

• Der Befehl describe, hat wie bereits gesehen einige Unterbefehle (z.B. describe, simple sowie describe, short), die praktisch sind um schnell einen Überblick über die verwendeten Daten zu bekommen.

• Der Befehl codebook [varlist] ... gibt detaillierte Information über die einzelne Variable aus.

• Der Befehl list: Stata produziert eine Tabelle, die die Ausprägung jedes Falls bei jeder Variable zeigt. Das ist ziemlich unübersichtlich. Aber: Eingrenzung auf bestimmte Variablen und/oder Fälle möglich.

list [varlist] ... [in] ...

• Bsp.: nach list v174 in 1/50 werden die Ausprägungen der Fälle 1-50 bei der Variable v174 angezeigt.

Page 14: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 14 -

• Sehr interessant ist der list Befehl, wenn man sich z.B. für die 50 Personen mit dem niedrigsten Einkommen im Datensatz interessiert. Dazu müssen die Personen zunächst nach ihrem Einkommen sortiert werden.

• Der Befehl: sort varlist [...] [, ...] sortiert die Fälle des Datensatzes nach den Ausprägungen der angegebenen Variablen.

• Also: um nach Einkommen zu sortieren: sort v437• Nach list v437 in 1/50 werden nun die Einkommen der 50

Personen mit dem niedrigsten Einkommen angezeigt. Durch list v437 v174 in 1/50 erhält man darüber hinaus auch die Geschlechtsinformation.

���� Übung:

• Befehle zur Datenübersicht anwenden: describe, simple;describe, short; describe; codebook; list; für verschiedene Variablen sowiesort und dann list für die 100 jüngsten Personen sowie für Einkommen der 100 jüngsten Personen.

Page 15: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 15 -

6. Univariate Statistik I: Häufigkeitstabellen

• Der Befehl tabulate [variable] produziert univariate Häufigkeitstabellen. Ich benutze i.d.R die Abkürzung tab.

• Details zum Befehl:

�help tabulate oneway (oneway, da wir univariate Häufigkeitstabellen erstellen wollen)

• Viewer Output:

Page 16: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 16 -

Zeigt, das tabulateabgekürzt werden kann mit ta

Page 17: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 17 -

Page 18: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 18 -

Page 19: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 19 -

Page 20: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 20 -

• Beispiel:Absolute Häufigkeit (Frequency)

Prozentuale Häufigkeit

Kumulierte prozentuale Häufigkeit (Cumulative)

Label der Variable*

Name der Variable

Labels der Ausprägungen der Variable

* in diesem Fall sollte die genaue Fragestellung im ALLBUSCodebook nachgeschlagen werden, um Fehlauslegungen zu vermeiden.

Page 21: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 21 -

Auszug aus dem Codebook zum ALLBUS 2006:

WiSoRZ > [Name] on 'ug-uxwscip-s3\Benutzer'(W:) > Stata > Datensätze > Codebook06.pdf

Page 22: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 22 -

Zurück zur Häufigkeitstabelle

Page 23: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 23 -

• Standardmäßig zeigt Stata nur die Labels der Ausprägungen an.

• Mit dem Befehl numlabel [Label], add wird jedem Ausprägungslabel der entsprechende Code zugeordnet. Bei numlabel _all, add werden die Codes aller Ausprägungen in der Ausgabe angezeigt.

• Nach numlabel v24, add sieht die Tabelle wie folgt aus:

Codes der Ausprägungen der Variable

7. Datentransformationen I:

Page 24: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 24 -

• Die Missing Value-Informationen sind beim Export der ALLBUS-Daten nach Stata offensichtlich verloren gegangen! Denn wir wissen ja, dass der Befehl tab als Missing definierte Werte nur in die Tabelle einbezieht, wenn als Option miss angegeben wird. D.h. die Werte 8 und 9 sind offensichtlich nicht als fehlende Werte definiert!

� Die Prozentuierung erfolgt auf Basis aller Fälle inklusive der Fehlenden Werte (Ausprägungen 8 `Weiss nicht´ und 9 `Keine Angabe´)

Page 25: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 25 -

• Also: Wir müssen für die Variable v24 die Werte 8 und 9 als Missing Values (Fehlende Werte) definieren.

• Generell gilt: Ist ein Wert in Stata als Missing Value definiert, wird er von der statistischen Analyse ausgeschlossen.

• Ein Missing Value wird in Stata durch einen Punkt oder einen Punkt gefolgt von einem Buchstaben zwischen a und z dargestellt.

• Es sind also insgesamt 27 verschiedene Missing Valuesdefinierbar. Stata selbst vergibt einen Punkt als fehlenden Wert. Von daher nennt man diese Missing Values auch System Missing Values.

• Da wir in unserem Fall zwei verschiedene Fehlende Werte haben, sollten wir auch zwei verschiedene Fehlende Werte definieren, z.B. .a und .b

Page 26: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 26 -

• Numerische Codes (also z.B. 8 & 9) werden mit folgendem Befehl in Missing Values umgewandelt: mvdecode varlist[...], mv(numlist | numlist=mvc [\ numlist=mvc...])

• In unserem Fall: mvdecode v24, mv(8=.a \ 9=.b)

• Würden wir beiden Ausprägungen 8 und 9 denselben Missing Value .z geben wollen, müssten wir eingeben:

mvdecode v24, mv(8 9=.z)

• Wenn wir schließlich z.B. alle Werten zwischen 6 und 9 bei v16 als einen Missing Value definieren wollen, müssen wir eingeben: mvdecode v19, mv(6/9=.c) Es ist hier sinnvoll einen anderen Missing Value (nämlich .c) zu definieren, da sich ja hinter .c eine andere Bedeutung verbirgt als hinter .a oder .b.

Page 27: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 27 -

���� Übung:

• Häufigkeitstabellen für die Variablen v24 und v19 erstellen.• Die Anzeige der Codes der Ausprägungen für alle Variablen

aktivieren (dazu braucht Stata einen Moment, also Geduld) und Häufigkeitstabellen für v24 und v19 erstellen.

• Missings definieren: Bei v24 sollen die Ausprägungen 8 und 9 als unterschiedliche Missing Values definiert werden und bei v19 sollen die Werte 6 bis 9 in einem Missing Value zusammengefasst werden (vgl. Folie 26).

• Datensatz speichern mit save W:\Stata\Datensätze\allbus_ueb1a.dta

• Häufigkeitstabellen mit und ohne Missing Values für v24 und v19 erstellen.

Page 28: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 28 -

• Ergebnis a: Häufigkeitstabellen v24 v19 ohne Missings

Page 29: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 29 -

• Ergebnis b: Häufigkeitstabellen v24 v19 mit Missings

� Um die Missing Values der Variable in der Tabelle angezeigt zu bekommen:

tab v24, miss

� oder:

tab1 [varlist],miss

Page 30: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 30 -

• Transformation von Missing Values (zurück) in normale numerische Werte möglich mit dem Befehl: mvencode(Syntax des Befehls ist die gleiche wie beim mvdecode -Befehl).

• Damit wir nicht vergessen, was sich in unseren Häufigkeitstabellen der Variablen v24 und v19 hinter .a, .b und .c verbirgt sollten wir den Werten .a,.b und .c Labels zuweisen.

• Drei Wege eine Variable zu labeln: Name der Variable (machen wir nicht heute), Label der Variable und Label der Variablenwerte bzw. Codes der Ausprägungen der Variable.

Page 31: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 31 -

• Name der Variable: ergibt sich hier aus der Reihenfolge der Fragen im Fragebogen, kann aber auch beschreibenden Charakter haben. Kann 32 Zeichen umfassen, sollte aber sehr kurz sein.

• Label der Variable: enthält zusätzliche Informationen über den Inhalt der Variable und ist nur für den Stata-Nutzer wichtig. Kann 32.000 Zeichen umfassen.

• Label der Werte der Variable: enthalten die Bedeutung eines Wertes (also die alphanumerische Ausprägung) und sind insb. bei nominalen, meist aber auch bei ordinalem und intervall Skalenniveau unerlässlich (für den Stata-User)

• Mit dem Befehl label können der Datensatz, Variablen oder die Variablenwerte gelabelt werden (vgl. help label).

Page 32: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 32 -

• Befehl zum labeln der Variable: label variable varname ["label"]

• Werte von Variablen werden in zwei Schritten gelabelt:1. Ein `Labelcontainer´ wird definiert, der die einzelnen Werte und die Labels enthält: label define lblname # "label" [# "label" ...] [, add ...]

2. Das Label wird der Variable zugeordnet:

label values varname [lblname] [, nofix]

Name des Labelcontainers

Wert oder Code der Ausprägung

Durch ,add wird ein bereits vorhandenes Label um die genannten Wertelabels ergänzt

Name der Variable der der Labelcontainer zugeordnet werden soll.

• Eine Übersicht über die im Datensatz enthaltenen Labelcontainer und die enthaltenen Labels gibt:

label list [lblname [lblname ...]]

Page 33: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 33 -

• In unserem Fall wollen wir nun das Label der Variable v24 klarer formulieren und unsere neu definierten Missing Values der beiden Variablen v24 und v19 labeln:

���� Übung:

label variable v24 "Zuzug von: Nicht-EU-Arbeitnehmern, z.B. Türken"

label define v24 .a "Weiss nicht" .b "Keine Angabe" , add

label define v19 .c "Missing" , add

• Hat alles funktioniert? Kontrolle mit tab1 v24 v19, miss.

Page 34: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 34 -

6. Übungsaufgaben1. Untersuche welche Unterschiede zwischen den

Datensätzen allbus_ungew.dta und allbus_ueb1a.dtahinsichtlich der Variablen bestehen. Welche Befehle erscheinen dir zur Untersuchung sinnvoll?

Öffne die Datensätze dabei über das Command-Fenster und benutze zur Navigation die Befehle pwd, cd und dir.

2. Bei den Variablen v... sind sowohl die Label der Variablen als auch die Label der Werte verloren gegangen. Außerdem sind die fehlenden Werte nicht als solche definiert. Definiere die fehlenden Werte als solche und Label die genannten Variablen sowie ihre Werte.

Page 35: Übung Statistik I – Statistik mit Stata - uni-goettingen.de · Statistik mit Stata - 2 - Überblick 1. Sonstiges 2. Besprechung der Hausaufgaben 3. Befehlsstruktur und -abkürzungen

Statistik mit Stata - 35 -

Hausaufgaben:

1. Führe jeden Befehl, den die Präsentation enthält mindestens einmal aus. Untersuche die verwendeten Befehle dabei auch auf mögliche Unterbefehle und Optionen.

2. Welche Unterschiede bestehen zwischen den Datensätzen allbus_ungew.dta und allbus_ueb1.dtahinsichtlich der Ausprägungen und Fälle? Welche Befehle erscheinen dir zur Untersuchung sinnvoll?