27
Tutorial Stata und Wharton Research Data Services (WRDS)

Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

Tutorial

Stata und Wharton Research Data Services (WRDS)

Page 2: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

2

Inhaltsverzeichnis

Stata

Wharton Research Data Services (WRDS)2

1

Page 3: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

3

Inhaltsverzeichnis

Was ist Stata?1

Benutzeroberfläche2

do-file3

Daten einlesen und Datensätze mergen4

Variablenberechnung6

Bilden einer Stichprobe7

Regression10

Wie behalte ich den Überblick?11

Weiterführende Informationen12

Stata

Wharton Research Data Services (WRDS)2

1

Änderung der Variablentypisierung5

Deskriptive Statistik9

Implementierung zeitverzögerter Effekte8

Page 4: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

4

Stata

Was ist Stata?

• Stata ist eine kommerzielle Statistik-Software, die das Daten-Management insbesondere großer Datensätze vereinfacht

• Implementierung einer Vielzahl statistischer Modelle

• Implementierung einer Vielzahl grafischer Darstellungen

• Selbstverständnis von Stata als eigenständiges Betriebssystem mit einer recht simplen Programmsprache

• Sehr hohe Transparenz durch die Offenlegung sämtlicher in Stata verwendeter Formeln und Funktionen

Page 5: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

5

Stata

Benutzeroberfläche

do-file

Data Editor

Terminal Output

Variablen Window

EigenschaftenWindowCommand

Window

Page 6: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

6

Stata

Benutzeroberfläche

Variablen-bezeichnung

Observation

Daten

Page 7: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

7

Stata

do-file

• Achtung: Direkte Bearbeitung kann zu unwiderruflichen Datenverlusten führen

• Daher: Nutzen eines do-files, der den verwendeten Roh-Datensatz immer wieder neu einliest und den bearbeiteten Datensatz in einer neuen Datei abspeichert

do-file

Page 8: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

8

Stata

Daten einlesen und Datensätze mergen

Löscht den internen Speicher

Daten einlesen

Die zu mergenden Datensätze müssen vorab entsprechend ihrer EINDEUTIGEN und EINMALIGENVariablenkombination sortiert werden

Löscht die nicht benötigte Variable “_merge“

Speichern des neuen Datensatzes

Lässt Stata wissen, dass der do-file beendet ist

Weitere merger: one-to-many (1:m); many-to-one (m:1); many-to-many (m:m)

Page 9: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

9

Stata

Daten einlesen und Datensätze mergen

• Sortieren der Datensätze

Sortiert nach Variable 1 und Variable 2 gleichzeitig

Sortiert erst nach Variable 1 und dann nach Variable 2

Sinnvoll bei Datensatz mit einer verschachtelten Struktur (Bsp.: Datensatz mit sowohl Daten auf Segment-als auch Unternehmensebene)

Page 10: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

10

Stata

Daten einlesen und Datensätze mergen

• Duplikate auffinden und aus dem Datensatz löschen

Variable “dup” hilft falsche/fehlerhafte Dateneingaben ausfindig zu machen

Lediglich die erste Observation eines Duplikats wird zur weiteren Berechnung herangezogen

Zum mergen von zwei Datensätze obligatorisch

Page 11: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

11

Stata

Daten einlesen und Datensätze mergen

• Beim mergen von Datensätzen wird die Variable “_merge” von Stata automatisch generiert

“_merge==1” : Daten nur in Masterdatensatz vorhanden

“_merge==2” : Daten nur in zu mergenden Datensatz vorhanden

“_merge==3” : Daten sind im kombinierten Datensatz vorhanden

• Lediglich der kombinierte Datensatz wird zur weiteren Berechnung herangezogen

Page 12: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

12

Stata

Änderung der Variablentypisierung

Wandelt eine String Variable in eine numerische Variable um

Wandelt eine numerische Variable in eine String Variable um

Page 13: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

13

Stata

Variablenberechnung

Sortieren des Datensatzes

Simple Operatoren (+,-,* etc.)

Komplexere Operatoren (median, sum, total etc.)

Page 14: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

14

Stata

Bilden einer Stichprobe

Alle Observations der Variable „year“ fallen lassen

Alle Observations, bei der die Variable „sale“ kleiner als $20 Mio., fallen lassen

Die ersten neun Observations über alle Variablen fallen lassen

Page 15: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

15

Stata

Implementierung zeitverzögerter Effekte (time-lag/lead)

Bezeichnung der (neu generierten) Variable

Gibt den Vorjahreswert wieder

Überprüft, ob ein Vorjahreswert existiert

Überprüft, ob ein Wert im Folgejahr existiert

Gibt den Wert des Folgejahrs wieder

Page 16: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

16

Stata

Deskriptive Statistik

Mittelwerte und Standardabweichung Variablenliste

Paarweise Korrelation der Koeffizienten

Signifikanzlevel der einzelnen Korrelationen

Page 17: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

17

Stata

Regression

Paneldaten-Deklarierung: Panelvariable, Zeitvariable

Hausman-Test

Regression von Paneldaten

Unterdrücken des Terminal-Outputs

Internes Speichern der Koeffizienten

fixed-effects

random-effects

Page 18: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

18

Stata

Wie behalte ich den Überblick?

Kommentare

Eindeutige Variablenbezeichnungen VariablenlabelGrafische Elemente

Page 19: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

19

Stata

Weiterführende Informationen

• help-Funktion über command-Fenster (Bsp.: „help pwcorr“ )

• Internet-Foren

• Bedienungsanleitung

• Stata-Lernbücher:

Christopher F. Baum: An Introduction to Modern Econometrics Using Stata

Ulrich Kohler & Frauke Kreuter: Datenanalyse mit Stata

Page 20: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

20

Inhaltsverzeichnis

Stata

Wharton Research Data Services (WRDS)

1

2

Was ist WRDS?1

Benutzeroberfläche2

Datenzugriff3

Beispieldatensatz4

Weiterführende Informationen6

Zugang5

Page 21: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

21

WRDS

Was ist WRDS?

• WRDS: Wharton Research Data Services

• Führende Data Research-Plattform mit über 200 Terabyte an Daten

• Datenbanken decken die verschiedensten Bereiche ab (Bsp.: Accounting, Banking, Finance und Marketing)

• WRDS bündelt die Datenbanken in einem standardisierten Format

• Goldstandard in den Wirtschaftswissenschaften

Page 22: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

22

WRDS

Benutzeroberfläche

Page 23: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

23

WRDS

Benutzeroberfläche

Page 24: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

24

WRDS

Home-Button: Get Data

Search WRDS

Variablenbeschreibung des ausgewählten Datensatzes

Internetrecherche

Datenzugriff

Page 25: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

25

WRDS

Beispieldatensatz

• WRDS-Webinar (ZIV-Zugangsdaten benötigt)

Page 26: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

26

WRDS

Zugang

• Ansprechpartner: Betriebliche Datenverarbeitung

• Voraussetzungen:

Der Antragssteller muss über eine gültige ZIV-Kennung verfügen

Regelungen für den Zugriff auf das Datenbankangebot

Erklärung zur Freischaltung

Antrag auf Freischaltung Betreuer muss eingetragen werden

Page 27: Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file 4 Daten einlesen und Datensätze mergen 6 Variablenberechnung 7 Bilden einer Stichprobe

27

WRDS

Weiterführende Informationen

• Weitere Foren (Google-Suche)

• Journal-Paper

Manuals and Overview; WRDS-Forum