Stata und Wharton Research Data Services (WRDS) · 1 Was ist Stata? 2 Benutzeroberfläche 3 do-file...

Preview:

Citation preview

Tutorial

Stata und Wharton Research Data Services (WRDS)

2

Inhaltsverzeichnis

Stata

Wharton Research Data Services (WRDS)2

1

3

Inhaltsverzeichnis

Was ist Stata?1

Benutzeroberfläche2

do-file3

Daten einlesen und Datensätze mergen4

Variablenberechnung6

Bilden einer Stichprobe7

Regression10

Wie behalte ich den Überblick?11

Weiterführende Informationen12

Stata

Wharton Research Data Services (WRDS)2

1

Änderung der Variablentypisierung5

Deskriptive Statistik9

Implementierung zeitverzögerter Effekte8

4

Stata

Was ist Stata?

• Stata ist eine kommerzielle Statistik-Software, die das Daten-Management insbesondere großer Datensätze vereinfacht

• Implementierung einer Vielzahl statistischer Modelle

• Implementierung einer Vielzahl grafischer Darstellungen

• Selbstverständnis von Stata als eigenständiges Betriebssystem mit einer recht simplen Programmsprache

• Sehr hohe Transparenz durch die Offenlegung sämtlicher in Stata verwendeter Formeln und Funktionen

5

Stata

Benutzeroberfläche

do-file

Data Editor

Terminal Output

Variablen Window

EigenschaftenWindowCommand

Window

6

Stata

Benutzeroberfläche

Variablen-bezeichnung

Observation

Daten

7

Stata

do-file

• Achtung: Direkte Bearbeitung kann zu unwiderruflichen Datenverlusten führen

• Daher: Nutzen eines do-files, der den verwendeten Roh-Datensatz immer wieder neu einliest und den bearbeiteten Datensatz in einer neuen Datei abspeichert

do-file

8

Stata

Daten einlesen und Datensätze mergen

Löscht den internen Speicher

Daten einlesen

Die zu mergenden Datensätze müssen vorab entsprechend ihrer EINDEUTIGEN und EINMALIGENVariablenkombination sortiert werden

Löscht die nicht benötigte Variable “_merge“

Speichern des neuen Datensatzes

Lässt Stata wissen, dass der do-file beendet ist

Weitere merger: one-to-many (1:m); many-to-one (m:1); many-to-many (m:m)

9

Stata

Daten einlesen und Datensätze mergen

• Sortieren der Datensätze

Sortiert nach Variable 1 und Variable 2 gleichzeitig

Sortiert erst nach Variable 1 und dann nach Variable 2

Sinnvoll bei Datensatz mit einer verschachtelten Struktur (Bsp.: Datensatz mit sowohl Daten auf Segment-als auch Unternehmensebene)

10

Stata

Daten einlesen und Datensätze mergen

• Duplikate auffinden und aus dem Datensatz löschen

Variable “dup” hilft falsche/fehlerhafte Dateneingaben ausfindig zu machen

Lediglich die erste Observation eines Duplikats wird zur weiteren Berechnung herangezogen

Zum mergen von zwei Datensätze obligatorisch

11

Stata

Daten einlesen und Datensätze mergen

• Beim mergen von Datensätzen wird die Variable “_merge” von Stata automatisch generiert

“_merge==1” : Daten nur in Masterdatensatz vorhanden

“_merge==2” : Daten nur in zu mergenden Datensatz vorhanden

“_merge==3” : Daten sind im kombinierten Datensatz vorhanden

• Lediglich der kombinierte Datensatz wird zur weiteren Berechnung herangezogen

12

Stata

Änderung der Variablentypisierung

Wandelt eine String Variable in eine numerische Variable um

Wandelt eine numerische Variable in eine String Variable um

13

Stata

Variablenberechnung

Sortieren des Datensatzes

Simple Operatoren (+,-,* etc.)

Komplexere Operatoren (median, sum, total etc.)

14

Stata

Bilden einer Stichprobe

Alle Observations der Variable „year“ fallen lassen

Alle Observations, bei der die Variable „sale“ kleiner als $20 Mio., fallen lassen

Die ersten neun Observations über alle Variablen fallen lassen

15

Stata

Implementierung zeitverzögerter Effekte (time-lag/lead)

Bezeichnung der (neu generierten) Variable

Gibt den Vorjahreswert wieder

Überprüft, ob ein Vorjahreswert existiert

Überprüft, ob ein Wert im Folgejahr existiert

Gibt den Wert des Folgejahrs wieder

16

Stata

Deskriptive Statistik

Mittelwerte und Standardabweichung Variablenliste

Paarweise Korrelation der Koeffizienten

Signifikanzlevel der einzelnen Korrelationen

17

Stata

Regression

Paneldaten-Deklarierung: Panelvariable, Zeitvariable

Hausman-Test

Regression von Paneldaten

Unterdrücken des Terminal-Outputs

Internes Speichern der Koeffizienten

fixed-effects

random-effects

18

Stata

Wie behalte ich den Überblick?

Kommentare

Eindeutige Variablenbezeichnungen VariablenlabelGrafische Elemente

19

Stata

Weiterführende Informationen

• help-Funktion über command-Fenster (Bsp.: „help pwcorr“ )

• Internet-Foren

• Bedienungsanleitung

• Stata-Lernbücher:

Christopher F. Baum: An Introduction to Modern Econometrics Using Stata

Ulrich Kohler & Frauke Kreuter: Datenanalyse mit Stata

20

Inhaltsverzeichnis

Stata

Wharton Research Data Services (WRDS)

1

2

Was ist WRDS?1

Benutzeroberfläche2

Datenzugriff3

Beispieldatensatz4

Weiterführende Informationen6

Zugang5

21

WRDS

Was ist WRDS?

• WRDS: Wharton Research Data Services

• Führende Data Research-Plattform mit über 200 Terabyte an Daten

• Datenbanken decken die verschiedensten Bereiche ab (Bsp.: Accounting, Banking, Finance und Marketing)

• WRDS bündelt die Datenbanken in einem standardisierten Format

• Goldstandard in den Wirtschaftswissenschaften

22

WRDS

Benutzeroberfläche

23

WRDS

Benutzeroberfläche

24

WRDS

Home-Button: Get Data

Search WRDS

Variablenbeschreibung des ausgewählten Datensatzes

Internetrecherche

Datenzugriff

25

WRDS

Beispieldatensatz

• WRDS-Webinar (ZIV-Zugangsdaten benötigt)

26

WRDS

Zugang

• Ansprechpartner: Betriebliche Datenverarbeitung

• Voraussetzungen:

Der Antragssteller muss über eine gültige ZIV-Kennung verfügen

Regelungen für den Zugriff auf das Datenbankangebot

Erklärung zur Freischaltung

Antrag auf Freischaltung Betreuer muss eingetragen werden

27

WRDS

Weiterführende Informationen

• Weitere Foren (Google-Suche)

• Journal-Paper

Manuals and Overview; WRDS-Forum

Recommended