Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
Tutorial
Stata und Wharton Research Data Services (WRDS)
2
Inhaltsverzeichnis
Stata
Wharton Research Data Services (WRDS)2
1
3
Inhaltsverzeichnis
Was ist Stata?1
Benutzeroberfläche2
do-file3
Daten einlesen und Datensätze mergen4
Variablenberechnung6
Bilden einer Stichprobe7
Regression10
Wie behalte ich den Überblick?11
Weiterführende Informationen12
Stata
Wharton Research Data Services (WRDS)2
1
Änderung der Variablentypisierung5
Deskriptive Statistik9
Implementierung zeitverzögerter Effekte8
4
Stata
Was ist Stata?
• Stata ist eine kommerzielle Statistik-Software, die das Daten-Management insbesondere großer Datensätze vereinfacht
• Implementierung einer Vielzahl statistischer Modelle
• Implementierung einer Vielzahl grafischer Darstellungen
• Selbstverständnis von Stata als eigenständiges Betriebssystem mit einer recht simplen Programmsprache
• Sehr hohe Transparenz durch die Offenlegung sämtlicher in Stata verwendeter Formeln und Funktionen
5
Stata
Benutzeroberfläche
do-file
Data Editor
Terminal Output
Variablen Window
EigenschaftenWindowCommand
Window
6
Stata
Benutzeroberfläche
Variablen-bezeichnung
Observation
Daten
7
Stata
do-file
• Achtung: Direkte Bearbeitung kann zu unwiderruflichen Datenverlusten führen
• Daher: Nutzen eines do-files, der den verwendeten Roh-Datensatz immer wieder neu einliest und den bearbeiteten Datensatz in einer neuen Datei abspeichert
do-file
8
Stata
Daten einlesen und Datensätze mergen
Löscht den internen Speicher
Daten einlesen
Die zu mergenden Datensätze müssen vorab entsprechend ihrer EINDEUTIGEN und EINMALIGENVariablenkombination sortiert werden
Löscht die nicht benötigte Variable “_merge“
Speichern des neuen Datensatzes
Lässt Stata wissen, dass der do-file beendet ist
Weitere merger: one-to-many (1:m); many-to-one (m:1); many-to-many (m:m)
9
Stata
Daten einlesen und Datensätze mergen
• Sortieren der Datensätze
Sortiert nach Variable 1 und Variable 2 gleichzeitig
Sortiert erst nach Variable 1 und dann nach Variable 2
Sinnvoll bei Datensatz mit einer verschachtelten Struktur (Bsp.: Datensatz mit sowohl Daten auf Segment-als auch Unternehmensebene)
10
Stata
Daten einlesen und Datensätze mergen
• Duplikate auffinden und aus dem Datensatz löschen
Variable “dup” hilft falsche/fehlerhafte Dateneingaben ausfindig zu machen
Lediglich die erste Observation eines Duplikats wird zur weiteren Berechnung herangezogen
Zum mergen von zwei Datensätze obligatorisch
11
Stata
Daten einlesen und Datensätze mergen
• Beim mergen von Datensätzen wird die Variable “_merge” von Stata automatisch generiert
“_merge==1” : Daten nur in Masterdatensatz vorhanden
“_merge==2” : Daten nur in zu mergenden Datensatz vorhanden
“_merge==3” : Daten sind im kombinierten Datensatz vorhanden
• Lediglich der kombinierte Datensatz wird zur weiteren Berechnung herangezogen
12
Stata
Änderung der Variablentypisierung
Wandelt eine String Variable in eine numerische Variable um
Wandelt eine numerische Variable in eine String Variable um
13
Stata
Variablenberechnung
Sortieren des Datensatzes
Simple Operatoren (+,-,* etc.)
Komplexere Operatoren (median, sum, total etc.)
14
Stata
Bilden einer Stichprobe
Alle Observations der Variable „year“ fallen lassen
Alle Observations, bei der die Variable „sale“ kleiner als $20 Mio., fallen lassen
Die ersten neun Observations über alle Variablen fallen lassen
15
Stata
Implementierung zeitverzögerter Effekte (time-lag/lead)
Bezeichnung der (neu generierten) Variable
Gibt den Vorjahreswert wieder
Überprüft, ob ein Vorjahreswert existiert
Überprüft, ob ein Wert im Folgejahr existiert
Gibt den Wert des Folgejahrs wieder
16
Stata
Deskriptive Statistik
Mittelwerte und Standardabweichung Variablenliste
Paarweise Korrelation der Koeffizienten
Signifikanzlevel der einzelnen Korrelationen
17
Stata
Regression
Paneldaten-Deklarierung: Panelvariable, Zeitvariable
Hausman-Test
Regression von Paneldaten
Unterdrücken des Terminal-Outputs
Internes Speichern der Koeffizienten
fixed-effects
random-effects
18
Stata
Wie behalte ich den Überblick?
Kommentare
Eindeutige Variablenbezeichnungen VariablenlabelGrafische Elemente
19
Stata
Weiterführende Informationen
• help-Funktion über command-Fenster (Bsp.: „help pwcorr“ )
• Internet-Foren
• Bedienungsanleitung
• Stata-Lernbücher:
Christopher F. Baum: An Introduction to Modern Econometrics Using Stata
Ulrich Kohler & Frauke Kreuter: Datenanalyse mit Stata
20
Inhaltsverzeichnis
Stata
Wharton Research Data Services (WRDS)
1
2
Was ist WRDS?1
Benutzeroberfläche2
Datenzugriff3
Beispieldatensatz4
Weiterführende Informationen6
Zugang5
21
WRDS
Was ist WRDS?
• WRDS: Wharton Research Data Services
• Führende Data Research-Plattform mit über 200 Terabyte an Daten
• Datenbanken decken die verschiedensten Bereiche ab (Bsp.: Accounting, Banking, Finance und Marketing)
• WRDS bündelt die Datenbanken in einem standardisierten Format
• Goldstandard in den Wirtschaftswissenschaften
22
WRDS
Benutzeroberfläche
23
WRDS
Benutzeroberfläche
24
WRDS
Home-Button: Get Data
Search WRDS
Variablenbeschreibung des ausgewählten Datensatzes
Internetrecherche
Datenzugriff
25
WRDS
Beispieldatensatz
• WRDS-Webinar (ZIV-Zugangsdaten benötigt)
26
WRDS
Zugang
• Ansprechpartner: Betriebliche Datenverarbeitung
• Voraussetzungen:
Der Antragssteller muss über eine gültige ZIV-Kennung verfügen
Regelungen für den Zugriff auf das Datenbankangebot
Erklärung zur Freischaltung
Antrag auf Freischaltung Betreuer muss eingetragen werden
27
WRDS
Weiterführende Informationen
• Weitere Foren (Google-Suche)
• Journal-Paper
Manuals and Overview; WRDS-Forum