25
Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten Statistische Grundbegriffe Merkmalstr ¨ ager (Beobachtungseinheit) o Individuen, Haushalte, Unternehmen, L ¨ ander Merkmal (Variable) o Alter, Einkommen, Gewinn, BIP Merkmalsauspr ¨ agung (Wert der Variable) o 25 Jahre, 50.000 e im Jahr, 4 Mrd. e im Jahr, 551 Mrd. e im 4. Quartal 2003 1

Empirischen Volkswirtschaftslehre 1.2 Statistische ...trenkler.vwl.uni-mannheim.de/fileadmin/user_upload/trenkler/evwl/... · o Basisvariable x, log-Transformation: ln(x) o Regressionsmodelle:

  • Upload
    buingoc

  • View
    218

  • Download
    0

Embed Size (px)

Citation preview

Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten

Statistische Grundbegriffe

• Merkmalstrager (Beobachtungseinheit)

o Individuen, Haushalte, Unternehmen, Lander

• Merkmal (Variable)

o Alter, Einkommen, Gewinn, BIP

• Merkmalsauspragung (Wert der Variable)

o 25 Jahre, 50.000 e im Jahr, 4 Mrd. e im Jahr, 551 Mrd. e im 4.Quartal 2003

1

Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten

Datenarten: Skalierungsniveau

• Nominalskala: Ist A verschieden von B?

o Auspragungen konnen lediglich unterschieden werden(Beispiel: Kaufentscheidung modelliert mit Hilfe von Dummyvariable:Kauf = 1 und kein Kauf = 0)

• Ordinalskala (Rangskala): Ist A großer als B?

o Auspragungen konnen zusatzlich auch in eine Rangordnung gebrachtwerden (Beispiel: Kundenzufriedenheit)

2

Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten

Datenarten: Skalierungsniveau

• Kardinalskala

o Ausmaß der Unterschiede kann angegeben und interpretiert werdeno Intervallskala: Um wieviel differieren A und B?

Abstande konnen verglichen werden (Beispiel: Temperaturdifferenz,aber 0 Grad Celsius bedeutet nicht ,,keine Temperatur”)

o Verhaltnisskala: Um das wie vielfache ist A großer als B?zusatzlich naturlicher Nullpunkt (Beispiele: Preis, Lange, Gewicht)

3

Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten

Datenarten

• Diskrete vs. stetige Merkmale

o Diskret: nominalskalierte Merkmale sowie alle Merkmale, denen einZahlvorgang zugrunde liegt (Beispiel: Besucherzahl)

o Stetig: beliebig genauer (fiktiver) Messvorgang(Beispiele: Korpergroße, Gewinn)

• Aggregationsebene

o Gesamtwirtschaftlich/Makrodaten (Beispiele: BIP, Inflation)o Individualdaten/ Mikrodaten (Beispiele: Lohn eines Arbeitnehmer,

Produktpreis)

4

Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten

Datenarten: Querschnitts- und Zeitreihendaten

• Querschnittsdaten

o Daten bzgl. verschiedener Einheiten (Beispiele: Individuen, Haushalte,Firmen) zu einem gegebenen Zeitpunkt

o Haufig: Annahme einer Zufallsstichprobe/Unabhangigkeit(Beispiel: Stichprobe von 1000 Arbeitnehmer ,,gezogen aus derGrundgesamtheit aller Arbeitnehmer”)

o Reihenfolge der Daten nicht bedeutendo Symbol: xi, i = 1, . . . , n, d.h. es gibt n Querschnittseinheiten

5

Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten

Datenarten: Querschnitts- und Zeitreihendaten

• Zeitreihendaten

o Daten fur eine oder mehrere Variablen uber die Zeit(Beispiele: Inflationsrate vom 1. Quartal 1990 bis 4. Quartal 1999,Dax-Index vom 03.01.2006-30.06.2006)

o Haufig: hohe Abhangigkeit (Korrelation) uber die Zeit (Beispiel: BIP)o Reihenfolge der Daten ist bedeutsamo Symbol: xt, t = 1, . . . , T , d.h. es gibt T Beobachtungspunkteo Datenfrequenz: taglich, wochentlich, monatlich, vierteljahrlich, jahrlicho Saisonale Effekte

6

Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten

Datenarten: Gepoolte Querschnitts- und Paneldaten

• Gepoolte Querschnittsdaten

o Daten von verschiedenen Querschnittseinheiten fur mehrereZeitpunkte(Beispiel: Haushaltsstichproben in den Jahren 1996 und 1998)

o Gemeinsame Analyse mehrerer Zufallsstichproben:Hohere Anzahl von BeobachtungenAnalyse von Veranderungen uber die Zeit(Beispiel: Analyse der Effekte der Gesundheitsreform von 1997mit Hilfe von Daten aus 1996 und 1998)

7

Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten

Datenarten: Gepoolte Querschnitts- und Paneldaten

• Paneldaten

o Daten von gleichen Querschnittseinheiten fur mehrere Zeitpunkte(Beispiel: Sozio-okonomische Panel (SOEP) des DIW)

o Paneldaten erlaubenKontrolle von so genannten ,,unbeobachteten Individualeffekten”Analyse von zeitverzogerten Effekten(Beispiel: Investition in Abhangigkeit von Firmencharakteristikaaus Vorperioden)

8

Empirischen Volkswirtschaftslehre 1.3 Datenquellen, -erhebung, und -transformationen

Datenquellen

• Amtliche Statistik

o Statistisches Bundesamt, Eurostat, EZB, Bundesbank, Bundesagenturfur Arbeit

• Nichtamtliche Statistik

o Sachverstandigenrat zur Begutachtung der gesamtwirtschaftlichenEntwicklung, VGR des DIW, OECD, UNO, IWF, Weltbank

• Haushalts- und Unternehmensbefragungen

o SOEP, Konjunkturindikatoren (z.B. Geschaftsklimaindex des ifoInstituts), Befragung von Finanzmarktexperten durch das ZEW

• Spieltheoretische und andere Experimente

9

Empirischen Volkswirtschaftslehre 1.3 Datenquellen, -erhebung, und -transformationen

Datenerhebung

• Befragungen

o Beispiele: Haushalts- und Unternehmenspanel, Umfragen

• Meldepflichten von Unternehmen und Institutionen

o Beispiele: Amtliche Statistiken, EZB/Bundesbank, Finanzbehorden

• Automatische (computergestutzte) Erfassung

o Beispiele: Finanzmarktdaten (Borsenkurse, Optionspreise etc.)

• Sonstige Erhebungen

o Beispiele: Firmeninterne Erfassung von Daten, Einzelhandelspreise alsBasis fur Preisindexberechnung

• Wichtige theoretische Basis: Stichprobentheorie

10

Empirischen Volkswirtschaftslehre 1.3 Datenquellen, -erhebung, und -transformationen

Auswahl geeigneter Daten: Probleme

• Messen die Daten die okonomisch relevante Große?

o Beispiel: Wirtschaftsaktivitat vs. BIP

• Datenqualitat: Sind Messfehler wahrscheinlich?

o Beispiele: Falsche Angabe von Einkommen bei Haushaltsbefragungen,Tipp- und Schreibfehler

• Durfen wir Variablen im okonometrischen Modell aufgrund mangelnderDatenverfugbarkeit auslassen?

o Beispiele: Fahigkeit/Intelligenz in Lohnmodellen, Tag der Prufung imRahmen von Leistungsstudien (z.B. PISA)

11

Empirischen Volkswirtschaftslehre 1.3 Datenquellen, -erhebung, und -transformationen

Auswahl geeigneter Daten: Probleme

• Enstprechen die okonometrischen Modellannahmen denDateneigenschaften?

o Beispiel: Unabhangigkeit der Stichprobe

• Konsequenzen fur empirische/okonometrische Analyse?

o Bestimmung der Effekte von z.B. Messfehlerno Entwicklung und Anwendung von adaquaten okonometrischen

Methoden

12

Empirischen Volkswirtschaftslehre 1.3 Datenquellen, -erhebung, und -transformationen

Elementare Datentransformationen

• Querschnittsdaten: Quotenbildung

o Beispiel: Bruttowertschopfung in Sektor k, xk, k = 1, . . . , K

Anteil von Sektor k: qk =xk∑Kj=1 xj

, k = 1, . . . , K

• Zeitreihendaten: Bildung von Indexreihe

o Beispiel: Bruttowertschopfung in Sektor k, xkt, fur die Jahre1991-2005, t = 1, . . . , 10Indexreihe fur xkt fur Basisjahr 1991, d.h. Index=100 in 1991ikt = (xkt/xk1)× 100, t = 1, . . . , 10, ⇒ ik1 = 100,

13

Empirischen Volkswirtschaftslehre 1.3 Datenquellen, -erhebung, und -transformationen

Elementare Datentransformationen

• Zeitreihendaten: Wachstumsraten

o Beispiel: vierteljahrliches BIP-Wachstum zwischen 1991:1-1999:4BIP-Zeitreihe: xt, t = 1, . . . , 40

Zeitreihe der BIP-Wachstumsraten: rt =xt − xt−1

xt−1, t = 2, . . . , 40

Bestimmung der Wachstumsraten erst ab der zweiten Beobachtungmoglich!Wachstumsrate uber mehrere Perioden entspricht nicht der Summeder einperiodigen Wachstumsraten: wegen Zinseszinseffekt

14

Empirischen Volkswirtschaftslehre 1.3 Datenquellen, -erhebung, und -transformationen

Elementare Datentransformationen

• Log-Transformation

o Basisvariable x, log-Transformation: ln(x)

o Regressionsmodelle: Interpretation der Koeffizienten als Semielastizitatbzw. Elastizitat bei Verwendung von logarithmierten Variablen

o Varianzglattung, falls Varianz mit Niveau der Variable ansteigt

o Bildung von (Log-)Wachstumsraten als Differenz von Logarithmen:Zeitreihe der BIP-(Log-)Wachstumsraten: rlt = ln(xt)− ln(xt−1)

Beachte: rlt = ln(xt)− ln(xt−1) ≈ rt, falls rt klein istLog-Wachstumsrate uber mehrere Perioden ergibt sich als Summe dereinperiodigen Log-Wachstumsraten

15

Empirischen Volkswirtschaftslehre 1.3 Datenquellen, -erhebung, und -transformationen

Reale vs. nominale Variablen

• Nominale Variable y und Preisindex p ⇒ Reale Variable x = (y/p)× 100

• Typische Anwendung fur Zeitreihenvariablen: Nominales und reales BIP

o Nominale BIP-Zeitreihe: yt, t = 1, . . . , T

o Preisindexzeitreihe: pt, t = 1, . . . , T , mit p1 = 100o Reale BIP-Zeitreihe: xt = (yt/pt)× 100, t = 1, . . . , T

16

Empirischen Volkswirtschaftslehre 1.4 Computergestutze Datenanalyse

Datenzugang

• Die meisten Daten sind in elektronischer Form verfugbar

o Makro- und Finanzmarktdaten via CD oder Internetdatenbanken:Eurostat, Statistisches Bundesamt, EZB, International StatisticalYearbook (IMF), Main Economic Indicators (OECD), ThomsonDatastream, EcoWin, Yahoo-Finanzen etc..

o Mikrodatensatze mit Haushalts- oder UnternehmensdatenDatenschutz: eingeschrankter Zugang

• Beispiele fur nichtelektronischen Datenzugang

o Viele der o.g. Institutionen veroffentlichen Daten auch in gedruckterForm

o ,,Historische” Statistiken wie z.B. Handelstatistik des DeutschenReiches

17

Empirischen Volkswirtschaftslehre 1.4 Computergestutze Datenanalyse

Software

• Tabellenkalkulationsprogramme: Deskriptive Analyse

• Statistik- und Okonometrieprogramme: STATA, EViews, R, GAUSS

o Dateneinleseno Umfangreiche Datenanalyse: Regressionsanalyse u.a. komplexe

statistische und okonometrische Methodeno Programmierung von nicht implementierten Methodeno Simulationen zur Evaluation von statistischen Verfahren, z.B. Tests

18

Empirischen Volkswirtschaftslehre 1.4 Rolle der Stochastik

Zufallsvariablen

• Annahme: Betrachtete Variablen sind zufallig, d.h. stochstisch

• Beispiel Lohngleichung fur Arbeitnehmer

• Motivation I

o Stichprobe von 1000 Arbeitnehmer aus Grundgesamtheit allerArbeitnehmer

o Stichprobe bezuglich Lohn: {W1, . . . , W1000}o Zufallige Auswahl ⇒ Lohn von Arbeitnehmer i, Wi, ist eine

Zufallsvariable

19

Empirischen Volkswirtschaftslehre 1.4 Rolle der Stochastik

Zufallsvariablen: Motivation II

• Okonomisches LohnmodellW = f (Ausbildung, Berufserfahrung, Umfang von Qualifizierung,Fahigkeit)

• Okonometrisches LohnmodellW = β0 + β1ausb + β2befahr + β3quali + U

• Grunde fur Berucksichtigung von Fehlerterm U

o Intrinsische Zufalligkeit: okonomisches Modell gilt nicht exakto Messfehler, schlechte Proxyvariablen (z.B. Ausbildungszeit)o ausgelassene Variablen (z.B. Fahigkeit)o falsche funktionale Form (z.B. lineare Form)

20

Empirischen Volkswirtschaftslehre 1.4 Rolle der Stochastik

Zufallsvariablen: Motivation II

• Sinnvolle/Notwendige Annahme:Effekte des Fehlerterms sind nicht systematisch, sondern zufalligU ist eine Zufallsvariable, z.B. mit U ∼ (0, σ2)

• Wenn U eine Zufallsvariable ist, dann ist auch W eine Zufallsvariable,wegen W = β0 + β1ausb + β2befahr + β3quali + U

• Unterschiedliche Annahmen bzgl. erklarender Variablenausb, befahr, quali

o Realistisch: auch Zufallsvariableno Haufig: deterministisch Variablen, um Eigenschaften von

okonometrischen Methoden (Schatzer, Tests) einfacher herleiten zukonnen

21

Empirischen Volkswirtschaftslehre 1.4 Rolle der Stochastik

Stochastischer Modellrahmen

• Welche Konsequenz hat der stochastische Modellrahmen?

• Wie konnen wir den stochastische Modellrahmen nutzen, um etwas uberdie Grundgesamtheit zu lernen?

22

Empirischen Volkswirtschaftslehre 1.4 Rolle der Stochastik

Stochastischer Modellrahmen: Konsequenz

• Unterscheide Zufallsvariablen und Daten

• Beispiel: Zufallsexperiment zu Durchschnittsalter der EVWL-Studenten

o Grundgesamtheit: Alle EVWL-Studenteno Zufallige Auswahl von 10 Studenten

Jeder Student hat gleiche Chance, einzelne Auswahlentscheidungensind unabhangig =⇒ ,,Ziehen mit Zurucklegen”

o Zufallsstichprobe: {Y1, . . . , Y10}mit Yi = Alter von Student i, Yi ist eine Zufallsvariable

o Nach Auswahl: Daten bzw. Realisationen (y1, . . . , y10) liegen vor;Sie sind nicht zufallig!

o Daten variieren je nach Stichprobe

23

Empirischen Volkswirtschaftslehre 1.4 Rolle der Stochastik

Stochastischer Modellrahmen: Inferenz

• Wir verwenden Daten um auf Eigenschaften der Grundgesamtheit(hier: Durchschnittsalter µ) zu schließen: Inferenz

• Schatzer/Schatzregel: Arithmetisches Mittel der Stichprobenvariablen

o Y =110

∑10i=1 Yi

o Y ist eine Zufallsvariable, da es eine Funktion von Zufallsvariablen ist

• Schatzwert/Schatzung: Arithmetisches Mittel der Daten

o y =110

∑10i=1 yi

o y ist keine Zufallsvariable, sondern ein Zahlenwert

24

Empirischen Volkswirtschaftslehre 1.4 Rolle der Stochastik

Stochastischer Modellrahmen: Inferenz

• Stochastischer Modellrahmen erlaubt Evaluation okonometrischerVerfahren, z.B. von Schatzern (aber auch Entwicklung von Verfahren)

• Relevante Frage: Ist unser(e) Schatzer/Schatzregel gut?

o Idee: Konnen unendlich viele Stichproben ziehen⇒ unendlich viele Schatzwerte

o Machen wir im Mittel einen Fehler, d.h. gilt E[Y ] = µ oder nicht?o Abstrakte Eigenschaft: oft nur eine Stichprobe verfugbaro Ableitung der Eigenschaften von Schatzern ist eine der Hauptaufgaben

der Okonometrie: verlangt Kenntnisse uber Wahrscheinlichkeitstheorieund induktiver Statistik

• Konkreter Schatzwert ist richtig oder falsch! Wir wissen es aber nie!

o Es gilt immer: E[y] = y, da y nicht zufallig

25