7. Integrierte Prozesse - … Prozess fXtg heißt integriert der Ordnung d (in Zeichen: Xt Ÿ I(d)), falls fXtg d mal diﬀerenziert werden muss, damit der Prozess station¨ar wird

7. Integrierte Prozesse

Bisher:

• Behandlung stationarer Prozesse(stationare ARMA(p, q)-Prozesse)

Problem:

• Viele okonomische Zeitreihen weisen im Zeitverlauf ein nicht-stationares Verhalten auf

225

Beispiel:

• Betrachte (log.) DAX von Folie 8

• Schatze den AR(1)-Prozess

DAXt = c + φ ·DAXt−1 + εt

• Offensichtlich: φ = 1.000314 sehr nahe bei 1 (vgl. Folie 227)

• DAX-Zeitreihe weist wahrscheinlich eine Einheitswurzel auf(das AR-Polynom φ(L) = 1 − L hat ein Nullstelle auf demEinheitskreis; Unit Root)

−→ DAX-Zeitreihe ist ein Random-Walk und nicht-stationar

226

Schatzung eines AR(1)-Prozesses fur den log. DAX

227

Dependent Variable: DAX_LOG Method: Least Squares Date: 22/06/08 Time: 13:39 Sample (adjusted): 1960M01 2008M02 Included observations: 578 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C 0.002606 0.017254 0.151020 0.8800DAX_LOG(-1) 1.000314 0.002429 411.8280 0.0000

R-squared 0.996615 Mean dependent var 7.043221Adjusted R-squared 0.996609 S.D. dependent var 0.962492S.E. of regression 0.056044 Akaike info criterion -2.921888Sum squared resid 1.809206 Schwarz criterion -2.906803Log likelihood 846.4258 F-statistic 169602.3Durbin-Watson stat 1.893856 Prob(F-statistic) 0.000000

Bemerkung:

• Man erhalt ein ahnliches Ergebnis, wenn man einen ARMA(p, q)-Prozess anpasst

Sprechweise:

• Wenn man sagt:

”Eine Zeitreihe weist eine Einheitswurzel auf ”,

dann ist gemeint:

”Die Zeitreihe ist nicht-stationar, jedoch kann durchBildung der Differenzen Stationaritat erreicht werden ”.

228

-.3

-.2

-.1

.0

.1

.2

1960 1970 1980 1990 2000

DAX (1. Differenzen im Logarithmus)

Zeit Dependent Variable: DAX_LOG_DIFF Method: Least Squares Date: 22/06/08 Time: 14:33 Sample (adjusted): 1960M02 2008M02 Included observations: 577 after adjustments


C 0.004566 0.002341 1.950640 0.0516DAX_LOG_DIFF(-1) 0.053286 0.041648 1.279451 0.2013


Differenzenbildung:

• 1. Differenzen:

∆Xt = (1− L)Xt = Xt −Xt−1

• 2. Differenzen:

∆2Xt = (1− L)2Xt = (1− 2L + L2)Xt = Xt − 2Xt−1 + Xt−2

• Differenzen der Ordnung d:

∆dXt = (1− L)dXt

230

Definition 7.1: (Integration eines SP)

Der Prozess {Xt} heißt integriert der Ordnung d (in Zeichen:Xt ∼ I(d)), falls {Xt} d mal differenziert werden muss, damit derProzess stationar wird.

Bemerkungen:

• Die meisten okonomischen Einheitswurzel-Zeitreihen werdendurch einmaliges Differenzieren stationar(d.h. die Zeitreihen sind I(1))

• Stationare Zeitreihen werden oft als I(0) bezeichnet

231

7.1 Stochastische vs. deterministische Trends

Bemerkung:

• Die Nicht-Stationaritat eines ARMA(p, q)-Prozesses {Xt} auf-grund einer Einheitswurzel bezieht sich auf die Nullstellen desAR(p)-Polynoms

−→ Wir betrachten jetzt nur den AR(p)-Teil von {Xt}(der MA(q)-Teil ist immer stationar)

232

Zwischenfazit:

• Viele okonomische Zeitreihen enthalten einen Trend(vgl. Folien 8-15)

• AR(p)-Modelle mit einer Einheitswurzel konnen einen Trenderfassen

Frage:

• Gibt es neben AR(p)-Prozessen mit einer Einheitswurzel nochandere theoretische Modelle, die einen zeitlichen Trend im-plizieren?

233

Betrachte das folgende Modell:

Xt = c + φ ·Xt−1 + δ · t + εt

mit {εt} ∼ WR(0, σ2)

Spezialfalle: (I)

• Random Walk mit/ohne Drift, d.h. φ = 1, δ = 0:

Xt = c + Xt−1 + εt

{Xt} hat eine Einheitswurzel (und damit einen Trend), jedochimpliziert Differenzenbildung Stationaritat:

∆Xt = Xt −Xt−1 = c + εt

−→ Stochastischer Trend

234

Spezialfalle: (II)

• Trend-stationarer Prozess, d.h. φ = 0, δ 6= 0:

Xt = c + δ · t + εt

Es gilt:

E(Xt) = c + δ · t, V ar(Xt) = V ar(εt) = σ2

d.h. {Xt} ist nicht-stationar und hat einen Trend. Betrachtetman jedoch den Prozess

{Yt} = {Xt − E(Xt)} = {Xt − c− δ · t} = {εt},

so ist dieser stationar

−→ Deterministischer Trend

235

Stochastischer vs. deterministischer Trend

236

-10

0

10

20

30

40

0 200 400 600 800 1000

Stochastischer Trend

Deterministischer Trend

t

Unterschied zwischen beiden Trends: (I)

• Deterministischer Trend:

Sind c und δ bekannt, so kann der E-Wert von Xt perfektvorhergesagt werden

Abweichungen von der Trendlinie c+ δ · t sind rein zufalligund haben keinerlei Einfluss auf das Langfrist-Verhaltenvon Xt

Stationaritat wird uber ’Detrenden’ erreicht

237

Unterschied zwischen beiden Trends: (II)

• Stochastischer Trend:

Die stochastische Komponente εt hat langfristigen Ein-fluss auf Xt(ohne mathematischen Beweis)

Stationaritat wird nur uber Differenzieren erreicht

238

7.2 Parametertests im AR(p)-Modell mit deter-ministischem Trend

Ausgangssituation:

• Betrachte das AR(p)-Modell der Form

Xt = c + φ1Xt−1 + . . . + φpXt−p + εt

mit εt ∼ WR(0, σ2)

Ziel:

• Entwicklung eines statistischen Tests auf Einheitswurzel ineiner Zeitreihe(Stationaritatstest)

239

Hierfur zunachst:

• Gunstige Umformulierung des AR(p)-Modells

Satz 7.2: (Aquivalente Darstellung von AR(p)-Prozessen)

Es sei {Xt} ein AR(p)-Prozess gemaß der obigen Darstellung.Dann lasst sich der Prozess {Xt} mit geeignet gewahlten Param-etern %, ψ1, . . . , ψp−1 auch wie folgt in Differenzen darstellen:

∆Xt = c+%·Xt−1+ψ1·∆Xt−1+ψ2·∆Xt−2+. . .+ψp−1·∆Xt−p+1+εt.

240

Bemerkungen:

• Die Aquivalenz der AR(p)-Darstellungen ergibt sich durcheinfache algebraische Umformungen

• Die ’neuen’ Parameter %, ψ1, . . . , ψp−1 sind einfache Funktio-nen der ursprunglichen Parameter φ1, . . . , φp

• Z.B. gilt: % = φ1 + φ2 + . . . + φp − 1

• Beide Darstellungen haben insgesamt p+1 Parameter, namlichc, φ1, . . . , φp bzw. c, %, ψ1, . . . , ψp−1

241

Satz 7.3: (Stationaritat von AR(p)-Prozessen)

Es sei {Xt} ein AR(p)-Prozess in der Darstellung des Satzes 7.2.Dann gilt:

(a) Der Prozess {Xt} ist stationar, falls −2 < % < 0.

(b) Der Prozess {Xt} hat eine Einheitswurzel (d.h. ist nicht-stationar), falls % = 0.

242

Bemerkungen:

• In der umformulierten Fassung des AR(p)-Modells hangt dieStationaritat nur noch vom Parameter % ab

• In der ursprunglichen Form hangt die Stationaritat von derLage der Nullstellen des AR(p)-Polynoms

Φ(z) = 1− φ1z − φ2z2 − . . .− φpzp

und damit von den p Parametern φ1, . . . , φp ab(vgl. Folien 83, 84)

243

Jetzt:

• Betrachte das AR(p)-Modell aus Satz 7.2 erweitert um dendeterministischen Trend:

∆Xt = c + % ·Xt−1 +p−1∑

j=1ψj ·∆Xt−j + δ · t + εt

(AR(p)-mit-deterministischem-Trend-Modell, kurz: AR(p)-DT-Modell)

• Test auf Einheitswurzel im AR(p)-DT-Modell lautet

H0 : % = 0 gegen H1 : % < 0

244

Betrachte:

• Statistische Tests im AR(p)-DT-Modell

2 Ziele dieser Tests:

• Bestimmung der geeigneten Lag-Lange p

• Test auf Einheitswurzel (Unit Root)

Dafur:

• Unterteilung der Parameter in 2 Gruppen, namlich

(a) c, ψ1, . . . , ψp−1 und δ

(b) %

245

Vorlaufige Begrundung:

• Test fur Parameter % unterscheidet sich von Tests fur alleanderen Parameter(genaue Erklarung folgt)

Zunachst:

• Sequentielles Verfahren zur Bestimmung derLag-Lange p im AR(p)-DT-Modell

246

Strategie in 5 Schritten: (I)

1. Wahle eine inhaltlich sinnvolle Maximal-Lange pmax

2. Schatze mittels KQ das AR(pmax)-DT-Modell

∆Xt = c + % ·Xt−1 +pmax−1

∑


Entscheide anhand des t-Tests:

H0 : ψpmax−1 = 0 gegen H1 : ψpmax−1 6= 0

Bei Ablehnung von H0, gehe zu Schritt 5Bei Nicht-Ablehnung von H0, gehe zu Schritt 3

247

Strategie in 5 Schritten: (II)

3. Schatze mittels KQ das AR(pmax − 1)-DT-Modell

∆Xt = c + % ·Xt−1 +pmax−2

∑


Entscheide anhand des t-Tests:

H0 : ψpmax−2 = 0 gegen H1 : ψpmax−2 6= 0

Bei Ablehnung von H0, gehe zu Schritt 5Bei Nicht-Ablehnung von H0, gehe zu Schritt 4

4. Wiederhole die Schatzung des Modells mit schrittweise re-duzierten Lags bis ein ψ-Koeffizient statistisch signifikant istoder bis keine Lags mehr ubrig sind

248

Strategie in 5 Schritten: (III)

5. Teste anhand des t-Tests H0 : δ = 0 gegen H1 : δ 6= 0und entscheide so uber die Belassung des deterministischenTrends im Modell

249

Beispiel:

• Betrachte log. DAX und beginne mit pmax = 4

Ergebnis (vgl. Folien 251, 252):

• Modell reduziert sich auf

∆Xt = c + % ·Xt−1 + δ · t + εt

Frage:

• Ist % = 0, d.h. weist die Zeitreihe eine Einheitswurzel auf?

Plausible Vorgehensweise:

• Gemaß t-Test (vgl. Folie 252) ist % signifikant von Null ver-schieden zum Niveau 0.05

250

Dependent Variable: D(DAX_LOG) Method: Least Squares Date: 22/06/08 Time: 17:42 Sample (adjusted): 1960M04 2008M02 Included observations: 575 after adjustments


C 0.080399 0.035856 2.242239 0.0253DAX_LOG(-1) -0.014513 0.006485 -2.237911 0.0256

D(DAX_LOG(-1)) 0.056230 0.041823 1.344494 0.1793D(DAX_LOG(-2)) 0.028922 0.042240 0.684693 0.4938D(DAX_LOG(-3)) 0.019308 0.042221 0.457311 0.6476

T 8.96E-05 3.73E-05 2.400637 0.0167




C 0.078717 0.035652 2.207934 0.0276DAX_LOG(-1) -0.014189 0.006443 -2.202013 0.0281

D(DAX_LOG(-1)) 0.056398 0.041747 1.350959 0.1772D(DAX_LOG(-2)) 0.029728 0.042134 0.705563 0.4807

T 8.79E-05 3.71E-05 2.371416 0.0181




C 0.077131 0.035460 2.175164 0.0300DAX_LOG(-1) -0.013912 0.006404 -2.172346 0.0302

D(DAX_LOG(-1)) 0.057755 0.041651 1.386645 0.1661T 8.71E-05 3.69E-05 2.364580 0.0184




C 0.073723 0.035336 2.086314 0.0374DAX_LOG(-1) -0.013278 0.006377 -2.082053 0.0378

T 8.45E-05 3.67E-05 2.303511 0.0216


Leider:

• Im AR(p)-DT-Modell ist der t-Test fur den Parameter %ungultig!

• Die Vtlg. der t-Statistik des Parameters % unter H0 folgtim AR(p)-DT-Modell nicht der t-Verteilung, sondern eineranderen Verteilung!

253

7.3 Statistische Tests auf Einheitswurzel

Frage:

• Wie kann statistisch auf das Vorliegen einer Einheitswurzel(d.h. auf Nicht-Stationaritat) einer Zeitreihe getestet wer-den?

Betrachte dazu:

• AR(p)-DT-Modell

∆Xt = c + % ·Xt−1 +p−1∑

j=1ψj ·∆Xt−j + δ · t + εt,

das mit der 5-Schritt-Strategie der Folien 247-249 angepasstwurde

254

Erinnerung:

• Statistischer Test

H0 : % = 0 gegen H1 : % < 0

ist gleichbedeutend mit

H0 : Zeitreihe weist eine Einheitswurzel auf(Stochastischer Trend)

gegen

H1 : Zeitreihe weist keine Einheitswurzel auf(Kein stochastischer Trend)

255

Erinnere ferner:

• Die gewohnliche t-Statistik fur den Parameter % im AR(p)-DT-Modell ist unter H0 nicht t-verteilt(vgl. Folie 253)

Deshalb:

• t-Statistik fur Parameter % im AR(p)-DT-Modell wird haufigals τ-Statistik bezeichnet

256

Bemerkungen zur Vtlg. der τ-Statistik unter H0:

• Vtlg. geht zuruck auf Dickey-Fuller (1979, 1981)

• Exakte H0-Vtlg. der τ-Statistik hangt davon ab, ob

der deterministische Trend t im AR(p)-DT-Modell enthal-ten ist

die Niveaukonstante c im AR(p)-DT-Modell enthalten ist

• Die kritischen Werte der H0-Verteilung werden

MacKinnon-Werte

genannt und sind in EViews implementiert

257

Definition 7.4: (Augmented-Dickey-Fuller-Test)

Man betrachte das AR(p)-DT-Modell von Folie 244, das mitHilfe der 5-schrittigen Strategie der Folien 247-249 an eine Zeit-reihe {xt}t=0,1,... angepasst wurde. Der statistische Test fur dasProblem

H0 : % = 0 gegen H1 : % < 0,

der anhand der τ-Statistik und den MacKinnon-Werten durch-gefuhrt wird, heißt Augmented-Dickey-Fuller-Test (ADF-Test).

258

Bemerkungen:

• Der ADF-Test ist ein Test auf Stationaritat

• Der ADF-Test lehnt die Nullhypothese einer Einheitswurzel(die Nicht-Stationaritat) zugunsten der Alternative (der Sta-tionaritat) ab, falls die τ-Statistik starker negativ ist als derMacKinnon-Wert zum gewunschten Signifikanzniveau(d.h. falls der τ-Wert betraglich großer ist als der Betrag desentsprechenden MacKinnon-Wertes)

259

Beispiel: (ADF-Test fur den log. DAX)

• Die 5-schrittige Anpassungsstrategie auf den Folien 247-249fuhrte zu einem AR(p)-DT-Modell mit p = 1, δ 6= 0(Modell ohne verzogerte Differenzen, mit determin. Trend)

260

Null Hypothesis: DAX_LOG has a unit root Exogenous: Constant, Linear Trend Lag Length: 0 (Automatic based on SIC, MAXLAG=18)

t-Statistic Prob.*

Augmented Dickey-Fuller test statistic -2.082053 0.5542 Test critical values: 1% level -3.974012

5% level -3.417613 10% level -3.131232

*MacKinnon (1996) one-sided p-values.

Ergebnis mit EViews:

• τ-Statistik = −2.082053 ist betraglich kleiner als die jeweili-gen Betrage der 3 MacKinnon-Werte

−→ H0 kann zu den Sig.-Niveaus 1%, 5%, 10% nicht abgelehntwerden

−→ Stat. Anzeichen fur eine Einheitswurzel(stochastischer Trend)

261

Abschließende Bemerkungen: (I)

• Der ADF-Test unterstellt folgende Eigenschaften fur denFehlerprozess {εt}t=0,1,... im AR(p)-DT-Modell:

Die Fehler εt sind stochastisch unabhangig(keine Autokorrelation)

Der Fehlerprozess ist homoskedastisch(V ar(εt) = σ2 fur alle t)

• Ein alternativer (nicht-parametrischer) Einheitswurzel-Test,der Autokorrelation und Heteroskedastie im Fehlerprozess{εt} zulasst, ist der Phillips-Perron-Test

262

Abschließende Bemerkungen: (II)

• ADF-Tests haben in der Praxis oft eine geringe Gute: DieADF-Tests halten haufig an der Nullhypothese einer Ein-heitswurzel (also der Nicht-Stationaritat) fest, wenn die Null-hypothese in Wirklichkeit falsch ist(Fehlentscheidung des Tests)

• Liegt in den Daten ein Strukturbruch vor, so versagen dieADF-Tests vollstandig

263

7.4 Regressionen mit integrierten Variablen

Bisher:

• Eigenschaften eines Prozesses {Xt}:

StationaritatEinheitswurzel (integrierter Prozess)

Jetzt:

• Regressionsmodelle mit Zeitreihenvariablen, z.B.

Yt = β0 + β1X1t + . . . + βKXKt + εt

264

Zentrale Frage:

• Eigenschaften der KQ-Schatzer fur β0, . . . , βK, falls

alle Variablen stationar sindeinige Variablen Einheitswurzeln aufweisen

−→ Problem der Schein-Regression(spurious Regression)

Es gilt:

Falls alle Variablen {Yt}, {X1t}, . . . , {XKt} stationar und dieklassischen Annahmen des multiplen Regressionsmodellserfullt sind, so ist die KQ-Schatzung vollig unproblematisch

265

7.4.1 Schein-Regression (spurious regression)

Frage:

• Warum sind Regressionen mit Einheitswurzel-Zeitreihen prob-lematisch?

266

Beispiel:• Betrachte 2 Random Walks {Yt}, {Xt}

(nicht-stationare Prozesse mit Einheitswurzel)

• Beide Prozesse werden unabhangig voneinander erzeugt:

Yt = Yt−1 + ε1tXt = Xt−1 + ε2t

mit {ε1t}, {ε2t} ∼ GWR(0,1) ({ε1t}, {ε2t} unabhangig)

• Betrachte Regressionenin Niveaugroßen

Yt = β0 + β1 ·Xt + εtin 1. Differenzen

∆Yt = β0 + β1 ·∆Xt + εt

267

-20

0

20

40

60

200 400 600 800 1000

1. Random Walk

2. Random Walk

t

Dependent Variable: RANDOMWALK_1 Method: Least Squares Date: 01/20/03 Time: 10:10 Sample: 1 1000 Included observations: 1000


C 3.108647 0.688040 4.518121 0.0000 RANDOMWALK_2 1.316307 0.033693 39.06771 0.0000

R-squared 0.604641 Mean dependent var 25.60444 Adjusted R-squared 0.604245 S.D. dependent var 18.93122 S.E. of regression 11.90946 Akaike info criterion 7.794541 Sum squared resid 141551.5 Schwarz criterion 7.804356 Log likelihood -3895.270 F-statistic 1526.286 Durbin-Watson stat 0.017870 Prob(F-statistic) 0.000000

-4

-2

0

2

4

-4 -2 0 2 4

1. Differenzen des 1. Random Walk

1. D

iffe

renz

en d

es 2

. Ran

dom

Wal

k

Dependent Variable: D(RANDOMWALK_1) Method: Least Squares Date: 01/20/03 Time: 10:14 Sample(adjusted): 2 1000 Included observations: 999 after adjusting endpoints


C 0.044324 0.031349 1.413892 0.1577 D(RANDOMWALK_2) 0.041491 0.032064 1.294021 0.1960

R-squared 0.001677 Mean dependent var 0.045276 Adjusted R-squared 0.000675 S.D. dependent var 0.990895 S.E. of regression 0.990561 Akaike info criterion 2.820909 Sum squared resid 978.2666 Schwarz criterion 2.830732 Log likelihood -1407.044 F-statistic 1.674491 Durbin-Watson stat 1.962213 Prob(F-statistic) 0.195958

Regression in Niveaugroßen:

• Parameter β1 ist statistisch signifikant

• R2 ist hoch und ebenfalls statistisch signifikant(vgl. F -Test)

Regression in 1. Differenzen:

• Parameter β1 ist nicht mehr signifikant

• R2 ist praktisch gleich 0 und ebenfalls nicht mehr statistischsignifikant

270

Fazit:

• Regressionszusammenhang in Niveaugroßen basiert einzig undallein darauf, dass beide Zeitreihen einen stochastischen Trendin die gleiche Richtung aufweisen(unechter [spurious] Zusammenhang)

• Regression in 1. Differenzen weist darauf hin, dass beide Vari-ablen nichts miteinander zu tun haben(was ihrem Erzeugungsmechanismus entspricht)

271

7.4.2 Kointegration

Jetzt:

• Betrachte vereinfachend die 2-Variablen-Regression

Yt = β0 + β1 ·Xt + εt

mit {Yt} und {Xt} als Einheitswurzel-Prozesse

Frage:

• Gibt es Situationen, in denen das Problem der Schein-Regres-sion entfallt?

272

Antwort:

• Ja, falls {Yt} und {Xt} kointegriert sind

−→ Durchfuhrung einer ’gewohnlichen’ KQ-Schatzung trotzEinheitswurzeln unproblematisch

Definition 7.5: (Kointegration)

Es seien {Xt}, {Yt} ∼ I(1) zwei Einheitswurzel-Prozesse. Fallses einen Koeffizienten β gibt, so dass der Prozess {Yt − βXt}stationar ist (d.h. falls {Yt−βXt} ∼ I(0)), so heißen {Xt} und {Yt}kointegriert. Der Koeffizient β heißt Kointegrationskoeffizient.

273

Bemerkungen:

• Wenn {Xt} und {Yt} kointegriert sind, dann haben beideProzesse einen gemeinsamen stochastischen Trend

−→ Der Differenzprozess {Yt − βXt} eliminiert den gemein-samen stochastischen Trend

• Eine Kointegrationsbeziehung zwischen {Yt} und {Xt} repra-sentiert eine langfristige Gleichgewichtsbeziehung zwischenden Prozessen

274

Okonomische Beispiele fur Kointegration: (I)

1. Preise ’stark’ substituierbarer Guter(z.B. Preise fur ’normale’ und fur Bio-Orangen)

Grund fur Kointegration:

• Konsumenten haben grundsatzlich hohere Zahlungsbere-itschaft fur Bio-Orangen(deshalb liegt die Bio-Orangen-Preiskurve hoher)

• Hohere Zahlungsbereitschaft ist aber begrenzt

−→ Abstand zwischen beiden Kurven solltestationar sein

275

Pfundpreise von ’normalen’ und Bio-Orangen

276

50

100

150

200

250

300

20 40 60 80 100 120 140 160 180

Monate

Prei

s / P

fund

Bio-Orangen

Herkömmliche Orangen

Okonomische Beispiele fur Kointegration: (II)

2. Kurz- und langfristige Zinssatze

• Langfr. Zinssatze sind i.d.R. hoher als kurzfristige(Risikopramie, Theorie der Zinsstruktur)

• Unangemessen hohe Risikopramie fuhrt zu Portfolio-Um-schichtungen der Anleger

−→ Zinssatze gleichen sich wieder an, d.h. Zinsverlaufe wer-den durch Marktmechanismus ’zusammengehalten’

277

Okonomische Beispiele fur Kointegration: (III)

3. Absolute Kaufkraft-Paritat

• Nominaler Wechselkurs entspricht Kaufkraft zwischen denLandern, d.h.

Wt =Pt

P ∗toder in Logarithmen wt = pt − p∗t mit

W = nominalem WechselkursP, P ∗ = inland. bzw. ausland. Preisniveau

• Diese Beziehung ist ein Gleichgewicht(mit entsprechenden Anpassungsmechanismen, falls nichterfullt)

−→ {wt + p∗t − pt} sollte stationar sein(d.h. Prozesse {wt}, {pt − p∗t} sind kointegriert)

278

Satz 7.6: (Konsequenzen von Kointegration)

Man betrachte die 2-Variablen-Regression

Yt = β0 + β1 ·Xt + εt.

Falls {Xt} und {Yt} kointegriert sind, gilt:

1. Das Problem der Schein-Regression entfallt.

2. Die 2-Variablen-Regression kann problemlos mit der ’KQ-Methode’ geschatzt werden. Die klassische statistische In-ferenz ist gultig.

279

7.4.3 Ein Test auf Kointegration

Ziel:

• Entwicklung eines statistischen Tests auf Kointegration zweierI(1)-Variablen {Xt}, {Yt}

Intuitive Idee:

• Basiere Test auf 2-Variablen-Regression:

Yt = β0 + β1 ·Xt + εt

⇐⇒ Yt − β1 ·Xt︸︷︷︸

Differenzprozess= β0 + εt

−→ Engle-Granger-Kointegrationstest in 3 Schritten

280

Engle-Granger-Kointegrationstest:

1. Schatze die 2-Variablen-Regression mittels der KQ-Methodeund speichere die Residuen

2. Fuhre mit den Residuen einen ADF-Test (ohne determinis-tischen Trend) auf Stationaritat durch(vgl. Abschnitt 7.3)

3. Falls der ADF-Test die Nullhypothese der Einheitswurzel ver-wirft, schließe auf Kointegration zwischen {Xt} und {Yt}.Falls der ADF-Test die Nullhypothese der Einheitswurzel nichtverwerfen kann, schließe auf keine Kointegration zwischen{Xt} und {Yt}

281

Bemerkungen: (I)

• Der ADF-Test auf Stationaritat in den Residuen vollzieht sichdurch die Anpassung eines AR(p)-Modells an die Residuenunter Anwendung der 5-schrittigen Strategie von Folie 247-249 (vgl. Definition 7.4, Folie 258)

• Jedoch wird beim Engle-Granger-Kointegrationstest auf dieEinbeziehung des deterministischen Trends t verzichtet

• Da die Residuen {εt} auf den Parameterschatzungen β0 undβ1 (und nicht auf den tatsachlichen Parametern β0, β1) ba-sieren, gelten andere kritische Werte als die MacKinnon-Werte fur den gewohnlichen ADF-Test

282

Bemerkungen: (II)

• Fur den Stichprobenumfang T ergeben sich die gangigen kri-tischen Werte wie folgt:

1% Krit. Wert = −3.9001− 10.534 · T−1 − 30.03 · T−2

5% Krit. Wert = −3.3377− 5.967 · T−1 − 8.98 · T−2

10% Krit. Wert = −3.0462− 4.069 · T−1 − 5.73 · T−2

(vgl. MacKinnon, 1991, S. 267-276)

• Analog zum ADF-Test muss auch beim Engle-Granger-Ko-integrationstest der τ-Wert starker negativ ausfallen als derentsprechende kritische Wert, um die Nullhypothese der Ein-heitswurzel in den Residuen (keine Kointegration) abzulehnen

283

Bemerkungen: (III)

• Der Engle-Granger-Test ist im wesentlichen ein ADF-Ein-heitswurzel-Test angewendet auf die Residuen

−→ Es gelten in ubertragener Form die Bemerkungen zumADF-Test auf den Folien 262, 263(Annahmen uber den Fehlerterm, geringe Gute)

284

Beispiel: (Zusammenhang Konsum ←→ Einkommen)

• Betrachte die USA-Zeitreihen

Private Konsumausgaben (PCE)

Privates verfugbares Einkommen (PDI)

• Sind die Prozesse {PCEt}, {PDIt} kointegriert?(Ubungsaufgabe)

285

7.4.4 Vektor-Fehlerkorrekturmodell

Ausgangssituation:

• {Yt}, {Xt} ∼ I(1) und kointegriert mit Kointegrationskoef-fizient β

Hieraus folgt:

• {∆Yt} und {∆Xt} sind stationar

• {Yt − βXt} ist stationar

286

Konsequenz:

• Man kann die differenzierten Prozesse {∆Yt} und {∆Xt} mitdem folgenden 2-Gleichungssystem schatzen:

∆Yt = β10 + β11∆Yt−1 + . . . + β1p∆Yt−p + γ11∆Xt−1 + . . .

+ γ1p∆Xt−p + α1(Yt−1 − βXt−1) + ε1t (1)

∆Xt = β20 + β21∆Yt−1 + . . . + β2p∆Yt−p + γ21∆Xt−1 + . . .

+ γ2p∆Xt−p + α2(Yt−1 − βXt−1) + ε2t (2)

Definition 7.7: (Fehlerkorrekturmodell)

Das obige 2-Gleichungssystem heißt vektorielles Fehlerkorrektur-modell und der Term {Yt−1 − βXt−1} heißt Fehlerkorrekturterm.

287

Bemerkungen:

• Da alle Variablen des 2-Gleichungssystems stationar sind,kann jede Einzelgleichung fur sich mit der KQ-Methode ge-schatzt werden(vgl. Stock and Watson, 2011, S. 693 ff.)

• Der Kointegrationskoeffizient β ist in praxi oft unbekannt

−→ Man ersetzt den Fehlerkorrekturterm durch den Regressor

Zt−1 = Yt−1 − βXt−1,

wobei β der KQ-Schatzer fur β ist

• Vergangene Werte des Fehlerkorrekturterms {Yt−βXt} fließenin die Prognose zukunftiger Werte von {∆Yt} und {∆Xt} ein

288

Beispiel:

• Zinssatz-Datensatz(vgl. Stock & Watson, 2011, S. 698-701)

289

7.4.5 Multiple kointegrierte Variablen

Jetzt:

• Ubertragung des Konzeptes auf multiples Regressionsmodell

Yt = β0 + β1X1t + . . . + βKXKt + εt

Analoge Vorgehensweise:

• Falls {Yt}, {X1t}, . . . {XKt} ∼ I(1), dann sind die Variablenkointegriert mit Koeffizienten θ1, . . . θK, wenn

{Yt − θ1X1t − . . .− θKXKt} ∼ I(0)

290

Man beachte:

• Bei multiplen Regressoren konnen verschiedene einzelne Koin-tegrationsbeziehungen bestehen, z.B.

zwischen {Yt} und {X1t},zwischen {Yt} und {X2t},u.s.w.

Test auf Kointegration:

• Analogon zum Engle-Granger-Test

• Test auf multiple Kointegrationsbeziehungen(vgl. Johansen, 1988)

291

Documents

7. Integrierte Prozesse - … Prozess fXtg heißt integriert der Ordnung d (in Zeichen: Xt Ÿ I(d)), falls fXtg d mal diﬀerenziert werden muss, damit der Prozess station¨ar wird