Upload
lenhan
View
213
Download
0
Embed Size (px)
Citation preview
7. Integrierte Prozesse
Bisher:
• Behandlung stationarer Prozesse(stationare ARMA(p, q)-Prozesse)
Problem:
• Viele okonomische Zeitreihen weisen im Zeitverlauf ein nicht-stationares Verhalten auf
225
Beispiel:
• Betrachte (log.) DAX von Folie 8
• Schatze den AR(1)-Prozess
DAXt = c + φ ·DAXt−1 + εt
• Offensichtlich: φ = 1.000314 sehr nahe bei 1 (vgl. Folie 227)
• DAX-Zeitreihe weist wahrscheinlich eine Einheitswurzel auf(das AR-Polynom φ(L) = 1 − L hat ein Nullstelle auf demEinheitskreis; Unit Root)
−→ DAX-Zeitreihe ist ein Random-Walk und nicht-stationar
226
Schatzung eines AR(1)-Prozesses fur den log. DAX
227
Dependent Variable: DAX_LOG Method: Least Squares Date: 22/06/08 Time: 13:39 Sample (adjusted): 1960M01 2008M02 Included observations: 578 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 0.002606 0.017254 0.151020 0.8800DAX_LOG(-1) 1.000314 0.002429 411.8280 0.0000
R-squared 0.996615 Mean dependent var 7.043221Adjusted R-squared 0.996609 S.D. dependent var 0.962492S.E. of regression 0.056044 Akaike info criterion -2.921888Sum squared resid 1.809206 Schwarz criterion -2.906803Log likelihood 846.4258 F-statistic 169602.3Durbin-Watson stat 1.893856 Prob(F-statistic) 0.000000
Bemerkung:
• Man erhalt ein ahnliches Ergebnis, wenn man einen ARMA(p, q)-Prozess anpasst
Sprechweise:
• Wenn man sagt:
”Eine Zeitreihe weist eine Einheitswurzel auf ”,
dann ist gemeint:
”Die Zeitreihe ist nicht-stationar, jedoch kann durchBildung der Differenzen Stationaritat erreicht werden ”.
228
-.3
-.2
-.1
.0
.1
.2
1960 1970 1980 1990 2000
DAX (1. Differenzen im Logarithmus)
Zeit Dependent Variable: DAX_LOG_DIFF Method: Least Squares Date: 22/06/08 Time: 14:33 Sample (adjusted): 1960M02 2008M02 Included observations: 577 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 0.004566 0.002341 1.950640 0.0516DAX_LOG_DIFF(-1) 0.053286 0.041648 1.279451 0.2013
R-squared 0.002839 Mean dependent var 0.004824Adjusted R-squared 0.001105 S.D. dependent var 0.056045S.E. of regression 0.056014 Akaike info criterion -2.922980Sum squared resid 1.804083 Schwarz criterion -2.907875Log likelihood 845.2798 F-statistic 1.636995Durbin-Watson stat 2.002391 Prob(F-statistic) 0.201254
Differenzenbildung:
• 1. Differenzen:
∆Xt = (1− L)Xt = Xt −Xt−1
• 2. Differenzen:
∆2Xt = (1− L)2Xt = (1− 2L + L2)Xt = Xt − 2Xt−1 + Xt−2
• Differenzen der Ordnung d:
∆dXt = (1− L)dXt
230
Definition 7.1: (Integration eines SP)
Der Prozess {Xt} heißt integriert der Ordnung d (in Zeichen:Xt ∼ I(d)), falls {Xt} d mal differenziert werden muss, damit derProzess stationar wird.
Bemerkungen:
• Die meisten okonomischen Einheitswurzel-Zeitreihen werdendurch einmaliges Differenzieren stationar(d.h. die Zeitreihen sind I(1))
• Stationare Zeitreihen werden oft als I(0) bezeichnet
231
7.1 Stochastische vs. deterministische Trends
Bemerkung:
• Die Nicht-Stationaritat eines ARMA(p, q)-Prozesses {Xt} auf-grund einer Einheitswurzel bezieht sich auf die Nullstellen desAR(p)-Polynoms
−→ Wir betrachten jetzt nur den AR(p)-Teil von {Xt}(der MA(q)-Teil ist immer stationar)
232
Zwischenfazit:
• Viele okonomische Zeitreihen enthalten einen Trend(vgl. Folien 8-15)
• AR(p)-Modelle mit einer Einheitswurzel konnen einen Trenderfassen
Frage:
• Gibt es neben AR(p)-Prozessen mit einer Einheitswurzel nochandere theoretische Modelle, die einen zeitlichen Trend im-plizieren?
233
Betrachte das folgende Modell:
Xt = c + φ ·Xt−1 + δ · t + εt
mit {εt} ∼ WR(0, σ2)
Spezialfalle: (I)
• Random Walk mit/ohne Drift, d.h. φ = 1, δ = 0:
Xt = c + Xt−1 + εt
{Xt} hat eine Einheitswurzel (und damit einen Trend), jedochimpliziert Differenzenbildung Stationaritat:
∆Xt = Xt −Xt−1 = c + εt
−→ Stochastischer Trend
234
Spezialfalle: (II)
• Trend-stationarer Prozess, d.h. φ = 0, δ 6= 0:
Xt = c + δ · t + εt
Es gilt:
E(Xt) = c + δ · t, V ar(Xt) = V ar(εt) = σ2
d.h. {Xt} ist nicht-stationar und hat einen Trend. Betrachtetman jedoch den Prozess
{Yt} = {Xt − E(Xt)} = {Xt − c− δ · t} = {εt},
so ist dieser stationar
−→ Deterministischer Trend
235
Stochastischer vs. deterministischer Trend
236
-10
0
10
20
30
40
0 200 400 600 800 1000
Stochastischer Trend
Deterministischer Trend
t
Unterschied zwischen beiden Trends: (I)
• Deterministischer Trend:
Sind c und δ bekannt, so kann der E-Wert von Xt perfektvorhergesagt werden
Abweichungen von der Trendlinie c+ δ · t sind rein zufalligund haben keinerlei Einfluss auf das Langfrist-Verhaltenvon Xt
Stationaritat wird uber ’Detrenden’ erreicht
237
Unterschied zwischen beiden Trends: (II)
• Stochastischer Trend:
Die stochastische Komponente εt hat langfristigen Ein-fluss auf Xt(ohne mathematischen Beweis)
Stationaritat wird nur uber Differenzieren erreicht
238
7.2 Parametertests im AR(p)-Modell mit deter-ministischem Trend
Ausgangssituation:
• Betrachte das AR(p)-Modell der Form
Xt = c + φ1Xt−1 + . . . + φpXt−p + εt
mit εt ∼ WR(0, σ2)
Ziel:
• Entwicklung eines statistischen Tests auf Einheitswurzel ineiner Zeitreihe(Stationaritatstest)
239
Hierfur zunachst:
• Gunstige Umformulierung des AR(p)-Modells
Satz 7.2: (Aquivalente Darstellung von AR(p)-Prozessen)
Es sei {Xt} ein AR(p)-Prozess gemaß der obigen Darstellung.Dann lasst sich der Prozess {Xt} mit geeignet gewahlten Param-etern %, ψ1, . . . , ψp−1 auch wie folgt in Differenzen darstellen:
∆Xt = c+%·Xt−1+ψ1·∆Xt−1+ψ2·∆Xt−2+. . .+ψp−1·∆Xt−p+1+εt.
240
Bemerkungen:
• Die Aquivalenz der AR(p)-Darstellungen ergibt sich durcheinfache algebraische Umformungen
• Die ’neuen’ Parameter %, ψ1, . . . , ψp−1 sind einfache Funktio-nen der ursprunglichen Parameter φ1, . . . , φp
• Z.B. gilt: % = φ1 + φ2 + . . . + φp − 1
• Beide Darstellungen haben insgesamt p+1 Parameter, namlichc, φ1, . . . , φp bzw. c, %, ψ1, . . . , ψp−1
241
Satz 7.3: (Stationaritat von AR(p)-Prozessen)
Es sei {Xt} ein AR(p)-Prozess in der Darstellung des Satzes 7.2.Dann gilt:
(a) Der Prozess {Xt} ist stationar, falls −2 < % < 0.
(b) Der Prozess {Xt} hat eine Einheitswurzel (d.h. ist nicht-stationar), falls % = 0.
242
Bemerkungen:
• In der umformulierten Fassung des AR(p)-Modells hangt dieStationaritat nur noch vom Parameter % ab
• In der ursprunglichen Form hangt die Stationaritat von derLage der Nullstellen des AR(p)-Polynoms
Φ(z) = 1− φ1z − φ2z2 − . . .− φpzp
und damit von den p Parametern φ1, . . . , φp ab(vgl. Folien 83, 84)
243
Jetzt:
• Betrachte das AR(p)-Modell aus Satz 7.2 erweitert um dendeterministischen Trend:
∆Xt = c + % ·Xt−1 +p−1∑
j=1ψj ·∆Xt−j + δ · t + εt
(AR(p)-mit-deterministischem-Trend-Modell, kurz: AR(p)-DT-Modell)
• Test auf Einheitswurzel im AR(p)-DT-Modell lautet
H0 : % = 0 gegen H1 : % < 0
244
Betrachte:
• Statistische Tests im AR(p)-DT-Modell
2 Ziele dieser Tests:
• Bestimmung der geeigneten Lag-Lange p
• Test auf Einheitswurzel (Unit Root)
Dafur:
• Unterteilung der Parameter in 2 Gruppen, namlich
(a) c, ψ1, . . . , ψp−1 und δ
(b) %
245
Vorlaufige Begrundung:
• Test fur Parameter % unterscheidet sich von Tests fur alleanderen Parameter(genaue Erklarung folgt)
Zunachst:
• Sequentielles Verfahren zur Bestimmung derLag-Lange p im AR(p)-DT-Modell
246
Strategie in 5 Schritten: (I)
1. Wahle eine inhaltlich sinnvolle Maximal-Lange pmax
2. Schatze mittels KQ das AR(pmax)-DT-Modell
∆Xt = c + % ·Xt−1 +pmax−1
∑
j=1ψj ·∆Xt−j + δ · t + εt
Entscheide anhand des t-Tests:
H0 : ψpmax−1 = 0 gegen H1 : ψpmax−1 6= 0
Bei Ablehnung von H0, gehe zu Schritt 5Bei Nicht-Ablehnung von H0, gehe zu Schritt 3
247
Strategie in 5 Schritten: (II)
3. Schatze mittels KQ das AR(pmax − 1)-DT-Modell
∆Xt = c + % ·Xt−1 +pmax−2
∑
j=1ψj ·∆Xt−j + δ · t + εt
Entscheide anhand des t-Tests:
H0 : ψpmax−2 = 0 gegen H1 : ψpmax−2 6= 0
Bei Ablehnung von H0, gehe zu Schritt 5Bei Nicht-Ablehnung von H0, gehe zu Schritt 4
4. Wiederhole die Schatzung des Modells mit schrittweise re-duzierten Lags bis ein ψ-Koeffizient statistisch signifikant istoder bis keine Lags mehr ubrig sind
248
Strategie in 5 Schritten: (III)
5. Teste anhand des t-Tests H0 : δ = 0 gegen H1 : δ 6= 0und entscheide so uber die Belassung des deterministischenTrends im Modell
249
Beispiel:
• Betrachte log. DAX und beginne mit pmax = 4
Ergebnis (vgl. Folien 251, 252):
• Modell reduziert sich auf
∆Xt = c + % ·Xt−1 + δ · t + εt
Frage:
• Ist % = 0, d.h. weist die Zeitreihe eine Einheitswurzel auf?
Plausible Vorgehensweise:
• Gemaß t-Test (vgl. Folie 252) ist % signifikant von Null ver-schieden zum Niveau 0.05
250
Dependent Variable: D(DAX_LOG) Method: Least Squares Date: 22/06/08 Time: 17:42 Sample (adjusted): 1960M04 2008M02 Included observations: 575 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 0.080399 0.035856 2.242239 0.0253DAX_LOG(-1) -0.014513 0.006485 -2.237911 0.0256
D(DAX_LOG(-1)) 0.056230 0.041823 1.344494 0.1793D(DAX_LOG(-2)) 0.028922 0.042240 0.684693 0.4938D(DAX_LOG(-3)) 0.019308 0.042221 0.457311 0.6476
T 8.96E-05 3.73E-05 2.400637 0.0167
R-squared 0.013597 Mean dependent var 0.004860Adjusted R-squared 0.004929 S.D. dependent var 0.056135S.E. of regression 0.055996 Akaike info criterion -2.916681Sum squared resid 1.784151 Schwarz criterion -2.871244Log likelihood 844.5457 F-statistic 1.568696Durbin-Watson stat 1.999215 Prob(F-statistic) 0.166999
Dependent Variable: D(DAX_LOG) Method: Least Squares Date: 22/06/08 Time: 17:43 Sample (adjusted): 1960M03 2008M02 Included observations: 576 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 0.078717 0.035652 2.207934 0.0276DAX_LOG(-1) -0.014189 0.006443 -2.202013 0.0281
D(DAX_LOG(-1)) 0.056398 0.041747 1.350959 0.1772D(DAX_LOG(-2)) 0.029728 0.042134 0.705563 0.4807
T 8.79E-05 3.71E-05 2.371416 0.0181
R-squared 0.013139 Mean dependent var 0.004862Adjusted R-squared 0.006226 S.D. dependent var 0.056086S.E. of regression 0.055911 Akaike info criterion -2.921462Sum squared resid 1.784981 Schwarz criterion -2.883648Log likelihood 846.3810 F-statistic 1.900547Durbin-Watson stat 2.000813 Prob(F-statistic) 0.108867
Dependent Variable: D(DAX_LOG) Method: Least Squares Date: 22/06/08 Time: 17:45 Sample (adjusted): 1960M02 2008M02 Included observations: 577 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 0.077131 0.035460 2.175164 0.0300DAX_LOG(-1) -0.013912 0.006404 -2.172346 0.0302
D(DAX_LOG(-1)) 0.057755 0.041651 1.386645 0.1661T 8.71E-05 3.69E-05 2.364580 0.0184
R-squared 0.012478 Mean dependent var 0.004824Adjusted R-squared 0.007308 S.D. dependent var 0.056045S.E. of regression 0.055840 Akaike info criterion -2.925761Sum squared resid 1.786644 Schwarz criterion -2.895551Log likelihood 848.0822 F-statistic 2.413400Durbin-Watson stat 2.003207 Prob(F-statistic) 0.065757
Dependent Variable: D(DAX_LOG) Method: Least Squares Date: 22/06/08 Time: 17:46 Sample (adjusted): 1960M01 2008M02 Included observations: 578 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 0.073723 0.035336 2.086314 0.0374DAX_LOG(-1) -0.013278 0.006377 -2.082053 0.0378
T 8.45E-05 3.67E-05 2.303511 0.0216
R-squared 0.009172 Mean dependent var 0.004813Adjusted R-squared 0.005726 S.D. dependent var 0.055997S.E. of regression 0.055836 Akaike info criterion -2.927614Sum squared resid 1.792663 Schwarz criterion -2.904986Log likelihood 849.0804 F-statistic 2.661481Durbin-Watson stat 1.885543 Prob(F-statistic) 0.070705
Leider:
• Im AR(p)-DT-Modell ist der t-Test fur den Parameter %ungultig!
• Die Vtlg. der t-Statistik des Parameters % unter H0 folgtim AR(p)-DT-Modell nicht der t-Verteilung, sondern eineranderen Verteilung!
253
7.3 Statistische Tests auf Einheitswurzel
Frage:
• Wie kann statistisch auf das Vorliegen einer Einheitswurzel(d.h. auf Nicht-Stationaritat) einer Zeitreihe getestet wer-den?
Betrachte dazu:
• AR(p)-DT-Modell
∆Xt = c + % ·Xt−1 +p−1∑
j=1ψj ·∆Xt−j + δ · t + εt,
das mit der 5-Schritt-Strategie der Folien 247-249 angepasstwurde
254
Erinnerung:
• Statistischer Test
H0 : % = 0 gegen H1 : % < 0
ist gleichbedeutend mit
H0 : Zeitreihe weist eine Einheitswurzel auf(Stochastischer Trend)
gegen
H1 : Zeitreihe weist keine Einheitswurzel auf(Kein stochastischer Trend)
255
Erinnere ferner:
• Die gewohnliche t-Statistik fur den Parameter % im AR(p)-DT-Modell ist unter H0 nicht t-verteilt(vgl. Folie 253)
Deshalb:
• t-Statistik fur Parameter % im AR(p)-DT-Modell wird haufigals τ-Statistik bezeichnet
256
Bemerkungen zur Vtlg. der τ-Statistik unter H0:
• Vtlg. geht zuruck auf Dickey-Fuller (1979, 1981)
• Exakte H0-Vtlg. der τ-Statistik hangt davon ab, ob
der deterministische Trend t im AR(p)-DT-Modell enthal-ten ist
die Niveaukonstante c im AR(p)-DT-Modell enthalten ist
• Die kritischen Werte der H0-Verteilung werden
MacKinnon-Werte
genannt und sind in EViews implementiert
257
Definition 7.4: (Augmented-Dickey-Fuller-Test)
Man betrachte das AR(p)-DT-Modell von Folie 244, das mitHilfe der 5-schrittigen Strategie der Folien 247-249 an eine Zeit-reihe {xt}t=0,1,... angepasst wurde. Der statistische Test fur dasProblem
H0 : % = 0 gegen H1 : % < 0,
der anhand der τ-Statistik und den MacKinnon-Werten durch-gefuhrt wird, heißt Augmented-Dickey-Fuller-Test (ADF-Test).
258
Bemerkungen:
• Der ADF-Test ist ein Test auf Stationaritat
• Der ADF-Test lehnt die Nullhypothese einer Einheitswurzel(die Nicht-Stationaritat) zugunsten der Alternative (der Sta-tionaritat) ab, falls die τ-Statistik starker negativ ist als derMacKinnon-Wert zum gewunschten Signifikanzniveau(d.h. falls der τ-Wert betraglich großer ist als der Betrag desentsprechenden MacKinnon-Wertes)
259
Beispiel: (ADF-Test fur den log. DAX)
• Die 5-schrittige Anpassungsstrategie auf den Folien 247-249fuhrte zu einem AR(p)-DT-Modell mit p = 1, δ 6= 0(Modell ohne verzogerte Differenzen, mit determin. Trend)
260
Null Hypothesis: DAX_LOG has a unit root Exogenous: Constant, Linear Trend Lag Length: 0 (Automatic based on SIC, MAXLAG=18)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -2.082053 0.5542 Test critical values: 1% level -3.974012
5% level -3.417613 10% level -3.131232
*MacKinnon (1996) one-sided p-values.
Ergebnis mit EViews:
• τ-Statistik = −2.082053 ist betraglich kleiner als die jeweili-gen Betrage der 3 MacKinnon-Werte
−→ H0 kann zu den Sig.-Niveaus 1%, 5%, 10% nicht abgelehntwerden
−→ Stat. Anzeichen fur eine Einheitswurzel(stochastischer Trend)
261
Abschließende Bemerkungen: (I)
• Der ADF-Test unterstellt folgende Eigenschaften fur denFehlerprozess {εt}t=0,1,... im AR(p)-DT-Modell:
Die Fehler εt sind stochastisch unabhangig(keine Autokorrelation)
Der Fehlerprozess ist homoskedastisch(V ar(εt) = σ2 fur alle t)
• Ein alternativer (nicht-parametrischer) Einheitswurzel-Test,der Autokorrelation und Heteroskedastie im Fehlerprozess{εt} zulasst, ist der Phillips-Perron-Test
262
Abschließende Bemerkungen: (II)
• ADF-Tests haben in der Praxis oft eine geringe Gute: DieADF-Tests halten haufig an der Nullhypothese einer Ein-heitswurzel (also der Nicht-Stationaritat) fest, wenn die Null-hypothese in Wirklichkeit falsch ist(Fehlentscheidung des Tests)
• Liegt in den Daten ein Strukturbruch vor, so versagen dieADF-Tests vollstandig
263
7.4 Regressionen mit integrierten Variablen
Bisher:
• Eigenschaften eines Prozesses {Xt}:
StationaritatEinheitswurzel (integrierter Prozess)
Jetzt:
• Regressionsmodelle mit Zeitreihenvariablen, z.B.
Yt = β0 + β1X1t + . . . + βKXKt + εt
264
Zentrale Frage:
• Eigenschaften der KQ-Schatzer fur β0, . . . , βK, falls
alle Variablen stationar sindeinige Variablen Einheitswurzeln aufweisen
−→ Problem der Schein-Regression(spurious Regression)
Es gilt:
Falls alle Variablen {Yt}, {X1t}, . . . , {XKt} stationar und dieklassischen Annahmen des multiplen Regressionsmodellserfullt sind, so ist die KQ-Schatzung vollig unproblematisch
265
7.4.1 Schein-Regression (spurious regression)
Frage:
• Warum sind Regressionen mit Einheitswurzel-Zeitreihen prob-lematisch?
266
Beispiel:• Betrachte 2 Random Walks {Yt}, {Xt}
(nicht-stationare Prozesse mit Einheitswurzel)
• Beide Prozesse werden unabhangig voneinander erzeugt:
Yt = Yt−1 + ε1tXt = Xt−1 + ε2t
mit {ε1t}, {ε2t} ∼ GWR(0,1) ({ε1t}, {ε2t} unabhangig)
• Betrachte Regressionenin Niveaugroßen
Yt = β0 + β1 ·Xt + εtin 1. Differenzen
∆Yt = β0 + β1 ·∆Xt + εt
267
-20
0
20
40
60
200 400 600 800 1000
1. Random Walk
2. Random Walk
t
Dependent Variable: RANDOMWALK_1 Method: Least Squares Date: 01/20/03 Time: 10:10 Sample: 1 1000 Included observations: 1000
Variable Coefficient Std. Error t-Statistic Prob.
C 3.108647 0.688040 4.518121 0.0000 RANDOMWALK_2 1.316307 0.033693 39.06771 0.0000
R-squared 0.604641 Mean dependent var 25.60444 Adjusted R-squared 0.604245 S.D. dependent var 18.93122 S.E. of regression 11.90946 Akaike info criterion 7.794541 Sum squared resid 141551.5 Schwarz criterion 7.804356 Log likelihood -3895.270 F-statistic 1526.286 Durbin-Watson stat 0.017870 Prob(F-statistic) 0.000000
-4
-2
0
2
4
-4 -2 0 2 4
1. Differenzen des 1. Random Walk
1. D
iffe
renz
en d
es 2
. Ran
dom
Wal
k
Dependent Variable: D(RANDOMWALK_1) Method: Least Squares Date: 01/20/03 Time: 10:14 Sample(adjusted): 2 1000 Included observations: 999 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 0.044324 0.031349 1.413892 0.1577 D(RANDOMWALK_2) 0.041491 0.032064 1.294021 0.1960
R-squared 0.001677 Mean dependent var 0.045276 Adjusted R-squared 0.000675 S.D. dependent var 0.990895 S.E. of regression 0.990561 Akaike info criterion 2.820909 Sum squared resid 978.2666 Schwarz criterion 2.830732 Log likelihood -1407.044 F-statistic 1.674491 Durbin-Watson stat 1.962213 Prob(F-statistic) 0.195958
Regression in Niveaugroßen:
• Parameter β1 ist statistisch signifikant
• R2 ist hoch und ebenfalls statistisch signifikant(vgl. F -Test)
Regression in 1. Differenzen:
• Parameter β1 ist nicht mehr signifikant
• R2 ist praktisch gleich 0 und ebenfalls nicht mehr statistischsignifikant
270
Fazit:
• Regressionszusammenhang in Niveaugroßen basiert einzig undallein darauf, dass beide Zeitreihen einen stochastischen Trendin die gleiche Richtung aufweisen(unechter [spurious] Zusammenhang)
• Regression in 1. Differenzen weist darauf hin, dass beide Vari-ablen nichts miteinander zu tun haben(was ihrem Erzeugungsmechanismus entspricht)
271
7.4.2 Kointegration
Jetzt:
• Betrachte vereinfachend die 2-Variablen-Regression
Yt = β0 + β1 ·Xt + εt
mit {Yt} und {Xt} als Einheitswurzel-Prozesse
Frage:
• Gibt es Situationen, in denen das Problem der Schein-Regres-sion entfallt?
272
Antwort:
• Ja, falls {Yt} und {Xt} kointegriert sind
−→ Durchfuhrung einer ’gewohnlichen’ KQ-Schatzung trotzEinheitswurzeln unproblematisch
Definition 7.5: (Kointegration)
Es seien {Xt}, {Yt} ∼ I(1) zwei Einheitswurzel-Prozesse. Fallses einen Koeffizienten β gibt, so dass der Prozess {Yt − βXt}stationar ist (d.h. falls {Yt−βXt} ∼ I(0)), so heißen {Xt} und {Yt}kointegriert. Der Koeffizient β heißt Kointegrationskoeffizient.
273
Bemerkungen:
• Wenn {Xt} und {Yt} kointegriert sind, dann haben beideProzesse einen gemeinsamen stochastischen Trend
−→ Der Differenzprozess {Yt − βXt} eliminiert den gemein-samen stochastischen Trend
• Eine Kointegrationsbeziehung zwischen {Yt} und {Xt} repra-sentiert eine langfristige Gleichgewichtsbeziehung zwischenden Prozessen
274
Okonomische Beispiele fur Kointegration: (I)
1. Preise ’stark’ substituierbarer Guter(z.B. Preise fur ’normale’ und fur Bio-Orangen)
Grund fur Kointegration:
• Konsumenten haben grundsatzlich hohere Zahlungsbere-itschaft fur Bio-Orangen(deshalb liegt die Bio-Orangen-Preiskurve hoher)
• Hohere Zahlungsbereitschaft ist aber begrenzt
−→ Abstand zwischen beiden Kurven solltestationar sein
275
Pfundpreise von ’normalen’ und Bio-Orangen
276
50
100
150
200
250
300
20 40 60 80 100 120 140 160 180
Monate
Prei
s / P
fund
Bio-Orangen
Herkömmliche Orangen
Okonomische Beispiele fur Kointegration: (II)
2. Kurz- und langfristige Zinssatze
• Langfr. Zinssatze sind i.d.R. hoher als kurzfristige(Risikopramie, Theorie der Zinsstruktur)
• Unangemessen hohe Risikopramie fuhrt zu Portfolio-Um-schichtungen der Anleger
−→ Zinssatze gleichen sich wieder an, d.h. Zinsverlaufe wer-den durch Marktmechanismus ’zusammengehalten’
277
Okonomische Beispiele fur Kointegration: (III)
3. Absolute Kaufkraft-Paritat
• Nominaler Wechselkurs entspricht Kaufkraft zwischen denLandern, d.h.
Wt =Pt
P ∗toder in Logarithmen wt = pt − p∗t mit
W = nominalem WechselkursP, P ∗ = inland. bzw. ausland. Preisniveau
• Diese Beziehung ist ein Gleichgewicht(mit entsprechenden Anpassungsmechanismen, falls nichterfullt)
−→ {wt + p∗t − pt} sollte stationar sein(d.h. Prozesse {wt}, {pt − p∗t} sind kointegriert)
278
Satz 7.6: (Konsequenzen von Kointegration)
Man betrachte die 2-Variablen-Regression
Yt = β0 + β1 ·Xt + εt.
Falls {Xt} und {Yt} kointegriert sind, gilt:
1. Das Problem der Schein-Regression entfallt.
2. Die 2-Variablen-Regression kann problemlos mit der ’KQ-Methode’ geschatzt werden. Die klassische statistische In-ferenz ist gultig.
279
7.4.3 Ein Test auf Kointegration
Ziel:
• Entwicklung eines statistischen Tests auf Kointegration zweierI(1)-Variablen {Xt}, {Yt}
Intuitive Idee:
• Basiere Test auf 2-Variablen-Regression:
Yt = β0 + β1 ·Xt + εt
⇐⇒ Yt − β1 ·Xt︸ ︷︷ ︸
Differenzprozess= β0 + εt
−→ Engle-Granger-Kointegrationstest in 3 Schritten
280
Engle-Granger-Kointegrationstest:
1. Schatze die 2-Variablen-Regression mittels der KQ-Methodeund speichere die Residuen
2. Fuhre mit den Residuen einen ADF-Test (ohne determinis-tischen Trend) auf Stationaritat durch(vgl. Abschnitt 7.3)
3. Falls der ADF-Test die Nullhypothese der Einheitswurzel ver-wirft, schließe auf Kointegration zwischen {Xt} und {Yt}.Falls der ADF-Test die Nullhypothese der Einheitswurzel nichtverwerfen kann, schließe auf keine Kointegration zwischen{Xt} und {Yt}
281
Bemerkungen: (I)
• Der ADF-Test auf Stationaritat in den Residuen vollzieht sichdurch die Anpassung eines AR(p)-Modells an die Residuenunter Anwendung der 5-schrittigen Strategie von Folie 247-249 (vgl. Definition 7.4, Folie 258)
• Jedoch wird beim Engle-Granger-Kointegrationstest auf dieEinbeziehung des deterministischen Trends t verzichtet
• Da die Residuen {εt} auf den Parameterschatzungen β0 undβ1 (und nicht auf den tatsachlichen Parametern β0, β1) ba-sieren, gelten andere kritische Werte als die MacKinnon-Werte fur den gewohnlichen ADF-Test
282
Bemerkungen: (II)
• Fur den Stichprobenumfang T ergeben sich die gangigen kri-tischen Werte wie folgt:
1% Krit. Wert = −3.9001− 10.534 · T−1 − 30.03 · T−2
5% Krit. Wert = −3.3377− 5.967 · T−1 − 8.98 · T−2
10% Krit. Wert = −3.0462− 4.069 · T−1 − 5.73 · T−2
(vgl. MacKinnon, 1991, S. 267-276)
• Analog zum ADF-Test muss auch beim Engle-Granger-Ko-integrationstest der τ-Wert starker negativ ausfallen als derentsprechende kritische Wert, um die Nullhypothese der Ein-heitswurzel in den Residuen (keine Kointegration) abzulehnen
283
Bemerkungen: (III)
• Der Engle-Granger-Test ist im wesentlichen ein ADF-Ein-heitswurzel-Test angewendet auf die Residuen
−→ Es gelten in ubertragener Form die Bemerkungen zumADF-Test auf den Folien 262, 263(Annahmen uber den Fehlerterm, geringe Gute)
284
Beispiel: (Zusammenhang Konsum ←→ Einkommen)
• Betrachte die USA-Zeitreihen
Private Konsumausgaben (PCE)
Privates verfugbares Einkommen (PDI)
• Sind die Prozesse {PCEt}, {PDIt} kointegriert?(Ubungsaufgabe)
285
7.4.4 Vektor-Fehlerkorrekturmodell
Ausgangssituation:
• {Yt}, {Xt} ∼ I(1) und kointegriert mit Kointegrationskoef-fizient β
Hieraus folgt:
• {∆Yt} und {∆Xt} sind stationar
• {Yt − βXt} ist stationar
286
Konsequenz:
• Man kann die differenzierten Prozesse {∆Yt} und {∆Xt} mitdem folgenden 2-Gleichungssystem schatzen:
∆Yt = β10 + β11∆Yt−1 + . . . + β1p∆Yt−p + γ11∆Xt−1 + . . .
+ γ1p∆Xt−p + α1(Yt−1 − βXt−1) + ε1t (1)
∆Xt = β20 + β21∆Yt−1 + . . . + β2p∆Yt−p + γ21∆Xt−1 + . . .
+ γ2p∆Xt−p + α2(Yt−1 − βXt−1) + ε2t (2)
Definition 7.7: (Fehlerkorrekturmodell)
Das obige 2-Gleichungssystem heißt vektorielles Fehlerkorrektur-modell und der Term {Yt−1 − βXt−1} heißt Fehlerkorrekturterm.
287
Bemerkungen:
• Da alle Variablen des 2-Gleichungssystems stationar sind,kann jede Einzelgleichung fur sich mit der KQ-Methode ge-schatzt werden(vgl. Stock and Watson, 2011, S. 693 ff.)
• Der Kointegrationskoeffizient β ist in praxi oft unbekannt
−→ Man ersetzt den Fehlerkorrekturterm durch den Regressor
Zt−1 = Yt−1 − βXt−1,
wobei β der KQ-Schatzer fur β ist
• Vergangene Werte des Fehlerkorrekturterms {Yt−βXt} fließenin die Prognose zukunftiger Werte von {∆Yt} und {∆Xt} ein
288
Beispiel:
• Zinssatz-Datensatz(vgl. Stock & Watson, 2011, S. 698-701)
289
7.4.5 Multiple kointegrierte Variablen
Jetzt:
• Ubertragung des Konzeptes auf multiples Regressionsmodell
Yt = β0 + β1X1t + . . . + βKXKt + εt
Analoge Vorgehensweise:
• Falls {Yt}, {X1t}, . . . {XKt} ∼ I(1), dann sind die Variablenkointegriert mit Koeffizienten θ1, . . . θK, wenn
{Yt − θ1X1t − . . .− θKXKt} ∼ I(0)
290
Man beachte:
• Bei multiplen Regressoren konnen verschiedene einzelne Koin-tegrationsbeziehungen bestehen, z.B.
zwischen {Yt} und {X1t},zwischen {Yt} und {X2t},u.s.w.
Test auf Kointegration:
• Analogon zum Engle-Granger-Test
• Test auf multiple Kointegrationsbeziehungen(vgl. Johansen, 1988)
291