30
Zeitreihenanalyse WS 2004/2005 Definition einer Zeitreihe, Eigenschaften Tests und Trenderkennung bei Zeitreihen Beispiele (ACF, Tests), Fouriertransformationen, Powerspektru Zeitreihenmodellierung der ARMA-Klasse Modellierung von Zeitreihen mit langem Gedächtnis Kausalität, Transferfunktionen, multivariate Methoden Skalierung, (Multi-)Fraktale Komplexität und Information von Zeitreihen Wavelets Michael Hauhs / Gunnar Lischeid

Zeitreihenanalyse WS 2004/2005

  • Upload
    monte

  • View
    22

  • Download
    3

Embed Size (px)

DESCRIPTION

Zeitreihenanalyse WS 2004/2005. Michael Hauhs / Gunnar Lischeid. Definition einer Zeitreihe, Eigenschaften Tests und Trenderkennung bei Zeitreihen Beispiele (ACF, Tests), Fouriertransformationen , Powerspektrum Zeitreihenmodellierung der ARMA-Klasse - PowerPoint PPT Presentation

Citation preview

Page 1: Zeitreihenanalyse WS 2004/2005

ZeitreihenanalyseWS 2004/2005

• Definition einer Zeitreihe, Eigenschaften

• Tests und Trenderkennung bei Zeitreihen

• Beispiele (ACF, Tests), Fouriertransformationen, Powerspektrum

• Zeitreihenmodellierung der ARMA-Klasse

• Modellierung von Zeitreihen mit langem Gedächtnis

• Kausalität, Transferfunktionen, multivariate Methoden

• Skalierung, (Multi-)Fraktale

• Komplexität und Information von Zeitreihen

• Wavelets

Michael Hauhs / Gunnar Lischeid

Page 2: Zeitreihenanalyse WS 2004/2005

Trendanalyse

Zugrundeliegendes Modell (additives Komponentenmodell):

)()()()())(),(()( ttTtTtStYtXftX SD )(tY externe Faktoren

)(tS saisonale Komponente

)(tTDdeterministischer Trend

)(tTSstochastischer Trend

)(t stationäres Rauschen

Globaler monotoner Trend: "im Mittel wächst X(t) an / fällt ab"

=> Trend des Mittelwerts (= 1. Moment der Verteilung)

Page 3: Zeitreihenanalyse WS 2004/2005

Der Mann-Kendall Test

Anwendung des Kendall-Tests auf Zeitreihen (d.h., sortiert nach Zeit, ohne doppelte Einträge) => Trendtest:

01

00

01

)sgn(

x

x

x

x

1

1 1

))()(sgn(n

k

n

kjkj txtxS

Für die H0-Hypothese (= "es gibt keinen Trend") gilt dann:

18

)52()1()()var(

0)()(2

nnn

SS

SSE

=> normalverteilt

=> Ableitung der Testgröße: Abweichung der beobachteten (normierten) S von den laut H0 erwarteten

Page 4: Zeitreihenanalyse WS 2004/2005

beachte: Korrektur für verbundene Ränge (Ranggleichheit) notwendig

=> statt

wobei tj = Anzahl der verbundenen Ränge (ties)

=> Teststatistik: ,

wobei D = maximal mögliche Anzahl der Konkordanzen:

Der Mann-Kendall Test

18

)52()1()()var( 2 nnn

SS

18

)52()1()52()1(

)()var( 12

p

jjjj tttnnn

SS

)1(2

1)1(

2

1)1((

2

1

1

nnttnnDp

jjj

D

S

Page 5: Zeitreihenanalyse WS 2004/2005

Erweiterung auf saisonale Daten: saisonaler Mann-Kendall Test

n Beobachtungen pro Saisonteil (z.B. fester Tag im Jahr),m Saisonteile pro Saison (z.B. 365 Tage/Jahr)

igx i-te Beobachtung im g-ten Saisonteil

1

1 1

18/)52)(1(),sgn(n

i

n

ijgigjgg nnnxxS

m

g

m

ghg

hghggSg SSSS

1 1 ,

22 )cov(,

• Entmaskierung von Gesamttrends• Trends in einzelnen Saisonteilen (z.B. Monaten)

Page 6: Zeitreihenanalyse WS 2004/2005

Regressionsanalyse zur Trendbeseitigung

k

iii tmtm

1

)()( )(tmi beliebig, aber bekannt (z.B. ii ttm )( )

Methode der kleinsten Quadrate:

n

t

tmtxQ1

2))()(( minimieren!

Normalgleichungen

n

tjiijij

n

tkkkkkk

n

tkk

n

tkk

tmtmcC

tmtxccc

tmtxccc

tmtxccc

1

12211

122222221

111212111

)()()(

)()(...

)()(...

)()(...

Fehler der Schätzwerte:

jjj C )()( 12

Page 7: Zeitreihenanalyse WS 2004/2005

Desaisonalisierung

Vermutet wird eine (natürliche) Periode s in den Daten.

Unnormierte Desaisonalisierung:

mrmrm txtx )()(~,,

)( ,rmtx r-te Messung der m-ten Stelle ),...,1;,...,1( pmnr

Normierte Desaisonalisierung:

mmrmrm txtx /))(()(~,,

F

kkkm

F

kkkm

s

kmD

s

kmCC

s

kmB

s

kmAA

10

10

2sin

2cos

2sin

2cos

Page 8: Zeitreihenanalyse WS 2004/2005

Additive Modelle zur Darstellung einer Zeitreihe

Zugrundeliegendes Modell (additives Komponentenmodell):

)()()()())(),(()( ttTtTtStYtXftX SD

Globaler monotoner Trend: „im Mittel wächst X(t) an / fällt ab“

Page 9: Zeitreihenanalyse WS 2004/2005

Frequenzraumdarstellung von Zeitreihen

•bisher: Zeitreihen wurden durch ihre Werte dargestellt

(Zeitdomäne): x = x(t)

•alternativ: Darstellung in einem Funktionenraum - möglich für jede Funktion in einem n-dimensionalen Vektorraum:

1

)()(k

kk tcfxx

kc: Koeffizienten

: Basisfunktionenk

•sinnvolle Wahl des Funktionenraums:

additiv (Superposition) => orthogonale Funktionen

Page 10: Zeitreihenanalyse WS 2004/2005

•Zwei Vektoren und heißen orthogonal wenn:

Orthogonalsysteme

332211

3

2

1

3

2

1

)cos(0 bababa

b

b

b

a

a

a

BABA

• vergleiche: Orthogonalität = "Unabhängigkeit", "Unkorreliertheit" im statistischen Sinne

=> Veränderung eines Vektor hat keine Auswirkungen auf den anderen Vektor: Superposition

B

A

ji

jidttt ji 0

0)()( * (kontinuierlicher Fall)

ji

jitt

kkjki 0

0)()( * (diskreter Fall)

Page 11: Zeitreihenanalyse WS 2004/2005

Orthogonalsystem: sin(x), cos(x)

•Wahl von sin(x) und cos(x) als Basisfunktionen

2/...,,1,0:2cos,2sin Nk

Nkt

Nkt

bzw. Darstellung als komplexe Zahl:

21

2:

2 Nk

Ne N

kti

Page 12: Zeitreihenanalyse WS 2004/2005

Wiederholung: Komplexe Zahlen

1ImRe 2 iezziziyxz i

1

sincos

i

i

e

ie

alternative Darstellung in Polarkoordinaten (φ, ρ):

22

)]sin()[cos(

yxyix

iyix

Eulersche Gleichung:

Page 13: Zeitreihenanalyse WS 2004/2005

•generell:

• für f(x) = ex und a = 0 :

•analog für f(x) = eix :

• für a = 0 :

=>

Taylorreihendarstellung der trigonometrischen Funktionen

...!6!4!2

1)cos(642

xxxx

...!5!4!3!2

15432

ixxixx

ixe ix

xxan

axxfR

Rn

axaf

axaf

axafafxf

nn

n

n

nn

00)(

1)1(

2''

1'

!

)()(

)!1(

)()(...

!2

)()(

!1

)()()()(

...!5!4!3!2

15432

xxxxxe x

...!7!5!3

)sin(753

xxxxx

)sin()cos( xixe ix ...!7!5!3

)sin(753

ixixixixxi

=>

Exponent n 0 1 2 3 4 5 6 7 8

i n = 1 i -1 -i 1 i -1 -i 1

12 i

Page 14: Zeitreihenanalyse WS 2004/2005

Eine äquidistante Zeitreihe mit Messintervall (Zeitauflösung) und N Werten

Länge der Messperiode

Anzahl der Perioden im Datensatz

Periodenlänge

Frequenz

Kreisfrequenz

harmonische Frequenz

Grundfrequenz, Frequenzauflösung

Nyquist-Theorem, Abtasttheorem

t

Frequenzen, Zeiten, Längen, Perioden, ...

tNT

TPkT

maxminmin 12

12 kkT

kk N

tPNkt

22/ minmaxmax

kk fkTP /2/1/

tN

k

Pf k

kk

2

1

kPTk /

kkk fP 2/2

tP

tNT

Page 15: Zeitreihenanalyse WS 2004/2005

Eine äquidistante Zeitreihe mit Messintervall (Zeitauflösung) und N Werten

Länge der Messperiode

Anzahl der Perioden im Datensatz

Periodenlänge

Frequenz

Kreisfrequenz

harmonische Frequenz

Grundfrequenz, Frequenzauflösung

Nyquist-Theorem, Abtasttheorem

t

Frequenzen, Zeiten, Längen, Perioden, ...

tNT

TPkT

maxminmin 12

12 kkT

kk N

tPNkt

22/ minmaxmax

kk fkTP /2/1/

tN

k

Pf k

kk

2

1

kPTk /

kkk fP 2/2

Page 16: Zeitreihenanalyse WS 2004/2005

Fourieranalyse = harmonische AnalyseJ.B.J. Fourier (1807): Jede stetige und periodische Funktion kann (beliebig genau) dargestellt werden als Superposition einer Serie harmonischer Schwingungen unterschiedlicher Frequenzen.

=> Entwicklung in eine unendliche trigonometrische Reihe:

Voraussetzungen (= Dirichletsche Bedingungen):

1. Die Funktion muss sich in endlich viele Teilintervalle zerlegen lassen können, in denen jeweils x stetig und monoton ist.

2. In den Unstetigkeitsstellen (Sprungstellen) existiert jeweils der links- und der rechtsseitige Grenzwert.

]2cos()2sin([2

)( 0

N

ktb

N

kta

atx k

kk

Page 17: Zeitreihenanalyse WS 2004/2005

Fourierkoeffizienten

• hier: für periodische, diskrete, äquidistante Zeitreihen mit N Werten

• Schätzung der Koeffizienten für die kte harmonische Frequenz:

• Ausnahme für k = N/2:

N

iiik

N

iiik

tNk

xN

b

tNk

xN

a

1

1

)2cos(2

)2sin(2

N

iiN

N

tNxN

b

a

12/

2/

))2/(2cos(2

21

0

Page 18: Zeitreihenanalyse WS 2004/2005

Fouriertransformation

deftx ti

21

)(

Für unendlich lange Zeitreihen gibt es alle Frequenzen

Merkmale:• umkehrbar• existiert für absolut integrierbare Funktionen• zeitglobal• Stationarität prinzipiell erforderlich

k

tik etxf

21

)( Spektrum von tx

Page 19: Zeitreihenanalyse WS 2004/2005

Beispiel für eine Fourierapproximation

Page 20: Zeitreihenanalyse WS 2004/2005

1 Term: Mittelwert

Page 21: Zeitreihenanalyse WS 2004/2005

2 Terme

Page 22: Zeitreihenanalyse WS 2004/2005

3 Terme

Page 23: Zeitreihenanalyse WS 2004/2005

5 Terme

Page 24: Zeitreihenanalyse WS 2004/2005

10 Terme

Page 25: Zeitreihenanalyse WS 2004/2005

100 Terme

Page 26: Zeitreihenanalyse WS 2004/2005

Aliasing

= "Frequenzmissdeutung"

= "Einstrahlen" höherer Frequenzen in den niedrigen Bereich aufgrund der endlichen Länge/Auflösung des Datensatzes:

Page 27: Zeitreihenanalyse WS 2004/2005

Parsevalsches Theorem

Die totale Varianz der Werte ist gleich der Summe der Varianzen der einzelnen Frequenzen:

Energie ist im Zeit- und Frequenzraum gleich

Def.: Energie eines Signals:

)()()( 221

2

2221

21

2kk

k

iiiT bababa

k

ktxE2

)(

Page 28: Zeitreihenanalyse WS 2004/2005

Periodogramm

• Aufteilung der Varianz auf die einzelnen Frequenzen:

s2(k) (= spektrale Varianz) gegen k aufgetragen

• Berechnung anhand der Fourier-Koeffizienten:

2

)( 22 NbaI kkk

Page 29: Zeitreihenanalyse WS 2004/2005

Periodogramm

= Darstellung der Varianzanteile für die einzelnen Frequenzen bzw. Phasenlängen

0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50

Frequenz

0

5

10

15

20

25

Periodogram

m-Werte

0

5

10

15

20

25

0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32

Per iode

0

5

10

15

20

25

Periodogram

m-Werte

0

5

10

15

20

25

Page 30: Zeitreihenanalyse WS 2004/2005

Aufgabe

1. Berechnen Sie in Excel die Fourierkoeffizienten für den Datensatz in Aufgabe_Fourieranalyse.xls.

2. Erstellen Sie anhand der Fourierkoeffizienten ein Periodogramm.

3. Rekonstruieren Sie die Zeitreihe als Superposition der entsprechenden sin- und cos- Funktionen.

4. Führen Sie mit den Daten eine Fourieranalyse in Statistica durch und vergleichen Sie die Ergebnisse.