33
Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 53 Test von Hypothesen: Signifikanz des Zusammenhangs (F-Test) p Die Schätzung der Regressionsfunktion basiert auf Daten einer Stichprobe p Inwiefern können die Ergebnisse dieser Schätzung auf die Grundgesamtheit übertragen werden? p Es könnte sein, dass in der Realität die Veränderung der Funktionswerte gar nicht auf die lineare Veränderung der unabhängigen Modellvariablen zurückzuführen ist. Der Wert von r 2 kann sich aufgrund zufälliger Einflusse ergeben haben. p Die Frage ist nun, wie signifikant die Abhängigkeit des Regressands von Regressoren ist? M.a.W. wie (un)wahrscheinlich ist es, dass es keinen Zusammenhang zwischen der unabhängigen und abhängigen Variablen gibt? p Die Prüfung von Gültigkeit der Regressionsfunktion als Ganzer: F-Test

Test von Hypothesen: Signifikanz des … · p Es wird zwischen 2 Arten von Fehlern unterschieden: ... Test von Hypothesen: Gültigkeit von Regressionskoeffizienten für die Grundgesamtheit

Embed Size (px)

Citation preview

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 53

TestvonHypothesen:SignifikanzdesZusammenhangs(F-Test)

p DieSchätzungderRegressionsfunktionbasiertaufDateneinerStichprobe

p InwiefernkönnendieErgebnissedieserSchätzungaufdieGrundgesamtheit übertragenwerden?

p Eskönntesein,dassinderRealitätdieVeränderungderFunktionswertegarnichtaufdielineareVeränderungderunabhängigenModellvariablenzurückzuführenist.DerWertvonr2 kannsichaufgrundzufälligerEinflusseergebenhaben.

p DieFrageistnun,wiesignifikantdieAbhängigkeitdesRegressands vonRegressorenist?M.a.W.wie(un)wahrscheinlichistes,dasseskeinenZusammenhangzwischenderunabhängigenundabhängigenVariablengibt?

p DiePrüfungvonGültigkeitderRegressionsfunktionalsGanzer:F-Test

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 54

p DieEntscheidungeineHypothesezuverwerfen,kannfehlerhaftsein

p Eswirdzwischen2ArtenvonFehlernunterschieden:

p FehlerIArt(α)=Signifikanzniveau(1-α=Vertrauenswahrscheinlichkeit)- Statement:„Einflussbesteht“;inWirklichkeit: „keinEinfluss“

p FehlerIIArt(𝛽)=Teststärke- Statement:„keinEinfluss“;inWirklichkeit: „Einflussbesteht“

p SimultaneMinimierungbeiderFehlerartenistunmöglich.FalschePositivessind „wichtiger“,damehrSchaden.Daherwirdzunächstαminimiert.

H0 richtig H0 falschverwerfen Fehler I Art (α) kein Fehlerakzeptieren kein Fehler Fehler II Art

TestvonHypothesen: zweiFehlerarten

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 55

TestvonHypothesen: F-Test

p AblaufdesF-Tests:

1. Aufstellender„Nullhypothese“(H0):„Esbestehtkein ZusammenhangzwischenderabhängigenunddenunabhängigenVariablen!“– 𝛽j=0,fürj ϵ [ 0; J ]– RegressionsgleichungistunbrauchbarAlternativhypothese(H1):„DerZusammenhangbesteht!r2 istsignifikantvonnullverschieden!“

2. VerlässlichkeitdesTestergebnisses(Vertrauenswahrscheinlichkeit)wirdvorgegeben– üblicherweise0,95oder0,99– D.h.miteinerWahrscheinlichkeit von95%bzw.99%kannmansichdaraufverlassen,dassH0 nicht

zuunrechtabgelehntwird.– M.a.W.wirdH0 abgelehnt,soistmit95%- bzw.99%-igenWahrscheinlichkeitdieH1 richtig.

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 56

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 57

TestvonHypothesen: F-Test

3. BerechnungdesempirischenF-WertesaufgrundvonStichprobendatenbzw.- werte

)1(//

11

1)ˆ(

)ˆ(

2

2

2

2

−−=

−−−

=

−−

=∑

JNStreuungerklärtenichtJStreuungerklärte

JNrJr

JNyy

Jyy

Femp

mit

N = Anzahl der Beobachtungswerte (Fälle)J = Anzahl von RegressorenN – J – 1 = Zahl der Freiheitsgrade der Regression

809,18)117(/)79,01(

1/79,0=

−−−=empF

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 58

TestvonHypothesen: F-Test

4. VergleichdesempirischenF-Wertes(Femp)miteinemtheoretischenF-Wert(Ftab)anhandeinerTabelle

Entscheidungskriterium:

Femp >Ftab →Ho verworfen,esgiltH1

Femp ≤ Ftab →Ho nichtverworfen

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 59

TestvonHypothesen: F-Test

F-Tabelle:95%Vertrauenswahrscheinlichkeit(Ausschnitt)

hierf1:J =ZahldererklärendenVariablenf2:N-J-1 =AnzahlFreiheitsgrade

(N =ZahlderBeobachtungswerte)

FürunserBeispiel:J =1;N =7; N-J-1 =5; Femp =18,809

18,809>6,61→Ho verworfen!

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 60

Test von Hypothesen: F-Test

F-Tabelle:99%Vertrauenswahrscheinlichkeit(Ausschnitt)

FürunserBeispiel:J =1;N =7;N-J-1 =5;Femp =18,809

18,809>16,26→Ho verworfen!

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 61

Test von Hypothesen: F-Test

F-Tabelle:99,9%Vertrauenswahrscheinlichkeit(Ausschnitt)

FürunserBeispiel:J =1;N =7;N-J-1 =5;Femp =18,809

18,809<47,04→Ho nicht verworfen!

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 62

DiegeschätzteFunktion

erklärt79%desZusammenhangsvony undxsignifikantaufdemNiveauvon0,01.

TestvonHypothesen: F-Test

Vertrauenswahrscheinlichkeit

95%(0,95)

99%(0,99)

99,9%(0,999)

H1 H1 H0

0,05 0,01 0,001

Signifikanzniveau

xy ⋅−= 057,1174,43

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 63

TestvonHypothesen:GültigkeitvonRegressionskoeffizienten fürdieGrundgesamtheit (T-Test)

p DieSchätzungderFunktionsparameterbasiertaufbekannten Daten

p Wiezuverlässigsinddiegeschätzten𝛽-WertefürPrognosen?

T-Test

p Geprüftwird,obtatsächlicherb-WertgleichNullist(Also𝛽j=0),d.h.Ho:„Faktorxj hatinderGrundgesamtheitkeinenEinflussaufy.DerermittelteWertvon𝛽jgiltnurfürdieStichprobe.“H1:„DerEinflussvomFaktorxj inderGrundgesamtheitistsignifikantgrößerNull“

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 64

TestvonHypothesen: T-Test

p ÄhnlichwiebeimF-TestwirdeinePrüfgrößeerrechnetundmitdemTabellenwertverglichen

jS

t jjemp

β

ββ −=ˆ

∑=

−⋅=

≠ N

ii xx

sSjj

1

2)(

10|β

jS

t jemp

β

β̂=getestetwird 𝛽j=0 →

=

=

=

=

jS

t

j

j

emp

β

β

β̂

Errechnetert-Wert

Regressionskoeffizientdesj-ten Regressor

WahrerRegressionskoeffizient(unbekannt)

StandardfehlerdesRegressionskoeffizientendesj-ten Regressors

∑=

−+⋅= N

ii xx

xN

sS

1

2

2

)(

10β

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 65

TestvonHypothesen: T-TestNr.i1 10 26 -8 642 16 28 -2 1003 18 19 0 14 23 24 5 365 30 15 12 96 33 6 15 1447 39 8 21 100

Summe 169 454,00Mittelwert 24,14 18,00

24,04541125,5

)(

1

1

20|

=⋅=−

⋅=

∑=

≠ N

ii xx

sSjjβ

743,445418

71125,5

)(

1 2

1

2

2

0=+⋅=

−+⋅=

∑=

N

ii xx

xN

sSβ

ixip xxi − 2)( xxi −

125,5)1(

1

2

=−−

=∑=

JN

us

N

ii

102,9743,4174,43ˆ

0

00

===β

βS

temp

404,424,0057,1ˆ

1

1

1 −=−

==β

βS

temp

xp ⋅−= 057,1174,43

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 66

TestvonHypothesen: T-Test

VergleichmitdemTabellenwert:

|temp| >ttab → Ho verworfen|temp| ≤ttab →Ho nichtverworfen

FürunserBeispiel:J =1;N =7;N-J-1 =5;temp =-4,404

α=0,95: 4,395>2,57→Ho verworfen!α=0,99: 4,395>4,03→Ho verworfen!α=0,999: 4,395<6,86→Ho nichtverworfen!

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 67

TestvonHypothesen:Konfidenzintervall desRegressionskoeffizienten

p DerEinflussvonVariablex1 kanninderGrundgesamtheitmit99%-igerWahrscheinlichkeit(=aufdemSignifikanzniveau von0,01)vermutetwerden.

p Wieweitkönnendiewahrenbj-WertevondeninderStichprobeermitteltenWertenabweichen?

ii xy ⋅+= 10ˆ ββ

VerlaufvonRegressionsgeradebeiVariationvon𝛽1VerlaufvonRegressionsgeradebeiVariationvon𝛽0und𝛽1

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 68

β̂

βαβ Stt

⋅=)(

β0

Wahrschinlichkeitsdichte

)(αβt

Ho akzeptieren(keinEinflussinderGrundgesamtheit)

Ho verwerfen(Einflussbesteht)

BeinormalverteiltenResiduensinddiegeschätzten𝛽 Koeffizientenauchnormalverteilt

)(ˆ

αββt

Ho akzeptieren(keinEinflussinderGrundgesamtheit)

)(ˆ

αββt

+

TestvonHypothesen: t-TestundKonfidenzintervall desRegressionskoeffizienten

Relationvomgeschätzten𝛽 zuseinemStandardfehleristkleineralskritischert-Wert

β

βS

t =

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 69

βαβ Stt

⋅=)(

β0

Wahrschinlichkeitsdichte

Ho akzeptieren(keinEinflussinderGrundgesamtheit)

Ho verwerfen(Einflussbesteht)

BeinormalverteiltenResiduensinddiegeschätzten𝛽 Koeffizientenauchnormalverteilt

Ho verwerfen(Einflussbesteht)

TestvonHypothesen: t-TestundKonfidenzintervall desRegressionskoeffizienten

KritischeRegion

β

βS

t =

𝛽=0𝛽 - tS 𝛽 + tSKritischert-Wert

KritischeRegion

Kritischert-Wert

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 70

TestvonHypothesen:Konfidenzintervall desRegressionskoeffizienten

jjStSt jjj ββ βββ ⋅+≤≤⋅− ˆˆ

p DerwahreWertdesRegressionskoeffizienten(fürdasvorgegebeneSignifikanzniveau )liegtimBereich

p DieserBereichnenntsichKonfidenzintervall vonbj

Fürα=0,01

Fürα=0,05

jStj ββ ⋅±ˆ

24,003,4057,124,003,4057,1 1 ⋅+−≤≤⋅−− β086,003,2 1 −≤≤− β

24,057,2057,124,057,2057,1 1 ⋅+−≤≤⋅−− β

44,067,1 1 −≤≤− β

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 71

TestvonHypothesen:Konfidenzintervall desRegressionskoeffizienten

086,003,2 1 −≤≤− β

xy ⋅−= 057,1174,43

xy ⋅−= 086,0174,43

xy ⋅−= 03,2174,43

236,62112,24 0 ≤≤ β

VerlaufvonRegressionsgerade beiVariationvon𝛽1

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 72

TestvonHypothesen:Konfidenzintervall desRegressionskoeffizienten

086,003,2 1 −≤≤− β

xy ⋅−= 057,1174,43

xy ⋅−= 086,0112,24

xy ⋅−= 03,2236,62

236,62112,24 0 ≤≤ β

VerlaufvonRegressionsgerade beiVariationvonb0undb1

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 73

0

5

10

15

20

25

30

35

40

45Pr

eis

(y)

Menge (x)0 5 10 15 20 25 30 35 40

TestvonHypothesen:Konfidenzintervall derRegressionsfunktion

_Y

α=0,01

α=0,05

Konfidenzintervall =RegionderAnnahmevonH1

VereinfachteAbbildung!

Konfidenzintervall gibtan,inwelchemBereichderwahreRegressionskoeffizientmiteinerbestimmtenfestgelegtenVertrauenswahrscheinlichkeitliegt

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 74

0

5

10

15

20

25

30

35

40

45Pr

eis

(y)

Menge (x)0 5 10 15 20 25 30 35 40

TestvonHypothesen:Konfidenzintervall derRegressionsfunktion

α=0,01

Jeweiterx vomMittelwert,destoungenaueristdieSchätzungvony(x)

ÜbertragenaufdieRegressionsgeradezeigtKonfidenzintervall an,inwelchemBereichdiewahrenWerteliegenkönnenbzw.wiestarksievondengeschätztenWertenabweichenkönnen(miteinerbestimmtenfestgelegtenVertrauenswahrscheinlichkeit)

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 75

Häufigkeitvony

Preis(y)

Konfidenzintervall derRegressionsfunktion

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 76

ErgebnissederRegressionsanalyse

ii xy ⋅−= 057,1174,43ˆ

Sbj = (4,743) (0,24) r2 = 0,795t = (9,102) (-4,404) df = 6a = (0,001) (0,01) F1,6 = 18,809

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 77

ErgebnissederRegressionsanalyse:SPSS

ModellQuadratsumme df

MittelderQuadrate F Signifikanz

1 Regression 507,489 1 507,489 19,316 ,007(a)Residuen 131,368 5 26,274Gesamt 638,857 6

ANOVA(b)aEinflußvariablen :(Konstante),AbsatzmengebAbhängigeVariable:Preis

Modell

NichtstandardisierteKoeffizienten

Standardisierte

Koeffizienten

T SignifikanzBStandardfehl

er Beta1 (Konstante) 43,174 4,744 9,101 ,000

Absatzmenge -1,057 ,241 -,891 -4,395 ,007

Koeffizienten(a)aAbhängigeVariable:Preis

Modell R R-QuadratKorrigiertesR-Quadrat

StandardfehlerdesSchätzers

1 ,891(a) ,794 ,753 5,12578

ModellzusammenfassungaEinflußvariablen :(Konstante),Absatzmenge

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 78

Methodologie vonÖkonometrie

1. FormulierungeinerTheorieoderHypothese2. SpezifizierungeinesmathematischenModellsderTheorie3. SpezifizierungdesstatistischenoderökonometrischenModells4. Datenerhebung5. SchätzungderParameterdesökonometrischenModells6. TestvonHypothesen

7. Prognosen/Vorhersagen8. NutzungvomModellzuKontroll- oderPolitischenZwecken

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 79

BestimmungderAbsatzmenge

füry=25 → x=17,19

xy ⋅−= 057,1174,43ˆ

0

5

10

15

20

25

30

35

40

45

Prei

s (y

)

Menge (x)0 5 10 15 20 25 30 35 40

α=0,05

x= 18,18

x= 13,6

ZurErinnerung:Konfidenzintervall gibtan,inwelchemBereichderwahreRegressionskoeffizientmiteinerbestimmtenfestgelegtenVertrauenswahrscheinlichkeitliegt

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 80

BestimmungdesPreises

fürx=25 → y=16,74

xy ⋅−= 057,1174,43ˆ

0

5

10

15

20

25

30

35

40

45

Prei

s (y

)

Menge (x)0 5 10 15 20 25 30 35 40

α=0,05

y= 19,98

y= 13,61

ZurErinnerung:Konfidenzintervall gibtan,inwelchemBereichderwahreRegressionskoeffizientmiteinerbestimmtenfestgelegtenVertrauenswahrscheinlichkeitliegt

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 81

OptimaleProduktionsmenge undPreis

Gewinnfunktionz.B.G = (y - k) xmitk = 4G = yx – 4x = (43,174 – x )x – 4x =

= 43,174 x – x2 – 4 x = 39,174 x – x2

Gmax istgegebenimPunkt,wo∂G/∂x = 0

39,174 – 2x = 0 →

xopt = 39,174 / 2 = 19,587 = 20yopt = 43,174 – 20 = 23,17

xy ⋅−= 057,1174,43ˆ

0

5

10

15

20

25

30

35

40

45

Prei

s (y

), G

ewin

n/10

Menge (x)0 5 10 15 20 25 30 35 40

G= 39,174x-x2

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 82

Methodologie vonÖkonometrie

1. FormulierungeinerTheorieoderHypothese2. SpezifizierungeinesmathematischenModellsderTheorie3. SpezifizierungdesstatistischenoderökonometrischenModells4. Datenerhebung5. SchätzungderParameterdesökonometrischenModells6. TestvonHypothesen7. Prognosen/Vorhersagen

8. NutzungvomModellzuKontroll- oderPolitischenZwecken

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 83

Preis-Absatz-Funktion imMonopol

AusunseremBeispielfolgt: RealeNachfrageistaberhöher:xopt = 20 yopt = 23,17Gopt = 383,4 G|x=24; p=19,17 = 364,08 < Gopt

DerMonopolisthatkeinenAnreiz,mehrzuproduzieren.EsentstehtDefizit.Bevölkerungistunzufrieden.

DerStaatkann/musseingreifen:*VerpflichtungzurMindestproduktion*SenkungderSteuerfürdenMonopolisten*SubventionierungvonProduzentenkomplementärerGüter*StimulierungdesWettbewerbes*…

Preis,€ Absatz,Stk.

23 24

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 84

LOGISCHERFEHLER!!!

p InderRealitäthängtderPreisnichtvonderAbsatzmengeab.VielmehrhängtderAbsatzvomPreisab.

p RegressionsanalysebestimmtlediglichdieStärkedesZusammenhangs,jedochnichtdieRichtung!

ImZweivariablen-Fallistesunproblematisch,dadieRichtungdesZusammenhangeseinfachumgekehrtwerdenkann.WennmehrVariablenregressiert wären,wäreunsereSchätzungkomplettfalschundirreführend.

p DielogischeBegründungbeimSpezifizierendesModellsistwichtigeralsKennzahlen!

p Übungsaufgabe: SpezifizierenSiedasModelrichtigundführenSieentsprechendeRegressionsanalysedurch.

Jun.-Prof. Dr. Paul Marx | Universität Siegen Regressionsanalyse Folie 85

Übungsaufgabe

BestimmenSiedieAbsatzmengeeinesUnternehmens, diesichbeiWerbeausgaben inHöhevon€ 85.000ergebenwird.

Werbeausgaben(€1000)

Absatz(€1000)

40 37760 50770 555110 779150 869160 818190 862200 817