Carsten Rezny - iam.uni-bonn.de · Hypothesen Uberpr ufung von Hypothesen mit statistischen Tests...

Preview:

Citation preview

Statistikpraktikum

Carsten Rezny

Institut fur angewandte MathematikUniversitat Bonn

Sommersemester 2016

Hypothesen

Uberprufung von Hypothesen mit statistischen Tests

Definition

Eine zu prufende Aussage uber Daten einer Stichprobe heißtHypothese.

Hypothesen

Arten von Hypothesen

Unterschiedshypothese Parameter verschiedener(Teil-)Populationen sind verschieden

Beispiel

µ1 6= µ2

Zusammenhangshypothese Es besteht ein Zusammenhangzwischen Merkmalen einer Population

Beispielµ1 ∼ µ2

Hypothesen

gerichtete Hypothese macht eine Richtungsaussage

Beispielµ1 < µ2

ungerichtete Hypothese macht keine Richtungsaussage

Beispiel

µ1 6= µ2

Hypothesen

unspezifische Hypothese qualitative Aussage

Beispielσ1 < σ2

spezifische Hypothese quantitative Aussage

Beispiel

µ1 − µ2 > ∆

Aquivalenzhypothese Spezialfall der gerichteten spezifischenUnterschiedshypothese

Beispiel

|µ1 − µ2| < ∆

Test von Hypothesen

Testkonstruktion mit zwei komplementaren Hypothesen:

Alternativhypothese H1 die vermutete/zu bestatigende Aussage

Nullhypothese H0 Negation von H1:”kein Effekt“

Beispiel (Vergleich der Mittelwerte zweier Populationen)

H1 : µ1 < µ2

H0 : µ1 ≥ µ2

Test von Hypothesen

Definition

Statistischer Test: Entscheidung uber die Ablehnung oderNichtablehnung von H0

Zwei mogliche Ergebnisse

H0 verwerfen (also H1 annehmen)

H0 nicht verwerfen (also H1 nicht annehmen)→keine Aussage uber Gultigkeit von H0

Test von Hypothesen

Aussage uber Populationen auf Grundlage von Stichproben→Wahrscheinlichkeitsaussage

Mogliche Fehler

Fehler 1. Art H0 verworfen, obwohl wahr

Fehler 2. Art H0 beibehalten, obwohl falsch

Gauß-Test

Bedingung fur Behalten/Verwerfen von H0 aufstellenAnnahme: X1,X2, . . . gemaß N(m, σ2) normalverteilt;σ bekannt, m unbekannt

Beispiel

H1 : m 6= µ0

H0 : m = µ0

H0 verwerfen, wenn |x − µ0| > c

→Bestimme c

Gauß-TestWie wahrscheinlich ist Fehler 1. Art?Betrachte P(Stichprobe widerspricht H0 | H0 wahr).

Wahle Signifikanzniveau α: maximal akzeptableWahrscheinlichkeit, einen Fehler 1. Art zu begehen;

gesucht ist c , so dass

P(|X − µ0| > c) = α

Gauß-Test

Mit N(0, 1)-verteilter Teststatistik Zn = |X−µ0|σX

√n

ergibt sich:

Fur |x − µ0| > c gilt: Zn > z1−α/2 →H0 wird verworfen,fur |x − µ0| ≤ c gilt: Zn ≤ z1−α/2 →H0 wird behalten.

zp: p-Quantil der Standardnormalverteilung N(0, 1)

Gauß-Test

Bislang: ungerichtete Hypothese, also symmetrischerAkzeptanzbereich fur H0

→”zweiseitige Fragestellung“

Gerichtete Hypothesen :”einseitige Fragestellung“

H0 : m ≥ µ0 →Verwerfen wenn Zn < zαH0 : m ≤ µ0 →Verwerfen wenn Zn > z1−α

p-Wert

Bisher: Bestimmung von Grenzen fur x bei gegebenem α

Alternative: Bestimmung des sogenannten p-Wertes(Uberschreitungswahrscheinlichkeit)

Definition

Der p-Wert ist die Wahrscheinlichkeit, bei Gultigkeit von H0 denbeobachteten Wert der Teststatistik oder einen in Richtung von H1

extremeren Wert zu erhalten.

p-Wert

Einseitige Fragestellung: p = Pµ0(X ≥ x)

p-Wert

Entsprechend bei zweiseitiger Fragestellung:p = Pµ0(X ≥ µ0 + d) + Pµ0(X ≤ µ0 − d)

mit d = |x − µ0|

p-Wert

Entscheidung uber H0: Vergleich mit vorher festgelegtem α

p ≤ α H0 verwerfen

p > α H0 beibehalten

p-Wert

p-Wert fur Gauß-Test in Excel/OpenOffice

GTEST(data; my; sigma) = 1− Φ(√n(x−µ0)σ ) =: q

(englisch: ZTEST(...))

einseitige Fragestellung:

p1 = MIN(q; 1-q)

zweiseitige Fragestellung:

p2 = 2p1

t-Test

Bei unbekannter Standardabweichung σ:Verwendung der Schatzung der korrigierten StandardabweichungS∗ anstatt σ

Teststatistik

T =X − µ0

S∗√

n

ist t-verteilt.→einfacher t-Test

t-Test

Einfacher t-Test mit Excel/OpenOfficeBei einseitiger Fragestellung:

n = ANZAHL(data)

t = (MITTELWERT(data)− µ0) ∗WURZEL(n)/STABW(data)

p = TVERT(ABS(t);n-1;1)

Bei zweiseitiger Fragestellung:

p = TVERT(ABS(t);n-1;2)

t-Test

Vergleich zweier Stichproben

zwei Messgroßen als Folgen von Zufallsvariablen:X = {X1,X2, . . . ,Xn1}Y = {Y1,Y2, . . . ,Yn2}daraus zwei unabhangige Stichproben xi (i = 1, . . . , n1) undyi (i = 1, . . . , n2)

X und Y normalverteilt mit Mittelwerten µX und µYunbekannt

gleiche Standardabweichungen: σX = σY =: σ unbekannt

mogliche Alternativhypothesen:

µ1 6= µ2

µ1 > µ2

µ1 < µ2

t-Test

Bestimmung des p-Wertes

H0 : µ1 = µ2 p = P(|T | ≥ |t|)p = TTEST(data1; data2; 2; 2)

H0 : µ1 ≤ µ2 p = P(T ≥ t)

H0 : µ1 ≥ µ2 p = P(T ≤ t)p = TTEST(data1; data2; 1; 2)

t-Test

Die Funktion TTEST(data1; data2; tails; type)

data1, data2 zu vergleichende Stichproben

tails 1: einseitiger Test2: zweiseitiger Test

type 1: abhangige (gepaarte) Stichproben2: unabhangige Stichproben mit gleicherStandardabweichung

t-Test

Gepaarte Stichproben

Zufallsvariablen Xi ,Yi seien N(m, σ2)-verteilt

zwei gepaarte Stichproben (xi , yi ) (i = 1, . . . , n)

die paarweisen Differenzen Xdi = yi − xi (i = 1, . . . , n) sindnormalverteilt

Teststatistik t = xdsd

√n

Bestimmung des p-Wertes

H0 : µ1 = µ2 p = P(|T | ≥ |t|)p = TTEST(data1; data2; 2; 1)

H0 : µ1 ≤ µ2 p = P(T ≥ t)

H0 : µ1 ≥ µ2 p = P(T ≤ t)p = TTEST(data1; data2; 1; 1)

VerteilungsfunktionenNormalverteilung in Excel/OpenOffice

NORMVERT(x;m;s;C) Normalverteilung mit m = µ, s = σC=0: WahrscheinlichkeitsdichtefunktionC=1: Verteilungsfunktion (default)

STANDNORMVERT(x) Standardnormalverteilung (µ = 0, σ = 1)

STANDNORMINV(p) p-Quantil der Standardnormalverteilung

STANDNORMINV(p)

STANDNORMVERT(x)

NORMVERT(x;m;s;0)

-4 -2 2 4

-1.0

-0.5

0.5

1.0

1.5

2.0

Verteilungsfunktionen

TVERT(x;n;m)

x Argument der t-Verteilung, ≥ 0

n Zahl der Freiheitsgrade

m”Modus“ ∈ {1, 2}

”Tail-Funktion“

Verteilungsfunktionen

Quantile der t-Verteilung in Excel/OpenOffice

tn,p =

{-TINV(-2*p,n) 0 < p ≤ 1

2

TINV(2*(1-p),n) 12 < p ≤ 1

TINVHp; nL = tn ,1-p�2

tn ,p

0.2 0.4 0.6 0.8 1.0

-3

-2

-1

1

2

3

4

Recommended