27
UE Einf¨ uhrung in die Inferenzstatistik Beispielsammlung 0 Einf¨ uhrung und Wiederholung 0.1 Betrachten Sie das Experiment: urfeln mit zwei sechsseitigen W¨ urfeln. Berechnen Sie die Wahrscheinlichkeitsfunktion und die Verteilungsfunktion der Zufallsvariable Y, die die absolute Differenz der beiden Augenzahlen beschreibt. 0.2 Geben Sie ein k an, so dass die Funktion f (x)= kx 2 , 0 <x< 1 0, sonst eine Dichte ist. Berechnen Sie außerdem die Verteilungsfunktion und P(1/3 <X 1/2), wobei die Zufallsvariable X die Dichte f hat. 0.3 Berechnen Sie den Erwartungswert und die Varianz der Zufallsvariable Y in Bei- spiel 0.1. 0.4 Berechnen Sie den Erwartungswert und die Varianz der Zufallsvariable X, wobei X die folgende Verteilungsfunktion hat F (x)= 0, x< 0 x 3 , 0 x< 1 1, x 1. 0.5 Sei X die Lebensdauer von Gl¨ uhbirnen (in Stunden). Die Dichte von X sei f (x)= 2x, 0 x< 1/2 3/4, 2 <x< 3 0, sonst. (a) Welcher Prozentsatz an Gl¨ uhbirnen ¨ uberlebt l¨ anger als 15 Minuten ? (b) Berechnen Sie E(X ) und Var(X ). 0 Version: 10. Mai 2017

UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

UE Einfuhrung in die Inferenzstatistik

Beispielsammlung

0 Einfuhrung und Wiederholung

0.1 Betrachten Sie das Experiment: Wurfeln mit zwei sechsseitigen Wurfeln. Berechnen

Sie die Wahrscheinlichkeitsfunktion und die Verteilungsfunktion der Zufallsvariable

Y, die die absolute Differenz der beiden Augenzahlen beschreibt.

0.2 Geben Sie ein k an, so dass die Funktion

f(x) =

kx2, 0 < x < 1

0, sonst

eine Dichte ist. Berechnen Sie außerdem die Verteilungsfunktion und P(1/3 < X ≤1/2), wobei die Zufallsvariable X die Dichte f hat.

0.3 Berechnen Sie den Erwartungswert und die Varianz der Zufallsvariable Y in Bei-

spiel 0.1.

0.4 Berechnen Sie den Erwartungswert und die Varianz der Zufallsvariable X, wobei

X die folgende Verteilungsfunktion hat

F (x) =

0, x < 0

x3, 0 ≤ x < 1

1, x ≥ 1.

0.5 Sei X die Lebensdauer von Gluhbirnen (in Stunden). Die Dichte von X sei

f(x) =

2x, 0 ≤ x < 1/2

3/4, 2 < x < 3

0, sonst.

(a) Welcher Prozentsatz an Gluhbirnen uberlebt langer als 15 Minuten ?

(b) Berechnen Sie E(X) und Var(X).

0Version: 10. Mai 2017

Page 2: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 2

(c) Berechnen Sie P(0.25 < X ≤ 2.2|X > 1).

(d) Berechnen Sie P(X = 2), P(X = 0), P(X = E(X)).

0.6 Betrachten Sie die Zufallsvariable X mit E(X) = 10 und Var(X)=25. Geben Sie

positive Zahlen a und b an, so dass die Zufallsvariable Y = aX−b Erwartungswert

0 und Varianz 1 hat.

0.7 Die momenterzeugende Funktion (engl.: moment generating function) einer Zu-

fallsvariable X ist definiert als

MX(t) := E(eXt), t ∈ R.

(a) Es sei X ∼ N(0, 1). Berechnen Sie MX(t).

Hinweis: Erganze in der Rechnung (x2−2xt) zu einem vollstandigen Quadrat

und entdecke im gesamten Ausdruck die Dichte einer Normalverteilung mit

Erwartungswert t und Varianz 1.

(b) Es sei X ∼ Geo(θ), d.h. X folgt einer geometrischen Verteilung mit Parame-

ter θ ∈ (0, 1). Die Wahrscheinlichkeitsfunktion einer geometrisch verteilten

Zufallsvariable ist gegeben durch

P (X = k) = pθ(k) = (1− θ)k−1θ, k ∈ {1, 2, · · · }.

Berechnen Sie die momenterzeugende Funktion.

Hinweis: Fur eine diskrete Zufallsvariable X ist MX(t) gegeben durch

MX(t) =∑k

ektP (X = k).

0.8 Es sei X ∼ Geo(θ) mit θ ∈ (0, 1). Leiten Sie einfache Formeln fur P (X ≤ k)

und fur P (X ≥ k) her. Verwenden Sie hierfur die Wahrscheinlichkeitsfunktion aus

Beispiel 0.7.

0.9 Betrachte folgendes Glucksspiel: Der Einsatz wird mit Wahrscheinlichkeit p ver-

doppelt, mit Wahrscheinlichkeit 1− p verliert man ihn.

(a) Wie viele Runden muss man im Schnitt spielen, um einmal zu gewinnen?

Berechne auch die Varianz der Anzahl der zu spielenden Runden.

(b) Wenn man seinen Einsatz bei jedem Verlust verdoppelt und spielt, bis man

einmal gewonnen hat, wie hoch ist dann der zu erwartende Gewinn, wie hoch

ist der zu erwartende Einsatz?

Page 3: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 3

0.10 Birdie’s Bearing Works manufactures bearing shafts whose diameters are normally

distributed with parameters µ = 1 and σ = 0.002. The buyer’s specifications

require these diameters to be 1.000±0.003 cm. What fraction of the manufacturer’s

shafts are likely to be rejected? If the manufacturer improves her quality control,

she can reduce the value of σ. What value of σ will ensure that not more than 1

percent of her shafts are likely to be rejected?

0.11 (Aus: S. Ross, A First Course in Probability Theory, 2nd ed. (New York: MacMil-

lan, 1984)). An expert witness in a paternity suit testifies that the length (in days)

of a pregnancy, from conception to delivery, is approximately normally distributed,

with parameters µ = 270 and σ = 10. The defendant in the suit is able to prove

that he was out of the country during the period from 290 to 240 days before the

birth of the child. What is the probability that the defendant was in the country

when the child was conceived?

0.12 Es wird mit zwei vierseitigen Wurfeln gewurfelt. Berechnen Sie die gemeinsame

Wahrscheinlichkeitsfunktion der Zufallsvariable X, die die maximale Augenzahl

beschreibt, und der Zufallsvariablen Y, die die Summe der beiden Augenzahlen

beschreibt. Sind die beiden Variablen unabhangig? Optional: Konnen Sie Ihre Re-

sultate auf den Fall zweier m-seitiger Wurfel (m > 1) erweitern?

0.13 Gegeben sei eine Zufallsvariable X mit E[X] = µ und Var(X) = σ2. Berechnen

Sie den Erwartungswert und die Varianz der Zufallsvariable

Y =X − µσ

.

Welche Eigenschaften von Erwartungswert und Varianz verwenden Sie?

1 Einfache Zufallsstichproben

1.1 Eine einfache Zufallsstichprobe einer Population der Große 2000 liefert die folgen-

den 25 Werte:

104 109 111 108 87

86 80 119 88 122

91 103 99 106 96

102 98 95 83 107

79 89 94 92 97

Page 4: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 4

(a) Berechnen Sie unverzerrte Schatzungen fur den Populationsmittelwert und fur

die Populationsvarianz. Berechnen Sie außerdem eine unverzerrte Schatzung

fur die Varianz des Schatzers des Populationsmittelwerts.

(b) Geben Sie ein 95% Konfidenzintervall fur den Populationsmittelwert an.

1.2 Aus einer Population der Große N wird eine einfache Zufallsstichprobe X1, . . . , Xn

mit Zurucklegen gezogen. Dies bedeutet in der Notation aus der Vorlesung, dass

P(Xj = wi) =1

N

P(Xj = wi, Xj′ = wi′) =1

N2falls j 6= j′.

Es sei µ = 1/n∑n

i=1Xi. Berechnen Sie E[µ] und Var(µ).

1.3 Um den Populationsmittelwert µ zu schatzen wurden unabhangig voneinander zwei

Umfragen durchgefahrt. Die entsprechenden Schatzer werden mit µ1 und µ2, deren

Standardabweichungen mit σ1 und σ2 bezeichnet. Nehmen Sie an, dass µ1 und µ2

unverzerrt sind. Fur reelle Zahlen α und β konnen diese beiden Schatzer zu einem

neuen Schatzer kombiniert werden, namlich

µ∗ = αµ1 + βµ2.

Welche Bedingungen mussen α und β erfullen, damit µ∗ unverzerrt ist. Wie mussen

α und β gewahlt werden, damit die Varianz unter den davor gefundenen Bedin-

gungen minimal wird. Ist die Varianz des neuen Schatzers kleiner als die Varianz

von µ1 und/oder µ2?

1.4 In Umfragen ist es schwierig ehrliche Antworten auf heikle und unangenehme Fra-

gen zu bekommen, wie”Haben Sie schon jemals Drogen genommen?“ oder

”Haben

Sie jemals bei einer Prufung geschummelt?“ Um mit solchen Situationen umzuge-

hen, hat Warner (1965) die Methode der randomisierten Antwort eingefuhrt. Der

Befragte dreht einen Pfeil auf einem Rad oder zieht eine Kugel aus einer Urne,

die mit Ballen zweier verschiedener Farben gefallt ist, um zu bestimmen auf wel-

che Aussage er antwortet: (1)”Ich habe Charakteristik A“, oder (2)

”Ich habe

Charakteristik A nicht“. (Charakteristik A ist zum Beispiel, ob man bereits Dro-

gen genommen hat.) Der Interviewer weiß nicht, auf welche der beiden Aussagen

geantwortet wird und tragt nur die Antwort, namlich”ja“ oder

”nein“ ein. Die

Hoffnung ist hierbei, dass der Interviewte ehrlich antwortet, wenn er/sie erkennt,

Page 5: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 5

dass der Interviewer nicht weiß, auf welche Aussage geantwortet wird. Es sei R der

Anteil der”ja“-Antworten in der Stichprobe. Weiters sei p die Wahrscheinlichkeit,

dass auf Aussage (1) geantwortet wird (p ist aus der Struktur des Zufallsexperi-

ments bekannt). Weiters sei q der Anteil der Personen in der Population, die die

Charakteristik A aufweisen, und r die Wahrscheinlichkeit, dass ein Befragter mit

”ja“ antwortet.

(a) Zeigen Sie, dass r = (2p− 1)q + (1− p).(Hinweis: Bedingen Sie auf den Ausgang der Randomisierung.)

(b) Zeigen Sie, dass E[R] = r, und geben Sie einen Schatzer Q fur q an, der

E[Q] = q erfullt.

(c) Zeigen Sie, dass

Var(R) ≈ r(1− r)n

,

wobei ≈ bedeutet”ist gleich bis auf Terme der Form (constant)/N oder

(constant)/(N−1)“. In der Vorlesung wurde zum Beispiel gezeigt, dass Var(µ) ≈σ2/n

1.5 Diese Aufgabe stellt einen Algorithmus vor um eine einfache Zufallsstichprobe

mittels einer sequentiellen Methode zu erhalten. Die insgesamt N Individuen einer

Population werden in einer vorher festgelegten Reihenfolge (z.B. in der aufgelis-

teten Reihenfolge) betrachtet und es wird schrittweise entschieden, ob sie in die

Stichprobe aufgenommen werden oder nicht. Das i-te Individuum wird mit einer

Wahrscheinlichkeit von

n− niN − i+ 1

aufgenommen, wobei ni die Anzahl der sich bereits in der Stichprobe befindenden

Individuen bezeichnet. Zeigen Sie, dass es sich hierbei wirklich um eine einfache

Zufallsstichprobe handelt, d.h. zeigen Sie, dass jede Teilmenge der Große n mit

einer Wahrscheinlichkeit von 1/(Nn

)auftritt.

1.6 Anhand einer einfachen Zufallsstichprobe wurde ein 90% Konfidenzintervall fur die

durchschnittliche Anzahl an Kindern pro Haushalt berechnet und ergab (0.7, 2.1).

Heißt dies, dass 90% der Haushalte zwischen 0.7 und 2.1 Kinder haben?

Page 6: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 6

1.7 In dieser Aufgabe wird das Konzept eines einseitigen Konfidenzintervalls erklart.

Wie sollte A unter Verwendung des Zentralen Grenzwertsatzes gewahlt werden,

sodass das Intervall (−∞, µ − A] ein approximatives 90% Konfidenzintervall fur

µ ist, d.h., sodass P (µ ≤ µ − A) ≈ 0.9 gilt? (Hier bezeichnet µ den Mittelwert

einer einfachen Zufallsstichprobe der Große n.) Diese Konstruktion wird einseitiges

Konfidenzintervall genannt. Wie sollte A gewahlt werden, sodass (−∞, µ−A] ein

approximatives 95% Konfidenzintervall ist?

1.8 Betrachten Sie eine Situation, in der der Populationsmittelwert linear in der Zeit

t wachst: µ(t) = α+ βt (die Populationsvarianz bleibt konstant). Angenommen es

werden zu den Zeitpunkten t = 1, 2, 3 unabhangige einfache Zufallsstichproben der

Große n gezogen. Finden Sie Konstanten w1, w2, w3, sodass

β = w1X1 + w2X2 + w3X3

ein unverzerrter Schatzer fur die Anderungsrate β ist. Hier bezeichnet Xt den

Mittelwert der Stichprobe, die zum Zeitpunkt t gezogen wurde. Wie mussen die

Konstanten wt gewahlt werden, sodass der resultierende Schatzer minimale Varianz

hat (und gleichzeitig unverzerrt ist)?

1.9 Eine Population vom Umfang N bestehe aus zwei disjunkten Teilpopulationen,

sogenannten Strata. Des Weiteren seien die beiden Strata gleich groß. Fur den

Populationsmittelwert gilt also µ = (µ1 + µ2)/2, wobei µ1 und µ2 die Mittelwerte

innerhalb der beiden Strata bezeichnen. Die Varianzen innerhalb der beiden Stra-

ta bezeichnen wir mit σ21 und σ22. Angenommen aus jedem Stratum wurde eine

einfache Zufallsstichprobe der Große n gezogen. Weiters seien die beiden Zufallss-

tichproben voneinander unabhangig.

(a) Geben Sie einen unverzerrten Schatzer µ fur den Populationsmittelwert µ an,

indem Sie Schatzer fur die Mittelwerte der beiden Teilpopulationen geeignet

kombinieren. Berechnen Sie auch die Standardabweichung σµ des Schatzers

und geben Sie einen unverzerrten Schatzer dafur an.

(b) Betrachten Sie nun den Datensatz income.txt aus der Vorlesung. Die zu-

grundeliegende Population lasst sich in zwei Strata unterteilen: diejenigen

Personen, die ein Einkommen uber dem Medianeinkommen haben, und die-

jenigen Personen, deren Einkommen darunter liegt. Berechnen Sie fur diesen

Datensatz zuerst den Stichproben-Median. Teilen Sie dann die Stichprobe

Page 7: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 7

in zwei Gruppen: diejenigen Werte, die kleiner als der Stichproben-Median

sind, und jene Werte, die großer als der Stichproben-Median sind oder mit

ihm ubereinstimmen. Verwenden Sie nun den ersten Teil dieser Aufgabe, um

einen unverzerrte Schatzer fur den Populationsmittelwert und seine Standard-

abweichung zu erhalten. Welche Annahmen mussen Sie treffen?

1.10 Betrachten Sie den Datensatz expenditures.txt, der die wochtentlichen Gesamt-

ausgaben aller Haushalte enthalt, die im Living Costs and Food Survey, 2010 er-

fasst wurden. Verschaffen Sie sich zuerst einen Gesamteindruck, indem Sie passende

deskriptive Statistiken und Grafiken erstellen, und berechnen Sie mit Hilfe einer

Normalverteilungsapproximation und mit Hilfe des Bootstraps jeweils ein approxi-

matives 95% Konfidenzintervall fur die erwarteten wochentlichen Gesamtausgaben

eines Haushalts.

1.11 Seien Xii.i.d.∼ U ([µ− 1, µ+ 1]), fur i ∈ N und µ ∈ R. Als Stichprobe wurden X1 =

0.2 und X2 = 0.7 gezogen. Zeigen Sie, dass der Schatzer µ = X1+X22 unverzerrt ist

und berechnen Sie ein symmetrisches 95%-Konfidenzintervall fur den Parameter

µ, d.h. ein Intervall der Form [µ− k, µ+ k], fur k > 0. Hinweis: X1 +X2 folgt eine

Dreiecksverteilung mit Erwartungswert 2µ und Support [2µ− 2, 2µ+ 2].

1.12 Das folegende Spiel wird gespielt. Ein Euro wird gesetzt und dann werden drei

Wurfel geworfen. Falls die Summe der Augenzahlen kleiner als 5 ist, gewinnt man

20 Euro.

(a) Was ist der erwartete Gewinn nach einem Spiel?

(b) Was ist die Verteilung des totalen Gewinnes nach zwei Spielen?

(c) Was ist die approximative Verteilung der totalen Gewinnes nach 100 Spielen

und wie groß ist die Wahrscheinlichkeit, dass dieser Gewinn positiv ist?

1.13 (a) Gesucht ist ein Konfidenzintervall fur den unbekannten Anteil p der Merk-

malstrager mit Eigenschaft A in einer Population. Wir ziehen eine Stichpro-

be X1, . . . , Xn aus unserer Population zufallig mit Zurucklegen. Wir haben

Xi = 1, falls das i-te Element der Stichprobe die Eigenschaft A besitzt, und 0

sonst. Finden Sie ein approximatives (1-α) -Konfidenzintervall fur p. Nehmen

Sie an, dass n ≥ 30.

Page 8: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 8

(b) Aus der Meldekartei einer Großstadt werden 100 Personen zufallig ausgewahlt.

Anhand der Geburtsorte dieser Personen stellt man fest, dass 20% an ei-

nem anderen Ort geboren sind. Aufgrund dieses Stichprobenanteils soll ab-

geschatzt werden, wie viel Prozent der Gesamtbevolkerung der Großstadt an

einem anderen Ort geboren sind. Finden Sie auch ein 0.95 - Konfidenzinterval

fur den wahren Anteil der Bewohner, die an einem anderen Ort geboren sind.

2 Parametrische Modelle

2.1 Es seien X1, . . . , Xn i.i.d. U([0, θ]), θ > 0, d.h., X1, . . . , Xn sind unabhangig und fol-

gen einer Gleichverteilung auf dem Intervall [0, θ]. Die Dichte der Gleichverteilung

ist

fθ(x) =

1θ 0 ≤ x ≤ θ

0 sonst.

Finden Sie einen Schatzer fur θ mit der Momentenmethode.

2.2 Es seien X1, . . . , Xn i.i.d. U([θ1, θ2]), d.h., X1, . . . , Xn sind unabhangig und folgen

einer Gleichverteilung auf dem Intervall [θ1, θ2] fur θ1, θ2 ∈ R und θ1 < θ2. Finden

Sie Schatzer fur θ1 und θ2 mit der Momentenmethode.

2.3 Es seienX1, . . . , Xn i.i.d. B(n, p), d.h.,X1, . . . , Xn sind unabhangig und folgen einer

Binomialverteilung mit Parametern n ∈ N und p ∈ (0, 1). Finden Sie Schatzer fur

n und p mit der Momentenmethode.

2.4 Es seien X1, . . . , Xn unabhangig und identisch verteilt wie X mit P(X = 1) = 2−2θ2−θ

und P(X = 2) = θ2−θ fur θ ∈ (0, 1). Finden Sie einen Schatzer fur θ mit der

Momentenmethode.

2.5 Es seien X1, . . . , Xn i.i.d. Exp(λ) mit λ > 0. Die Dichte der Exponentialverteilung

ist

fλ(x) =

λe−λx x ≥ 0

0 sonst.

Finden Sie einen Schatzer fur λ mit der Momentenmethode.

Page 9: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 9

2.6 Die Dichtefunktion der Paretoverteilung mit Parametern k > 0 und θ > 1 ist

gegeben durch

fk,θ(x) =

θkθ

xθ+1 x ≥ k

0 sonst.

Nehmen Sie an, dass k bekannt ist und, dass man eine i.i.d. Stichprobe der Große n

gegeben hat. Berechnen Sie einen Schatzer fur θ mit Hilfe der Momentenmethode.

2.7 Betrachten Sie die Gleichverteilung mit folgender Dichte

fα1,α2(x) =

12α2

α1 − α2 ≤ x ≤ α1 + α2

0 sonst,

wobei α1 ∈ R und α2 > 0. Nehmen Sie an, dass Sie eine i.i.d. Stichprobe der

Große n gegeben haben. Schatzen Sie die beiden Parameter α1 und α2 mittels der

Momentenmethode.

2.8 Eine der ersten Anwendungen der Poissonverteilung geht auf William S. Gos-

set (a.k.a. Student) zuruck. Er studierte die auftretenden Fehler bei der Zahlung

von Hefezellen mittels eines Hamozytometers. In dieser Studie wurden Hefezellen

getotet, mit Wasser und Gelatine vermischt und anschließend auf einer Glasplatte

abgekuhlt. Es wurden fur vier verschiedene Konzentrationen je 400 Zahlungen ge-

macht. Diese sind im Textdokument yeast.txt zusammengefasst. Schatzen Sie den

Parameter λ fur jede der vier Konzentrationen und konstruieren Sie approximative

95% Konfidenzintervalle. Fertigen Sie fur jede Konzentration eine Abbildung an,

in der Sie die beobachteten Haufigkeiten mit den theoretischen Haufigkeiten aus

den geschatzten Poissonmodellen vergleichen.

2.9 Es seien X1, . . . , Xn i.i.d. Geo(p) mit p ∈ (0, 1). Finden Sie einen Schatzer fur p

mit der Momentenmethode.

2.10 In einer okologischen Studie uber das Fressverhalten von Vogeln wurde die Anzahl

der Sprunge zwischen je zwei Flugen bei mehreren Vogeln gezahlt. Folgende Daten

wurden beobachtet:

Page 10: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 10

Anzahl der Sprunge Haufigkeit

1 48

2 31

3 20

4 9

5 6

6 5

7 4

8 2

9 1

10 1

11 2

12 1

Verwenden Sie den Schatzer aus Beispiel 2.9 um eine geometrische Verteilung an-

zupassen und geben Sie ein approximatives 95% Konfidenzintervall an.

2.11 Die folgenden 16 Zahlen stammen aus einem Zufallszahlengenerator der i.i.d Be-

obachtungen einer N(µ, σ2) verteilten Zufallsvariable erzeugt:

7.886846 11.016898 7.861484 9.918058 10.286014 4.919416

11.790559 8.608189 10.343040 9.490196 9.831089 10.433526

10.616618 9.104823 7.657797 7.516910

(a) Schatzen Sie den Erwartungswert µ und die Varianz σ2 der zugrunde liegenden

Normalverteilung.

(b) Berechnen Sie ein approximatives 95% Konfidenzintervall fur µ.

(c) Wieviel großer musste die Stichprobe sein, damit sich die Lange des Konfi-

denzintervalls halbiert?

2.12 Betrachten Sie eine i.i.d. Stichprobe der Große n von Zufallsvariablen mit Dichte

fσ(x) =1

2σe−

|x|σ

fur x ∈ R, wobei σ > 0. Finden Sie einen Momentenschatzer fur σ.

2.13 Der Winkel θ, in dem Elektronen beim Zerfall des Elementarteilchens Myon emit-

tiert werden, hat die Eigenschaft, dass X = cos θ eine Dichte der folgenden Gestalt

Page 11: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 11

hat

fα(x) =

1+αx2 −1 ≤ x ≤ 1

0 sonst.

Damit obige Funktion eine Dichte ist, muss |α| ≤ 1 gelten. Physikalische Uberlegungen

legen nahe, dass |α| ≤ 1/3.

(a) Berechnen Sie den Erwartungswert von X.

(b) Nehmen Sie an, Sie haben eine i.i.d. Stichprobe der Große n gegeben. Finden

Sie einen Momentenschatzer α fur α.

(c) Zeigen Sie, dass α ein unverzerrter Schatzer fur α mit Varianz (3−α2)/n ist.

(d) Verwenden Sie den Zentralen Grenzwertsatz um eine Approximation fur die

Stichprobenverteilung von α zu erhalten. Berechnen Sie damit fur n = 25 und

α = 0 naherungsweise die Wahrscheinlichkeit, dass α großer als 0.5 ist.

2.14 Es seien X1, . . . , Xn i.i.d. N(µ, σ2) mit µ ∈ R und σ2 > 0. Finden Sie Momen-

tenschatzer fur µ und σ2.

2.15 In einer Urne befinden sich rote und weiße Kugeln, der Anteil der roten Kugeln

sei p (unbekannt). Man zieht jetzt funf Mal mit Zurucklegen und erhalt die Folge

rot, weiß, weiß, rot, weiß. Bestimmen und berechnen Sie einen Schatzer fur p mit

der Momentenmethode.

2.16 Um die Große einer Tierpopulation zu bestimmen, wurden 100 Tiere gefangen,

markiert und danach wieder freigelassen. Zu einem spateren Zeitpunkt wurden

50 weitere Tiere gefangen, und es stellte sich heraus, dass 20 davon markiert wa-

ren. Erstellen Sie ein parametrisches Modell, das das Experiment beschreibt, und

entwickeln Sie einen Schatzer fur die Große der Population.

2.17 Aus einer exponentialverteilten Grundgesamtheit wurde eine Stichprobe der Große

50 gezogen. Der Stichprobenmittelwert betragt 2.17. Bestimmen Sie einen Momen-

tenschatzer fur den Parameter der zugrundeliegenden Exponentialverteilung und

konstruieren Sie ein 95% Konfidenzintervall.

2.18 The Datei bodytemp.txt enthalt die Korpertemperatur (Fahrenheit) und die Herz-

frequenz (Schlage pro Minute) von 65 Mannern (kodiert als 1) und 65 Frauen

Page 12: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 12

(kodiert als 2) aus einer Studie von Schoemaker (1996). Schatzen Sie die Er-

wartungswerte und Varianzen der Korpertemperatur und der Herzfrequenz, se-

parat fur Manner und Frauen, unter der Annahme, dass die Beobachtungen un-

abhangig und normalverteilt sind. Bestimmen Sie 95% Konfidenzintervalle fur die

Erwartungswerte. Unterstutzen die Daten die Daumenregel einer durchschnittli-

chen Korpertemperatur von 98.6 Grad Fahrenheit?

2.19 Gegeben sei eine Stichprobe X1, . . . , Xn von unabhangigen Beobachtungen. Die i-

te Beobachtung Xi sei exponentialverteilt mit Parameter 2iλ, λ > 0, i = 1, . . . , n.

Entwerfen Sie einen vernunftigen Schatzer fur λ.

2.20 Betrachten Sie eine Stichprobe X1, . . . , Xn von unabhangigen und identisch verteil-

ten Zufallsvariablen, deren gemeinsamer Erwartungswert µ ist. Hier ist µ ∈ R ein

unbekannter Parameter. Die hier tatsachlich interessierende Große ist nicht µ son-

dern eine Funktion von µ, also eine Große von der Form θ = g(µ). Bestimmen Sie

einen Schatzer fur θ mit der Momentenmethode. Untersuchen Sie den Schatzer auf

Unverzerrtheit und Konsistenz, wenn die Funktion g(µ) (a) linear, (b) nichtlinear

und stetig, (c) unstetig ist.

2.21 In einer Urne befinden sich rote und weiße Kugeln, wobei der Anteil p der roten Ku-

geln entweder 1/2 oder 1/3 ist. Man zieht jetzt funf Mal mit Zurucklegen und erhalt

die Folge rot, weiß, weiß, rot, weiß. Was ist der Maximum-Likelihood-Schatzer fur

p?

2.22 Eine Urne enthalt 10 Geldstucke. Sie kann zwei unterschiedliche Zusammensetzun-

gen aufweisen:

Zustand I: 3 1-EURO-Munzen und 7 2-EURO-Munzen

Zustand II: 6 1-EURO-Munzen und 4 2-EURO-Munzen

Von Interesse ist der Gesamtbetrag θ des Geldes in der Urne. Der Zustand der Urne

und damit auch der Wert von θ seien unbekannt. Um θ zu schatzen, entnehmen

wir der Urne zwei Munzen mit Zurucklegen.

(a) Stellen Sie die Wahrscheinlichkeiten der einzelnen Stichproben in Abhangigkeit

von den Werten von θ in einer Tabelle zusammen.

(b) Geben Sie die Maximum-Likelihood-Schatzfunktion fur θ an.

Page 13: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 13

(c) Bei einer Ziehung werden zwei 1-EURO-Munzen gezogen. Berechnen Sie den

Maximum-Likelihood-Schatzer fur θ?

2.23 Berechnen Sie die log-Likelihood fur den Parameter λ, wenn die Zufallsvaria-

blen unabhangig Poisson-verteilt sind. Berechnen Sie den Maximum-Likelihood-

Schatzer fur λ.

2.24 (a) Sei X eine Zufallsvariable mit Dichte f(x), fur x ∈ R und sei s ∈ R, wobei

s 6= 0. Finden Sie die Dichte der Zufallsvariablen Y = s ·X.

(b) Sei Y = s · X, fur s > 0, und sei X ∼ χ21. Weiters seien Y1, . . . , Yn i.i.d. Y .

Finden Sie den Maximum-Likelihood-Schatzer fur s.

2.25 (a) Eine Munze wird 20 mal geworfen und es wird gezahlt, wie oft sie auf”Kopf“

fallt. Sei p die Wahrscheinlichkeit, dass sie auf”Kopf“ fallt. Was ist dann die

log-Likelihood von p? Berechnen Sie den Maximum-Likelihood-Schatzer fur

p.

(b) Ein leicht abgeandertes Experiment: Eine Munze wird nun so lange geworfen

bis sie 10 mal auf”Kopf“ gefallen ist. Berechnen Sie die log-Likelihood von

p. Berechnen Sie den Maximum-Likelihood-Schatzer fur p.

Hinweis: Verwenden Sie die negative Binomialverteilung (siehe http://en.

wikipedia.org/wiki/Negative_binomial)

2.26 In einer Schachtel befinden sich 6 Kugeln, die entweder weiß oder rot sind. Die

Anzahl θ der roten Kugeln ist unbekannt (θ=0, 1, 2, 3, 4, 5 oder 6). Ein Statistiker

zieht mit Zurucklegen 4 Kugeln aus der Urne und erhalt folgendes Ergebnis: rot,

rot, weiß, rot.

(a) Wie groß ist die Wahrscheinlichkeit dieses Ereignisses, wenn θ = 2 ist?

(b) Wie lautet die Likelihoodfunktion fur θ aufgrund dieses Ergebnisses?

(c) Berechnen Sie den Maximum-Likelihood-Schatzer fur θ.

2.27 Es sei X hypergeometrisch verteilt mit Parameter N , M und n. Hier bezeichnet

N die Anzahl der Elemente in der Grundgesamtheit, M die Anzahl der Elemente

in der Grundgesamtheit mit einer bestimmten Eigenschaft und n die Anzahl der

Elemente in der Stichprobe. Was ist der Maximum-Likelihood-Schatzer fur M?

Hinweis: Betrachten Sie den Quotienten der Likelihood an den Stellen M und

M + 1, i.e., L(M)/L(M + 1).

Page 14: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 14

2.28 Angenommen X1, . . . , Xn seien i.i.d. mit Dichte

fθ0(x) =

exp(−|x− θ0|) falls x ≥ θ0

0 sonst,

wobei θ0 ∈ R. Leiten Sie den Maximum-Likelihood-Schatzer her.

2.29 Angenommen X1, . . . , Xn seien i.i.d. mit Dichte

fθ0(x) =1

2exp(−|x− θ0|)

wobei θ0 ∈ R. Leiten Sie den Maximum-Likelihood-Schatzer her. (Hinweis:∑n

i=1 |xi−θ| wird minimiert fur θ = m, wobei m ein Stichproben-Median ist.)

2.30 In dieser Aufgabe wird die Cramer-Rao-Schranke fur diskrete Verteilungen herge-

leitet. Betrachten Sie eine diskret verteilte Zufallsvariable X mit Wertebereich

{ω1, ω2, . . . , ωd}, wobei d ≥ 2, und Wahrscheinlichkeitsfunktion p(x|θ0), wobei

θ0 ∈ Θ ⊆ R. Die Fisher-Information des Modells ist hier gegeben durch

I(θ0) := Eθ0

[(d

dθlog(p(X|θ0))

)2]

=

d∑i=1

p(ωi|θ0)(d

dθlog(p(ωi|θ0))

)2

.

Seien nunX1, . . . , Xn i.i.d. Zufallsvariablen mit Wahrscheinlichkeitsfunktion p(x|θ0)und θ0 ∈ Θ ⊆ R. Wir wollen zeigen, dass fur jeden unverzerrten Schatzer θ fur θ0

die Cramer-Rao-Ungleichung

Varθ0(θ) ≥ (nI(θ0))−1 (1)

gilt. Beweisen Sie dazu, mit der Bezeichnung Z =∑n

i=1ddθ log p(xi|θ0), die Aussa-

gen:

(a) Covθ0(θ, Z)2 ≤ Varθ0(θ)Varθ0(Z),

(b) Varθ0(Z) = nI(θ0),

(c) Covθ0(θ, Z) = 1.

Angenommen der Wertebereich {ω1, ω2, . . .} sei (abzahlbar) unendlich. Kann man

unter zusatzlichen Glattheitsbedingungen an die Wahrscheinlichkeitsfunktion p(x|θ0)ein ahnliches Argument wie fur den endlichen Fall anwenden? Ist θ ein effizienter

Schatzer fur θ?

Page 15: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 15

2.31 Sei X1, . . . , Xn eine i.i.d. Stichprobe aus einer Cauchy-Verteilung mit Lokations-

parameter l ∈ R und Skalenparameter s > 0. Die Dichte ist gegeben durch

fl,s(x) = 1/(πs(1 + ((x− l)/s)2)) fur x ∈ R.

(a) Welche Gleichungen erfullen die Maximum-Likelihood-Schatzer? Ist es moglich

diese Gleichungen explizit zu losen, d.h., konnen Sie explizite Formeln fur die

Maximum-Likelihood-Schatzer angeben?

(b) Kann man die Parameter auch mit der Momentenmethode schatzen?

2.32 (a) Der Datensatz cauchy.txt enthalt eine i.i.d. Stichprobe der Große 50, wobei

die zugrundeliegende Verteilung eine Cauchy Verteilung ist. Berechnen Sie

die Maximum-Likelihood-Schatzer fur den Datensatz cauchy.txt. (Hinweis:

Verwenden Sie dazu beispielsweise die Funktion fitdistr aus der library

MASS.)

(b) Untersuchen Sie weiters das Verhalten des Maximum-Likelihood-Schatzers fur

den Lokationsparameter einer Cauchy Verteilung fur Stichproben der Große

10: Simulieren Sie dazu die Verteilung des Maximum-Likelihood-Schatzers

unter der Annahme, dass der zugrundeliegende Lokationsparameter 1 und

der zugrundeliegende Skalenparameter 2 ist. (Hinweis: Falls Sie die Funk-

tion fitdistr aus der MASS-library verwenden, um den MLE zu berech-

nen, benutzen Sie den Befehl fitdistr(s, "cauchy")$estimate[1] um den

geschatztschatzeen Lokationsparameter zu erhalten - hier bezeichnet s die

Stichprobe.)

2.33 Angenommen X1, . . . , Xn sind i.i.d. gleichverteilt auf [0, θ] mit θ > 0.

(a) Leiten Sie den Maximum-Likelihood-Schatzer fur θ her. Bestimmen Sie zusatzlich

dessen Dichte und berechnen Sie den Erwartungswert und die Varianz des

Maximum-Likelihood-Schatzers. Vergleichen Sie diese Resultate mit dem Mo-

mentenschatzer fur θ (vgl. Beispiel 2.1).

(b) Finden Sie eine erwartungstreue Modifikation des Maximum-Likelihood-Schatzers.

2.34 Es seien X1, . . . , Xn i.i.d. Poisson-verteilt mit Parameter λ > 0. Leiten Sie den

Maximum Likelihood Schatzer fur λ her. Ist dieser effizient?

2.35 Es seien X1, . . . , Xn i.i.d. geometrisch verteilt mit Parameter p ∈ (0, 1). Leiten Sie

den Maximum Likelihood Schatzer fur p her. Berechnen Sie die Fisher-Information

Page 16: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 16

in diesem Modell. Konnen Sie mit der Cramer-Rao Schranke feststellen, ob der

Schatzer effizient ist?

2.36 Es seien X1, . . . , Xn i.i.d. Pareto-verteilt mit Parameter θ > 1 und x0 > 0. Die

Dichte ist gegeben durch:

fθ,x0(x) =

θ xθ0 x−θ−1 fur x ≥ x0

0 sonst.

Die Pareto-Verteilung wird oft verwendet, um Einkommensdaten zu modellieren,

da die Dichte nicht so schnell abfallt. Nehmen Sie an, dass x0 > 0 bekannt ist.

(a) Finden Sie einen Schatzer fur θ mit der Momentenmethode.

(b) Leiten Sie den Maximum Likelihood Schatzer θML fur θ her.

(c) Bestimmen Sie die Varianz der asymptotischen Verteilung von√n(θML − θ).

2.37 Es seien X1, . . . , Xn i.i.d. Rayleigh-verteilt mit Parameter θ > 0. Die Dichte ist

gegeben durch

fθ(x) =

xθ2

e−x2/(2θ2) fur x ≥ 0

0 sonst.

(a) Finden Sie einen Schatzer fur θ mit der Momentenmethode.

(b) Leiten Sie den Maximum Likelihood Schatzer θML fur θ her.

(c) Bestimmen Sie die Varianz der asymptotischen Verteilung von√n(θML − θ).

2.38 Die folgende Tabelle (siehe Fisher, 1958) zeigt Daten von Keimlingen, die Nach-

kommen von autogamen Heterozygoten sind. Jeder Keimling kann klassifiziert wer-

den als starke- oder zuckerhaltig und als grun oder weiß.

Typ Anzahl

starkehaltig und grun 1997

starkehaltig und weiß 906

zuckerhaltig und grun 904

zuckerhaltig und weiß 32

Aus der Genetik weiß man, dass die Zellenwahrscheinlichkeiten durch (2 + θ)/4,

(1− θ)/4, (1− θ)/4 und θ/4 mit θ ∈ (0, 1) gegeben sind.

Page 17: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 17

(a) Leiten Sie den Maximum Likelihood Schatzer θML fur θ her. Bestimmen Sie

weiters die Varianz der asymptotischen Verteilung von√n(θML − θ).

(b) Berechnen Sie basierend auf (a) ein approximatives 95% Konfidenzintervall

fur θ.

(c) Verwenden Sie den Bootstrap um die Standardabweichung des Maximum Li-

kelihood Schatzer zu approximieren und vergleichen Sie das Ergebnis mit dem

Ergebnis aus (a).

(d) Verwenden Sie den Bootstrap um ein approximatives Konfidenzintervall fur

θ zu finden und vergleichen Sie das Ergebnis mit dem Ergebnis aus (b).

2.39 Betrachten Sie im vorigen Beispiel zwei weitere Schatzer, namlich

θ1 =4X1

n− 2, θ2 =

4X4

n,

wobei X1 und X4 die Haufigkeiten in der ersten bzw. vierten Zeile sind. Berechnen

Sie diese beiden Schatzer. Verwenden Sie, dass X1 und X4 binomialverteilte Zu-

fallsvariable sind, um zu zeigen, dass beide Schatzer unverzerrt sind. Bestimmen

Sie deren Varianzen. Verwenden Sie Beispiel 2.38 (a) um die Varianz von θML ge-

eignet zu approximieren. Vergleichen Sie diese Approximation mit den Varianzen

von θ1 und θ2.

2.40 Seien X1, . . . , Xni.i.d∼ X, wobei X einer Verteilung mit folgender Dichte folgt

f(x|θ) =

θ if x ∈ [0, α]

0 otherwise,

wobei θ > 0 und α = α(θ) nur von θ abhangt.

(a) Bestimmen Sie die Beziehung zwischen α und θ. Verwenden Sie, dass f(·|θ)eine Dichtefunktion ist.

(b) Berechnen Sie EX und VarX und schatzen Sie θ und α mittels Momen-

tenschatzern.

(c) Bestimmen Sie die approximative Verteilung von X (fur große n).

(d) Bestimmen Sie die approximative Verteilung Ihrer Momentenschatzer fur θ

und α (fur große n).

(e) Geben Sie ein ein approximatives (1 − γ) Konfidenzintervall fur θ an, wobei

0 < γ < 1.

Page 18: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 18

3 Testen von Hypothesen

3.1 Im Folgenden seien die Daten nach einer Normalverteilung mit Parametern µ und

σ2 generiert. Argumentieren Sie, ob man die Nullhypothese ablehnt oder nicht.

(a) H0 : µ = 120 versus H1 : µ < 120; y = 114.2, n = 25, σ = 18, α = 0.08

(b) H0 : µ = 42.9 versus H1 : µ 6= 42.9; y = 45.1, n = 16, σ = 3.2, α = 0.01

(c) H0 : µ = 14.2 versus H1 : µ > 14.2; y = 15.8, n = 9, σ = 4.1, α = 0.13

3.2 Der Gehalt an Calcium eines Mineralwassers (in mg/l) wird an 6 verschiedenen

Tagen ermittelt: 840 680 920 1000 750 850. Der Produzent behauptet, dass das

Mineralwasser einen mittleren Calciumgehalt von 1000 mg/l hat. Testen Sie diese

Hypothese gegen eine zweiseitige Alternative zum Niveau α = 0.05,

(a) wenn die Varianz nicht bekannt ist.

(b) wenn die Standardabweichung 200 mg/l betragt.

3.3 Es sei Y1, . . . , Y8 ein i.i.d. Sample einer Gleichverteilung auf dem Intervall [0, θ] mit

θ > 0. Mit Hilfe der Teststatistik

Ymax = max1≤i≤8

Yi

testet man die Hypothese H0 : θ = 2 gegen die Alternative H1 : θ < 2 zum

Signifikanzniveau α = 0.1.

(a) Bestimmen Sie die Dichtefunktion von Ymax.

(b) Bestimmen Sie den kritischen Wert κ, sodass unter der Nullhypothese P(Ymax <

κ) = α gilt.

(c) Was ist die Wahrscheinlichkeit, einen Fehler zweiter Art zu begehen, wenn

θ = 1.7?

3.4 Eine Munze wird 10 mal (unabhangig voneinander) geworfen. Angenommen Sie

wollen die Hypothese, dass die Wahrscheinlichkeit fur”Kopf“ 1/2 ist, gegen die

Alternative, dass diese ungleich 1/2 ist, testen. Der Test lehnt die Nullhypothese

ab, wenn entweder 0 oder 10 Kopfe vorkommen.

(a) Berechnen Sie das Signifikanzniveau dieses Tests.

Page 19: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 19

(b) Nehmen Sie an, dass die Wahrscheinlichkeit fur”Kopf“ 0.1 ist. Berechnen Sie

die Power dieses Tests.

3.5 Ein Test mit Signifikanzniveau α lehnt die Nullhypothese ab, wenn die Teststatistik

T strikt großer als t ist. Fur eine streng monoton steigende Funktion g(·) setzen

Sie S = g(T ). Hat der Test, der die Nullhypothese ablehnt, wenn S > g(t) ist,

Signifikanzniveau α?

3.6 Angenommen die Verteilung der Teststatistik T unter der Nullhypothese habe

Verteilungsfunktion F (·), wobei F (·) invertierbar ist, und angenommen ein Test

lehnt die Nullhypothese fur große Werte von T ab. Es sei V der p-Wert, d.h.,

V = 1− F (T ).

(a) Zeigen Sie, dass die Verteilung von V unter der Nullhypothese die Gleichver-

teilung auf [0, 1] ist.

(b) Berechnen Sie unter der Nullhypothese die Wahrscheinlichkeit, dass der p-

Wert großer als 0.1 ist.

(c) Welches Signifikanzniveau hat der Test, der ablehnt, wenn V < α ist?

3.7 Es wird vermutet, dass Menschen, die im Sterben liegen, ihren Tod bis kurz nach

einem wichtigen Ereignis, wie zum Beispiel einer Hochzeit oder einem Feiertag,

hinauszogern konnen. Philips und King (1988) analysierten dazu in den Jahren

1966 – 1984 Sterbemuster rund um das Passahfest, einem wichtigen judischen Fei-

ertag, in Kalifornien. Sie verglichen die Anzahl der Sterbefalle in der Woche vor

dem Passahfest (922) mit der Anzahl der Sterbefallen in der Woche nach dem

Passahfest (997) von insgesamt 1919 Menschen mit judischem Nachnamen. Wir

interpretieren die Anzahl vor und nach dem Passahfest als eine Tabelle mit zwei

Zellen. Falls kein Feiertagseffekt vorliegt, dann fallt ein Sterbefall mit Wahrschein-

lichkeit je 1/2 in eine der beiden Zellen. Um also zu zeigen, dass ein Feiertagseffekt

vorliegt, ist es notwendig zu zeigen, dass dieses einfache Modell nicht zu den Daten

passt. Formulieren Sie das als Testproblem und konstruieren Sie einen passenden

Test. Verwirft Ihr Test die Nullhypothese, dass kein Feiertagseffekt vorliegt? Wen-

den Sie den Test auch auf die Daten einer Gruppe von mannlichen Verstorbenen

mit chinesischen und japanischen Vorfahren an, von welchen 418 in der Woche

vor dem Passahfest und 434 in der Woche nach dem Passahfest verstorben sind.

Welche Relevanz hat die letztere Analyse fur die vorangegangene?

Page 20: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 20

3.8 Berechnen Sie die p-Werte in Beispiel 3.1.

3.9 In einer reprasentativen Umfrage fur ein Land wurde das monatliche Einkommen

von 240 Mannern und 160 Frauen erhoben. Das durchschnittliche Einkommen der

Manner lag in der Stichprobe bei 1650 EUR, jenes der Frauen bei 1280 EUR.

Die Stichprobenstandardabweichung der Einkommens betrug 270 EUR bei den

Mannern und 480 EUR bei den Frauen.

(a) Testen Sie, ob ein Einkommensunterschied zwischen Mannern und Frauen

besteht (α = 0.01).

(b) Fuhren Sie einen Test auf Varianzhomogenitat durch (α = 0.01).

(c) Diskutieren Sie inhaltlich, inwieweit fur diese Fragestellung ein Test auf einen

Mittelwertsunterschied sinnvoll ist.

3.10 Zur Untersuchung der Variabilitat der Starke (in t/cm2) von zwei Typen von Stahl-

seilen (Typ 1, Typ 2) ergaben sich folgende Werte n1 = 10, s21 = 19.2, n2 = 16,

s22 = 3.5. Weist der Unterschied in den Standardabweichungen auf eine hohere

Variabilitat des Typ 1 hin? (α = 0.01).

3.11 Angenommen X1, . . . , Xn sind i.i.d. Poisson-verteilte Zufallsvariablen mit Parame-

ter λ > 0, und Sie wollen fur zwei verschiedene vorgegebene Werte λ0 > 0 und

λ1 > 0 mit dem Likelihood-Ratio-Test die Hypothese

H0 : λ = λ0 gegen H1 : λ = λ1

testen. Zeigen Sie, dass im Fall λ1 < λ0 der Likelihood-Ratio-Test verwirft, falls

X klein ist, und dass im Fall λ1 > λ0 der Likelihood-Ratio-Test verwirft, falls X

groß ist.

3.12 Angenommen X1, . . . , Xn sind i.i.d. Poisson-verteilte Zufallsvariablen mit Parame-

ter λ > 0, und Sie wollen fur einen vorgegebenen Wert λ0 > 0 die Hypothese

H0 : λ = λ0 gegen H1 : λ < λ0

testen. Zeigen Sie, dass der Likelihood-Ratio-Test UMP (Uniformly-Most-Powerful)

ist.

3.13 Gegeben sei eine normalverteilte Grundgesamtheit mit σ = 4. Mittels z-Test soll

die Hypothese H0 : µ = 10 gegen H1 : µ 6= 10 auf einem Signifikanzniveau von

Page 21: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 21

α = 0.05 getestet werden. Genugt eine Zufallsstichprobe der Große n = 45, um

den Fehler zweiter Art unter 0.2 zu halten, wenn µ = 12 ?

3.14 Betrachten Sie eine Stichprobe der Große 1 aus einer Verteilung mit Dichte

fθ(y) =

(θ + 1)yθ, 0 ≤ y ≤ 1

0, sonst.

Falls y ≥ 0.9, dann verwirft man H0 : θ = 1 zugunsten von H1 : θ > 1. Berechnen

Sie das Signifikanzniveau des Tests.

3.15 In einem Betrieb verteilen sich die Krankenstande der letzten sechs Monate fol-

gendermaßen auf die Wochentage:

Mo Di Mi Do Fr

Anzahl 125 111 98 104 112

Testen Sie zum Niveau α = 0.05, ob die Krankenstande uber die Wochentage

gleichverteilt sind.

3.16 Einhundert ungeordnete Stichproben der Große 2 werden ohne Zurucklegen aus

einer Urne mit 6 roten und 4 weißen Ballen gezogen. Die Ergebnisse sind wie folgt

weiße Kugeln 0 1 2

Stichproben 35 55 10

Fuhren Sie einen Verteilungsanpassungstest fur die Hypergeometrische Verteilung

durch (α = 0.1).

3.17 Sie haben zwei verschiedene Dichten gegeben:

f0(x) =

1 fur 0 < x < 1

0 sonst,

sowie

f1(x) =

2x fur 0 < x < 1

0 sonst.

Page 22: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 22

Weiters haben Sie eine Beobachtung, die einer Verteilung mit Dichte f folgt. Sie

wollen die Hypothese

H0 : f = f0 gegen H1 : f = f1

testen. Wie hoch ist die hochste Power, die ein Test zum Signifikanzniveau α = 0.1

haben kann?

3.18 Seien X1, . . . , Xn i.i.d. mit Dichte fθ mit θ ∈ R. Zeigen Sie die folgenden Aussagen:

(a) Angenommen C(X1, . . . , Xn) = C ist eine Konfidenzmenge fur θ, sodass fur

ein α ∈ (0, 1) gilt

Pθ(θ ∈ C) = 1− α fur alle θ ∈ R.

Angenommen Sie wollen fur ein fixes θ0 ∈ R die Hypothese

H0 : θ = θ0 gegen H1 : θ 6= θ0

testen. Zeigen Sie, dass der Test, der die Nullhypothese verwirft, falls θ0 /∈ Cist, Signifikanzniveau α hat.

(b) Angenommen fur jedes θ0 ∈ R gibt es einen Test tθ0 mit Signifikanzniveau

α ∈ (0, 1) fur die Hypothese

H0 : θ = θ0 gegen H1 : θ 6= θ0.

Zeigen Sie, dass die Konfidenzmenge

C = C(X1, . . . , Xn) = {θ ∈ R : tθ verwirft nicht}

erfullt, dass

Pθ(θ ∈ C) = 1− α fur alle θ ∈ R.

3.19 Sind die folgenden Aussagen wahr oder falsch?

(a) Die LR-Statistik ist immer kleiner oder gleich 1.

(b) Wenn der p-Wert 0.03 ist, dann lehnt der entsprechende Test mit Signifikanz-

niveau 0.02 ab.

(c) Wenn ein Test auf dem Signifikanzniveau 0.06 die Nullhypothese verwirft,

dann ist der p-Wert kleiner oder gleich 0.06.

(d) Der p-Wert ist die Wahrscheinlichkeit, dass die Nullhypothese wahr ist.

Page 23: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 23

(e) Testet man simple Hypothesen mittels LR-Test, dann ist der p-Wert gleich

der LR-Statistik.

(f) Wenn die Teststatistik des Chiquadrat-Tests mit 4 Freiheitsgraden den Wert

8.5 hat, dann ist der p-Wert kleiner als 0.05.

3.20 Es seien X1, . . . , Xn i.i.d. exponentialverteilt mit Parameter λ. Leiten Sie den LR-

Test fur die Nullhypothese H0 : λ = λ0 und die Alternative H1 : λ 6= λ0 her. Zeigen

Sie, dass der Verwerfungsbereich von der Form {X exp(−λ0X) ≤ c} ist.

3.21 In einer klassischen Studie zur Genetik von Geissler (1889) wurde das Geschlechter-

verhaltnis untersucht. Die folgende Tabelle zeigt die Anzahl der mannlichen Kinder

in 6115 Familien mit je 12 Kindern. Die Daten wurden aus Krankenhausakten in

Sachsen gewonnen. Nehmen Sie an, dass das Geschlecht eines Kindes nicht das

Geschlecht der zukunftigen Geschwister beeinflusst und, dass die Wahrscheinlich-

keit eines mannlichen Kindes konstant uber die Zeit ist. Unter diesen Annahmen

ist die Anzahl der mannlichen Nachkommen in einer Familie mit 12 Kindern bino-

mialverteilt mit Parameter 12 und unbekannter Erfolgswahrscheinlichkeit p. Wenn

die Wahrscheinlichkeit eines mannlichen Nachkommens fur alle Familien gleich ist,

dann enthalt die nachfolgende Tabelle die Realisierungen von 6115 binomialverteil-

ten Zufallsvariablen. Testen Sie, ob die Daten mit diesem Modell ubereinstimmen.

Anzahl Haufigkeit Anzahl Haufigkeit

0 7 7 1033

1 45 8 670

2 181 9 286

3 478 10 104

4 829 11 24

5 1112 12 3

6 1343

3.22 Gegeben sind 600 Beobachtungen, die man folgendermaßen zusammenfassen kann:

Intervall (−∞,−1) (-1,-0.5) (-0.5, 0) (0, 0.5) (0.5, 1) (1,∞)

Haufigkeit 93 96 115 107 88 101

Uberprufen Sie auf einem Signifikanzniveau von α = 0.01 die Hypothese, dass die

Beobachtungen aus einer Standardnormalverteilung stammen

Page 24: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 24

(a) mittels LR-Test,

(b) mittels Chiquadrat-Anpassungstest.

3.23 Es seien X1, . . . , Xm unabhangig und binomialverteilt mit Parameter ni und pi.

Leiten Sie den LR-Test fur die Nullhypothese

H0 : p1 = p2 = . . . = pm

gegen die Alternative, dass nicht alle pi gleich sind, her. Welche Grenzverteilung

hat die Teststatistik?

3.24 Es seien X1, . . . , Xn i.i.d. mit Verteilungsfunktion F und Y1, . . . , Ym i.i.d. mit Ver-

teilungsfunktion G. Weiters seien die Xi’s von den Yi’s unabhangig. Sie wollen die

Nullhypothese H0 : F = G testen. Nehmen Sie an, dass m+n gerade ist, sodass in

der kombinierten Stichprobe genau (m + n)/2 Beobachtungen kleiner oder gleich

dem Median und (m + n)/2 Beobachtungen großer als der Median sind. Nehmen

Sie weiters an, dass sowohl F als auch G stetig sind, sodass mit Wahrscheinlichkeit

1 alle Beobachtungen verschieden sind.

(a) Betrachten Sie die Teststatistik T , die zahlt, wie viele Xi’s kleiner oder gleich

dem Median der kombinierten Stichprobe sind. Zeigen Sie, dass die Teststa-

tistik unter der Nullhypothese hypergeometrisch verteilt ist, d.h., zeigen Sie

dass

P (T = k) =

((m+n)/2k

)((m+n)/2n−k

)(m+nn

) .

Konstruieren Sie einen Test.

(b) Eine Studie von McCool (1979) vergleicht die Leistung von Kugellagern ver-

schiedenen Typs. Dazu wurden jeweils 10 Kugellager zweier Typen untersucht

und es wurde festgestellt, nach wie vielen Umdrehungen das Kugellager bricht

(in Millionen); siehe bearings.txt. Verwenden Sie obigen Test, um die Null-

hypothese, dass es keinen Unterschied zwischen den beiden Kugellagern gibt,

zu testen.

3.25 In einer Grundgesamtheit sei ein Merkmal normalverteilt mit unbekanntem Erwar-

tungswert µ und bekannter Varianz σ2 = 2500. Es soll die Hypothese H0 : µ = 100

gegen H1 : µ 6= 100 getestet werden, wobei der Umfang der Stichprobe bei n = 100

liegt.

Page 25: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 25

(a) Bestimmen Sie den Annahmebereich fur H0 (α = 0.05).

(b) Berechnen Sie die Wahrscheinlichkeit eines Fehlers zweiter Art unter der An-

nahme, dass der unbekannte Erwartungswert µ gleich (i) 105, (ii) 110 und

(iii) 115 ist.

(c) Erstellen Sie eine Skizze der Power des Tests als Funktion von µ.

3.26 Der Soziologe Max Weber fuhrt in dem Aufsatz”Zur Psychophysik der industriellen

Arbeit“ folgende Verteilung der Arbeitsunfalle mannlicher Arbeiter in Kopenhagen

1898-1907 dar:

Wochentag Mo Di Mi Do Fr Sa

Anzahl 50 46 34 34 33 43

(a) Die hohen Frequenzen am Samstag und Montag halt Weber fur eine Folge

des Alkohols (Freitag ist Lohnungstag) bzw. fur eine Folge großerer gesund-

heitlicher Strapazen am Wochenende. Testen Sie auf eine Gleichverteilung

(α = 0.01).

(b) Vorausgesetzt, die Stichprobe ware zehnmal so groß wie oben und die Vertei-

lung sahe wie folgt aus:

Wochentag Mo Di Mi Do Fr Sa

Anzahl 500 460 340 340 330 430

Testen Sie wie unter (a).

(c) Vergleichen Sie die gefundenen Ergebnisse miteinander und kommentieren Sie

diese.

3.27 Testen Sie mittels eines Verteilungsanpassungstests auf dem Signifikanzniveau α =

0.05, ob folgende Daten aus einer Exponentialverteilung mit Parameter λ stammen.

Page 26: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 26

x Beobachtungen

0 ≤ x ≤ 1 83

1 < x ≤ 2 57

2 < x ≤ 3 28

3 < x ≤ 4 17

4 < x ≤ 5 10

5 < x ≤ 6 4

6 < x ≤ 7 3

7 < x ≤ 8 4

8 < x <∞ 5

3.28 Das National Center for Health Statistics (1970) stellte die untenstehenden mo-

natlichen Daten zur Verteilung von Suiziden in den Vereinigten Staten im Jahr

1970 zur Verfugung. Gibt es Anzeichen dafur, dass die Suizidrate saisonal variiert,

oder sind die Daten mit der Hypothese einer konstanten Rate konsistent?

Hinweis: Unter der Hypothese einer konstanten Rate kuonnen Sie die Anzahl

an Suiziden pro Monat als multinomialverteilte Zufallsvariable mit den passen-

den Wahrscheinlichkeiten modellieren, und einen Anpassungstest durchfuhren. Be-

trachten Sie eventuell auch die Vorzeichen von Oi−Ei, und stellen Sie fest, ob ein

Muster vorhanden ist.

Monat Selbstmorde Tage/Monat

Jan 1867 31

Feb 1789 28

Mar 1944 31

Apr 2094 30

Mai 2097 31

Jun 1981 30

Jul 1887 31

Aug 2024 31

Sep 1928 30

Okt 2032 31

Nov 1978 30

Dez 1859 31

3.29 Eine Zufallsvariable X ist lognormalverteilt, falls Y = log(X) normalverteilt ist.

Page 27: UE Einfuhrung in die Inferenzstatistik - univie.ac.at · 2017-05-10 · UE Einfuhrung in die Inferenzstatistik Beispielsammlung 0 Einf uhrung und Wiederholung 0.1Betrachten Sie das

Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 27

(a) Bestimmen Sie die Dichtefunktion einer lognormalverteilten Zufallsvariable.

(b) Finden Sie heraus, ob die Lognormalverteilung auf die Daten octopods.txt

(Ruckenwirbellangen von taxonomisch unterschiedlichen Achtfußlern gemes-

sen in Millimetern, Robson 1929) passt.

3.30 In der Vorlesung wurde der Uberdispersionstest fur poissonverteilte Zufallsvaria-

blen besprochen. Nehmen Sie nun an, dass X1, . . . , Xn unabhangig poissonverteilte

Zufallsvariablen sind mit Parameter λi > 0 fur i = 1, . . . , n. Seien weiters l1, . . . , ln

positive und bekannte reelle Zahlen.

(a) Bestimmen Sie den LR-Test fur die Hypothese

H0 :λ1l1

= . . . =λnln

gegen H1 :λili6= λj

ljfur zumindest ein Paar i 6= j.

(b) Im Datensatz gamma-ray.txt finden Sie Schatzer 100 aufeinander folgende

Zeitintervalle (in Sekunden) die Anzahl an Gammastrahlen, die in 100 ver-

schiedenen Bereichen des Himmels gemessen wurden. Nehmen Sie an, dass die

Anzahl an emittierten Gammastrahlen in den 100 Bereichen unabhangig von-

einander und poissonverteilt sind. Testen Sie mit dem von Ihnen hergeleiteten

Test die Hypothese, dass die Emissionsraten (erwartete Anzahl an Emissio-

nen pro Sekunde) in den unterschiedlichen Bereichen des Himmels gleich sind.

Beachten Sie hierbei, dass die Zeitintervalle unterschiedlich lange sind.