46
TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

Embed Size (px)

Citation preview

Page 1: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

TUTORIUM STATISTIK II

1

Philipp Schäpers

Mi. 10.15 – 11.45R. 025

Übung IV

09.05.2012

Inferenzstatistik

Page 2: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

2

Organisatorisches

[email protected]

Sprechstunde Herr Gediga Nach Vereinbarung per E- Mail

Folien im Learnweb

! Jede Frage ist eine gute Frage!

Page 3: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

3

Aufgaben

Aufgabe 1

Aufgabe 2

Aufgabe 3

Page 4: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

4

Aufgabe 1

Sie haben eine Untersuchung mit einer (Zufalls-)Stichprobe vom Umfang n = 29 Personen im Alter über 65 durchgeführt. Sie interessieren sich für die Gedächtnisleistungen der Personenin einem entsprechenden Test. Auf Basis der Ergebnisse vielerUntersuchungen mit diesem Test an Stichproben aus dem gleichen Altersbereich wissen Sie, dass die Annahme einer Normalverteilung in der Grundgesamtheit gerechtfertigtist. Sie haben für die vorliegende Stichprobe einen Mittelwert von MW = 31 und eine Varianz von s^2 = 39.0625berechnet.

Page 5: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

5

Aufgabe 1

a) Bestimmen Sie ein (zweiseitiges) 95%-Konfidenzintervall für .

Page 6: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

6

Konfidenzintervall

Liefern eine Antwort darauf in welchem Wertebereich, der (wahre) Parameter mit einer hohen Wahrscheinlichkeit liegt

Die Wahrscheinlichkeit, mit der ein Konfidenzintervall den zu schätzenden Parameter enthält, wird Sicherheitswahrscheinlichkeit, Überdeckungs- oder Vertrauenswahrscheinlichkeit genannt und allgemein mit 1 - bezeichnet

Die Wahrscheinlichkeit für das Komplementärereignis, dass das Intervall den Parameter nicht enthält, heißt Irrtumswahrscheinlichkeit und wird durch symbolisiert

Page 7: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

7

Konfidenzintervall

Der zu schätzende unbekannte Parameter liegt dabei fest

Für zwei verschiedene Stichproben aus der gleichen Population ergeben sich i.d.R. unterschiedliche Konfidenzintervalle

„Die Grundidee dabei besteht darin, nicht eine einzige Zahl alsSchätzung für den Parameter anzugeben sondern einen ganzenWertebereich, in dem der Parameter mit einer hohenWahrscheinlichkeit liegt“

Page 8: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

8

Konfidenzintervall

Page 9: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

9

Konfidenzintervall

Page 10: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

10

Konfidenzintervall

Man unterscheidet zwischen ein- und zweiseitigen Konfidenzintervallen:

Zweiseitiges Konfidenzintervall„Alkoholkonsum verändert die Reaktionszeit im Straßenverkehr (die Reaktionszeit könnte sich verschlechtern oder aber auch verbessern)

Einseitiges Konfindenzintervall„Alkoholkonsum verschlechtert die Reaktionszeit im Straßenverkehr“

Page 11: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

11

Konfidenzintervall

Konfidenzintervall für bei Normalverteilung und bekannter Varianz 2

Page 12: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

12

Konfidenzintervall

Die Länge eines Konfidenzintervalls für einen bestimmten Schätzer hängt von zwei Größen ab der Sicherheitswahrscheinlichkeit dem Standardfehler der

StichprobenverteilungJe höher die Irrtumswahrscheinlichkeit, umso schmaler das Konfidenzintervall.

Page 13: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

13

Aufgabe 1

Page 14: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

14

Aufgabe 1

a) Bestimmen Sie ein (zweiseitiges) 95%-Konfidenzintervall für .

Page 15: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

15

Aufgabe 1

b) Bestimmen Sie bei einer Fehlerwahrscheinlichkeit von 5% einKonfidenzintervall für

Konfidenzintervall für 2 bei Normalverteilung

Page 16: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

16

Aufgabe 1

Untere Grenze:

Obere Grenze

-> Unpräzise Varianzschätzung

Page 17: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

17

Aufgabe 1

c) Welche Möglichkeiten sehen Sie, die Fehlerspanne bei Teilaufgabe b) zu verringern ?

Erhöhung der Fehlerwahrscheinlichkeit Erhöhung der Stichprobengröße

Da es im Falle der Bestimmung von Konfidenzintervallen für 2 keine weiteren Einflussgrößen gibt, liegt bei konstant gehaltener Vertrauenswahrscheinlichkeit eine Erhöhung der Stichprobengröße nahe

Page 18: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

18

Aufgabe 1

Erneute Untersuchung bei der man aber mit dem Ergebnis aus a) für die Fehlerspanne unzufrieden ist.

Man möchte eine präzisere Schätzung vornehmen und fragt sich wie viele Personen untersucht werden müssen, wenn

Page 19: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

19

Aufgabe 1

1) man begründet annehmen könne, dass die Populationsvarianz = 36 betrage

2) man eine Fehlerwahrscheinlichkeit von = .01 zu akzeptieren bereit ist und

3) die angezielte Fehlerspanne 3 betragen soll

Page 20: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

20

Aufgabe 1

Stichprobenumfang bei gegebener Fehlerspanne m

Page 21: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

21

Aufgabe 2

An einer großen Universität wird eine Zufallsstichprobe von Studenten befragt, um den Anteil derjenigen Studenten zu bestimmen, die ein eigenes Auto besitzen

Page 22: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

22

Aufgabe 2

a) Bestimmen Sie unter der Annahme, dass 66% der Studenten in der Stichprobe ein eigenes Auto besitzen, je ein .95-Kondenzintervall für eine Stichprobengröße von 50, 100 und 400 Studenten

Page 23: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

23

Aufgabe 2

a) Bestimmen Sie unter der Annahme, dass 66% der Studenten in der Stichprobe ein eigenes Auto besitzen, je ein .95-Kondenzintervall für eine Stichprobengröße von 50, 100 und 400 Studenten

Mögliche Ausprägung der Variable „Eigenes Auto“ [Y] ? Hat ein Auto (Erfolg) Hat kein Auto (Misserfolg)Bernoulli Variable

Page 24: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

24

Aufgabe 2

p = Erfolgswahrscheinlichkeit (Besitz eines Autos)q= Gegenwahrscheinlichkeit

Page 25: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

25

Aufgabe 2

n Untere Grenze

Obere Grenze

50 .53 .79100 .5672 .7528400 .6136 .7064

Page 26: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

26

Aufgabe 2

b) Erklären Sie, warum die berechneten Konfidenzintervalle unterschiedlich groß ausfallen

Page 27: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

27

Aufgabe 2

Wovon hängt die Breite des Konfidenzintervalls ab ?

Vertrauens- Fehlerwahrscheinlichkeit (Ist hier konstant gehalten

Von der StichprobengrößeJe größer die Stichprobe, desto kleiner das Intervall

Page 28: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

28

Aufgabe 2

c) Bestimmen Sie zusätzlich ein .95-Kondenzintervall unter der Annahme, dass 81% ein Auto besitzen und die Stichprobengröße 50 beträgt.

Page 29: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

29

Aufgabe 2

p = 0.81n = 50

Page 30: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

30

Aufgabe 3

Nach einer Verhaltenstherapie ist bei 35 von 100 Schülern eine deutliche Reduktion der Prüfungsangst zu verzeichnen. Berechnen Sie das einseitige Konfidenzintervall, um den Anspruch der Therapeuten zu überprüfen, bei mindestens einem Drittel der Schüler eine deutliche Reduktion der Prüfungsangst zu erzielen. Berechnen Sie zusätzlich das zweiseitige Konfidenzintervall.

Page 31: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

31

Aufgabe 3

Nutzen Sie jeweils die klassischen Konfidenzbänder auf der Basis der Varianzschätzung.

Page 32: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

32

Aufgabe 3

Nach welchem Konfidenzintervall ist gesucht ? Es ist nach einem Konfidenzintervall für

p gesucht

Einseitiges Konfidenzintervall

Page 33: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

33

Aufgabe 3

Damit ergeben sich für das einseitige Intervall die Grenzen [.2718, ).

Der Anspruch, dass mindestens einem Drittel der Schüler durch die Angsttherapie geholfen wurde, kann durch das berechnete Intervall nicht bestätigt werden, da die untere Grenze unterhalb des Parameters p = 1/ 3 liegt.

Page 34: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

34

Aufgabe 3

Page 35: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

35

Aufgabe 3

Für das zweiseitige Intervall ergeben sich also folgende Grenzen [.257, .4435]. Dieses Intervall überdeckt also mit einer Vertrauenswahrscheinlichkeit von 95 Prozent den Parameter p.

Die Hypothese des Therapeuten, bei mindestens einem Drittel der Schüler eine deutliche Reduktion der Prüfungsangst erzielt zu haben, kann also in beiden Fällen nicht bestätigt werden.

Page 36: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

36

MC

Konfidenzintervalle überdecken mit einer Fehlerwahrscheinlichkeit von den interessierenden Populationsparameter nicht.

Ein Konfidenzintervall mit einer Vertrauenswahrscheinlichkeit von .70 ist unter sonst gleichen Bedingungen) breiter als ein Konfidenzintervall mit 1 - = .80

Zur Bestimmung von Konfidenzintervallen sind schiefe Stichprobenverteilungen ungeeignet.

Page 37: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

37

MC

Der zu schätzende Parameter ist eine Zufallsvariable

Bei unbekannter Stichprobenverteilung und unbekannter Varianz können nur approximative Konfidenzintervalle für bestimmt werden.

Bei einer Normalverteilung des Merkmals in der Population kann durch geeignete Wahl der Stichprobengröße jede beliebige Präzision einer Schätzung erreicht werden.

Page 38: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

38

MC

Durch Verringerung der Vertrauenswahrscheinlichkeit 1- bei festem n, verbreitert sich das Konfidenzintervall

Die Vertrauenswahrscheinlichkeit kann bei Konfidenzintervallen für nicht frei gewählt werden.

Der wahre Parameter liegt mit der Vertrauenswahrscheinlichkeit 1- in den Grenzen des entsprechenden Konfidenzintervalls

Page 39: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

39

MC

Bei Schätzung von und gegebener Vertrauenswahrscheinlichkeit hängt die Länge des Intervalls nur vom Standardfehler ab

Bei Verwendung der t-Verteilung ergeben sich unter sonst gleichen Bedingungen im Vergleich zur Verwendung der Normalverteilung größere Konfidenzintervalle.

Ein .95 Konfidenzintervall überdeckt den wahren Populationsparameter nicht immer

Page 40: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

40

MC

Bei Konfidenzintervallen steigt die Präzision möglicher Aussagen bezüglich des interessierenden Populationsparameters mit einer höheren Sicherheitswahrscheinlichkeit

Die Fehlerspanne von Konfidenzintervallen für verringert sich, je kleiner ist.

Große Stichproben führen in aller Regel zu breiteren Konfidenzintervallen als kleine Stichproben.

Page 41: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

41

MC

Die Voraussetzung normal verteilter i.i.d. Zufallsvariablen ist bei Konfidenzintervallen ab n > 30 grundsätzlich zu vernachlässigen

Die Konfidenzintervalle, die mit Hilfe des Schätzers für den Erwartungswert bestimmt werden, folgen der Form Schätzung ± Fehlerspanne

Im Falle von t-Konfidenzintervallen (Fall 2) oder approximativen Konfidenzintervallen (Fall 3) für den Erwartungswert ergeben sich im Vergleich zu z-Konfidenzintervallen (Fall 1) in aller Regel breitere Intervalle.

Page 42: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

42

MC

Durch den zentralen Grenzwertsatz ist gewährleistet, dass auch bei unbekannter Varianz und Verteilung die Standardnormalverteilung zur Bestimmung der Grenzen eines Konfidenzintervalls verwendet werden kann, wenn n > 20 ist

Bei der Bestimmung eines Konfidenzintervalls für den Erwartungswert bei bekannter Varianz und festem n hängt die Größe des Intervalls nicht von den Eigenschaften der Daten ab.

Page 43: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

43

MC

Bei der Bestimmung eines Konfidenzintervalls für die Varianz verwenden wir als Punktschätzer für den Parameter in aller Regel 1/n *(Summe der Abweichungsquadrate)

Die Summe von -Verteilungen ist wieder -verteilt

Page 44: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

44

Page 45: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

45

MC

Die Grenzen eines Konfidenzintervalls für die Varianz werden mit Hilfe der t-Verteilung bestimmt

Bei der Bestimmung eines Konfidenzintervalls für die Varianz müssen die Zufallsvariablen Y1,…..,Yn nicht normalverteilt sein.

Page 46: TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012 Inferenzstatistik

46

Vielen Dank für Eure Aufmerksamkeit!

Bis zur nächsten Woche...