TUTORIUM STATISTIK II 1 Philipp Schäpers Mi. 10.15 – 11.45 R. 025 Übung IV 09.05.2012...

Preview:

Citation preview

TUTORIUM STATISTIK II

1

Philipp Schäpers

Mi. 10.15 – 11.45R. 025

Übung IV

09.05.2012

Inferenzstatistik

2

Organisatorisches

phili-Schaepers@web.de

Sprechstunde Herr Gediga Nach Vereinbarung per E- Mail

Folien im Learnweb

! Jede Frage ist eine gute Frage!

3

Aufgaben

Aufgabe 1

Aufgabe 2

Aufgabe 3

4

Aufgabe 1

Sie haben eine Untersuchung mit einer (Zufalls-)Stichprobe vom Umfang n = 29 Personen im Alter über 65 durchgeführt. Sie interessieren sich für die Gedächtnisleistungen der Personenin einem entsprechenden Test. Auf Basis der Ergebnisse vielerUntersuchungen mit diesem Test an Stichproben aus dem gleichen Altersbereich wissen Sie, dass die Annahme einer Normalverteilung in der Grundgesamtheit gerechtfertigtist. Sie haben für die vorliegende Stichprobe einen Mittelwert von MW = 31 und eine Varianz von s^2 = 39.0625berechnet.

5

Aufgabe 1

a) Bestimmen Sie ein (zweiseitiges) 95%-Konfidenzintervall für .

6

Konfidenzintervall

Liefern eine Antwort darauf in welchem Wertebereich, der (wahre) Parameter mit einer hohen Wahrscheinlichkeit liegt

Die Wahrscheinlichkeit, mit der ein Konfidenzintervall den zu schätzenden Parameter enthält, wird Sicherheitswahrscheinlichkeit, Überdeckungs- oder Vertrauenswahrscheinlichkeit genannt und allgemein mit 1 - bezeichnet

Die Wahrscheinlichkeit für das Komplementärereignis, dass das Intervall den Parameter nicht enthält, heißt Irrtumswahrscheinlichkeit und wird durch symbolisiert

7

Konfidenzintervall

Der zu schätzende unbekannte Parameter liegt dabei fest

Für zwei verschiedene Stichproben aus der gleichen Population ergeben sich i.d.R. unterschiedliche Konfidenzintervalle

„Die Grundidee dabei besteht darin, nicht eine einzige Zahl alsSchätzung für den Parameter anzugeben sondern einen ganzenWertebereich, in dem der Parameter mit einer hohenWahrscheinlichkeit liegt“

8

Konfidenzintervall

9

Konfidenzintervall

10

Konfidenzintervall

Man unterscheidet zwischen ein- und zweiseitigen Konfidenzintervallen:

Zweiseitiges Konfidenzintervall„Alkoholkonsum verändert die Reaktionszeit im Straßenverkehr (die Reaktionszeit könnte sich verschlechtern oder aber auch verbessern)

Einseitiges Konfindenzintervall„Alkoholkonsum verschlechtert die Reaktionszeit im Straßenverkehr“

11

Konfidenzintervall

Konfidenzintervall für bei Normalverteilung und bekannter Varianz 2

12

Konfidenzintervall

Die Länge eines Konfidenzintervalls für einen bestimmten Schätzer hängt von zwei Größen ab der Sicherheitswahrscheinlichkeit dem Standardfehler der

StichprobenverteilungJe höher die Irrtumswahrscheinlichkeit, umso schmaler das Konfidenzintervall.

13

Aufgabe 1

14

Aufgabe 1

a) Bestimmen Sie ein (zweiseitiges) 95%-Konfidenzintervall für .

15

Aufgabe 1

b) Bestimmen Sie bei einer Fehlerwahrscheinlichkeit von 5% einKonfidenzintervall für

Konfidenzintervall für 2 bei Normalverteilung

16

Aufgabe 1

Untere Grenze:

Obere Grenze

-> Unpräzise Varianzschätzung

17

Aufgabe 1

c) Welche Möglichkeiten sehen Sie, die Fehlerspanne bei Teilaufgabe b) zu verringern ?

Erhöhung der Fehlerwahrscheinlichkeit Erhöhung der Stichprobengröße

Da es im Falle der Bestimmung von Konfidenzintervallen für 2 keine weiteren Einflussgrößen gibt, liegt bei konstant gehaltener Vertrauenswahrscheinlichkeit eine Erhöhung der Stichprobengröße nahe

18

Aufgabe 1

Erneute Untersuchung bei der man aber mit dem Ergebnis aus a) für die Fehlerspanne unzufrieden ist.

Man möchte eine präzisere Schätzung vornehmen und fragt sich wie viele Personen untersucht werden müssen, wenn

19

Aufgabe 1

1) man begründet annehmen könne, dass die Populationsvarianz = 36 betrage

2) man eine Fehlerwahrscheinlichkeit von = .01 zu akzeptieren bereit ist und

3) die angezielte Fehlerspanne 3 betragen soll

20

Aufgabe 1

Stichprobenumfang bei gegebener Fehlerspanne m

21

Aufgabe 2

An einer großen Universität wird eine Zufallsstichprobe von Studenten befragt, um den Anteil derjenigen Studenten zu bestimmen, die ein eigenes Auto besitzen

22

Aufgabe 2

a) Bestimmen Sie unter der Annahme, dass 66% der Studenten in der Stichprobe ein eigenes Auto besitzen, je ein .95-Kondenzintervall für eine Stichprobengröße von 50, 100 und 400 Studenten

23

Aufgabe 2

a) Bestimmen Sie unter der Annahme, dass 66% der Studenten in der Stichprobe ein eigenes Auto besitzen, je ein .95-Kondenzintervall für eine Stichprobengröße von 50, 100 und 400 Studenten

Mögliche Ausprägung der Variable „Eigenes Auto“ [Y] ? Hat ein Auto (Erfolg) Hat kein Auto (Misserfolg)Bernoulli Variable

24

Aufgabe 2

p = Erfolgswahrscheinlichkeit (Besitz eines Autos)q= Gegenwahrscheinlichkeit

25

Aufgabe 2

n Untere Grenze

Obere Grenze

50 .53 .79100 .5672 .7528400 .6136 .7064

26

Aufgabe 2

b) Erklären Sie, warum die berechneten Konfidenzintervalle unterschiedlich groß ausfallen

27

Aufgabe 2

Wovon hängt die Breite des Konfidenzintervalls ab ?

Vertrauens- Fehlerwahrscheinlichkeit (Ist hier konstant gehalten

Von der StichprobengrößeJe größer die Stichprobe, desto kleiner das Intervall

28

Aufgabe 2

c) Bestimmen Sie zusätzlich ein .95-Kondenzintervall unter der Annahme, dass 81% ein Auto besitzen und die Stichprobengröße 50 beträgt.

29

Aufgabe 2

p = 0.81n = 50

30

Aufgabe 3

Nach einer Verhaltenstherapie ist bei 35 von 100 Schülern eine deutliche Reduktion der Prüfungsangst zu verzeichnen. Berechnen Sie das einseitige Konfidenzintervall, um den Anspruch der Therapeuten zu überprüfen, bei mindestens einem Drittel der Schüler eine deutliche Reduktion der Prüfungsangst zu erzielen. Berechnen Sie zusätzlich das zweiseitige Konfidenzintervall.

31

Aufgabe 3

Nutzen Sie jeweils die klassischen Konfidenzbänder auf der Basis der Varianzschätzung.

32

Aufgabe 3

Nach welchem Konfidenzintervall ist gesucht ? Es ist nach einem Konfidenzintervall für

p gesucht

Einseitiges Konfidenzintervall

33

Aufgabe 3

Damit ergeben sich für das einseitige Intervall die Grenzen [.2718, ).

Der Anspruch, dass mindestens einem Drittel der Schüler durch die Angsttherapie geholfen wurde, kann durch das berechnete Intervall nicht bestätigt werden, da die untere Grenze unterhalb des Parameters p = 1/ 3 liegt.

34

Aufgabe 3

35

Aufgabe 3

Für das zweiseitige Intervall ergeben sich also folgende Grenzen [.257, .4435]. Dieses Intervall überdeckt also mit einer Vertrauenswahrscheinlichkeit von 95 Prozent den Parameter p.

Die Hypothese des Therapeuten, bei mindestens einem Drittel der Schüler eine deutliche Reduktion der Prüfungsangst erzielt zu haben, kann also in beiden Fällen nicht bestätigt werden.

36

MC

Konfidenzintervalle überdecken mit einer Fehlerwahrscheinlichkeit von den interessierenden Populationsparameter nicht.

Ein Konfidenzintervall mit einer Vertrauenswahrscheinlichkeit von .70 ist unter sonst gleichen Bedingungen) breiter als ein Konfidenzintervall mit 1 - = .80

Zur Bestimmung von Konfidenzintervallen sind schiefe Stichprobenverteilungen ungeeignet.

37

MC

Der zu schätzende Parameter ist eine Zufallsvariable

Bei unbekannter Stichprobenverteilung und unbekannter Varianz können nur approximative Konfidenzintervalle für bestimmt werden.

Bei einer Normalverteilung des Merkmals in der Population kann durch geeignete Wahl der Stichprobengröße jede beliebige Präzision einer Schätzung erreicht werden.

38

MC

Durch Verringerung der Vertrauenswahrscheinlichkeit 1- bei festem n, verbreitert sich das Konfidenzintervall

Die Vertrauenswahrscheinlichkeit kann bei Konfidenzintervallen für nicht frei gewählt werden.

Der wahre Parameter liegt mit der Vertrauenswahrscheinlichkeit 1- in den Grenzen des entsprechenden Konfidenzintervalls

39

MC

Bei Schätzung von und gegebener Vertrauenswahrscheinlichkeit hängt die Länge des Intervalls nur vom Standardfehler ab

Bei Verwendung der t-Verteilung ergeben sich unter sonst gleichen Bedingungen im Vergleich zur Verwendung der Normalverteilung größere Konfidenzintervalle.

Ein .95 Konfidenzintervall überdeckt den wahren Populationsparameter nicht immer

40

MC

Bei Konfidenzintervallen steigt die Präzision möglicher Aussagen bezüglich des interessierenden Populationsparameters mit einer höheren Sicherheitswahrscheinlichkeit

Die Fehlerspanne von Konfidenzintervallen für verringert sich, je kleiner ist.

Große Stichproben führen in aller Regel zu breiteren Konfidenzintervallen als kleine Stichproben.

41

MC

Die Voraussetzung normal verteilter i.i.d. Zufallsvariablen ist bei Konfidenzintervallen ab n > 30 grundsätzlich zu vernachlässigen

Die Konfidenzintervalle, die mit Hilfe des Schätzers für den Erwartungswert bestimmt werden, folgen der Form Schätzung ± Fehlerspanne

Im Falle von t-Konfidenzintervallen (Fall 2) oder approximativen Konfidenzintervallen (Fall 3) für den Erwartungswert ergeben sich im Vergleich zu z-Konfidenzintervallen (Fall 1) in aller Regel breitere Intervalle.

42

MC

Durch den zentralen Grenzwertsatz ist gewährleistet, dass auch bei unbekannter Varianz und Verteilung die Standardnormalverteilung zur Bestimmung der Grenzen eines Konfidenzintervalls verwendet werden kann, wenn n > 20 ist

Bei der Bestimmung eines Konfidenzintervalls für den Erwartungswert bei bekannter Varianz und festem n hängt die Größe des Intervalls nicht von den Eigenschaften der Daten ab.

43

MC

Bei der Bestimmung eines Konfidenzintervalls für die Varianz verwenden wir als Punktschätzer für den Parameter in aller Regel 1/n *(Summe der Abweichungsquadrate)

Die Summe von -Verteilungen ist wieder -verteilt

44

45

MC

Die Grenzen eines Konfidenzintervalls für die Varianz werden mit Hilfe der t-Verteilung bestimmt

Bei der Bestimmung eines Konfidenzintervalls für die Varianz müssen die Zufallsvariablen Y1,…..,Yn nicht normalverteilt sein.

46

Vielen Dank für Eure Aufmerksamkeit!

Bis zur nächsten Woche...

Recommended