18
| | Seminar für Statistik 03.11.2014 Markus Kalisch 1 Poweranalyse oder: Die richtige Stichprobengrösse

Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik 03.11.2014Markus Kalisch 1

Poweranalyse

oder: Die richtige Stichprobengrösse

Page 2: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik

Wie viele Stichproben brauchen wir, um eine gewisse

Alternative mit 80% Wa. (= Macht) erkennen zu können ?

Zu viel: Unnötiger Aufwand

Zu wenig: Nutzlose Studie

Zeitverschwendung

Ethische Probleme

Praxis: Stichprobengrösse = «Educated guess»

(weil Parameter willkürlich)

2

Warum Poweranalyse ?

Page 3: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik

Wdh: Zauberwürfel oder nicht ?

3

Wie oft müssen wir würfeln ?

Page 4: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik

Binomialtest: Bsp Zauberwürfel

4

1. Modell: X: Anzahl 6er bei 50 Würfen; 𝑋 ∼ 𝐵𝑖𝑛(𝑛 = 50, 𝜋 = 1/6)

2. Nullhypothese: 𝐻0: 𝜋 = 1/6Alternative: 𝐻𝐴: 𝜋 > 1/6 (einseitig)

3. Teststatistik T: Anz. 6er bei 50 Würfen

Verteilung der Teststatistik, wenn Nullhypothese stimmt:

𝑇 ∼ 𝐵𝑖𝑛(50, 1/6)

4. Signifikanzniveau: 𝛼 = 0.05 (Konvention)

5. Verwerfungsbereich der Teststatistik:

𝑃 𝑇 = 𝑡 = 𝑛𝑡𝜋𝑡 1 − 𝜋 𝑛−𝑡; berechne 𝑃 𝑇 ≥ 𝑡

6. Testentscheid: Liegt die beobachtete Anzahl 6er bei 50 Würfen im

Verwerfungsbereich der Nullhypothese?

Falls ja: 𝐻0 wird auf dem 5% Niveau verworfen

Falls nein: 𝐻0 kann auf dem 5% Niveau nicht verworfen werden

t … 13 14 15 …

𝑃[𝑇 ≥ 𝑡] … 0.06 0.03 0.01 …

Verwerfungsbereich

Grenze: Kleinste Zahl t,

sodass 𝑃 𝑇 ≥ 𝑡 ≤ 𝛼

Page 5: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik

Wdh: Fehler 1. und 2. Art, Macht

𝐻0: 𝑋 ~ 𝐵𝑖𝑛 𝑛, 𝑝 =1

6; 𝐻𝐴: 𝑝 >

1

6

Fehler 1. Art: 𝐻0 stimmt, wird aber im Test verworfen

Wa. für Fehler 1. Art ist höchstens 𝛼

Fehler 2. Art: 𝐻𝐴 stimmt, 𝐻0 wird aber im Test nicht

verworfen

Macht: Wa. dass 𝐻0 verworfen wird, falls 𝐻𝐴 stimmt

Macht = 1 – P(Fehler 2. Art)

Macht und Wa. für Fehler 2. Art kann nur mit konkreter

Alternative berechnet werden (z.B. 𝐻𝐴: 𝑝 =1

3)

5

Page 6: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik

Macht = 𝑃 𝑌 ≥ 14 = 1 − 𝑃(𝑌 ≤ 13)

Signifikanzniveau

14

𝑋~𝐵𝑖𝑛(50,1/6)

𝑌~𝐵𝑖𝑛(50,1/3)

Page 7: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik

Mit Theorie (wie im Bsp Zauberwürfel)

+ Genau, schnell berechnet

- kompliziert → oft zu kompliziert

Mit Simulation

+ fast immer möglich

- Programmieraufwand, ungenau(er), evtl. langsam

7

Berechnung der Macht: 2 Arten

Page 8: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik 03.11.2014Markus Kalisch 8

Zauberwürfel: Simulation

Simuliere n Würfe mit

𝑝 = 1/3

Mache Binomialtest

Falls Test verwirft:

𝑐𝑜𝑢𝑛𝑡𝑒𝑟 → 𝑐𝑜𝑢𝑛𝑡𝑒𝑟 + 1

Wiederhole 1000 mal

𝑀𝑎𝑐ℎ𝑡 =𝑐𝑜𝑢𝑛𝑡𝑒𝑟

1000

𝑐𝑜𝑢𝑛𝑡𝑒𝑟 = 0

Page 9: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik

Vektoren, Matrizen

Listen

For-Schleifen

Funktionen

03.11.2014Markus Kalisch 9

Programmieren in R

Page 10: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik 03.11.2014Markus Kalisch 10

Quiz: Welches Ergebnis ?

A: 2

B: 3

C: 4

D: 5

E: 6

Page 11: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik 03.11.2014Markus Kalisch 11

Macht beim Binomialtest

Page 12: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik

Bsp: Nullstellensuche bei monotoner Funktion

03.11.2014Markus Kalisch 12

Suche von Hand: Binäre Suche

Page 13: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik 03.11.2014Markus Kalisch 13

Macht beim t-Test

Page 14: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik 03.11.2014Markus Kalisch 14

Macht bei 1-weg ANOVA

Page 15: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik 03.11.2014Markus Kalisch 15

Macht bei Linearer Regression (Steigung)

Page 16: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik 03.11.2014Markus Kalisch 16

Macht beim Fisher-Test

Page 17: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik

Es gibt viele Varianten von “Post-hoc Power Analysis”

Bsp: 𝐻0 wurde nicht verworfen, obwohl die Macht für 𝑝 =1

380% wäre; also muss der Würfel «ungefähr fair» sein

Ungenaue Aussage; manche Varianten sind sogar falsch

Besser: Vertrauensintervall

Best practice:

03.11.2014Markus Kalisch 17

Exkurs: Falls 𝑯𝟎 nicht verworfen wird...

Vor dem Experiment: Power Analyse → Stichprobengrösse

Nach dem Experiment: Vertrauensintervall

Siehe: “The Abuse of Power: The Pervasive Fallacy of Power Calculations for Data Analysis”

J.M. Hoenig, D.M. Heisey; The American Statistician, 2001, Vol. 55, No.1

Page 18: Poweranalyse oder: Die richtige Stichprobengrösse · Seminar für Statistik | | Es gibt viele Varianten von “Post-hoc Power Analysis” Bsp: 𝐻0 wurde nicht verworfen, obwohl

||Seminar für Statistik

Welche konkrete Alternative? Parameter?

Verschiedene realistische Alternativen simulieren

→ Gefühl für die richtige Grössenordnung der

Stichprobengrösse

03.11.2014Markus Kalisch 18

Schwierigkeit in Praxis