21
14.01.14 1 VL Methodenlehre I WS13/14 Schäfer DAS THEMA: INFERENZSTATISTIK II – INFERENZSTATISTISCHE AUSSAGEN Standardfehler Konfidenzintervalle Signifikanztests VL Methodenlehre I WS13/14 Schäfer Standardfehler der Standardfehler Interpretation Verwendung

Meth11Web - Technische Universität Chemnitz · 14.01.14 7 der Einfluss der Stichprobengröße auf das KI • größere Stichproben sollten zu verlässlicheren Schätzungen führen

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

14.01.14  

1  

VL Methodenlehre I WS13/14 Schäfer

DAS THEMA: INFERENZSTATISTIK II – INFERENZSTATISTISCHE AUSSAGEN •  Standardfehler •  Konfidenzintervalle •  Signifikanztests

VL Methodenlehre I WS13/14 Schäfer

Standardfehler •  der Standardfehler •  Interpretation •  Verwendung

14.01.14  

2  

Ausgangspunkt: wir haben aufgrund von Daten aus einer Studie einen

Parameter für die Population geschätzt und eine Stichprobenverteilung für

diesen Parameter erstellt (zumindest theoretisch)

Ziel: eine Angabe darüber machen, wie gut die Parameterschätzung ist

3 Möglichkeiten: Standardfehler, Konfidenzintervalle, Signifikanztests

ZUR WIEDERHOLUNG...

VL Methodenlehre I WS13/14 Schäfer

wie  gut  ist  die  Parameterschätzung?  

ist  das  S:chprobenergebnis  durch  Zufall  entstanden  oder  

nicht?  

•  der Standardfehler ist die Standardabweichung der

Stichprobenverteilung

•  er gibt daher die Güte/Verlässlichkeit der Schätzung an

•  er zeigt an, welchen „durchschnittlichen“ Fehler man macht, wenn man

den gefundenen Kennwert als Parameterschätzung verwendet

Beispiel: wir haben für das Mögen von Klassik einen Mittelwert von 3 und

einen Standardfehler von 0,6 bestimmt:

DER STANDARDFEHLER

VL Methodenlehre I WS13/14 Schäfer

à  ca.  68%  aller  möglichen  S:chprobenergebnisse  würden  also  hier  zwischen  den  Werten  2,4  und  3,6  liegen  

14.01.14  

3  

Wie kann man den Standardfehler interpretieren?

•  lässt sich pauschal nicht beantworten, denn: je kleiner, desto besser

•  günstig: schauen wie groß er im Verhältnis zur verwendeten Merkmals-

Skala ist

Beispiel: die Skala für das Mögen von Klassik ging von 1 bis 5 à der SE von

0,6 nimmt davon nur 12% ein, ist also recht klein

DER STANDARDFEHLER – INTERPRETATION

VL Methodenlehre I WS13/14 Schäfer

à der  SE  von  0,6  liefert  uns  eine  Angabe  darüber,  wie  weit  wir  mit  unserer  Schätzung  prinzipiell  daneben  liegen  könnten  

à ob  der  SE  zufriedenstellend  klein  ist,  soll/muss  der  Forscher  beurteilen  

Wo wird der Standardfehler hauptsächlich verwendet?

•  er wird als „Rechenergebnis“ im Text sehr selten angegeben

•  dafür aber sehr häufig in Abbildungen, nämlich in Form von

Fehlerbalken (anstelle der Standardabweichung)

Beispiele:

DER STANDARDFEHLER – VERWENDUNG

VL Methodenlehre I WS13/14 Schäfer

 SD                                                                                                          SE                                                                                                          SE  

14.01.14  

4  

wenn man Abbildungen so gestaltet, dass die Y-Achse den gesamten

Wertebereich zeigt, kann man auch an solchen Abbildungen sehen, ob der

SE eher groß oder eher klein ist

DER STANDARDFEHLER – VERWENDUNG

VL Methodenlehre I WS13/14 Schäfer

VL Methodenlehre I WS13/14 Schäfer

Konfidenzintervalle •  Konfidenzintervalle •  Vertrauenswahrscheinlichkeit •  Einfluss der Stichprobengröße •  Verwendung

14.01.14  

5  

•  neben dem Standardfehler lässt sich ein weiteres Maß für die Güte einer

Populationsschätzung für einen Parameter angeben: das

Konfidenzintervall (KI, englisch: CI für confidence interval)

•  Konfidenzintervalle sind etwas informativer, da sie einen Wertebereich

(Vertrauens- oder Konfidenzbereich) beschreiben

Definition:

Ein Konfidenzintervall ist ein Wertebereich, der den wahren Parameter in

der Population mit der Wahrscheinlichkeit X beinhaltet.

(Achtung: die Wahrscheinlichkeitsaussage bezieht sich immer auf das

Intervall, nicht auf den Parameter! Man darf also nicht sagen: der

Parameter liegt mit der Wahrscheinlichkeit X im Intervall!)

KONFIDENZINTERVALLE

VL Methodenlehre I WS13/14 Schäfer

entscheidend sind zwei Dinge:

•  die Höhe der Konfidenz (also der Wahrscheinlichkeit X) à die lege ich

selbst fest

•  die beiden Grenzen des Intervalls (ausgedrückt in den Werten der

verwendeten Skala) à die will ich berechnen

die Logik dahinter: eine Parameterschätzung ist umso zuverlässiger, je

enger die Grenzen des Intervalls beieinander liegen

als Grundlage dient die Stichprobenverteilung

des berechneten Parameters

KONFIDENZINTERVALLE

VL Methodenlehre I WS13/14 Schäfer

14.01.14  

6  

Beispiel für ein Konfidenzintervall mit einer Vertrauenswahrscheinlichkeit

von 90% um einen Erwartungswert von 105:

à je näher die untere und die obere Grenze am Wert 105 liegen, desto

eher kann ich dem Erwartungswert von 105 vertrauen (d.h., desto höher ist

die Güte der Schätzung)

KONFIDENZINTERVALLE

VL Methodenlehre I WS13/14 Schäfer

Was bedeutet die Vertrauenswahrscheinlichkeit X?

à Wenn ich 100 Studien machen und jedes Mal ein KI konstruieren würde,

dann würde dieses in X Fällen den wahren Wert beinhalten.

à das Intervall schneidet die mittleren X% der Stichprobenverteilung ab

(symmetrisch um den Parameter)

Wie hoch sollte die Vertrauenswahrscheinlichkeit sein?

prinzipiell: natürlich möglichst hoch

aber: je höher sie ist, desto breiter (und damit weniger informativ) wird das

Intervall (im Extrem: wenn die Wahrscheinlichkeit 100 betrüge, würde das

Intervall den gesamten Wertebereich überdecken)

à üblicherweise liegt sie daher bei 90, 95, seltener bei 99%

VERTRAUENSWAHRSCHEINLICHKEIT

VL Methodenlehre I WS13/14 Schäfer

14.01.14  

7  

der Einfluss der Stichprobengröße auf das KI

•  größere Stichproben sollten zu verlässlicheren Schätzungen führen

•  das äußert sich darin, dass die Stichprobenverteilung schmaler wird und

damit die Grenzen enger zusammenrücken

EINFLUSS DER STICHPROBENGRÖßE

VL Methodenlehre I WS13/14 Schäfer

     kleinere  S:chprobe:                                                                                  größere  S:chprobe:  

Wo werden KI hauptsächlich verwendet?

•  in der Regel als inferenzstatistische Angaben im Text: es werden die

Höhe der Konfidenz und die Lage der unteren und oberen Grenze

angegeben (z.B. in der Form „95% KI, untere Grenze: ..., obere

Grenze: ...“ oder „95% confidence interval, CI-: ..., CI+: ...)

•  sehr häufig auch in Abbildungen: ebenfalls

in Form von Fehlerbalken

KONFIDENZINTERVALLE – VERWENDUNG

VL Methodenlehre I WS13/14 Schäfer

14.01.14  

8  

VL Methodenlehre I WS13/14 Schäfer

Signifikanztests •  Signifikanztests •  Ansatz nach Fisher •  die Nullhypothese •  der p-Wert •  die Irrtumswahrscheinlichkeit •  die Logik •  einseitiges und zweiseitiges Testen •  Einfluss der Stichprobengröße •  Ansatz nach Neyman & Pearson •  die Alternativhypothese •  Fehler erster und zweiter Art •  Einflussgrößen auf die Signifikanz

•  Signifikanztests beurteilen nicht die Güte einer Parameterschätzung,

sondern, ob ein Ergebnis zufällig zustande kam oder ob es generalisiert

werden kann

•  sie liefern damit eine ja/nein-Entscheidung

•  der Begriff „Signifikanz“ ist irreführend, weil ein Signifikanztest-

Ergebnis zunächst nichts über die „Bedeutsamkeit“ aussagt!

•  sie beruhen nicht mehr auf der Stichprobenverteilung, die aus den

Daten resultiert, sondern auf der abstrakten Idee der Nullhypothese

•  ihr einziges Ergebnis ist der berühmte p-Wert, der dann zur

Entscheidung (signifikant oder nicht) führt

SIGNIFIKANZTESTS

VL Methodenlehre I WS13/14 Schäfer

14.01.14  

9  

nach dem Ansatz von Fisher (dem z.B. auch SPSS folgt):

•  der Signifikanztest unterstellt immer, dass es in der

Population keinen Effekt gibt (der Mittelwert ist 0, es

gibt keinen Mittelwertsunterschied, es gibt keinen

Zusammenhang, usw.)

•  diese Unterstellung wird durch die Nullhypothese ausgedrückt

•  Ziel ist es nun zu zeigen, dass das Stichproben-Ergebnis unter der

Annahme der Nullhypothese so unwahrscheinlich ist, dass man die

Nullhypothese „verwerfen“ kann

ANSATZ NACH FISHER

VL Methodenlehre I WS13/14 Schäfer

•  für die Nullhypothese H0 wird auch eine Stichprobenverteilung erstellt

•  diese ist nicht um den gefundenen Kennwert konstruiert, sondern um die

0 herum:

à die Verteilung sagt, dass auch dann, wenn es in der Population keinen

Effekt gibt (0), Ergebnisse zustande kommen können, die zufällig von 0

abweichen (wobei größere Abweichungen immer unwahrscheinlicher werden)

DIE NULLHYPOTHESE

VL Methodenlehre I WS13/14 Schäfer

14.01.14  

10  

•  die Verteilung der H0 beschreibt also die Wahrscheinlichkeit, mit der

man bestimmte Werte „ziehen“ kann, wenn die H0 stimmt

•  diese Aussage steckt im p-Wert (p für probability)

Definition:

Der p-Wert ist die Wahrscheinlichkeit für das gefundene (oder ein noch

extremeres) Ergebnis unter der Annahme, dass in der Population die H0

gilt.

DER P-WERT

VL Methodenlehre I WS13/14 Schäfer

•  für die Entscheidung (signifikant oder nicht) wird nun eine

Irrtumswahrscheinlichkeit Alpha (α) festgelegt

•  Alpha wird auch Fehler erster Art, Signifikanzschwelle, Signifikanzniveau

oder Signifikanzkriterium genannt

•  Logik: wenn p < α dann ist das Ergebnis so unwahrscheinlich, dass die

Nullhypothese wohl nicht stimmt und daher verworfen werden kann à

man spricht dann von einem signifikanten Ergebnis

•  Alpha wird üblicherweise auf 10, 5 oder 1% festgelegt (5% sind die Regel)

•  aber: diese Festlegung ist absolut willkürlich, tatsächlich sollte der

Forscher festlegen, wie groß Alpha sinnvollerweise sein soll/darf

DIE IRRTUMSWAHRSCHEINLICHKEIT

VL Methodenlehre I WS13/14 Schäfer

14.01.14  

11  

die Gretchen-Frage:

p < α ?

SIGNIFIKANZTESTS – DIE LOGIK

VL Methodenlehre I WS13/14 Schäfer

SIGNIFIKANZTESTS – DIE LOGIK

VL Methodenlehre I WS13/14 Schäfer

14.01.14  

12  

Warum „Fehler erster Art“?

•  auch bei einem als signifikant eingestuften Ergebnis kann die H0

natürlich stimmen

•  genauer: man wird – statistisch gesehen – in α Prozent der Fälle die H0

ablehnen, obwohl sie stimmt à man begeht also einen Fehler (nämlich

eine „falsch positive“ Entscheidung)

Achtung: Alpha sagt nichts über die Wahrscheinlichkeit der H0 aus, sondern

nur etwas über die Wahrscheinlichkeit, mit der man sich irrt, wenn man die

H0 anlehnt.

SIGNIFIKANZTESTS – DIE LOGIK

VL Methodenlehre I WS13/14 Schäfer

Woher kommt der p-Wert?

•  genauer müsste man fragen: woher kommt die H0-Verteilung, aus der

der p-Wert abgelesen wird?

•  sie wird genauso konstruiert wie die Stichprobenverteilung für den

Parameter, mit dem Unterschied, dass als Parameterschätzung der Wert

der Nullhypothese (meist 0) verwendet wird

•  der p-Wert beschreibt die Lage des empirischen Wertes (also des

Ergebnisses) in dieser Verteilung

•  um nicht für jede Studie bzw. jeden Test diese Verteilung konstruieren

zu müssen, gibt es bereits standardisierte Verteilungen für die

Nullhypothese à Prüfverteilungen (z.B., z, t, F...)

•  Prüfverteilungen sind in allen Lehrbüchern abgedruckt bzw. in Statistik-

Software „hinterlegt“

SIGNIFIKANZTESTS – DIE LOGIK

VL Methodenlehre I WS13/14 Schäfer

14.01.14  

13  

zum Warmwerden: z-Test

•  der z-Test ist ein Signifikanztest, der prüft, ob sich ein Wert signifikant

von einem vorgegebenen Mittelwert unterscheidet

•  die Nullhypothese wäre hier durch diesen Mittelwert repräsentiert

•  Prüfverteilung ist die z-Verteilung (Standardnormalverteilung)

•  Beispiel: in einer Klausur ist von 50 Studierenden ein Mittelwert von M =

34 Punkten erreicht worden (SD = 3,7) – ist Paul mit 41 Punkten

signifikant besser als der Durchschnitt (Alpha = 5%)?

SIGNIFIKANZTESTS – DIE LOGIK

VL Methodenlehre I WS13/14 Schäfer

H0

M  =  34  

Paul  =  41  à wo  liegt  die  41  in  dieser  Verteilung?  à  z-­‐Standardisierung:  

SIGNIFIKANZTESTS – DIE LOGIK

VL Methodenlehre I WS13/14 Schäfer

z" 0" 0,01" 0,02" 0,03" 0,04" 0,05" 0,06" 0,07" 0,08" 0,09"0" 0,5$ 0,504$ 0,508$ 0,512$ 0,516$ 0,5199$ 0,5239$ 0,5279$ 0,5319$ 0,5359$0,1" 0,5398$ 0,5438$ 0,5478$ 0,5517$ 0,5557$ 0,5596$ 0,5636$ 0,5675$ 0,5714$ 0,5753$0,2" 0,5793$ 0,5832$ 0,5871$ 0,591$ 0,5948$ 0,5987$ 0,6026$ 0,6064$ 0,6103$ 0,6141$0,3" 0,6179$ 0,6217$ 0,6255$ 0,6293$ 0,6331$ 0,6368$ 0,6406$ 0,6443$ 0,648$ 0,6517$0,4" 0,6554$ 0,6591$ 0,6628$ 0,6664$ 0,67$ 0,6736$ 0,6772$ 0,6808$ 0,6844$ 0,6879$0,5" 0,6915$ 0,695$ 0,6985$ 0,7019$ 0,7054$ 0,7088$ 0,7123$ 0,7157$ 0,719$ 0,7224$0,6" 0,7257$ 0,7291$ 0,7324$ 0,7357$ 0,7389$ 0,7422$ 0,7454$ 0,7486$ 0,7517$ 0,7549$0,7" 0,758$ 0,7611$ 0,7642$ 0,7673$ 0,7704$ 0,7734$ 0,7764$ 0,7794$ 0,7823$ 0,7852$0,8" 0,7881$ 0,791$ 0,7939$ 0,7967$ 0,7995$ 0,8023$ 0,8051$ 0,8079$ 0,8106$ 0,8133$0,9" 0,8158$ 0,8186$ 0,8212$ 0,8238$ 0,8264$ 0,8289$ 0,8315$ 0,834$ 0,8365$ 0,8398$1" 0,8413$ 0,8438$ 0,8461$ 0,8485$ 0,8508$ 0,8531$ 0,8554$ 0,8577$ 0,8599$ 0,8621$1,1" 0,8643$ 0,8665$ 0,8686$ 0,8708$ 0,8729$ 0,8749$ 0,877$ 0,879$ 0,881$ 0,883$1,2" 0,8849$ 0,8869$ 0,8888$ 0,8907$ 0,8925$ 0,8944$ 0,8962$ 0,898$ 0,8997$ 0,9015$1,3" 0,9032$ 0,9049$ 0,9066$ 0,9082$ 0,9099$ 0,9115$ 0,9131$ 0,9147$ 0,9162$ 0,9177$1,4" 0,9192$ 0,9207$ 0,9222$ 0,9236$ 0,9251$ 0,9265$ 0,9279$ 0,9292$ 0,9306$ 0,9319$1,5" 0,9332$ 0,9345$ 0,9357$ 0,937$ 0,9382$ 0,9304$ 0,9406$ 0,9418$ 0,9429$ 0,9441$1,6" 0,9452$ 0,9463$ 0,9474$ 0,9484$ 0,9495$ 0,9505$ 0,9515$ 0,9525$ 0,9535$ 0,9545$1,7" 0,9554$ 0,9564$ 0,9573$ 0,9582$ 0,9591$ 0,9599$ 0,9608$ 0,9616$ 0,9625$ 0,9633$1,8" 0,9641$ 0,9649$ 0,9656$ 0,9664$ 0,9671$ 0,9678$ 0,9686$ 0,9693$ 0,9699$ 0,9706$1,9" 0,9713$ 0,9719$ 0,9726$ 0,9723$ 0,9738$ 0,9744$ 0,975$ 0,9756$ 0,9761$ 0,9767$2" 0,9772$ 0,9778$ 0,9783$ 0,9788$ 0,9793$ 0,9798$ 0,9803$ 0,9808$ 0,9812$ 0,9817$2,1" 0,9821$ 0,9826$ 0,983$ 0,9834$ 0,9838$ 0,9842$ 0,9846$ 0,985$ 0,9854$ 0,9857$2,2" 0,9861$ 0,9864$ 0,9868$ 0,9871$ 0,9875$ 0,9878$ 0,9881$ 0,9884$ 0,9887$ 0,989$2,3" 0,9893$ 0,9896$ 0,9898$ 0,9901$ 0,9904$ 0,9906$ 0,9909$ 0,9911$ 0,9913$ 0,9916$2,4" 0,9918$ 0,992$ 0,9922$ 0,9925$ 0,9927$ 0,9929$ 0,9931$ 0,9932$ 0,9934$ 0,9936$2,5" 0,9938$ 0,994$ 0,9941$ 0,9943$ 0,9945$ 0,9946$ 0,9948$ 0,9949$ 0,9951$ 0,9952$2,6" 0,9953$ 0,9955$ 0,9956$ 0,9957$ 0,9959$ 0,996$ 0,9961$ 0,9962$ 0,9963$ 0,9964$2,7" 0,9965$ 0,9966$ 0,9967$ 0,9968$ 0,9969$ 0,997$ 0,9971$ 0,9972$ 0,9973$ 0,9974$2,8" 0,9974$ 0,9975$ 0,9976$ 0,9977$ 0,9977$ 0,9978$ 0,9979$ 0,9979$ 0,998$ 0,9981$2,9" 0,9981$ 0,9982$ 0,9982$ 0,9983$ 0,9984$ 0,9984$ 0,9985$ 0,9985$ 0,9986$ 0,9986$3" 0,9987$ 0,9987$ 0,9987$ 0,9988$ 0,9988$ 0,9989$ 0,9989$ 0,9989$ 0,999$ 0,999$

!

p-­‐Wert:  1  –  0,97  =  3%  

14.01.14  

14  

à p < α à Paul ist mit 41 Punkten signifikant besser als der Durchschnitt

SIGNIFIKANZTESTS – DIE LOGIK

VL Methodenlehre I WS13/14 Schäfer

H0

M  =  34              α  =  5%  

p  =  3%  

Hinweis: der gesuchte Effekt/Parameter kann auch auf der linken Seite der

Verteilung liegen

Beispiel: Ist Paul mit 27 Punkten signifikant schlechter als der Durchschnitt?

Achtung: bei Mittelwertsunterschieden ist es uns überlassen, ob wir Gruppe

A von Gruppe B abziehen oder umgekehrt – entsprechend kann der

gesuchte Effekt links oder rechts liegen

SIGNIFIKANZTESTS – DIE LOGIK

VL Methodenlehre I WS13/14 Schäfer

H0

α  =  5%              M  =  34  

p  =  3%  à  signifikant  schlechter  

14.01.14  

15  

•  bei ungerichteten Hypothesen (exploratives Forschen) verteilt sich die

Irrtumswahrscheinlichkeit auf beide Seiten der H0-Verteilung

à es wird entsprechend schwieriger ein signifikantes Ergebnis zu

bekommen

à daher sind gerichtete Hypothesen besser

EINSEITIGES UND ZWEISEITIGES TESTEN

VL Methodenlehre I WS13/14 Schäfer

H0 H0

Beispiel: Mittelwertsunterschied Gruppe A – Gruppe B:

EINSEITIGES UND ZWEISEITIGES TESTEN

VL Methodenlehre I WS13/14 Schäfer

H0

hier  verteilen  sich  alle  möglichen  Ergebnisse,  bei  denen  der  

Mi\elwertsunterschied  nega:v  ist  (also  Gruppe  B  besser  ist)  

hier  verteilen  sich  alle  möglichen  Ergebnisse,  bei  denen  der  Mi\elwertsunterschied  posi:v  ist  (also  Gruppe  A  besser  ist)  

14.01.14  

16  

der Vorteil gerichteter Hypothesen

am selben Beispiel: Unterscheidet sich Paul signifikant vom Durchschnitt

(Alpha = 5%)? ß ungerichtete Hypothese

EINSEITIGES UND ZWEISEITIGES TESTEN

VL Methodenlehre I WS13/14 Schäfer

H0

α  =  2,5%                M  =  34                  α  =  2,5%    

p  =  3%  à  p  >  α  à  kein  signifikanter  Unterschied  

altbekanntes Prinzip: bei steigender Stichprobengröße wird die

Stichprobenverteilung schmaler

à es ist dann leichter, ein signifikantes

Ergebnis zu bekommen

DER EINFLUSS DER STICHPROBENGRÖßE

VL Methodenlehre I WS13/14 Schäfer

H0

α  =  2,5%                M  =  34                  α  =  2,5%    

p  =  3%  

H0

α  =  2,5%      M  =  34      α  =  2,5%    

p  =  0,00...%  

Ausgangs-­‐Beispiel:                

Beispiel  mit  größerer  S:chprobe:  à  das  gleiche  Testergebnis  führt  

zu  einem  kleineren  p-­‐Wert  

14.01.14  

17  

Prinzipieller Ablauf:

1.  formuliere eine Nullhypothese und konstruiere die entsprechende

Stichprobenverteilung (macht i.d.R. eine Software für uns, z.B. SPSS)

2.  prüfe, ob der p-Wert kleiner oder größer als Alpha ist

3.  ist p < α, „verwerfe“ die Nullhypothese und argumentiere, dass es einen

Effekt gibt; ist p > α, ...? (Fisher macht dazu keine Aussage)

à die H0 sollte „annehmbar“ gemacht werden

à neuer Ansatz nach Neyman und Pearson

ANSATZ NACH FISHER – ZUSAMMENFASSUNG

VL Methodenlehre I WS13/14 Schäfer

•  oft ist die Nullhypothese allein eine wenig sinnvolle Annahme

•  in der Regel geht man ja von einem Effekt aus

•  der erhoffte Effekt wird durch die Alternativhypothese H1 ausgedrückt

•  die H1 ist auch eine Stichprobenverteilung, deren Mittelwert um den

erhofften Effekt von der H0 verschoben ist

•  der erhoffte Effekt ist nicht das Studienergebnis, sondern tatsächlich

eine Schätzung des erwarteten Effektes, den man vor der Studie festlegt!

ANSATZ NACH NEYMAN & PEARSON

VL Methodenlehre I WS13/14 Schäfer

14.01.14  

18  

•  der erhoffte Effekt kann aus vorhergehenden Studien resultieren (was

wurde bisher gefunden?) oder die Hoffnung des Forschers repräsentieren

(welchen Effekt ist von Interesse?)

•  H0 und H1 stehen im Widerstreit

•  der Signifikanztest soll helfen, sich für eine der beiden Hypothesen zu

entscheiden

•  entscheidend dabei ist der Überschneidungsbereich beider Hypothesen

•  dort liegen Daten drin, die zu beiden Hypothesen gehören können – das

kann zu verschiedenen Fehlern führen

DIE ALTERNATIVHYPOTHESE

VL Methodenlehre I WS13/14 Schäfer

Alpha bekommt nun eine

weitere wichtige Bedeutung:

wenn p < α, lehne ich die H0 ab – das kann

•  richtig sein à alles perfekt

•  falsch sein à Fehler erster Art (Alpha-Fehler)

wenn p > α, „nehme ich die H0 an“ – das kann ebenfalls •  richtig sein à alles perfekt

•  falsch sein à Fehler zweiter Art (Beta-Fehler)

FEHLER ERSTER UND ZWEITER ART

VL Methodenlehre I WS13/14 Schäfer

14.01.14  

19  

•  im Ansatz von Neyman und Pearson geht es darum, eine sinnvolle

Abwägung der beiden Fehlerarten zu machen

•  daran sollte sich dann die Festlegung des Signifikanzniveaus orientieren

FEHLER ERSTER UND ZWEITER ART

VL Methodenlehre I WS13/14 Schäfer

Prinzipieller Ablauf:

1.  formuliere eine Nullhypothese und konstruiere die entsprechende

Stichprobenverteilung (mit Hilfe einer Software)

2.  formuliere eine Alternativhypothese und konstruiere die entsprechende

Stichprobenverteilung (mit Hilfe einer Software)

3.  mache eine Abwägung der Wichtigkeit der Fehler erster und zweiter Art

4.  prüfe, ob der p-Wert kleiner oder größer als Alpha ist

5.  ist p < α, „verhalte dich so“, als ob die Alternativhypothese stimmt; ist p

> α, „verhalte dich so“, als ob die Nullhypothese stimmt

à  dieser Ansatz zwingt uns über die Bedeutsamkeit von Effekten

nachzudenken und diese in den Signifikanztest einzubeziehen

NEYMAN & PEARSON – ZUSAMMENFASSUNG

VL Methodenlehre I WS13/14 Schäfer

14.01.14  

20  

Drei Größen beeinflussen die Wahrscheinlichkeit, ein signifikantes Ergebnis

zu finden: Populationseffekt, Stichprobengröße, Alpha

EINFLUSSGRÖßEN AUF DIE SIGNIFIKANZ

VL Methodenlehre I WS13/14 Schäfer

größereStichproben

größerer/Populationseffekt

!

•  die Ergebnisse führen oft zu Missverständnissen

•  Signifikanz hat nichts mit Bedeutsamkeit

•  es gibt keine Aussagen über die Wahrscheinlichkeit von Hypothesen,

sondern stets nur von Daten!

•  häufiger Vorwurf: mit genügend großen Stichproben wird jeder Effekt

signifikant

•  Abhilfe: auf besser interpretierbare Angaben zurückgreifen – vor allem

Effektgrößen und Konfidenzintervalle

KRITIK ZUM SIGNIFIKANZTEST

VL Methodenlehre I WS13/14 Schäfer

14.01.14  

21  

•  drei inferenzstatistische Maße: Standardfehler, Konfidenzintervalle,

Signifikanztests

•  Standardfehler: gibt die Verlässlichkeit der Parameterschätzung als einen Wert an

•  Konfidenzintervalle: geben die Verlässlichkeit der Parameterschätzung als

Intervall an

•  beide Maße basieren auf der Stichprobenverteilung um den gefundenen Wert

•  Signifikanztests prüfen, ob ein Ergebnis zufällig zustande kam oder nicht

•  sie basieren auf Stichprobenverteilungen, die um Null- oder Alternativhypothese

konstruiert sind

•  sie sollen eine Entscheidungshilfe sein, wenn es um das Abwägen von Hypothesen

geht

•  sie sagen aber nichts über die Größe von Effekten oder die Wahrscheinlichkeit von

Hypothesen aus!

INFERENZSTATISTIK STECKBRIEF

VL Methodenlehre I WS13/14 Schäfer