METHODENLEHRE I - tu-chemnitz.de · 28.01.14 2 VL Methodenlehre I WS13/14 Schäfer Inferenzstatistik für Zusammenhänge • Standardfehler • Konﬁdenzintervalle • Signiﬁkanztest

28.01.14

1

VL Methodenlehre I WS13/14 Schäfer

METHODENLEHRE I WS 2013/14

THOMAS SCHÄFER


DAS THEMA: INFERENZSTATISTIK IV – INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE •  Inferenzstatistik für Zusammenhänge •  Inferenzstatistik für Unterschiede

28.01.14

2


Inferenzstatistik für Zusammenhänge •  Standardfehler •  Konfidenzintervalle •  Signifikanztest

•  Zusammenhänge werden in der Regel durch Korrelationskoeffizienten

ausgedrückt, am häufigsten durch die Pearson-Korrelation r

•  ein in einer Stichprobe gefundener Zusammenhang r kann wieder auf die

Population verallgemeinert werden – der Schätzwert heißt ρ (Rho)

•  auch für diese Schätzung fragen wir wieder nach der Güte und wollen

daher inferenzstatistische Aussagen machen

Beispiel: Wie groß ist der Zusammenhang zwischen der Anzahl von Störchen

und der Anzahl Neugeborener? à Wir untersuchen als Stichprobe den Raum

Chemnitz über 10 Jahre:

à r = ρ = .38

STANDARDFEHLER FÜR ZUSAMMENHÄNGE


Jahr Störche Geburten 1 12 4408 2 14 3990 3 11 3792 4 14 4020 5 15 3899 6 9 3789 7 16 4142 8 11 3879 9 13 4032 10 12 4001

28.01.14

3

•  der Standardfehler für ρ berechnet sich wie folgt:

•  für unser Beispiel:

à  bezogen auf die Skala von r ist das ein recht großer Standardfehler

à  anders als bei Mittelwerten wird der Standardfehler für Korrelationen

normalerweise nicht in Abbildungen irgendeiner Art verwendet

STANDARDFEHLER FÜR ZUSAMMENHÄNGE


ρ

ρ

•  auch bei Korrelationen gilt: eigentlich müssten wir für jeden

Koeffizienten eine Stichprobenverteilung erstellen, um die Grenzen des

KI zu bestimmen

•  auch hier könnte aber stattdessen die t-Verteilung verwendet werden

•  ABER: die t-Verteilung ist nur gültig, wenn r = 0, ansonsten sind rs nicht

symmetrisch verteilt und können nicht durch t repräsentiert werden

•  da wir aber in der Regel Effekte ungleich 0 haben, kann die t-Verteilung

nicht verwendet werden à stattdessen ist ein anderer „Umweg“ nötig,

der die Fisher-z-Transformation benutzt:

1. das gefundene r wird in einen z-Wert umgerechnet

2. die Grenzen des KI werden für diesen z-Wert bestimmt

3. die Grenzen in z-Werten werden wieder in rs zurückgerechnet

KI FÜR ZUSAMMENHÄNGE


28.01.14

4

à  da Korrelationskoeffizienten von -1 bis 1 begrenzt sind, ist ihre

Stichprobenverteilung nur bei 0 symmetrisch; sie wird schiefer, je

stärker die Korrelation von 0 abweicht

à  KI sind dann nicht mehr symmetrisch und können nicht mit Hilfe der t-

Verteilung bestimmt werden



Fisher‘s-r-to-z-Tabelle



r = .38 in der Tabelle suchen à der entsprechende zr-‐Wert ist 0,40

SchriE 1

28.01.14

5

z-Tabelle

Was sind die Grenzen des 95%-KI?



à wieder bei 97,5% nachsehen à z = 1,96

SchriE 2

Bestimmung der Grenzen des KI ausgedrückt in z-Werten:

für das Beispiel:

à diese beiden Grenzen müssen nun wieder in rs umgerechnet werden



SchriE 2

28.01.14

6

Fisher‘s-r-to-z-Tabelle



für z = -‐0,34: à r = -‐0,327 à untere Grenze für z = 1,14: à  r = 0,814 à obere Grenze

Hinweis: negaOve z-‐Werte führen auch zu negaOven rs!

SchriE 3

als Abbildung:

à wir finden ein asymmetrisches KI



28.01.14

7

•  wieder die Logik des Signifikanztests: unterstellt wird die H0, dass der

wahre Zusammenhang in der Population ρ = 0 ist •  die H0-Verteilung zeigt also mögliche Korrelationen ungleich 0, die man

zufällig finden kann, auch wenn die H0 gilt •  da die H0 von ρ = 0 ausgeht (und Korrelationen unter dieser

Voraussetzung normalverteilt sind), kann jetzt die t-Verteilung verwendet werden

SIGNIFIKANZTESTS FÜR ZUSAMMENHÄNGE


ρ

0

t

0

die Verteilung von KorrelaOonskoeffizienten kann durch die t-‐Verteilung

repräsenOert werden

•  für den Test muss also die Korrelation in einen t-Wert umgerechnet

werden:

•  dieser t-Wert wird dann auf Signifikanz geprüft mit

für das Beispiel:

à  kritischer t-Wert für Alpha = 5%, df = 8, zweiseitig: 2,31

à  tempirisch < tkritisch à Korrelationskoeffizient nicht signifikant



(n ist die Anzahl der Wertepaare)

Formel t-Test für Korrelationskoeffizienten

df t-Test für Korrelationskoeffizienten

28.01.14

8



t-Verteilung

df = n – 2 Beispiel: 10 – 2 = 8 à tkri)sch = 2,31

Alpha-‐Niveau



das Beispiel in SPSS:

hier gibt es wieder den exakten p-‐Wert: 0,28

28.01.14

9

INFERENZSTATISTIK FÜR ZUSAMMENHÄNGE


Verwendung der drei Aussagen für Korrelationskoeffizienten:

Standardfehler

im Fließtext: so gut wie nie

in Abbildungen: so gut wie nie

Konfidenzintervalle

im Fließtext: zunehmend beliebt

in Abbildungen: zunehmend beliebt

Signifikanztests

im Fließtext: nahezu immer

in Abbildungen: sehr selten

INFERENZSTATISTIK FÜR ZUSAMMENHÄNGE


noch ein Hinweis

•  auch Regressionskoeffizienten sind Zusammenhangsmaße

•  für Regressionskoeffizienten können alle drei inferenzstatischen Maße

bestimmt werden

•  auch hier sind die Konfidenzintervalle asymmetrisch, wenn β ≠ 0

•  der Signifikanztest, der prüft, ob ein Regressionskoeffizient in der

Population von 0 verschieden ist, ist auch ein t-Test:

mit

Formel t-Test für Regressionskoeffizienten

df t-Test für Regressionskoeffizienten

Regressionskoeffizient Standardfehler des Koeffizienten

(n – SOchprobengröße; k – Anzahl von Prädiktoren)

28.01.14

10

•  für Zusammenhänge werden inferenzstatische Aussagen recht häufig gemacht

•  der Standardfehler wird aus der gefundenen Korrelation und der

Stichprobengröße berechnet

•  Konfidenzintervalle sind für ρ ungleich 0 nicht symmetrisch, daher wird die

Fisher-r-in-z-Transformation genutzt, um die Grenzen des Intervalls zunächst in z-

Werten zu bestimmen und dann in Korrelationen zurück zu rechnen

•  Konfidenzintervalle für Korrelationen sind zunehmend beliebt und sind sehr

empfehlenswert

•  der Signifikanztest, der prüft, ob ein Korrelationskoeffizient in der Population

größer ist als 0, ist wieder ein t-Test

•  auch für Regressionskoeffizienten können die drei inferenzstatistischen Maße

bestimmt werden

IS FÜR ZUSAMMENHÄNGE STECKBRIEF



Inferenzstatistik für Unterschiede •  Standardfehler •  Konfidenzintervalle •  Signifikanztest

28.01.14

11

•  wir beschränken uns auf Unterschiede von Mittelwerten

•  wie jeder andere Parameter auch folgen die Differenzen von Mittelwerten

einer Normalverteilung

•  es lässt sich also wieder eine Stichprobenverteilung von

Mittelwertsunterschieden ΔM erstellen, die die Grundlage für die

Bestimmung von Standardfehler und KI bildet:

STANDARDFEHLER FÜR UNTERSCHIEDE


ΔM

gefundene Differenz

die Logik: diese Verteilung entsteht, wann man immer wieder Studien machen und die Differenz von zwei MiEelwerten besOmmen würde à diese verteilen sich um den wahren MiEelwertsunterschied in der PopulaOon

prinzipiell müssen zwei Fälle unterschieden werden

1.  die Differenzen stammen von Messwerten von verschiedenen Personen

à Mittelwertsunterschiede von unabhängigen Stichproben

2.  die Differenzen stammen von Messwiederholungen an denselben

Personen à Mittelwertsunterschiede von abhängigen Stichproben



Häufigkeitsverteilungen der Messwerte

SOchprobenverteilung der Differenzwerte

ΔM

xA xB

A und B können verschiedene Personen sein à unabhängige SP ODER A und B können Mess-‐wiederholungen an denselben Personen (oder sonsOge abhängige Messungen) sein à abhängige SP

28.01.14

12

Beispiel

Unterschied im Gewichtsverlust bei mehr oder weniger Schlaf

Fall 1: verschiedene Personen in den beiden Bedingungen à unabhängige SP

Fall 2: dieselben Personen in beiden Bedingungen à abhängige SP



Gew

ichtsverlust in kg

8.5h 5.5h Schlaf

Nedeltcheva et al. (2010)

A B 1,0 0,9 0,9 1,0 1,6 1,0 -‐0,4 0 1,1 -‐0,1 1,3 0,4 3,3 0,3 1,0 2,5 1,6 1,8 1,6 1,2 2,1 0,9

A B

Beispieldaten für 22 (Fall1) bzw. 11 Personen (Fall 2):

ΔM = Δμ = 0,47 à Schätzwert für den MW-‐Unterschied in der PopulaOon SDA = 0,82 SDB = 0,70

unabhängige Stichproben

•  der Standardfehler des Mittelwertsunterschieds kann wieder durch die

Streuungen innerhalb der Gruppen geschätzt werden:

•  für das Beispiel:

à bezogen auf die relevanten Gewichtsverluste, die sich hauptsächlich

zwischen 0 und 2 kg bewegen, ist das ein mittelgroßer Standardfehler



zur Erinnerung: das bedeutet, dass ca. 68% der Differenzwerte in dieser Verteilung zwischen 0,11 und 0,83 liegen ΔM

0,47

28.01.14

13

abhängige Stichproben

•  zur Erinnerung: bei abhängigen Messungen

kommt es nicht auf die Streuungen innerhalb

der Gruppen, sondern auf die Streuung der

Differenzwerte an

•  diese Streuung wird wieder für die Bestimmung

des Standardfehlers verwendet:


à Interpretation wie bei unabhängigen Messungen



8.5h 5.5h Schlaf

Design: within

Messwertedifferenzen pro Person


•  für die Bestimmung der Grenzen des KI wird wieder die t-Verteilung

verwendet

•  die Grenzen in t-Werten werden wieder mit dem Standardfehler der

Mittelwertsdifferenz verknüpft, um die Länge des Intervalls in Rohwerten

zu bestimmen:

•  für das Beispiel (bei 95% Konfidenz):

à  das KI ist recht lang und reicht sogar in den negativen Bereich hinein

à  die Schätzung ist nicht besonders zuverlässig

KONFIDENZINTERVALLE FÜR UNTERSCHIEDE


28.01.14

14



t-Verteilung

df = (nA – 1) + (nB – 1) Beispiel: 10 + 10 = 20

Alpha-‐Niveau


Darstellung des Konfidenzintervalls:

Hinweis: noch findet man solche Darstellungen von KI für

Mittelwertsunterschiede recht selten – meist werden nur die Mittelwerte der

beiden Bedingungen mit ihren jeweiligen KI dargestellt (siehe KI für

Mittelwerte)



kg

28.01.14

15


•  die Grenzen des Konfidenzintervalls berechnen sich hier entsprechend:

•  für das Beispiel (bei 95% Konfidenz):

à  Interpretation wie bei unabhängigen Messungen

Hinweis: oft sind KI für abhängige Messungen kürzer, da hier der

Standardfehler meist kleiner ist (in unserem Beispiel ist das nicht der Fall)





t-Verteilung

df = n – 1 Beispiel: 11 – 1 = 10

Alpha-‐Niveau

28.01.14

16


Darstellung des Konfidenzintervalls:

Hinweis: noch findet man solche Darstellungen von KI für

Mittelwertsunterschiede recht selten – meist werden nur die Mittelwerte der

beiden Bedingungen mit ihren jeweiligen KI dargestellt (siehe KI für

Mittelwerte)



kg

•  die Logik wie gehabt: die Nullhypothese unterstellt, dass es in der

Population keinen Unterschied gibt (genauer gesagt, dass beide

Stichproben aus derselben Population stammen)

•  auch Mittelwertsunterschiede sind t-verteilt, sodass jedem

Mittelwertsunterschied ein t-Wert zugewiesen werden kann, der dann auf

Signifikanz geprüft wird

•  die Bestimmung des t-Wertes ist wieder abhängig vom Studiendesign

•  generelles Prinzip: Mittelwertsdifferenz durch den Standardfehler teilen

SIGNIFIKANZTESTS FÜR UNTERSCHIEDE


28.01.14

17


•  Bestimmung des t-Wertes:


•  Bestimmung der Freiheitsgrade:




Formel t-Test für unabhängige Stichproben

MiEelwertsunterschied Standardfehler

!" = !! − 1 + (!! − 1)! df t-Test für unabhängige Stichproben



Signifikanzprüfung: was ist der kritische t-Wert für Alpha = 5%?

à nachsehen in der t-Verteilung bei df = 20

bei einsei)gem Testen hier, bei zweisei)gem Testen hier ablesen

H0

H0

28.01.14

18



Signifikanzprüfung:

tempirisch = 1,31 tkritisch = 2,09 à  nicht signifikant

à  das Ergebnis in SPSS:

das Programm gibt den genauen p-‐Wert an


•  Bestimmung des t-Wertes:


•  Bestimmung der Freiheitsgrade:




Formel t-Test für abhängige Stichproben

MiEelwertsunterschied Standardfehler

! = 0,470,35 = 1,34!

!" = ! − 1!

!" = 11− 1 = 10!

df t-Test für abhängige Stichproben

28.01.14

19



Signifikanzprüfung: was ist der kritische t-Wert für Alpha = 5%?

à nachsehen in der t-Verteilung bei df = 10

bei einsei)gem Testen hier, bei zweisei)gem Testen hier ablesen

H0

H0



Signifikanzprüfung:

tempirisch = 1,34 tkritisch = 2,23 à  nicht signifikant

à  das Ergebnis in SPSS:

das Programm gibt den genauen p-‐Wert an

(die Werte des KI weichen durch Rundungsfehler von den vorn berechneten etwas ab)

28.01.14

20



ein paar wichtige Hinweise

•  es ist egal, welche Stichprobe man von welcher abzieht (A-B oder B-A) –

der berechnete t-Wert kann entsprechend positiv oder negativ sein

•  bei ungerichteten Hypothesen spielt das keine weitere Rolle

•  bei gerichteten Hypothesen ist zunächst zu prüfen, ob der Unterschied

in die richtige Richtung geht (das hängt nicht vom Vorzeichen des t-

Wertes sondern davon ab, welche Stichprobe von welcher abgezogen

wurde!)

•  diese Prüfung geschieht deskriptiv – durch die Mittelwerte und/oder eine

Abbildung

•  geht die Differenz in die falsche Richtung, erübrigen sich

inferenzstatistische Angaben!

•  generell gilt: immer zuerst eine deskriptive Darstellung (am besten

Abbildung) und erst dann ein Signifikanztest



Darstellung

•  im Fließtext werden die Ergebnisse von Signifikanztests nahezu immer

angegeben

•  in Abbildungen wird manchmal der p-Wert eingefügt:

p = .20

28.01.14

21



Konfidenzintervalle und Signifikanztests – eine interessante Faustregel

•  da in Abbildungen häufig nur die Konfidenzintervalle der Mittelwerte

angegeben sind, kann man mit Hilfe dieser Faustregel „sehen“, auf

welchem Niveau ein Unterschied signifikant ist

à das ist ein weiterer Grund, warum eine gute Abbildung einem Signifikanztest vorzuziehen ist!



Zusammenhang von Effektgrößen und inferenzstatistischen Aussagen

am Beispiel eines Mittelwertsunterschiedes bei unabhängigen SP:

Effekt

wird durch Standardisierung anhand der Streuungen zur

Effektgröße

drei mögliche inferenzstaOsOsche Aussagen: 1.  Schätzung des Standardfehlers

des Effektes anhand dessen SOchprobenverteilung

2.  Angabe eines Konfidenzintervalls für den Effekt anhand dessen SOchprobenverteilung

3.  Berechnung der Prüfgröße t und Prüfen auf Signifikanz mit Hilfe der t-‐Verteilung (p < α?)

Verteilung möglicher Effekte beim wiederholten Ziehen

Verteilung möglicher Effekte beim wiederholten Ziehen

Verteilung der Prüfgröße t, falls die H0 zutrir

se

α p

sA sB

zwei unabhängige SOchproben: Ngesamt wird aufgeteilt in nA und nB

28.01.14

22



Voraussetzungen für die Berechnung von t-Tests

Signifikanztests basieren auf Stichprobenverteilungen und damit auf der

Betrachtung von Streuungen – daher sind diese Tests nur sinnvoll, wenn

•  intervallskalierte Daten vorliegen

•  die Daten in der Population normalverteilt sind

•  die Streuungen in beiden Stichproben in etwa gleich groß sind

•  und – bei unabhängigen Messungen – die Stichproben auch tatsächlich

unabhängig sind (gut durch Randomisieren zu erreichen)

•  die Vergleichbarkeit der Streuungen bei unabhängigen Stichproben kann

man rechnerisch prüfen (Tests auf Varianzhomogenität)

•  t-Tests gelten aber als robust: kleine bis moderate Abweichungen der

Voraussetzungen führen dennoch zu guten Ergebnissen



Bestimmung von Effektgrößen aus den Ergebnissen von t-Tests

•  aus den Signifikanztestergebnissen lassen sich Effektgrößen bestimmen

(als Alternative zur Berechnung aus den Rohwerten)

•  dies geschieht, indem die Stichprobengröße einbezogen wird

Abstandsmaße Zusammenhangsmaße

unabhängige SOchproben

abhängige SOchproben

-‐

! = !!!! + !"!! = ! 1

!!+ 1!!

!

! = !!!

diese Berechnung wird nicht empfohlen, da sie zu verzerrten Schätzungen führen kann

28.01.14

23

INFERENZSTATISTIK FÜR UNTERSCHIEDE


Verwendung der drei Aussagen für Mittelwertsunterschiede:

Standardfehler

im Fließtext: eher selten

in Abbildungen: so gut wie nie

Konfidenzintervalle

im Fließtext: recht häufig

in Abbildungen: zunehmend beliebt

Signifikanztests

im Fließtext: nahezu immer

in Abbildungen: ab und zu

•  für Mittelwertsunterschiede werden so gut wie immer inferenzstatistische

Aussagen gemacht

•  hier muss darauf geachtet werden, ob das Studiendesign abhängige oder

unabhängige Stichproben benutzt

•  der Standardfehler wird recht selten benutzt

•  Konfidenzintervalle nutzen den SE und die t-Verteilung und werden dann um die

Mittelwertsdifferenz herum aufgespannt

•  der Signifikanztest, der prüft, ob ein Mittelwertsunterschied ungleich 0 in der

Population vorhanden ist, ist der t-Test, den es für unabhängige Stichproben und

abhängige Stichproben gibt

•  hier ist auch relevant, ob einseitig oder zweiseitig getestet werden soll

•  jedem inferenzstatistischen Verfahren sollte eine deskriptive Analyse

vorangestellt werden, am besten eine Abbildung

IS FÜR UNTERSCHIEDE STECKBRIEF


Documents

METHODENLEHRE I - tu-chemnitz.de · 28.01.14 2 VL Methodenlehre I WS13/14 Schäfer Inferenzstatistik für Zusammenhänge • Standardfehler • Konﬁdenzintervalle • Signiﬁkanztest