Upload
doankien
View
222
Download
0
Embed Size (px)
Citation preview
28.01.14
1
VL Methodenlehre I WS13/14 Schäfer
METHODENLEHRE I WS 2013/14
THOMAS SCHÄFER
VL Methodenlehre I WS13/14 Schäfer
DAS THEMA: INFERENZSTATISTIK IV – INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE • Inferenzstatistik für Zusammenhänge • Inferenzstatistik für Unterschiede
28.01.14
2
VL Methodenlehre I WS13/14 Schäfer
Inferenzstatistik für Zusammenhänge • Standardfehler • Konfidenzintervalle • Signifikanztest
• Zusammenhänge werden in der Regel durch Korrelationskoeffizienten
ausgedrückt, am häufigsten durch die Pearson-Korrelation r
• ein in einer Stichprobe gefundener Zusammenhang r kann wieder auf die
Population verallgemeinert werden – der Schätzwert heißt ρ (Rho)
• auch für diese Schätzung fragen wir wieder nach der Güte und wollen
daher inferenzstatistische Aussagen machen
Beispiel: Wie groß ist der Zusammenhang zwischen der Anzahl von Störchen
und der Anzahl Neugeborener? à Wir untersuchen als Stichprobe den Raum
Chemnitz über 10 Jahre:
à r = ρ = .38
STANDARDFEHLER FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
Jahr Störche Geburten 1 12 4408 2 14 3990 3 11 3792 4 14 4020 5 15 3899 6 9 3789 7 16 4142 8 11 3879 9 13 4032 10 12 4001
28.01.14
3
• der Standardfehler für ρ berechnet sich wie folgt:
• für unser Beispiel:
à bezogen auf die Skala von r ist das ein recht großer Standardfehler
à anders als bei Mittelwerten wird der Standardfehler für Korrelationen
normalerweise nicht in Abbildungen irgendeiner Art verwendet
STANDARDFEHLER FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
ρ
ρ
• auch bei Korrelationen gilt: eigentlich müssten wir für jeden
Koeffizienten eine Stichprobenverteilung erstellen, um die Grenzen des
KI zu bestimmen
• auch hier könnte aber stattdessen die t-Verteilung verwendet werden
• ABER: die t-Verteilung ist nur gültig, wenn r = 0, ansonsten sind rs nicht
symmetrisch verteilt und können nicht durch t repräsentiert werden
• da wir aber in der Regel Effekte ungleich 0 haben, kann die t-Verteilung
nicht verwendet werden à stattdessen ist ein anderer „Umweg“ nötig,
der die Fisher-z-Transformation benutzt:
1. das gefundene r wird in einen z-Wert umgerechnet
2. die Grenzen des KI werden für diesen z-Wert bestimmt
3. die Grenzen in z-Werten werden wieder in rs zurückgerechnet
KI FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
28.01.14
4
à da Korrelationskoeffizienten von -1 bis 1 begrenzt sind, ist ihre
Stichprobenverteilung nur bei 0 symmetrisch; sie wird schiefer, je
stärker die Korrelation von 0 abweicht
à KI sind dann nicht mehr symmetrisch und können nicht mit Hilfe der t-
Verteilung bestimmt werden
KI FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
Fisher‘s-r-to-z-Tabelle
KI FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
r = .38 in der Tabelle suchen à der entsprechende zr-‐Wert ist 0,40
SchriE 1
28.01.14
5
z-Tabelle
Was sind die Grenzen des 95%-KI?
KI FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
à wieder bei 97,5% nachsehen à z = 1,96
SchriE 2
Bestimmung der Grenzen des KI ausgedrückt in z-Werten:
für das Beispiel:
à diese beiden Grenzen müssen nun wieder in rs umgerechnet werden
KI FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
SchriE 2
28.01.14
6
Fisher‘s-r-to-z-Tabelle
KI FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
für z = -‐0,34: à r = -‐0,327 à untere Grenze für z = 1,14: à r = 0,814 à obere Grenze
Hinweis: negaOve z-‐Werte führen auch zu negaOven rs!
SchriE 3
als Abbildung:
à wir finden ein asymmetrisches KI
KI FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
28.01.14
7
• wieder die Logik des Signifikanztests: unterstellt wird die H0, dass der
wahre Zusammenhang in der Population ρ = 0 ist • die H0-Verteilung zeigt also mögliche Korrelationen ungleich 0, die man
zufällig finden kann, auch wenn die H0 gilt • da die H0 von ρ = 0 ausgeht (und Korrelationen unter dieser
Voraussetzung normalverteilt sind), kann jetzt die t-Verteilung verwendet werden
SIGNIFIKANZTESTS FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
ρ
0
t
0
die Verteilung von KorrelaOonskoeffizienten kann durch die t-‐Verteilung
repräsenOert werden
• für den Test muss also die Korrelation in einen t-Wert umgerechnet
werden:
• dieser t-Wert wird dann auf Signifikanz geprüft mit
für das Beispiel:
à kritischer t-Wert für Alpha = 5%, df = 8, zweiseitig: 2,31
à tempirisch < tkritisch à Korrelationskoeffizient nicht signifikant
SIGNIFIKANZTESTS FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
(n ist die Anzahl der Wertepaare)
Formel t-Test für Korrelationskoeffizienten
df t-Test für Korrelationskoeffizienten
28.01.14
8
SIGNIFIKANZTESTS FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
t-Verteilung
df = n – 2 Beispiel: 10 – 2 = 8 à tkri)sch = 2,31
Alpha-‐Niveau
SIGNIFIKANZTESTS FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
das Beispiel in SPSS:
hier gibt es wieder den exakten p-‐Wert: 0,28
28.01.14
9
INFERENZSTATISTIK FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
Verwendung der drei Aussagen für Korrelationskoeffizienten:
Standardfehler
im Fließtext: so gut wie nie
in Abbildungen: so gut wie nie
Konfidenzintervalle
im Fließtext: zunehmend beliebt
in Abbildungen: zunehmend beliebt
Signifikanztests
im Fließtext: nahezu immer
in Abbildungen: sehr selten
INFERENZSTATISTIK FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
noch ein Hinweis
• auch Regressionskoeffizienten sind Zusammenhangsmaße
• für Regressionskoeffizienten können alle drei inferenzstatischen Maße
bestimmt werden
• auch hier sind die Konfidenzintervalle asymmetrisch, wenn β ≠ 0
• der Signifikanztest, der prüft, ob ein Regressionskoeffizient in der
Population von 0 verschieden ist, ist auch ein t-Test:
mit
Formel t-Test für Regressionskoeffizienten
df t-Test für Regressionskoeffizienten
Regressionskoeffizient Standardfehler des Koeffizienten
(n – SOchprobengröße; k – Anzahl von Prädiktoren)
28.01.14
10
• für Zusammenhänge werden inferenzstatische Aussagen recht häufig gemacht
• der Standardfehler wird aus der gefundenen Korrelation und der
Stichprobengröße berechnet
• Konfidenzintervalle sind für ρ ungleich 0 nicht symmetrisch, daher wird die
Fisher-r-in-z-Transformation genutzt, um die Grenzen des Intervalls zunächst in z-
Werten zu bestimmen und dann in Korrelationen zurück zu rechnen
• Konfidenzintervalle für Korrelationen sind zunehmend beliebt und sind sehr
empfehlenswert
• der Signifikanztest, der prüft, ob ein Korrelationskoeffizient in der Population
größer ist als 0, ist wieder ein t-Test
• auch für Regressionskoeffizienten können die drei inferenzstatistischen Maße
bestimmt werden
IS FÜR ZUSAMMENHÄNGE STECKBRIEF
VL Methodenlehre I WS13/14 Schäfer
VL Methodenlehre I WS13/14 Schäfer
Inferenzstatistik für Unterschiede • Standardfehler • Konfidenzintervalle • Signifikanztest
28.01.14
11
• wir beschränken uns auf Unterschiede von Mittelwerten
• wie jeder andere Parameter auch folgen die Differenzen von Mittelwerten
einer Normalverteilung
• es lässt sich also wieder eine Stichprobenverteilung von
Mittelwertsunterschieden ΔM erstellen, die die Grundlage für die
Bestimmung von Standardfehler und KI bildet:
STANDARDFEHLER FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
ΔM
gefundene Differenz
die Logik: diese Verteilung entsteht, wann man immer wieder Studien machen und die Differenz von zwei MiEelwerten besOmmen würde à diese verteilen sich um den wahren MiEelwertsunterschied in der PopulaOon
prinzipiell müssen zwei Fälle unterschieden werden
1. die Differenzen stammen von Messwerten von verschiedenen Personen
à Mittelwertsunterschiede von unabhängigen Stichproben
2. die Differenzen stammen von Messwiederholungen an denselben
Personen à Mittelwertsunterschiede von abhängigen Stichproben
STANDARDFEHLER FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
Häufigkeitsverteilungen der Messwerte
SOchprobenverteilung der Differenzwerte
ΔM
xA xB
A und B können verschiedene Personen sein à unabhängige SP ODER A und B können Mess-‐wiederholungen an denselben Personen (oder sonsOge abhängige Messungen) sein à abhängige SP
28.01.14
12
Beispiel
Unterschied im Gewichtsverlust bei mehr oder weniger Schlaf
Fall 1: verschiedene Personen in den beiden Bedingungen à unabhängige SP
Fall 2: dieselben Personen in beiden Bedingungen à abhängige SP
STANDARDFEHLER FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
Gew
ichtsverlust in kg
8.5h 5.5h Schlaf
Nedeltcheva et al. (2010)
A B 1,0 0,9 0,9 1,0 1,6 1,0 -‐0,4 0 1,1 -‐0,1 1,3 0,4 3,3 0,3 1,0 2,5 1,6 1,8 1,6 1,2 2,1 0,9
A B
Beispieldaten für 22 (Fall1) bzw. 11 Personen (Fall 2):
ΔM = Δμ = 0,47 à Schätzwert für den MW-‐Unterschied in der PopulaOon SDA = 0,82 SDB = 0,70
unabhängige Stichproben
• der Standardfehler des Mittelwertsunterschieds kann wieder durch die
Streuungen innerhalb der Gruppen geschätzt werden:
• für das Beispiel:
à bezogen auf die relevanten Gewichtsverluste, die sich hauptsächlich
zwischen 0 und 2 kg bewegen, ist das ein mittelgroßer Standardfehler
STANDARDFEHLER FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
zur Erinnerung: das bedeutet, dass ca. 68% der Differenzwerte in dieser Verteilung zwischen 0,11 und 0,83 liegen ΔM
0,47
28.01.14
13
abhängige Stichproben
• zur Erinnerung: bei abhängigen Messungen
kommt es nicht auf die Streuungen innerhalb
der Gruppen, sondern auf die Streuung der
Differenzwerte an
• diese Streuung wird wieder für die Bestimmung
des Standardfehlers verwendet:
• für das Beispiel:
à Interpretation wie bei unabhängigen Messungen
STANDARDFEHLER FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
8.5h 5.5h Schlaf
Design: within
Messwertedifferenzen pro Person
unabhängige Stichproben
• für die Bestimmung der Grenzen des KI wird wieder die t-Verteilung
verwendet
• die Grenzen in t-Werten werden wieder mit dem Standardfehler der
Mittelwertsdifferenz verknüpft, um die Länge des Intervalls in Rohwerten
zu bestimmen:
• für das Beispiel (bei 95% Konfidenz):
à das KI ist recht lang und reicht sogar in den negativen Bereich hinein
à die Schätzung ist nicht besonders zuverlässig
KONFIDENZINTERVALLE FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
28.01.14
14
KONFIDENZINTERVALLE FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
t-Verteilung
df = (nA – 1) + (nB – 1) Beispiel: 10 + 10 = 20
Alpha-‐Niveau
unabhängige Stichproben
Darstellung des Konfidenzintervalls:
Hinweis: noch findet man solche Darstellungen von KI für
Mittelwertsunterschiede recht selten – meist werden nur die Mittelwerte der
beiden Bedingungen mit ihren jeweiligen KI dargestellt (siehe KI für
Mittelwerte)
KONFIDENZINTERVALLE FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
kg
28.01.14
15
abhängige Stichproben
• die Grenzen des Konfidenzintervalls berechnen sich hier entsprechend:
• für das Beispiel (bei 95% Konfidenz):
à Interpretation wie bei unabhängigen Messungen
Hinweis: oft sind KI für abhängige Messungen kürzer, da hier der
Standardfehler meist kleiner ist (in unserem Beispiel ist das nicht der Fall)
KONFIDENZINTERVALLE FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
KONFIDENZINTERVALLE FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
t-Verteilung
df = n – 1 Beispiel: 11 – 1 = 10
Alpha-‐Niveau
28.01.14
16
abhängige Stichproben
Darstellung des Konfidenzintervalls:
Hinweis: noch findet man solche Darstellungen von KI für
Mittelwertsunterschiede recht selten – meist werden nur die Mittelwerte der
beiden Bedingungen mit ihren jeweiligen KI dargestellt (siehe KI für
Mittelwerte)
KONFIDENZINTERVALLE FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
kg
• die Logik wie gehabt: die Nullhypothese unterstellt, dass es in der
Population keinen Unterschied gibt (genauer gesagt, dass beide
Stichproben aus derselben Population stammen)
• auch Mittelwertsunterschiede sind t-verteilt, sodass jedem
Mittelwertsunterschied ein t-Wert zugewiesen werden kann, der dann auf
Signifikanz geprüft wird
• die Bestimmung des t-Wertes ist wieder abhängig vom Studiendesign
• generelles Prinzip: Mittelwertsdifferenz durch den Standardfehler teilen
SIGNIFIKANZTESTS FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
28.01.14
17
unabhängige Stichproben
• Bestimmung des t-Wertes:
• für das Beispiel:
• Bestimmung der Freiheitsgrade:
• für das Beispiel:
SIGNIFIKANZTESTS FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
Formel t-Test für unabhängige Stichproben
MiEelwertsunterschied Standardfehler
!" = !! − 1 + (!! − 1)! df t-Test für unabhängige Stichproben
SIGNIFIKANZTESTS FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
Signifikanzprüfung: was ist der kritische t-Wert für Alpha = 5%?
à nachsehen in der t-Verteilung bei df = 20
bei einsei)gem Testen hier, bei zweisei)gem Testen hier ablesen
H0
H0
28.01.14
18
SIGNIFIKANZTESTS FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
Signifikanzprüfung:
tempirisch = 1,31 tkritisch = 2,09 à nicht signifikant
à das Ergebnis in SPSS:
das Programm gibt den genauen p-‐Wert an
abhängige Stichproben
• Bestimmung des t-Wertes:
• für das Beispiel:
• Bestimmung der Freiheitsgrade:
• für das Beispiel:
SIGNIFIKANZTESTS FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
Formel t-Test für abhängige Stichproben
MiEelwertsunterschied Standardfehler
! = 0,470,35 = 1,34!
!" = ! − 1!
!" = 11− 1 = 10!
df t-Test für abhängige Stichproben
28.01.14
19
SIGNIFIKANZTESTS FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
Signifikanzprüfung: was ist der kritische t-Wert für Alpha = 5%?
à nachsehen in der t-Verteilung bei df = 10
bei einsei)gem Testen hier, bei zweisei)gem Testen hier ablesen
H0
H0
SIGNIFIKANZTESTS FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
Signifikanzprüfung:
tempirisch = 1,34 tkritisch = 2,23 à nicht signifikant
à das Ergebnis in SPSS:
das Programm gibt den genauen p-‐Wert an
(die Werte des KI weichen durch Rundungsfehler von den vorn berechneten etwas ab)
28.01.14
20
SIGNIFIKANZTESTS FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
ein paar wichtige Hinweise
• es ist egal, welche Stichprobe man von welcher abzieht (A-B oder B-A) –
der berechnete t-Wert kann entsprechend positiv oder negativ sein
• bei ungerichteten Hypothesen spielt das keine weitere Rolle
• bei gerichteten Hypothesen ist zunächst zu prüfen, ob der Unterschied
in die richtige Richtung geht (das hängt nicht vom Vorzeichen des t-
Wertes sondern davon ab, welche Stichprobe von welcher abgezogen
wurde!)
• diese Prüfung geschieht deskriptiv – durch die Mittelwerte und/oder eine
Abbildung
• geht die Differenz in die falsche Richtung, erübrigen sich
inferenzstatistische Angaben!
• generell gilt: immer zuerst eine deskriptive Darstellung (am besten
Abbildung) und erst dann ein Signifikanztest
SIGNIFIKANZTESTS FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
Darstellung
• im Fließtext werden die Ergebnisse von Signifikanztests nahezu immer
angegeben
• in Abbildungen wird manchmal der p-Wert eingefügt:
p = .20
28.01.14
21
SIGNIFIKANZTESTS FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
Konfidenzintervalle und Signifikanztests – eine interessante Faustregel
• da in Abbildungen häufig nur die Konfidenzintervalle der Mittelwerte
angegeben sind, kann man mit Hilfe dieser Faustregel „sehen“, auf
welchem Niveau ein Unterschied signifikant ist
à das ist ein weiterer Grund, warum eine gute Abbildung einem Signifikanztest vorzuziehen ist!
SIGNIFIKANZTESTS FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
Zusammenhang von Effektgrößen und inferenzstatistischen Aussagen
am Beispiel eines Mittelwertsunterschiedes bei unabhängigen SP:
Effekt
wird durch Standardisierung anhand der Streuungen zur
Effektgröße
drei mögliche inferenzstaOsOsche Aussagen: 1. Schätzung des Standardfehlers
des Effektes anhand dessen SOchprobenverteilung
2. Angabe eines Konfidenzintervalls für den Effekt anhand dessen SOchprobenverteilung
3. Berechnung der Prüfgröße t und Prüfen auf Signifikanz mit Hilfe der t-‐Verteilung (p < α?)
Verteilung möglicher Effekte beim wiederholten Ziehen
Verteilung möglicher Effekte beim wiederholten Ziehen
Verteilung der Prüfgröße t, falls die H0 zutrir
se
α p
sA sB
zwei unabhängige SOchproben: Ngesamt wird aufgeteilt in nA und nB
28.01.14
22
SIGNIFIKANZTESTS FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
Voraussetzungen für die Berechnung von t-Tests
Signifikanztests basieren auf Stichprobenverteilungen und damit auf der
Betrachtung von Streuungen – daher sind diese Tests nur sinnvoll, wenn
• intervallskalierte Daten vorliegen
• die Daten in der Population normalverteilt sind
• die Streuungen in beiden Stichproben in etwa gleich groß sind
• und – bei unabhängigen Messungen – die Stichproben auch tatsächlich
unabhängig sind (gut durch Randomisieren zu erreichen)
• die Vergleichbarkeit der Streuungen bei unabhängigen Stichproben kann
man rechnerisch prüfen (Tests auf Varianzhomogenität)
• t-Tests gelten aber als robust: kleine bis moderate Abweichungen der
Voraussetzungen führen dennoch zu guten Ergebnissen
SIGNIFIKANZTESTS FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
Bestimmung von Effektgrößen aus den Ergebnissen von t-Tests
• aus den Signifikanztestergebnissen lassen sich Effektgrößen bestimmen
(als Alternative zur Berechnung aus den Rohwerten)
• dies geschieht, indem die Stichprobengröße einbezogen wird
Abstandsmaße Zusammenhangsmaße
unabhängige SOchproben
abhängige SOchproben
-‐
! = !!!! + !"!! = ! 1
!!+ 1!!
!
! = !!!
diese Berechnung wird nicht empfohlen, da sie zu verzerrten Schätzungen führen kann
28.01.14
23
INFERENZSTATISTIK FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
Verwendung der drei Aussagen für Mittelwertsunterschiede:
Standardfehler
im Fließtext: eher selten
in Abbildungen: so gut wie nie
Konfidenzintervalle
im Fließtext: recht häufig
in Abbildungen: zunehmend beliebt
Signifikanztests
im Fließtext: nahezu immer
in Abbildungen: ab und zu
• für Mittelwertsunterschiede werden so gut wie immer inferenzstatistische
Aussagen gemacht
• hier muss darauf geachtet werden, ob das Studiendesign abhängige oder
unabhängige Stichproben benutzt
• der Standardfehler wird recht selten benutzt
• Konfidenzintervalle nutzen den SE und die t-Verteilung und werden dann um die
Mittelwertsdifferenz herum aufgespannt
• der Signifikanztest, der prüft, ob ein Mittelwertsunterschied ungleich 0 in der
Population vorhanden ist, ist der t-Test, den es für unabhängige Stichproben und
abhängige Stichproben gibt
• hier ist auch relevant, ob einseitig oder zweiseitig getestet werden soll
• jedem inferenzstatistischen Verfahren sollte eine deskriptive Analyse
vorangestellt werden, am besten eine Abbildung
IS FÜR UNTERSCHIEDE STECKBRIEF
VL Methodenlehre I WS13/14 Schäfer