Der t -Test

Der t-Test

06_ttest(1) 1

Gliederung • Statistische Hypothesen

– Null- und Alternativhypothese– Alpha- und Betafehler– Statistische Entscheidungen

• Mittelwertsvergleiche mit dem t-Test– Überblick: 3 Arten von t-Tests– Stichprobenkennwerteverteilung von Mittelwertsdifferenzen– Die t-Verteilung– Die Interpretation von t-Werten– Voraussetzungen des t-Tests

Statistische Hypothesen

• Die Inferenzstatistik macht Aussagen über eine Population, aus welcher die untersuchten Stichproben gezogen wurden.

• Dabei werden statistische Hypothesen getestet.• Statistische Hypothesen sind Erwartungen über Unterschiede

zwischen (bzw. Zusammenhänge von) Variablen.• Statistische Hypothesen sollten immer vor einer Untersuchung

formuliert werden• Beispiele für statistische Hypothesen:

– Frauen sind ängstlicher als Männer.– Es besteht ein negativer Zusammenhang zwischen Ängstlichkeit und

Optimismus.– Die Selbstsicherheit von Teilnehmer eines Kommunikationstrainigs ist nach

dem Training höher als vor dem Training.

06_ttest(1) 2

Statistische Hypothesen

Woher kommen die Hypothesen?

• Eine psychologische Untersuchung wird immer mit dem Ziel durchgeführt, eine bestimmte Forschungsfrage zu beantworten.

• Beispiel: Wenn ein neues Therapieprogramm entwickelt wurde, dann muss der Entwickler dieses Programms zeigen, dass es den Teilnehmern nach der Therapie besser geht als vorher.

• Je nach Ziel des Programms wird eine Hypothese formuliert:– Beispiel: „Teilnehmer weisen in einem Test zur Depressivität nach der

Therapie geringere Werte als vor der Therapie auf.“

06_ttest(1) 3

Nullhypothese und Alternativhypothese

• Bei statistischen Tests werden immer (unabhängig von der Erwartung des beteiligten Forschers) zwei gegensätzliche Hypothesen formuliert:(a) Die Nullhypothese (H0) besagt, dass es keinen Unterschied zwischen

zwei Populationen (bzw. keinen Zusammenhang zwischen zwei Merkmalen) gibt.

(b) Die Alternativhypothese (H1) besagt dagegen, dass es einen Unterschied (bzw. einen Zusammenhang) gibt.

• Es kann also immer nur eine von beiden Hypothesen zutreffen!

• Die beiden statistischen Hypothesen (H0 und H1) werden unabhängig von den tatsächlichen inhaltlichen Erwartungen formuliert.

06_ttest(1) 4


Es gibt zwei Formen der Alternativhypothese• Eine ungerichtete Alternativhypothese (H1) besagt lediglich, dass

es einen Unterschied (bzw. einen Zusammenhang) gibt („zweiseitiger Test“).– Diese Hypothese gilt als bestätigt,

• wenn Gruppe 1 größere Werte als Gruppe 2 hat• wenn Gruppe 2 größere Werte als Gruppe 1 hat• (bzw. wenn ein pos. oder ein neg. Zusammenhang zwischen zwei Variablen

besteht)

• Eine gerichtete Alternativhypothese (H1) spezifiziert die Richtung des Unterschieds (des Zusammenhang) („einseitiger Test“).– Beispiel: Es wird erwartet,

• dass Gruppe 1 größere Werte als Gruppe 2 hat.• (bzw. dass ein pos. neg. Zusammenhang zwischen zwei Variablen besteht)

06_ttest(1) 5


Formale Schreibweise• Ungerichtete Alternativhypothese:

– H1: μ1 ≠ μ2

– H0: μ1 = μ2

• Gerichtete Alternativhypothese (1. Möglichkeit):– H1: μ1 > μ2

– H0: μ1 ≤ μ2

• Gerichtete Alternativhypothese (2. Möglichkeit):– H1: μ1 < μ2

– H0: μ1 ≥ μ2

• Die H0 hängt also von der Auswahl der H1 ab!

06_ttest(1) 6

Statistische Hypothesenprüfung

Grundgedanke eines statistischen Tests• Bei der statistischen Hypothesenprüfung berechnet, wie

wahrscheinlich die empirischen (Mittel-)Werte der Stichprobe sind, wenn in der Population die H0 gilt.

• Beispiel:– H0: μLOT, w = μLOT, m (Mittelwert LOT ist für Frauen und Männer gleich)– Gefundenes Ergebnis:– Wie wahrscheinlich ist dieses Ergebnis, wenn die H0 gilt?– Problem: Exakte Werte einer kontinuierlichen Wahrscheinlich-

keitsverteilung haben immer die Wahrscheinlichkeit 0.– Lösung: Wie Wahrscheinlich ist es, einen Unterschied von 0.3 oder mehr

zu finden, wenn die H0 gilt?– Wenn dies sehr unwahrscheinlich ist, wird die H0 verworfen, und die H1

angenommen– Andernfalls wird die H0 beibehalten.

06_ttest(1) 7

2.23, wlotx 9.22, mlotx

Alphafehler und Betafehler

Fehler bei der statistischen Entscheidung• Die statistische Entscheidung für die H0 oder die H1 wird aufgrund

von Wahrscheinlichkeiten gemacht• Daher sind immer Entscheidungsfehler möglich• Je nach der Entscheidung kann man zwei Fehler machen:

(1) Man entscheidet sich für die H1, obgleich zwischen den Populations-mittelwerten kein Unterschied existiert („α-Fehler“ bzw. „Fehler erster Art“).

(2) Man entscheidet sich für die H0, obgleich es auf Populationsebene einen bedeutsamen Unterschied gibt („β-Fehler“ bzw. „Fehler zweiter Art“).

• Für Fehlertypen sollte vor einer Untersuchung die gewünschte Wahrscheinlichkeit festgelegt werden (oft geschieht dies aber nur für den Alpha-Fehler)

06_ttest(1) 8


Das α-Niveau

• Das α-Niveau gibt die Wahrscheinlichkeit dafür an, dass ein Test einen bedeutsamen Effekt anzeigt, obwohl in der Population kein Effekt besteht:– Wenn die Wahrscheinlichkeit für den gefundenen Effekt unter der H0

kleiner als α ist, wird die H0 verworfen und die H1 angenommen.– Mit der Wahrscheinlichkeit α wird also die H1 fälschlicherweise

angenommen.

• Konventionen für das α-Niveau:– (p ≤ 0.10 „marginal signifikantes“ Ergebnis)– p ≤ 0.05 „signifikantes“ Ergebnis – p ≤ 0.01 „hoch signifikantes“ Ergebnis

06_ttest(1) 9


Das β-Niveau

• Das β-Niveau gibt an, wie wahrscheinlich es ist, dass ein Test keinen bedeutsamen Effekt anzeigt, obwohl in der Population ein Effekt besteht:– Mit der Wahrscheinlichkeit β wird also die H0 fälschlicherweise

beibehalten.

• Konventionen für das β-Niveau…– … gibt es leider nicht– Es gibt jedoch eigentlich keinen Grund warum β>α sein sollte (obwohl das

in vielen Untersuchungen der Fall ist).– β kann im Gegensatz zu α nicht frei gewählt werden, sondern ergibt sich

aus verschiedenen anderen Größen (u.a. aus dem gewählten α Niveau und der Stichprobengröße)

06_ttest(1) 10

Statistische Entscheidungen

06_ttest(1) 11

In der Populationgilt die

Testergebnis Ent-scheidung H0 H1

p > α „H0“ korrekt β

p < α „H1 “ α korrekt

Der t-Test

Drei Formen des t-Tests(1) Der t-Test für unabhängige Stichproben

– Dieser Test prüft, ob sich die Mittelwerte von zwei Gruppen unterscheiden

– Beispiel: „Sind Frauen ängstlicher als Männer?“

(2) Der t-Test für abhängige Stichproben– Dieser Test prüft, ob sich der Mittelwert einer Stichprobe zu zwei

Messzeitpunkten unterscheidet– Beispiel: „Ist der Mittelwert der Ängstlichkeit nach einer Therapie größer

als vor der Therapie“

(3) Der Ein-Gruppen t-Test– Dieser Test prüft, ob sich der Mittelwert einer Gruppe von einem

vorgegeben Wert unterscheidet– Beispiel: „Liegt der mittlere IQ einer Gruppe über 100?“

06_ttest(1) 12

Der t-Test für unabhängige Stichproben

• Mit dem t-Test für unabhängige Stichproben wird verglichen, ob sich zwei Populationsmittelwerte voneinander unterscheiden.

• Der t-Test gehört zu den parametrischen Testverfahren. Parametrische Testverfahren setzen eine bestimmte Verteilungsform (in der Regel die Normalverteilung) des untersuchten Merkmals voraus.

• Daher bildet die Normalverteilung des untersuchten Merkmals eine Voraussetzung für den t-Tests.

06_ttest(1) 13

Kennwert des t-Tests

Der Kennwert des t-Tests• Der Kennwert des t-Tests ist die Differenz der Mittelwerte der

beiden Stichproben:

• Der t-Test schätzt die bedingte Wahrscheinlichkeit :

• Wenn p < α, wird die H0 verworfen und die H1 angenommen.

06_ttest(1) 14

21 xxx

)|( 0Hp x

Stichprobenkennwerteverteilung

Die Stichprobenkennwerteverteilung des t-Tests• Um die Wahrscheinlichkeit zu bestimmen, wird eine theoretische

Stichprobenkennwerteverteilung der Mittelwertsdifferenzen unter der Nullhypothese gebildet.

• Diese Verteilung gibt an, wie sich empirische Mittelwerts-differenzen verteilen, wenn man sehr oft Stichproben zieht.

06_ttest(1) 15

-10 -5 0 5 100.0

0.1

0.2

0.3

0.4

x1 x2


Stichprobenkennwerteverteilung• Wenn die H0 gilt, muss die Stichproben-

kennwerteverteilung ihren Gipfel bei 0haben.

• Die theoretische Verteilung von Mittelwertsdifferenzen ist bei großen Stichproben normalverteilt.

• Bei kleineren Stichproben ergibt sich eine „schmalgipfligere“ Verteilung.

• Wenn die Verteilung bekannt ist, kann die Wahrscheinlichkeit für bestimmte Wertebereiche als „Fläche unter der Kurve“ bestimmt werden.

06_ttest(1) 16

-10 -5 0 5 100.0

0.1

0.2

0.3

0.4

x1 x2


Der Standardfehler der Stichprobenkennwerteverteilung• Der Standardfehler der Stichprobenkennwerteverteilung des

t-Tests hängt von den Standardabweichungen und den Größen der beiden Teilstichproben ab:

• Der Standardfehler wird benötigt, um die gefundene Mittelwertsdifferenz interpretieren zu können

06_ttest(1) 17

2

22

1

21 ˆˆˆ

21 NNxx


Die t-Verteilung• Die empirische Mittelwertsdifferenz wird durch den

Standardfehler dividiert.

• Der resultierende Wert kann nun mit der t-Verteilung verglichen werden.

• Die genaue For der t-Verteilung hängt von deren Freiheitsgraden (df = degree of freedom) ab.

06_ttest(1) 18

21

ˆ21

xx

xxdft

Freiheitsgrade

Die Freiheitsgrade der t-Verteilung• Die Freiheitsgrade der t-Verteilung berechnen sich als:

• Dabei beeinflussen die Freiheitsgrade die Form der t-Verteilung.• Bei vielen Freiheitsgraden (df >120) ist die t-Verteilung nahezu

identisch mit der z-Verteilung.• Je weniger Freiheitsgrade gegeben sind, desto schmalgipfliger

wird die t-Verteilung.

06_ttest(1) 19

221 NNdf


Entscheidung über die Nullhypothese• Mittels der t-Tabelle wird der empirische t-Wert interpretiert.• Dazu wird ein kritischer t-Wert aus der t-Tabelle entnommen

– Der kritische t-Wert häng dabei ab:• von den Freiheitsgraden,• von dem gewählten Alpha-Nivea• von der Art der Testung (einseitig vs. zweiseitig)

– Der kritische t-Wert definiert die Grenze des Bereichs für den empirischen t-Wert, ab dem die H0 verworfen wird.

06_ttest(1) 20


06_ttest(1) 21

-3 -2 -1 0 1 2 30

0.1

0.2

0.3

0.4

p = 1-

tkrit

-3 -2 -1 0 1 2 30

0.1

0.2

0.3

0.4

p = 1-

tkrit

H0 H1

H1H1H0

einseitiger Test(gerichtete H0)

zweiseitiger Test(ungerichtete H0)


06_ttest(1) 22

Entscheidungsregeln• Einseitiger Test:

– Wenn temp > tkrit wird die H0 verworfen

• Zweiseitiger Test– Wenn |temp| > tkrit wird die H0 verworfen

• In der t-Tabelle werden immer Werte für den einseitigen Test angegeben.

• Für einen 2-seitigen Test muss tkrit so gewählt werden, dass ein Bereich von α/2 „von der Verteilung abgeschnitten wird“

Die t-Verteilung

Kritische t-Werte:α = .05, einseitig, df=100: tkrit(100) = 1.66

α = .05, zweiseitig, df=100: tkrit(100) = 1.98

α = .01, einseitig, df=100: tkrit(100) = 2.63

06_ttest(1) 23

p=.800 p=.900 p=.950 p=.975 p=.9901 1,376 3,078 6,314 12,706 31,821 63,6572 1,061 2,920 2,920 4,303 6,965 9,9253 0,978 2,353 2,353 3,182 4,541 5,8414 0,941 2,132 2,132 2,776 3,747 4,6045 0,920 2,015 2,015 2,571 3,365 4,0326 0,906 1,943 1,943 2,447 3,143 3,7077 0,896 1,895 1,895 2,365 2,998 3,4998 0,889 1,860 1,860 2,306 2,896 3,3559 0,883 1,833 1,833 2,262 2,821 3,250

10 0,879 1,812 1,812 2,228 2,764 3,16920 0,860 1,725 1,725 2,086 2,528 2,84530 0,854 1,697 1,697 2,042 2,457 2,75040 0,851 1,684 1,684 2,021 2,423 2,70450 0,849 1,676 1,676 2,009 2,403 2,67860 0,848 1,671 1,671 2,000 2,390 2,66070 0,847 1,667 1,667 1,994 2,381 2,64880 0,846 1,664 1,664 1,990 2,374 2,63990 0,846 1,662 1,662 1,987 2,368 2,632

100 0,845 1,660 1,660 1,984 2,364 2,626200 0,843 1,653 1,653 1,972 2,345 2,601

1000 0,842 1,646 1,646 1,962 2,330 2,581

df p=.995

-3 -2 -1 0 1 2 30

0.1

0.2

0.3

0.4

1-

tkrit


06_ttest(1) 24

Arbeitsschritte beim t-Test für unabhängige Stichproben:(1) Formulierung der (inhaltlichen und statistische) Hypothesen

– gerichtet oder ungerichtet?

(2) Erfassung des Merkmals in zwei unabhängigen Stichproben(3) Berechnung der Mittelwerte in beiden Stichproben(4) Schätzung der Populationsvarianz(5) Berechnung des Standardfehlers der Mittelwertsdifferenz(6) Berechnung des empirischen t-Werts(7) Bestimmung des kritischen t-Werts

– aus df, α, und Art des Tests

(8) Entscheidung für H0 oder H1

Voraussetzungen

06_ttest(1) 25

Voraussetzungen des t-Tests für unabhängige Stichproben:(1) Intervallskalenniveau der Variable(2) Normalverteilung des Merkmals in der Grundgesamtheit(3) „Varianzhomogenität“ (Gleiche Varianzen des Merkmals in

beiden Populationen)(4) Unabhängigkeit der Stichproben

Voraussetzungen

06_ttest(1) 26

Normalverteilung des Merkmals in der Grundgesamtheit• Die Normalverteilungsannahme kann statistisch überprüft

werden– Dazu dient der Kolmogorov-Smirnov-Test (KS-Test).

• Die Verletzung der Normalverteilungsannahme ist vor allem bei kleinen Stichproben problematisch (N<50).

• Bei Verletzung der Normalverteilungsannahme sollte ein nicht-parametrisches Test verwenden werden (U-Test).– Solche Verfahren haben aber immer eine höhere β-Fehler

Wahrscheinlichkeit, d.h. vorhandene Effekte können oft nicht nachgewiesen werden.

Voraussetzungen

06_ttest(1) 27

Varianzhomogenität• Auch die Varianzhomogenität kann statistisch überprüft werden

(Levene-Test).• SPSS prüft die Varianzhomogenität automatisch bei jedem

t-Test für unabhängige Stichproben.• Bei einem signifikanten Ergebnis (p < .05), werden die

Freiheitsgrade des Tests „korrigiert“.

22

2

2

2

2

1

2

ˆˆˆ

1)1(

1

1

1

1

xx

x

corr

cmit

Nc

Nc

df

Zusammenfassung

• Zu Beginn einer empirischen Untersuchung wird die Nullhypothese (H0) und die Alternativhypothese (H1) formuliert.

• Ein statistischer Test bezieht sich immer auf die Nullhypothese.• Wenn ein empirisches Ergebnis unter der Nullhypothese sehr

unwahrscheinlich ist (p<α), wird diese verworfen und damit die H1 angenommen.

• Mit der Wahrscheinlichkeit α wird also die H1 fälschlicher-weise angenommen (Fehler erster Art)

• Der Fehler zweiter Art (β-Fehler) besteht darin, die H0 fälschlicherweise anzunehmen.

06_ttest(1) 28

Zusammenfassung

• Der t-Test für unabhängige Stichproben dient dazu, die Ausprägung eines Merkmales zwischen zwei Gruppen zu vergleichen.

• Unter Annahme der H0 kann eine theoretische Verteilung für Mittelwertsdifferenzen bestimmt werden.

• Der empirische t-Wert ergibt sich als empirische Mittel-wertsdifferenz dividiert durch den Standardfehler.

• Anhand der Anzahl der Freiheitsgrade und des vorher festgelegten α-Niveaus wird ein kritischer t-Wert aus der Tabelle zur t-Verteilung abgelesen.

• Wenn der empirische t-Wert größer als der kritischer t-Wert ist, wird die H0 verworfen und damit die H1 angenommen.

06_ttest(1) 29

Zusammenfassung

• Voraussetzung für den t-Tests für unabhängige Stichproben sind (a) Intervallskalenniveau der Variable; (b) Normalverteilung des Merkmals in der Grundgesamtheit (c) „Varianzhomogenität“ und (d) Unabhängigkeit der Stichproben

06_ttest(1) 30

Documents

Der t -Test