30
Der t-Test 06_ttest(1) 1 Gliederung Statistische Hypothesen Null- und Alternativhypothese Alpha- und Betafehler Statistische Entscheidungen Mittelwertsvergleiche mit dem t-Test Überblick: 3 Arten von t-Tests Stichprobenkennwerteverteilung von Mittelwertsdifferenzen – Die t-Verteilung Die Interpretation von t-Werten Voraussetzungen des t-Tests

Der t -Test

  • Upload
    arch

  • View
    61

  • Download
    0

Embed Size (px)

DESCRIPTION

Der t -Test. Gliederung Statistische Hypothesen Null- und Alternativhypothese Alpha- und Betafehler Statistische Entscheidungen Mittelwertsvergleiche mit dem t -Test Überblick: 3 Arten von t -Tests Stichprobenkennwerteverteilung von Mittelwertsdifferenzen Die t -Verteilung - PowerPoint PPT Presentation

Citation preview

Page 1: Der  t -Test

Der t-Test

06_ttest(1) 1

Gliederung • Statistische Hypothesen

– Null- und Alternativhypothese– Alpha- und Betafehler– Statistische Entscheidungen

• Mittelwertsvergleiche mit dem t-Test– Überblick: 3 Arten von t-Tests– Stichprobenkennwerteverteilung von Mittelwertsdifferenzen– Die t-Verteilung– Die Interpretation von t-Werten– Voraussetzungen des t-Tests

Page 2: Der  t -Test

Statistische Hypothesen

• Die Inferenzstatistik macht Aussagen über eine Population, aus welcher die untersuchten Stichproben gezogen wurden.

• Dabei werden statistische Hypothesen getestet.• Statistische Hypothesen sind Erwartungen über Unterschiede

zwischen (bzw. Zusammenhänge von) Variablen.• Statistische Hypothesen sollten immer vor einer Untersuchung

formuliert werden• Beispiele für statistische Hypothesen:

– Frauen sind ängstlicher als Männer.– Es besteht ein negativer Zusammenhang zwischen Ängstlichkeit und

Optimismus.– Die Selbstsicherheit von Teilnehmer eines Kommunikationstrainigs ist nach

dem Training höher als vor dem Training.

06_ttest(1) 2

Page 3: Der  t -Test

Statistische Hypothesen

Woher kommen die Hypothesen?

• Eine psychologische Untersuchung wird immer mit dem Ziel durchgeführt, eine bestimmte Forschungsfrage zu beantworten.

• Beispiel: Wenn ein neues Therapieprogramm entwickelt wurde, dann muss der Entwickler dieses Programms zeigen, dass es den Teilnehmern nach der Therapie besser geht als vorher.

• Je nach Ziel des Programms wird eine Hypothese formuliert:– Beispiel: „Teilnehmer weisen in einem Test zur Depressivität nach der

Therapie geringere Werte als vor der Therapie auf.“

06_ttest(1) 3

Page 4: Der  t -Test

Nullhypothese und Alternativhypothese

• Bei statistischen Tests werden immer (unabhängig von der Erwartung des beteiligten Forschers) zwei gegensätzliche Hypothesen formuliert:(a) Die Nullhypothese (H0) besagt, dass es keinen Unterschied zwischen

zwei Populationen (bzw. keinen Zusammenhang zwischen zwei Merkmalen) gibt.

(b) Die Alternativhypothese (H1) besagt dagegen, dass es einen Unterschied (bzw. einen Zusammenhang) gibt.

• Es kann also immer nur eine von beiden Hypothesen zutreffen!

• Die beiden statistischen Hypothesen (H0 und H1) werden unabhängig von den tatsächlichen inhaltlichen Erwartungen formuliert.

06_ttest(1) 4

Page 5: Der  t -Test

Nullhypothese und Alternativhypothese

Es gibt zwei Formen der Alternativhypothese• Eine ungerichtete Alternativhypothese (H1) besagt lediglich, dass

es einen Unterschied (bzw. einen Zusammenhang) gibt („zweiseitiger Test“).– Diese Hypothese gilt als bestätigt,

• wenn Gruppe 1 größere Werte als Gruppe 2 hat• wenn Gruppe 2 größere Werte als Gruppe 1 hat• (bzw. wenn ein pos. oder ein neg. Zusammenhang zwischen zwei Variablen

besteht)

• Eine gerichtete Alternativhypothese (H1) spezifiziert die Richtung des Unterschieds (des Zusammenhang) („einseitiger Test“).– Beispiel: Es wird erwartet,

• dass Gruppe 1 größere Werte als Gruppe 2 hat.• (bzw. dass ein pos. neg. Zusammenhang zwischen zwei Variablen besteht)

06_ttest(1) 5

Page 6: Der  t -Test

Nullhypothese und Alternativhypothese

Formale Schreibweise• Ungerichtete Alternativhypothese:

– H1: μ1 ≠ μ2

– H0: μ1 = μ2

• Gerichtete Alternativhypothese (1. Möglichkeit):– H1: μ1 > μ2

– H0: μ1 ≤ μ2

• Gerichtete Alternativhypothese (2. Möglichkeit):– H1: μ1 < μ2

– H0: μ1 ≥ μ2

• Die H0 hängt also von der Auswahl der H1 ab!

06_ttest(1) 6

Page 7: Der  t -Test

Statistische Hypothesenprüfung

Grundgedanke eines statistischen Tests• Bei der statistischen Hypothesenprüfung berechnet, wie

wahrscheinlich die empirischen (Mittel-)Werte der Stichprobe sind, wenn in der Population die H0 gilt.

• Beispiel:– H0: μLOT, w = μLOT, m (Mittelwert LOT ist für Frauen und Männer gleich)– Gefundenes Ergebnis:– Wie wahrscheinlich ist dieses Ergebnis, wenn die H0 gilt?– Problem: Exakte Werte einer kontinuierlichen Wahrscheinlich-

keitsverteilung haben immer die Wahrscheinlichkeit 0.– Lösung: Wie Wahrscheinlich ist es, einen Unterschied von 0.3 oder mehr

zu finden, wenn die H0 gilt?– Wenn dies sehr unwahrscheinlich ist, wird die H0 verworfen, und die H1

angenommen– Andernfalls wird die H0 beibehalten.

06_ttest(1) 7

2.23, wlotx 9.22, mlotx

Page 8: Der  t -Test

Alphafehler und Betafehler

Fehler bei der statistischen Entscheidung• Die statistische Entscheidung für die H0 oder die H1 wird aufgrund

von Wahrscheinlichkeiten gemacht• Daher sind immer Entscheidungsfehler möglich• Je nach der Entscheidung kann man zwei Fehler machen:

(1) Man entscheidet sich für die H1, obgleich zwischen den Populations-mittelwerten kein Unterschied existiert („α-Fehler“ bzw. „Fehler erster Art“).

(2) Man entscheidet sich für die H0, obgleich es auf Populationsebene einen bedeutsamen Unterschied gibt („β-Fehler“ bzw. „Fehler zweiter Art“).

• Für Fehlertypen sollte vor einer Untersuchung die gewünschte Wahrscheinlichkeit festgelegt werden (oft geschieht dies aber nur für den Alpha-Fehler)

06_ttest(1) 8

Page 9: Der  t -Test

Alphafehler und Betafehler

Das α-Niveau

• Das α-Niveau gibt die Wahrscheinlichkeit dafür an, dass ein Test einen bedeutsamen Effekt anzeigt, obwohl in der Population kein Effekt besteht:– Wenn die Wahrscheinlichkeit für den gefundenen Effekt unter der H0

kleiner als α ist, wird die H0 verworfen und die H1 angenommen.– Mit der Wahrscheinlichkeit α wird also die H1 fälschlicherweise

angenommen.

• Konventionen für das α-Niveau:– (p ≤ 0.10 „marginal signifikantes“ Ergebnis)– p ≤ 0.05 „signifikantes“ Ergebnis – p ≤ 0.01 „hoch signifikantes“ Ergebnis

06_ttest(1) 9

Page 10: Der  t -Test

Alphafehler und Betafehler

Das β-Niveau

• Das β-Niveau gibt an, wie wahrscheinlich es ist, dass ein Test keinen bedeutsamen Effekt anzeigt, obwohl in der Population ein Effekt besteht:– Mit der Wahrscheinlichkeit β wird also die H0 fälschlicherweise

beibehalten.

• Konventionen für das β-Niveau…– … gibt es leider nicht– Es gibt jedoch eigentlich keinen Grund warum β>α sein sollte (obwohl das

in vielen Untersuchungen der Fall ist).– β kann im Gegensatz zu α nicht frei gewählt werden, sondern ergibt sich

aus verschiedenen anderen Größen (u.a. aus dem gewählten α Niveau und der Stichprobengröße)

06_ttest(1) 10

Page 11: Der  t -Test

Statistische Entscheidungen

06_ttest(1) 11

In der Populationgilt die

Testergebnis Ent-scheidung H0 H1

p > α „H0“ korrekt β

p < α „H1 “ α korrekt

Page 12: Der  t -Test

Der t-Test

Drei Formen des t-Tests(1) Der t-Test für unabhängige Stichproben

– Dieser Test prüft, ob sich die Mittelwerte von zwei Gruppen unterscheiden

– Beispiel: „Sind Frauen ängstlicher als Männer?“

(2) Der t-Test für abhängige Stichproben– Dieser Test prüft, ob sich der Mittelwert einer Stichprobe zu zwei

Messzeitpunkten unterscheidet– Beispiel: „Ist der Mittelwert der Ängstlichkeit nach einer Therapie größer

als vor der Therapie“

(3) Der Ein-Gruppen t-Test– Dieser Test prüft, ob sich der Mittelwert einer Gruppe von einem

vorgegeben Wert unterscheidet– Beispiel: „Liegt der mittlere IQ einer Gruppe über 100?“

06_ttest(1) 12

Page 13: Der  t -Test

Der t-Test für unabhängige Stichproben

• Mit dem t-Test für unabhängige Stichproben wird verglichen, ob sich zwei Populationsmittelwerte voneinander unterscheiden.

• Der t-Test gehört zu den parametrischen Testverfahren. Parametrische Testverfahren setzen eine bestimmte Verteilungsform (in der Regel die Normalverteilung) des untersuchten Merkmals voraus.

• Daher bildet die Normalverteilung des untersuchten Merkmals eine Voraussetzung für den t-Tests.

06_ttest(1) 13

Page 14: Der  t -Test

Kennwert des t-Tests

Der Kennwert des t-Tests• Der Kennwert des t-Tests ist die Differenz der Mittelwerte der

beiden Stichproben:

• Der t-Test schätzt die bedingte Wahrscheinlichkeit :

• Wenn p < α, wird die H0 verworfen und die H1 angenommen.

06_ttest(1) 14

21 xxx

)|( 0Hp x

Page 15: Der  t -Test

Stichprobenkennwerteverteilung

Die Stichprobenkennwerteverteilung des t-Tests• Um die Wahrscheinlichkeit zu bestimmen, wird eine theoretische

Stichprobenkennwerteverteilung der Mittelwertsdifferenzen unter der Nullhypothese gebildet.

• Diese Verteilung gibt an, wie sich empirische Mittelwerts-differenzen verteilen, wenn man sehr oft Stichproben zieht.

06_ttest(1) 15

-10 -5 0 5 100.0

0.1

0.2

0.3

0.4

x1 x2

Page 16: Der  t -Test

Stichprobenkennwerteverteilung

Stichprobenkennwerteverteilung• Wenn die H0 gilt, muss die Stichproben-

kennwerteverteilung ihren Gipfel bei 0haben.

• Die theoretische Verteilung von Mittelwertsdifferenzen ist bei großen Stichproben normalverteilt.

• Bei kleineren Stichproben ergibt sich eine „schmalgipfligere“ Verteilung.

• Wenn die Verteilung bekannt ist, kann die Wahrscheinlichkeit für bestimmte Wertebereiche als „Fläche unter der Kurve“ bestimmt werden.

06_ttest(1) 16

-10 -5 0 5 100.0

0.1

0.2

0.3

0.4

x1 x2

Page 17: Der  t -Test

Stichprobenkennwerteverteilung

Der Standardfehler der Stichprobenkennwerteverteilung• Der Standardfehler der Stichprobenkennwerteverteilung des

t-Tests hängt von den Standardabweichungen und den Größen der beiden Teilstichproben ab:

• Der Standardfehler wird benötigt, um die gefundene Mittelwertsdifferenz interpretieren zu können

06_ttest(1) 17

2

22

1

21 ˆˆˆ

21 NNxx

Page 18: Der  t -Test

Stichprobenkennwerteverteilung

Die t-Verteilung• Die empirische Mittelwertsdifferenz wird durch den

Standardfehler dividiert.

• Der resultierende Wert kann nun mit der t-Verteilung verglichen werden.

• Die genaue For der t-Verteilung hängt von deren Freiheitsgraden (df = degree of freedom) ab.

06_ttest(1) 18

21

ˆ21

xx

xxdft

Page 19: Der  t -Test

Freiheitsgrade

Die Freiheitsgrade der t-Verteilung• Die Freiheitsgrade der t-Verteilung berechnen sich als:

• Dabei beeinflussen die Freiheitsgrade die Form der t-Verteilung.• Bei vielen Freiheitsgraden (df >120) ist die t-Verteilung nahezu

identisch mit der z-Verteilung.• Je weniger Freiheitsgrade gegeben sind, desto schmalgipfliger

wird die t-Verteilung.

06_ttest(1) 19

221 NNdf

Page 20: Der  t -Test

Der t-Test für unabhängige Stichproben

Entscheidung über die Nullhypothese• Mittels der t-Tabelle wird der empirische t-Wert interpretiert.• Dazu wird ein kritischer t-Wert aus der t-Tabelle entnommen

– Der kritische t-Wert häng dabei ab:• von den Freiheitsgraden,• von dem gewählten Alpha-Nivea• von der Art der Testung (einseitig vs. zweiseitig)

– Der kritische t-Wert definiert die Grenze des Bereichs für den empirischen t-Wert, ab dem die H0 verworfen wird.

06_ttest(1) 20

Page 21: Der  t -Test

Der t-Test für unabhängige Stichproben

06_ttest(1) 21

-3 -2 -1 0 1 2 30

0.1

0.2

0.3

0.4

p = 1-

tkrit

-3 -2 -1 0 1 2 30

0.1

0.2

0.3

0.4

p = 1-

tkrit

H0 H1

H1H1H0

einseitiger Test(gerichtete H0)

zweiseitiger Test(ungerichtete H0)

Page 22: Der  t -Test

Der t-Test für unabhängige Stichproben

06_ttest(1) 22

Entscheidungsregeln• Einseitiger Test:

– Wenn temp > tkrit wird die H0 verworfen

• Zweiseitiger Test– Wenn |temp| > tkrit wird die H0 verworfen

• In der t-Tabelle werden immer Werte für den einseitigen Test angegeben.

• Für einen 2-seitigen Test muss tkrit so gewählt werden, dass ein Bereich von α/2 „von der Verteilung abgeschnitten wird“

Page 23: Der  t -Test

Die t-Verteilung

Kritische t-Werte:α = .05, einseitig, df=100: tkrit(100) = 1.66

α = .05, zweiseitig, df=100: tkrit(100) = 1.98

α = .01, einseitig, df=100: tkrit(100) = 2.63

06_ttest(1) 23

p=.800 p=.900 p=.950 p=.975 p=.9901 1,376 3,078 6,314 12,706 31,821 63,6572 1,061 2,920 2,920 4,303 6,965 9,9253 0,978 2,353 2,353 3,182 4,541 5,8414 0,941 2,132 2,132 2,776 3,747 4,6045 0,920 2,015 2,015 2,571 3,365 4,0326 0,906 1,943 1,943 2,447 3,143 3,7077 0,896 1,895 1,895 2,365 2,998 3,4998 0,889 1,860 1,860 2,306 2,896 3,3559 0,883 1,833 1,833 2,262 2,821 3,250

10 0,879 1,812 1,812 2,228 2,764 3,16920 0,860 1,725 1,725 2,086 2,528 2,84530 0,854 1,697 1,697 2,042 2,457 2,75040 0,851 1,684 1,684 2,021 2,423 2,70450 0,849 1,676 1,676 2,009 2,403 2,67860 0,848 1,671 1,671 2,000 2,390 2,66070 0,847 1,667 1,667 1,994 2,381 2,64880 0,846 1,664 1,664 1,990 2,374 2,63990 0,846 1,662 1,662 1,987 2,368 2,632

100 0,845 1,660 1,660 1,984 2,364 2,626200 0,843 1,653 1,653 1,972 2,345 2,601

1000 0,842 1,646 1,646 1,962 2,330 2,581

df p=.995

-3 -2 -1 0 1 2 30

0.1

0.2

0.3

0.4

1-

tkrit

Page 24: Der  t -Test

Der t-Test für unabhängige Stichproben

06_ttest(1) 24

Arbeitsschritte beim t-Test für unabhängige Stichproben:(1) Formulierung der (inhaltlichen und statistische) Hypothesen

– gerichtet oder ungerichtet?

(2) Erfassung des Merkmals in zwei unabhängigen Stichproben(3) Berechnung der Mittelwerte in beiden Stichproben(4) Schätzung der Populationsvarianz(5) Berechnung des Standardfehlers der Mittelwertsdifferenz(6) Berechnung des empirischen t-Werts(7) Bestimmung des kritischen t-Werts

– aus df, α, und Art des Tests

(8) Entscheidung für H0 oder H1

Page 25: Der  t -Test

Voraussetzungen

06_ttest(1) 25

Voraussetzungen des t-Tests für unabhängige Stichproben:(1) Intervallskalenniveau der Variable(2) Normalverteilung des Merkmals in der Grundgesamtheit(3) „Varianzhomogenität“ (Gleiche Varianzen des Merkmals in

beiden Populationen)(4) Unabhängigkeit der Stichproben

Page 26: Der  t -Test

Voraussetzungen

06_ttest(1) 26

Normalverteilung des Merkmals in der Grundgesamtheit• Die Normalverteilungsannahme kann statistisch überprüft

werden– Dazu dient der Kolmogorov-Smirnov-Test (KS-Test).

• Die Verletzung der Normalverteilungsannahme ist vor allem bei kleinen Stichproben problematisch (N<50).

• Bei Verletzung der Normalverteilungsannahme sollte ein nicht-parametrisches Test verwenden werden (U-Test).– Solche Verfahren haben aber immer eine höhere β-Fehler

Wahrscheinlichkeit, d.h. vorhandene Effekte können oft nicht nachgewiesen werden.

Page 27: Der  t -Test

Voraussetzungen

06_ttest(1) 27

Varianzhomogenität• Auch die Varianzhomogenität kann statistisch überprüft werden

(Levene-Test).• SPSS prüft die Varianzhomogenität automatisch bei jedem

t-Test für unabhängige Stichproben.• Bei einem signifikanten Ergebnis (p < .05), werden die

Freiheitsgrade des Tests „korrigiert“.

22

2

2

2

2

1

2

ˆˆˆ

1)1(

1

1

1

1

xx

x

corr

cmit

Nc

Nc

df

Page 28: Der  t -Test

Zusammenfassung

• Zu Beginn einer empirischen Untersuchung wird die Nullhypothese (H0) und die Alternativhypothese (H1) formuliert.

• Ein statistischer Test bezieht sich immer auf die Nullhypothese.• Wenn ein empirisches Ergebnis unter der Nullhypothese sehr

unwahrscheinlich ist (p<α), wird diese verworfen und damit die H1 angenommen.

• Mit der Wahrscheinlichkeit α wird also die H1 fälschlicher-weise angenommen (Fehler erster Art)

• Der Fehler zweiter Art (β-Fehler) besteht darin, die H0 fälschlicherweise anzunehmen.

06_ttest(1) 28

Page 29: Der  t -Test

Zusammenfassung

• Der t-Test für unabhängige Stichproben dient dazu, die Ausprägung eines Merkmales zwischen zwei Gruppen zu vergleichen.

• Unter Annahme der H0 kann eine theoretische Verteilung für Mittelwertsdifferenzen bestimmt werden.

• Der empirische t-Wert ergibt sich als empirische Mittel-wertsdifferenz dividiert durch den Standardfehler.

• Anhand der Anzahl der Freiheitsgrade und des vorher festgelegten α-Niveaus wird ein kritischer t-Wert aus der Tabelle zur t-Verteilung abgelesen.

• Wenn der empirische t-Wert größer als der kritischer t-Wert ist, wird die H0 verworfen und damit die H1 angenommen.

06_ttest(1) 29

Page 30: Der  t -Test

Zusammenfassung

• Voraussetzung für den t-Tests für unabhängige Stichproben sind (a) Intervallskalenniveau der Variable; (b) Normalverteilung des Merkmals in der Grundgesamtheit (c) „Varianzhomogenität“ und (d) Unabhängigkeit der Stichproben

06_ttest(1) 30