21
Nicht-parametrische Statistik Eine kleine Einführung

Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Nicht-parametrische Statistik Eine kleine Einführung

Page 2: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Überblick

• Anwendung nicht-parametrischer Statistik

• Behandelte Tests– Mann-Whitney U Test

– Kolmogorov-Smirnov Test

– Wilcoxon Test

– Binomialtest

– Chi-squared Test

– Kruskal-Wallis Test

Page 3: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Anwendung nicht-parametrischer Statistik

• kleine Stichproben (bei Experimenten häufig

zwischen n=6 und n=30)

• keine Annahmen über die Verteilung der Daten in der

Grundgesamtheit

• ordinalskalierte und kategoriale Variablen können

einfach ausgewertet werden

• Methoden ähnlich der Medizin, Biologie

Page 4: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Mann-Whitney U-test

Test, ob Daten aus zwei statistisch unabhängigen Stichproben (X und Y) aus derselben Grundgesamtheit (hinsichtlich des Mittelwertes) stammen.

H0 : keine Mittelwertsunterschiede

H1 : Mittelwerte unterscheiden sich: X ≠

Y (zweiseitiger Test)

(Einseitiger Test wäre X > Y oder X < Y.)

Page 5: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Mann-Whitney U-test: Ein Beispiel

Ultimatum-Spiel mit VWlern vs. Nicht-VWLer:

Bringe die Beobachtungen in eine aufsteigende Reihenfolge und ordne aufsteigend Ränge zu

Angebote der VWLer 2 4 1 0.5 0.5

Angebote der Nicht-VWLer 3 2.5 5 5

offer 0.5 0.5 1 2 2.5 3 4 5 5group V V V V NV NV V NV NVrank 1.5 1.5 3 4 5 6 7 8.5 8.5

Page 6: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

U-test: Ein Beispiel – Fortsetzung

Summiere die Ränge der kleineren Gruppe zu W (Testgröße)

Im Beispiel: W(N) = 28 [maximaler Wert wäre W(N) = 30]

p = 0.063 (zweiseitig) (siehe Table J aus Siegel/Castellan)

p = 0.048 (zweiseitig) (aus STATA)

Approximation durch Normalverteilung von W(N) für große n

STATA: ranksum offer, by(study)

offer 0.5 0.5 1 2 2.5 3 4 5 5group V V V V NV NV V NV NVrank 1.5 1.5 3 4 5 6 7 8.5 8.5

Page 7: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Kolmogorov-Smirnov-Test

Test, ob Daten aus zwei statistisch unabhängigen Stichproben (X und Y) aus derselben Grundgesamtheit (hinsichtlich der Verteilung der Beobachtungen, Mittelwert, Schiefe …) stammen.

H0 : Verteilungsgleichheit

H1 : Verteilungen sind signifikant unterschiedlich (zweiseitiger Test)

Page 8: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Kolmogorov-Smirnov-Test: Ein Beispiel

Ultimatum-Spiel mit VWLern vs. Nicht-VWLer:

Bestimme die kumulierten Häufigkeiten der Beobachtungen.

Angebote der VWLer 2 4 1 0.5 0.5

Angebote der Nicht-VWLer 3 2.5 5 5

offer 0.5 1 2 2.5 3 4 5VWL 40% 60% 80% 80% 80% 100% 100%N-VWL 0% 0% 0% 25% 50% 50% 100%

Page 9: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Kolmogorov-Smirnov-Test – Fortsetzung

Suche die größte (absolute) Differenz zwischen den kumulierten Häufigkeiten und bilde folgende Größen:

Dm,n = max |Sn (X) - Sm (X)|, wobei m(n) die Anzahl der Beobachtungen in beiden Stichproben ist und

Sm (X) = K/m, wobei K die Anzahl der Beobachtungen ist, die kleiner oder gleich X sind.

offer 0.5 1 2 2.5 3 4 5VWL 40% 60% 80% 80% 80% 100% 100%N-VWL 0% 0% 0% 25% 50% 50% 100%Sn (X) - Sm (X) 40% 60% 80% 55% 30% 50% 0%

Page 10: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Kolmogorov-Smirnov-Test – Fortsetzung

Die Testgröße ist dann: m*n* Dm,n = 5*4*0.8 = 16

p = 0.10 (zweiseitig) (siehe Table LII aus Siegel/Castellan)

p = 0.116 (zweiseitig) (aus STATA)

Approximation durch die χ² Verteilung für große n (mit df=2)

STATA: ksmirnov offer, by(study)

Möglichkeit gegen eine theoretische Verteilung zu testen

offer 0.5 1 2 2.5 3 4 5VWL 40% 60% 80% 80% 80% 100% 100%N-VWL 0% 0% 0% 25% 50% 50% 100%Sn (X) - Sm (X) 40% 60% 80% 55% 30% 50% 0%

Page 11: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Wilcoxon-Signed-Ranks Test

Test, ob zwischen zwei statistisch abhängigen Beobachtungen (X1 und X2) Unterschiede bestehen

H0 : keine Unterschiede (X1 = X2)

H1 : Beobachtungen unterscheiden sich: X1 ≠

X2 (zweiseitiger Test)

(Einseitiger Test wäre X1 > X2 oder X1 < X2.)

Page 12: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Wilcoxon Test: Ein BeispielWiederholtes Ultimatum-Spiel

Bilde die Differenz zwischen den gepaarten Beobachtungen und ordne Ränge nach absoluter Differenz (versehen mit dem Vorzeichen der Differenz zu)

Subjekt 1 2 3 4 5 6 7 8 9Runde 1 0.5 0.5 1 2 2.5 3 4 5 5Runde 2 1.5 1.5 1 1.5 1 1 1 2 2.5

Subjekt 1 2 3 4 5 6 7 8 9Runde 1 0.5 0.5 1 2 2.5 3 4 5 5Runde 2 1.5 1.5 1 1.5 1 1 1 2 2.5Differenz 1 1 0 -0.5 -1.5 -2 -3 -3 -2.5Rang +2.5 +2.5 drop -1 -4 -5 -7.5 -7.5 -6

Page 13: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Wilcoxon Test: Ein Beispiel – Fortsetzung

T+ = Summe der Ränge mit positivem Vorzeichen (T+ = 5)

T- = Summe der Ränge mit negativem Vorzeichen (T- = 31)

p = 0.078 (zweiseitig mit N=8 (!), siehe Table H aus S/C)

p = 0.0745 (aus STATA)

Approximation durch Normalverteilung für große nSTATA: signrank offer = offer[_n+1]

Sign-Test als Alternative (auch gegen feste Werte)

Subjekt 1 2 3 4 5 6 7 8 9Runde 1 0.5 0.5 1 2 2.5 3 4 5 5Runde 2 1.5 1.5 1 1.5 1 1 1 2 2.5Differenz 1 1 0 -0.5 -1.5 -2 -3 -3 -2.5Rang +2.5 +2.5 drop -1 -4 -5 -7.5 -7.5 -6

Page 14: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Binomial-TestZwei Merkmalsausprägungen [X=1 oder X=0] (z.B.

Kopf oder Zahl bei Münze; Budgetüber- oder – unterschreitung)

Wahrscheinlichkeit für X=1: pWahrscheinlichkeit für X=0: q = 1 – p

H0 : p = p0

H1 : p ≠

p0

Test, ob die Verteilung der Merkmalsausprägungen aus einer Grundgesamtheit mit p = p0 stammen kann

Page 15: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Binomial-Test: Ein BeispielMünzwurf: Eine Münze werde 10 mal geworfen

Wahrscheinlichkeiten: p = q = 0.5Y = Σ

X = 2

Wahrscheinlichkeit, dass Y einen bestimmten Wert annimmt:

wobei

Wurf 1 2 3 4 5 6 7 8 9 10Ergebnis K Z K K K K Z K K KX 0 1 0 0 0 0 1 0 0 0

)!(!!

][

kNkN

kN

qpkN

kYP kNk

−=⎟

⎞⎜⎝

⎟⎠

⎞⎜⎝

⎛== −

Page 16: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Binomial-Test: Ein Beispiel - FortsetzungWahrscheinlichkeit, dass Y=2

Beim Binomialtest interessiert die kumulierte Wahrscheinlichkeit, dass Y ≤

r oder Y ≥

s

(siehe Table D)

043.05.0210*95.05.0

!8!2!10

210

]2[ 108282 ===⎟⎠

⎞⎜⎝

⎛== qpYP

iNik

iqp

iN

kYP −

=∑ ⎟

⎞⎜⎝

⎛=≤

0][

055.0

]2[]1[]0[]2[2

0=∑ ⎟

⎞⎜⎝

⎛=

==+=+==≤

=

iNi

iqp

iN

YPYPYPYP

Page 17: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Binomial-Test: Ein anderes Beispiel

Weichen Budgetvoranschlag und Budgetrealisierung für Forschung und Wissenschaft systematisch voneinander ab? Nein (16 Überschreitungen in den letzten 28 Jahren).

U n te rs c h ie d V o ra n s c h la g / Za h lu n g e n (+ Ü b e rs c h re itu n g )B ild u n g s s e k to r

-8 .00%

-6.00%

-4.00%

-2.00%

0.00%

2.00%

4.00%

6.00%

8.00%

10.00%

12.00%

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

J a h r

F ors c hung und W is s ens c haft

Page 18: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Chi-squared-test (χ²-test)

Test, ob Unterschiede in Verteilungen in zwei oder mehreren Kategorien existieren (Mindestanzahl an Beobachtungen pro Zelle ca. 5).

Test möglich für den Vergleich zweier Beoabchtung und dem Vergleich zu einer theoretischen Verteilung.

Einfachste Anwendung: 2x2-Tabellen.

Teststatistik (mit Kontinuitätskorrektur):

χ² = N{|AD – BC| - N/2}² / {(A+B)(C+D)(A+C)(B+D)}

Reject, if χ² > 3.84 (p < 0.05).

A BC D

Page 19: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Chi-squared-test (χ²-test) - Beispiel

χ² = N{|AD – BC| - N/2}² / {(A+B)(C+D)(A+C)(B+D)} = 0.61

Nicht ablehnen, da χ² < 3.84 (p < 0.05)

Möglichkeit der Erweiterung auf r x k Beobachtungen

# offers unter 5 # offers über 5VWLer 8 14Nicht-VWLer 13 12

Page 20: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Kruskal-Wallis Test

Test, ob Daten aus k statistisch unabhängigen Stichproben (X, Y, Z, …) aus derselben Grundgesamtheit stammen.

Teststatistik H wird über die Varianzen gebildet und folgt einer χ² Verteilung mit df = k-1

H0 = mehrere Stichproben sind aus derselben Grundgesamtheit

H1 = Stichproben aus unterschiedlichen GrundgesamtheitenSTATA: kwallis offer, by(age)

Page 21: Nicht-parametrische Statistik Eine kleine Einführung · – Kolmogorov-Smirnov Test – Wilcoxon Test – Binomialtest – Chi-squared Test – Kruskal-Wallis Test. Anwendung nicht-parametrischer

Übersicht der behandelten Tests

One sample Two samples N samplesAbhängige Beobachtungen

Unabhängige Beobachtungen

Unabhängige Beobachtungen

Nominale oder kategoriale Daten

Binomial Test

χ²-test (r x 2) χ²-test (r x k)

Ordinale Daten

Kolmogorov- Smirnov (one- sample)

Sign testWilcoxon signed ranks test

Mann-Whitney U testKolmogorov- Smirnov (two- sample)

Kruskal-Wallis test