Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
14 Statistische Beziehungen zwischen nomi–nalen Merkmalen
14.1 Der Chi–Quadrat–Test auf Unabhangigkeit fur Vier–
Feldertafeln
14.2 Der Chi–Quadrat–Test auf Unabhangigkeit fur r×s–
Kontingenztafeln
14.3 Zusammmenhangsmaße
Haufig werden an einem Objekt zwei nominal
skalierte Merkmale X und Y erhoben (z. B.
Geschlecht und Rauchen (ja/nein), Augenfarbe
und Haarfarbe).
Ziel: Prufen der Nullhypothese, dass es zwi-
schen X und Y keinen statistischen Zusam-
menhang gibt. Ferner: Gesucht sind statistische
Kenngroßen (Maßzahlen), die den Grad (Starke)
eines Zusammenhangs messen (Abschnitt 14.3).
StatBio 408
14.1 Der Chi–Quadrat–Test auf Unabhan–gigkeit fur Vier–Feldertafeln
Gegeben seien zwei binare Merkmale X und Y
mit den kodierten Auspragungen 1 und 0.
Beispiel: Geschlecht=X (mannlich=1, weib-
lich=0) und Rauchen=Y (ja=1, nein=0)
Man mochte wissen, ob es zwischen X und
Y einen Zusammenhang gibt oder ob sie un-
abhangig sind.
Es gibt 4 mogliche Auspragungsskombinationen
von (X,Y ):
(1, 1), (1, 0), (0, 1), (0, 0)
Diese seien in einer Stichprobe vom Umfang n
mit den Haufigkeiten a, b, c, d aufgetreten. Die
Darstellung erfolgt in einer sogenannten 2× 2–Kontingenztafel (Vier–Feldertafel):
StatBio 409
Tabelle 14–1 Vier–Feldertafel
Auspragung Y = 1 Y = 0 RandsummenX = 1 a b a+ bX = 0 c d c+ d
Randsummen a+ c b+ d a+ b+ c+ d = n
In der statistischen Analyse von Vierfelderta-
feln geht man davon aus, dass die Randsummen
die wahre (Haufigkeits–)Verteilung der binaren
Auspragungen in der Grundgesamtheit wider-
spiegeln:
a+ b
n= Anteilswert der Auspragung X = 1
in der Grundgesamtheit
c+ d
n= Anteilswert der Auspragung X = 0
in der Grundgesamtheit
StatBio 410
Es gilta+ b
n+c+ d
n= 1
Vollig analog:
a+ c
n= Anteilswert der Auspragung Y = 1
in der Grundgesamtheit
b+ d
n= Anteilswert der Auspragung Y = 0
in der Grundgesamtheit
Es gilta+ c
n+b+ d
n= 1
StatBio 411
14.1 Beispiel: Es soll die Frage geklart werden,
ob es einen Zusammenhang zwischen dem Ge-
schlecht und Rauchen gibt. Eine Untersuchung
von 69 Personen ergab folgendes Ergebnis:
Tabelle 14–2 Vier–Feldertafel zu Bsp. 14.1
Raucher Nichtr. SummeManner 19 20 39Frauen 10 20 30Summe 29 40 69
Die Prufgroße des Chi–Quadrat–Tests vergleicht
die beobachteten Haufigkeiten (hbeob) a, b,
c, d mit den Haufigkeiten, die man unter der
Nullhypothese
H0 : X und Y sind unabhangig
erwarten wurde (herw).
Frage: Welche Haufigkeiten sind unter H0 zu
erwarten?
StatBio 412
Dazu schaut man sich die relative Haufigkeiten
an.
In der Stichprobe gibt es a + b Merkmalskom-
binationen mit der Eigenschaft X = 1 (d.h.
die Merkmalskombinationen (1, 1) und (1, 0)
wurden (a + b)–mal beobachtet). Die relative
Haufigkeit, bezogen auf die gesamte Stichprobe,
ist alsoa+ b
nDie relative Haufigkeit der Merkmalskombinatio-
nen mit X = 1, bezogen auf die Merkmalskom-
binationen mit Y = 1, ist
a
a+ c
Hat Y keinen Einfluss auf X (Nullhypothese),
so wird man erwarten, dass sich diese beiden
relativen Haufigkeiten nicht (oder kaum) unter-
StatBio 413
scheiden:a
a+ c≈ a+ b
nalso
a ≈ (a+ b) · (a+ c)
n︸ ︷︷ ︸=herw
Unter H0 wurde man also in einer Stichpro-
be vom Umfang n die Auspragungskombination
(1, 1) mit einer Haufigkeit von
(a+ b) · (a+ c)
n
erwarten. Die erwarteten Haufigkeiten der an-
deren Merkmale lassen sich ahnlich herleiten.
Die Zusammenfassung kann wieder durch eine
Vier–Feldertafel erfolgen:
StatBio 414
Tabelle 14–3 Vier–Feldertafel der erwartetenHaufigkeiten
Auspragung Y = 1 Y = 0 Randsummen
X = 1 (a+b)·(a+c)n
(a+b)·(b+d)n a+ b
X = 0 (c+d)·(a+c)n
(c+d)·(b+d)n c+ d
Randsummen a+ c b+ d n
Bemerkung:
(i) Die erwarteten Haufigkeiten ergeben sich
aus den Randhaufigkeiten und dem Stichproben-
umfang:
herw =Zeilensumme ·Spaltensumme
Stichprobenumfang
(ii) Die Randsummen der erwarteten Haufig-
keiten sind identisch mit den Randsummen der
beobachteten Haufigkeiten.
StatBio 415
Fortsetzung von Beispiel 14.1
Tabelle 14–4 Vier–Feldertafel der erwartetenHaufigkeiten zu Bsp. 14.1
Raucher Nichtr. SummeManner 16.4 22.6 39Frauen 12.6 17.4 30Summe 29 40 69
Die wesentliche Idee des Chi–Quadrat–Tests be-
steht im Vergleich der vier beobachteten Haufig-
keiten mit den entsprechenden unter H0 er-
warteten Haufigkeiten. Die Prufgroße des Chi–
Quadrat–Tests lautet
χ2 =∑
alle 4Felder
(hbeob − herw)2
herw
Es lasst sich zeigen, dass diese Prufgroße die
wesentlich einfachere Darstellung
χ2 = n · (a · d− b · c)2
(a+ b) · (c+ d) · (a+ c) · (b+ d)
StatBio 416
besitzt (im Nenner steht das Produkt der vier
Randsummen).
Unter der Nullhypothese H0 erwartet man einen
Prufgroßenwert χ2 in der Nahe von Null (im
Extremfall gilt χ2 = 0, wenn alle beobachteten
Haufigkeiten mit den erwarteten ubereinstim-
men). Kleinere Abweichungen von 0 sind mit
H0 durchaus vereinbar; große Werte von χ2
sprechen gegen H0. Die Prufgroße χ2 ist um-
so großer, je mehr die beobachteten von den
erwarteten Haufigkeiten abweichen.
Um zu beurteilen, wann eine Abweichung von 0
als ,,groß”, als unplausibel fur H0 gilt, benotigt
man die Stichprobenverteilung der Prufgroße χ2.
Es lasst sich Folgendes nachweisen: Gilt fur die
vier erwarteten Haufigkeiten
herw ≥ 5
StatBio 417
so kann die Stichprobenverteilung der Prufgroße
χ2 hinreichend gut durch die Chi–Quadrat–Verteilung mit einem Freiheitsgrad [degress
of freedom (df) = 1] beschrieben werden.
Man wird sich gegen die Nullhypothese H0 ent-
scheiden, wenn die Prufgroße χ2 einen ,,großen”
Wert angenommen hat. Groß bedeutet, dass
χ2 oberhalb eines kritischen Wertes der Chi–
Quadrat–Verteilung liegt (siehe Tab. 14–8).
Dieser kritische Wert ((1− α)–Quantil)
χ2df ;1−α
hangt vom vorgegebenem Testiveau α ab (bei
Vier–Feldertafeln ist stets df = 1).
StatBio 418
Abbildung 14–1 Dichte der Chi–Quadrat–Verteilung miteinem Freiheitsgrad; 0.05 = graue Flache oberhalb des
kritischen Wertes χ21;0.95 = 3.841
Abbildung 14–2 Dichte der Chi–Quadrat–Verteilung miteinem Freiheitsgrad; 0.01 = graue Flache oberhalb des
kritischen Wertes χ21;0.99 = 6.635
Der Chi–Quadrat–Test fur Vier–Feldertafeln ist
wie folgt durchzufuhren:
StatBio 419
1. Man berechnet die Prufgroße
χ2 =∑
uber alle 4 Felder
(hbeob − herw)2
herw
= n ·(a · d− b · c
)2(a+ b) · (c+ d) · (a+ c) · (b+ d)
2. Die Prufgroße χ2 wird mit dem kritischen
Wert χ21;1−α verglichen (Tab. 14–8). Die
Testentscheidung lautet: Ablehnung der
Nullhypothese
H0 : X und Y sind statistisch unabhangig
falls
χ2 > χ21;1−α
StatBio 420
Fortsetzung von Bsp. 14.1: Es soll zum Niveau
α = 0.05 getestet werden. Der Prufgroßenwert
betragt
χ2 = 69 · (19 · 20− 20 · 10)2
39 · 30 · 29 · 40= 1.647
Wegen χ21;0.05 = 3.841 (Tab. 14–8, erste Zeile)
kann die Nullhypothese zum Niveau 0.05 nicht
abgelehnt werden.
Der p–Wert, also die Wahrscheinlichkeit, un-
ter H0 einen Prufgroßenwert χ2 zu erhalten,
der großer als der tatsachlich beobachtete Wert
1.647 ist, betragt
p(1.647) ≈ 0.199
StatBio 421
Abbildung 14–3 Dichte der Chi–Quadrat–Verteilung miteinem Freiheitsgrad; p–Wert = 0.199 = graue Flache
oberhalb von 1.647
Fur kleinere Stichprobenumfange n (20 ≤ n ≤60) verbessert sich nach Yates (1981) die Nahe-
rung durch eine Chi–Quadrat–Verteilung, wenn
die Teststatistik χ2 ,,korrigiert” wird zu
χ2korr = n · (|a · d− b · c| − n/2)2
(a+ b) · (c+ d) · (a+ c) · (b+ d)
Die Nullhypothese H0 wird abgelehnt, falls
χ2korr ≥ χ2
1;1−α
StatBio 422
Bemerkung: Falls die Bedingung
herw ≥ 5
nicht erfullt ist, benotigt man die exakte Verteil-
ung derPrufgroße χ2. Dies fuhrt dann zum ex-akten Test von Fisher.
14.2 Der Chi–Quadrat–Test auf Un-abhangigkeit fur r× s–Kontingenztafeln
Bezeichnen
a1, . . . , ar
die r moglichen Auspragungen eines Merkmals
X und
b1, . . . , bs
die s moglichen Auspragungen von Y . Die Null-
hypothese besagt, dass kein Zusammenhang zwi-
schen den beiden Merkmalen besteht:
H0 : X und Y sind statistisch unabhangig
StatBio 423
Es gibt r×s mogliche Kombinationen von Merk-
malsauspragungen:
(ai, bj), 1 ≤ i ≤ r, 1 ≤ j ≤ s
Diese seien in der Stichprobe mit den Haufig-keiten hij aufgetreten. Die Darstellung der
Haufigkeiten erfolgt in einer sogenannten r× s–Kontingenztafel:
Tabelle 14–5 r × s–Kontingenztafel
Merkmal Y Zeilen-
Merkmal X b1 . . . bs summe
a1 h11 . . . h1s h1.... ... ... ... ...
ar hr1 . . . hrs hr.Spaltensumme h.1 . . . h.s n
StatBio 424
Der Eintrag des Feldes im Schnitt der i–ten Zeile
mit der j–ten Spalte ist
hij = beobachtete Haufigkeit der
Auspragungskombination (ai, bj)
Aus den Randern dieser Tafel ergeben sich die
beobachteten Haufigkeiten der Auspragungen
von X bzw. Y . Genauer: Die i-te Zeilensummeist
hi. =
s∑j=1
hij
= beobachtete Haufigkeit
der Auspragung ai
StatBio 425
und die j–te Spaltensumme ist
h.j =
r∑i=1
hij
= beobachtete Haufigkeit
der Auspragung bj
Wie im Fall der Vier–Feldertafel wird angenom-
men, dass die relativen (Rand–)Haufigkeiten
hi.n, i = 1, . . . , r
undh.jn, j = 1, . . . , s
die wahre (Wahrscheinlichkeits–)Verteilung
der Merkmalsauspragungen a1, . . . , ar bzw.
b1, . . . , bs in der Grundgesamtheit widerspiegeln.
StatBio 426
Beispiel 14.2 (siehe Kap. 1) Um die Frage zubeantworten, ob es einen Zusammenhang gibtzwischen Haarfarbe und Augenfarbe eines Men-schen, erhob Snee (1974) die folgenden Da-ten anhand 592 Studenten eines Statistikkurses(Merkmal X: Augen (blau=1, braun=2, grun=3,haselnuss=4); Merkmal Y: Haare (blond=1,braun=2, rot=3, schwarz=4)].
Augen/Haare 1 2 3 4 Summe1 94 84 17 20 2152 7 119 26 68 2203 16 29 14 5 644 10 54 14 15 93Summe 127 286 71 198 592
StatBio 427
Bemerkung: Zeilen- und Spaltensummen sind
zufallsabhangig (diese ergeben sich erst aus den
konkreten Beobachtungen)!
Die erwartete Haufigkeit eij der Auspragungs-
kombination (ai, bj) unter H0 ergibt sich aus der
Kontingenztafel als
eij =i–te Zeilensumme × j–te Spaltensumme
n
Bemerkung: Die erwarteten Haufigkeiten be-
sitzen die gleichen Randhaufigkeiten wie die be-
obachteten Haufigkeiten:
s∑j=1
eij =
s∑j=1
hi. · h.jn
= hi.1
n
s∑j=1
h.j︸ ︷︷ ︸=n
= hi.
s∑i=r
eij =
r∑i=1
hi. · h.jn
= h.j1
n
r∑i=1
hi.︸ ︷︷ ︸=n
= h.j
StatBio 428
Fortsetzung von Bsp. 14.2: Die entsprechendeTafel fur die erwarteten Haufigkeiten lautet:
Tabelle 14–7 Erwartete Haufigkeiten der Snee–Daten
Augen/Haare 1 2 3 4 Summe1 46.12 103.87 25.79 39.22 2152 47.20 106.28 26.39 40.14 2203 13.73 30.92 7.684 11.68 644 19.95 44.93 11.15 16.97 93Summe 127 286 71 198 592
Die Idee des Chi–Quadrat–Tests beruht auf dem
Vergleich der beobachteten Haufigkeiten hij und
der erwarteten Haufigkeiten eij, i = 1, . . . , r,
j = 1, . . . , s. Die Prufgroße ist
χ2 =
s∑j=1
r∑i=1
(hij − eij)2
eij
[Bemerkung: Eine einfache Darstellung die-
ser Prufgroße ist nur im Fall r = s = 2
StatBio 429
(Vier–Feldertafel) moglich.] Unter der Gultig-
keitsannahme von H0 kann die Stichproben-
verteilung von χ2 hinreichend gut durch eine
Chi–Quadrat–Verteilung mit (r− 1) · (s− 1)
Freiheitsgraden beschrieben werden, falls die
folgende Bedingung erfullt ist:
Fur mindestens 80% der insgesamt r · sFelder gilt:
eij ≥ 5
Man wird sich gegen die Nullhypothese H0 ent-
scheiden, wenn die Prufgroße χ2 einen ,,großen”
Wert angenommen hat. Groß bedeutet, dass χ2
großer als ein kritischer Wert der Chi–Quadrat–
Verteilung ist (siehe Tab. 14–8). Dieser kritische
Wert
χ2df ;1−α mit df = (r − 1) · (s− 1)
((1 − α)–Quantil) hangt vom vorgegebenem
StatBio 430
Testniveau α ab.
Der Chi–Quadrat–Test fur r × s–Kontingenz-
tafeln ist wie folgt durchzufuhren:
1. Man berechnet die Prufgroße
χ2 =
s∑j=1
r∑i=1
(hij − eij)2
eij
2. Die Prufgroße χ2 wird mit dem kritischen
Wert
χ2(r−1)·(s−1);1−α
[(1− α)–Quantil der Chi–Quadrat–Verteilung
mit (r− 1) · (s− 1) Freiheitsgraden (df)] ver-
glichen. Die Testentscheidung lautet: Ableh-
nung der Nullhypothese
H0 : X und Y sind statistisch unabhangig
StatBio 431
falls
χ2 > χ2(r−1)·(s−1);1−α
Fortsetzung von Bsp. 14.2: Sei 0.05 das vor-
gegebene Testniveau. Fur die Prufgroße erhalt
man den Wert
χ2 =(94− 46.12)2
46.12+ . . .+
(15− 16.97)2
16.97
= 138.30
Wegen
χ2(r−1)(s−1);1−α = χ2
9;0.95 = 16.919
(Tab. 14–8) gilt T > 16.919 und die Nullhy-
pothese wird abgelehnt. Der p–Wert, also die
Wahrscheinlichkeit, unter H0 einen Prufgroßen-
wert χ2 zu erhalten, der großer als der tatsachlich
beobachtete Wert 138.30 ist, betragt nahezu 0:
p(138.30) ≈ 0
StatBio 432
Tabelle 14–8 Kritische Werte des χ2–Tests fur α = 0.05und α = 0.01
df χ2df ;0.95 χ2
df ;0.99
1 3.841 6.6352 5.991 9.2103 7.815 11.3454 9.488 13.2775 11.070 15.086
6 12.592 16.8127 14.067 18.4758 15.507 20.0909 16.919 21.666
10 18.307 23.209
11 19.675 24.72512 21.026 26.21713 22.362 27.68814 23.685 29.14115 24.996 30.578
16 26.296 32.00017 27.587 33.40918 28.869 34.80519 30.144 36.19120 31.410 37.566
StatBio 433
14.3 Zusammenhangsmaße
Mit dem χ2–Test auf Unabhangigkeit lasst sich
die Existenz eines Zusammenhangs zwischen
zwei nominal skalierten Merkmalen nachweisen –
uber die Starke macht das Testergebnis jedoch
keine Aussage.
Begrundung: Der χ2–Wert hangt direkt propor-
tional mit dem Stichprobenumfang n ab. Etwa
eine Verdopplung der beobachteten Haufigkei-
ten (bei gleichbleibenden relativen Haufigkeiten)
fuhrt zu einer Verdopplung des χ2–Wertes. Der
χ2–Wert ist somit nach oben nicht beschrankt,
kann also beliebig große Werte annehmen. Man
kann die folgende Abschatzung zeigen: Fur r×s–
Kontingenztafeln gilt
0 ≤ χ2 ≤ n ·min(r − 1, s− 1)
Die drei gebrauchlichsten Zusammenhangsmaße,
StatBio 434
die auf der Prufgroße χ2 basieren, sind:
• Der Phi–Koeffizient: 1
Φ =
√χ2
n
Fur Vier–Felder–Tafeln gilt stets 0 ≤ Φ ≤ 1.
Der Koeffizient Φ kann fur großere Kontin-
genztafeln auch hohere Werte annehmen und
ist daher nur fur Vier–Feldertafeln zu empfeh-
len.
• Cramer’s V:
V =
√χ2
n ·min(r − 1, s− 1)
1Dieser wird ublicherweie mit Φ bezeichnet. Eine Verwechslung mit
der Verteilungsfunktion der Standardnormalverteilung, die ebenfalls
mit Φ bezeichnet wird, durfte aber aus dem Zusammenhang heraus
ausgeschlossen sein.
StatBio 435
Es gilt stets 0 ≤ V ≤ 1. Hinweis: Fur 2 × 2–
Tafeln (r = s = 2) gilt V = Φ.
• Der Kontingenz–Koeffizient C von Pear-son:
C =
√χ2
n+ χ2
Es gilt stets
0 ≤ C ≤
√min(r − 1, s− 1)− 1
min(r − 1, s− 1)
Hinweis: Der Kontingenz–Koeffizient C soll-
te nur beim Vergleich von Kontingenztabellen
mit gleicher Zeilen– und Spaltenzahl verwen-
det werden.
Interpretation: Wert des Zusammenhangsma-
ßes nahe bei 0 = schwacher Zusammenhang;
Wert des Zusammenhangsmaßes nahe am Ma-
ximum = starker Zusammenhang.
StatBio 436
Beispiele:
(i) In Bsp. 14.1 erhalt man
V = Φ =
√1.647
69= 0.154
(ii) In Bsp. 14.2 (Snee–Daten) erhalt man
V =
√138.30
592 ·min(4− 1, 4− 1)= 0.279
In Bsp. 14.1 war kein signifikanter Zusammen-
hang festzustellen; in Beispiel Bsp. 13.2 ist der
signifikante Zusammenhang als gering einzustu-
fen.
StatBio 437