14 Statistische Beziehungen zwischen nomi{ nalen Merkmalen · 14.1 Der Chi{Quadrat{Test auf Unabh an{gigkeit fur Vier{Feldertafeln Gegeben seien zwei bin are Merkmale Xund Y mit den

14 Statistische Beziehungen zwischen nomi–nalen Merkmalen

14.1 Der Chi–Quadrat–Test auf Unabhangigkeit fur Vier–

Feldertafeln

14.2 Der Chi–Quadrat–Test auf Unabhangigkeit fur r×s–

Kontingenztafeln

14.3 Zusammmenhangsmaße

Haufig werden an einem Objekt zwei nominal

skalierte Merkmale X und Y erhoben (z. B.

Geschlecht und Rauchen (ja/nein), Augenfarbe

und Haarfarbe).

Ziel: Prufen der Nullhypothese, dass es zwi-

schen X und Y keinen statistischen Zusam-

menhang gibt. Ferner: Gesucht sind statistische

Kenngroßen (Maßzahlen), die den Grad (Starke)

eines Zusammenhangs messen (Abschnitt 14.3).

StatBio 408

14.1 Der Chi–Quadrat–Test auf Unabhan–gigkeit fur Vier–Feldertafeln

Gegeben seien zwei binare Merkmale X und Y

mit den kodierten Auspragungen 1 und 0.

Beispiel: Geschlecht=X (mannlich=1, weib-

lich=0) und Rauchen=Y (ja=1, nein=0)

Man mochte wissen, ob es zwischen X und

Y einen Zusammenhang gibt oder ob sie un-

abhangig sind.

Es gibt 4 mogliche Auspragungsskombinationen

von (X,Y ):

(1, 1), (1, 0), (0, 1), (0, 0)

Diese seien in einer Stichprobe vom Umfang n

mit den Haufigkeiten a, b, c, d aufgetreten. Die

Darstellung erfolgt in einer sogenannten 2× 2–Kontingenztafel (Vier–Feldertafel):

StatBio 409

Tabelle 14–1 Vier–Feldertafel

Auspragung Y = 1 Y = 0 RandsummenX = 1 a b a+ bX = 0 c d c+ d

Randsummen a+ c b+ d a+ b+ c+ d = n

In der statistischen Analyse von Vierfelderta-

feln geht man davon aus, dass die Randsummen

die wahre (Haufigkeits–)Verteilung der binaren

Auspragungen in der Grundgesamtheit wider-

spiegeln:

a+ b

n= Anteilswert der Auspragung X = 1

in der Grundgesamtheit

c+ d

n= Anteilswert der Auspragung X = 0


StatBio 410

Es gilta+ b

n+c+ d

n= 1

Vollig analog:

a+ c

n= Anteilswert der Auspragung Y = 1


b+ d

n= Anteilswert der Auspragung Y = 0


Es gilta+ c

n+b+ d

n= 1

StatBio 411

14.1 Beispiel: Es soll die Frage geklart werden,

ob es einen Zusammenhang zwischen dem Ge-

schlecht und Rauchen gibt. Eine Untersuchung

von 69 Personen ergab folgendes Ergebnis:

Tabelle 14–2 Vier–Feldertafel zu Bsp. 14.1

Raucher Nichtr. SummeManner 19 20 39Frauen 10 20 30Summe 29 40 69

Die Prufgroße des Chi–Quadrat–Tests vergleicht

die beobachteten Haufigkeiten (hbeob) a, b,

c, d mit den Haufigkeiten, die man unter der

Nullhypothese

H0 : X und Y sind unabhangig

erwarten wurde (herw).

Frage: Welche Haufigkeiten sind unter H0 zu

erwarten?

StatBio 412

Dazu schaut man sich die relative Haufigkeiten

an.

In der Stichprobe gibt es a + b Merkmalskom-

binationen mit der Eigenschaft X = 1 (d.h.

die Merkmalskombinationen (1, 1) und (1, 0)

wurden (a + b)–mal beobachtet). Die relative

Haufigkeit, bezogen auf die gesamte Stichprobe,

ist alsoa+ b

nDie relative Haufigkeit der Merkmalskombinatio-

nen mit X = 1, bezogen auf die Merkmalskom-

binationen mit Y = 1, ist

a

a+ c

Hat Y keinen Einfluss auf X (Nullhypothese),

so wird man erwarten, dass sich diese beiden

relativen Haufigkeiten nicht (oder kaum) unter-

StatBio 413

scheiden:a

a+ c≈ a+ b

nalso

a ≈ (a+ b) · (a+ c)

n︸︷︷︸=herw

Unter H0 wurde man also in einer Stichpro-

be vom Umfang n die Auspragungskombination

(1, 1) mit einer Haufigkeit von

(a+ b) · (a+ c)

n

erwarten. Die erwarteten Haufigkeiten der an-

deren Merkmale lassen sich ahnlich herleiten.

Die Zusammenfassung kann wieder durch eine

Vier–Feldertafel erfolgen:

StatBio 414

Tabelle 14–3 Vier–Feldertafel der erwartetenHaufigkeiten

Auspragung Y = 1 Y = 0 Randsummen

X = 1 (a+b)·(a+c)n

(a+b)·(b+d)n a+ b

X = 0 (c+d)·(a+c)n

(c+d)·(b+d)n c+ d

Randsummen a+ c b+ d n

Bemerkung:

(i) Die erwarteten Haufigkeiten ergeben sich

aus den Randhaufigkeiten und dem Stichproben-

umfang:

herw =Zeilensumme ·Spaltensumme

Stichprobenumfang

(ii) Die Randsummen der erwarteten Haufig-

keiten sind identisch mit den Randsummen der

beobachteten Haufigkeiten.

StatBio 415

Fortsetzung von Beispiel 14.1

Tabelle 14–4 Vier–Feldertafel der erwartetenHaufigkeiten zu Bsp. 14.1

Raucher Nichtr. SummeManner 16.4 22.6 39Frauen 12.6 17.4 30Summe 29 40 69

Die wesentliche Idee des Chi–Quadrat–Tests be-

steht im Vergleich der vier beobachteten Haufig-

keiten mit den entsprechenden unter H0 er-

warteten Haufigkeiten. Die Prufgroße des Chi–

Quadrat–Tests lautet

χ2 =∑

alle 4Felder

(hbeob − herw)2

herw

Es lasst sich zeigen, dass diese Prufgroße die

wesentlich einfachere Darstellung

χ2 = n · (a · d− b · c)2

(a+ b) · (c+ d) · (a+ c) · (b+ d)

StatBio 416

besitzt (im Nenner steht das Produkt der vier

Randsummen).

Unter der Nullhypothese H0 erwartet man einen

Prufgroßenwert χ2 in der Nahe von Null (im

Extremfall gilt χ2 = 0, wenn alle beobachteten

Haufigkeiten mit den erwarteten ubereinstim-

men). Kleinere Abweichungen von 0 sind mit

H0 durchaus vereinbar; große Werte von χ2

sprechen gegen H0. Die Prufgroße χ2 ist um-

so großer, je mehr die beobachteten von den

erwarteten Haufigkeiten abweichen.

Um zu beurteilen, wann eine Abweichung von 0

als ,,groß”, als unplausibel fur H0 gilt, benotigt

man die Stichprobenverteilung der Prufgroße χ2.

Es lasst sich Folgendes nachweisen: Gilt fur die

vier erwarteten Haufigkeiten

herw ≥ 5

StatBio 417

so kann die Stichprobenverteilung der Prufgroße

χ2 hinreichend gut durch die Chi–Quadrat–Verteilung mit einem Freiheitsgrad [degress

of freedom (df) = 1] beschrieben werden.

Man wird sich gegen die Nullhypothese H0 ent-

scheiden, wenn die Prufgroße χ2 einen ,,großen”

Wert angenommen hat. Groß bedeutet, dass

χ2 oberhalb eines kritischen Wertes der Chi–

Quadrat–Verteilung liegt (siehe Tab. 14–8).

Dieser kritische Wert ((1− α)–Quantil)

χ2df ;1−α

hangt vom vorgegebenem Testiveau α ab (bei

Vier–Feldertafeln ist stets df = 1).

StatBio 418

Abbildung 14–1 Dichte der Chi–Quadrat–Verteilung miteinem Freiheitsgrad; 0.05 = graue Flache oberhalb des

kritischen Wertes χ21;0.95 = 3.841

Abbildung 14–2 Dichte der Chi–Quadrat–Verteilung miteinem Freiheitsgrad; 0.01 = graue Flache oberhalb des

kritischen Wertes χ21;0.99 = 6.635

Der Chi–Quadrat–Test fur Vier–Feldertafeln ist

wie folgt durchzufuhren:

StatBio 419

1. Man berechnet die Prufgroße

χ2 =∑

uber alle 4 Felder

(hbeob − herw)2

herw

= n ·(a · d− b · c

)2(a+ b) · (c+ d) · (a+ c) · (b+ d)

2. Die Prufgroße χ2 wird mit dem kritischen

Wert χ21;1−α verglichen (Tab. 14–8). Die

Testentscheidung lautet: Ablehnung der

Nullhypothese

H0 : X und Y sind statistisch unabhangig

falls

χ2 > χ21;1−α

StatBio 420

Fortsetzung von Bsp. 14.1: Es soll zum Niveau

α = 0.05 getestet werden. Der Prufgroßenwert

betragt

χ2 = 69 · (19 · 20− 20 · 10)2

39 · 30 · 29 · 40= 1.647

Wegen χ21;0.05 = 3.841 (Tab. 14–8, erste Zeile)

kann die Nullhypothese zum Niveau 0.05 nicht

abgelehnt werden.

Der p–Wert, also die Wahrscheinlichkeit, un-

ter H0 einen Prufgroßenwert χ2 zu erhalten,

der großer als der tatsachlich beobachtete Wert

1.647 ist, betragt

p(1.647) ≈ 0.199

StatBio 421

Abbildung 14–3 Dichte der Chi–Quadrat–Verteilung miteinem Freiheitsgrad; p–Wert = 0.199 = graue Flache

oberhalb von 1.647

Fur kleinere Stichprobenumfange n (20 ≤ n ≤60) verbessert sich nach Yates (1981) die Nahe-

rung durch eine Chi–Quadrat–Verteilung, wenn

die Teststatistik χ2 ,,korrigiert” wird zu

χ2korr = n · (|a · d− b · c| − n/2)2

(a+ b) · (c+ d) · (a+ c) · (b+ d)

Die Nullhypothese H0 wird abgelehnt, falls

χ2korr ≥ χ2

1;1−α

StatBio 422

Bemerkung: Falls die Bedingung

herw ≥ 5

nicht erfullt ist, benotigt man die exakte Verteil-

ung derPrufgroße χ2. Dies fuhrt dann zum ex-akten Test von Fisher.

14.2 Der Chi–Quadrat–Test auf Un-abhangigkeit fur r× s–Kontingenztafeln

Bezeichnen

a1, . . . , ar

die r moglichen Auspragungen eines Merkmals

X und

b1, . . . , bs

die s moglichen Auspragungen von Y . Die Null-

hypothese besagt, dass kein Zusammenhang zwi-

schen den beiden Merkmalen besteht:


StatBio 423

Es gibt r×s mogliche Kombinationen von Merk-

malsauspragungen:

(ai, bj), 1 ≤ i ≤ r, 1 ≤ j ≤ s

Diese seien in der Stichprobe mit den Haufig-keiten hij aufgetreten. Die Darstellung der

Haufigkeiten erfolgt in einer sogenannten r× s–Kontingenztafel:

Tabelle 14–5 r × s–Kontingenztafel

Merkmal Y Zeilen-

Merkmal X b1 . . . bs summe

a1 h11 . . . h1s h1.... ... ... ... ...

ar hr1 . . . hrs hr.Spaltensumme h.1 . . . h.s n

StatBio 424

Der Eintrag des Feldes im Schnitt der i–ten Zeile

mit der j–ten Spalte ist

hij = beobachtete Haufigkeit der

Auspragungskombination (ai, bj)

Aus den Randern dieser Tafel ergeben sich die

beobachteten Haufigkeiten der Auspragungen

von X bzw. Y . Genauer: Die i-te Zeilensummeist

hi. =

s∑j=1

hij

= beobachtete Haufigkeit

der Auspragung ai

StatBio 425

und die j–te Spaltensumme ist

h.j =

r∑i=1

hij

= beobachtete Haufigkeit

der Auspragung bj

Wie im Fall der Vier–Feldertafel wird angenom-

men, dass die relativen (Rand–)Haufigkeiten

hi.n, i = 1, . . . , r

undh.jn, j = 1, . . . , s

die wahre (Wahrscheinlichkeits–)Verteilung

der Merkmalsauspragungen a1, . . . , ar bzw.

b1, . . . , bs in der Grundgesamtheit widerspiegeln.

StatBio 426

Beispiel 14.2 (siehe Kap. 1) Um die Frage zubeantworten, ob es einen Zusammenhang gibtzwischen Haarfarbe und Augenfarbe eines Men-schen, erhob Snee (1974) die folgenden Da-ten anhand 592 Studenten eines Statistikkurses(Merkmal X: Augen (blau=1, braun=2, grun=3,haselnuss=4); Merkmal Y: Haare (blond=1,braun=2, rot=3, schwarz=4)].

Augen/Haare 1 2 3 4 Summe1 94 84 17 20 2152 7 119 26 68 2203 16 29 14 5 644 10 54 14 15 93Summe 127 286 71 198 592

StatBio 427

Bemerkung: Zeilen- und Spaltensummen sind

zufallsabhangig (diese ergeben sich erst aus den

konkreten Beobachtungen)!

Die erwartete Haufigkeit eij der Auspragungs-

kombination (ai, bj) unter H0 ergibt sich aus der

Kontingenztafel als

eij =i–te Zeilensumme × j–te Spaltensumme

n

Bemerkung: Die erwarteten Haufigkeiten be-

sitzen die gleichen Randhaufigkeiten wie die be-

obachteten Haufigkeiten:

s∑j=1

eij =

s∑j=1

hi. · h.jn

= hi.1

n

s∑j=1

h.j︸︷︷︸=n

= hi.

s∑i=r

eij =

r∑i=1

hi. · h.jn

= h.j1

n

r∑i=1

hi.︸︷︷︸=n

= h.j

StatBio 428

Fortsetzung von Bsp. 14.2: Die entsprechendeTafel fur die erwarteten Haufigkeiten lautet:

Tabelle 14–7 Erwartete Haufigkeiten der Snee–Daten

Augen/Haare 1 2 3 4 Summe1 46.12 103.87 25.79 39.22 2152 47.20 106.28 26.39 40.14 2203 13.73 30.92 7.684 11.68 644 19.95 44.93 11.15 16.97 93Summe 127 286 71 198 592

Die Idee des Chi–Quadrat–Tests beruht auf dem

Vergleich der beobachteten Haufigkeiten hij und

der erwarteten Haufigkeiten eij, i = 1, . . . , r,

j = 1, . . . , s. Die Prufgroße ist

χ2 =

s∑j=1

r∑i=1

(hij − eij)2

eij

[Bemerkung: Eine einfache Darstellung die-

ser Prufgroße ist nur im Fall r = s = 2

StatBio 429

(Vier–Feldertafel) moglich.] Unter der Gultig-

keitsannahme von H0 kann die Stichproben-

verteilung von χ2 hinreichend gut durch eine

Chi–Quadrat–Verteilung mit (r− 1) · (s− 1)

Freiheitsgraden beschrieben werden, falls die

folgende Bedingung erfullt ist:

Fur mindestens 80% der insgesamt r · sFelder gilt:

eij ≥ 5

Man wird sich gegen die Nullhypothese H0 ent-

scheiden, wenn die Prufgroße χ2 einen ,,großen”

Wert angenommen hat. Groß bedeutet, dass χ2

großer als ein kritischer Wert der Chi–Quadrat–

Verteilung ist (siehe Tab. 14–8). Dieser kritische

Wert

χ2df ;1−α mit df = (r − 1) · (s− 1)

((1 − α)–Quantil) hangt vom vorgegebenem

StatBio 430

Testniveau α ab.

Der Chi–Quadrat–Test fur r × s–Kontingenz-

tafeln ist wie folgt durchzufuhren:

1. Man berechnet die Prufgroße

χ2 =

s∑j=1

r∑i=1

(hij − eij)2

eij

2. Die Prufgroße χ2 wird mit dem kritischen

Wert

χ2(r−1)·(s−1);1−α

[(1− α)–Quantil der Chi–Quadrat–Verteilung

mit (r− 1) · (s− 1) Freiheitsgraden (df)] ver-

glichen. Die Testentscheidung lautet: Ableh-

nung der Nullhypothese


StatBio 431

falls

χ2 > χ2(r−1)·(s−1);1−α

Fortsetzung von Bsp. 14.2: Sei 0.05 das vor-

gegebene Testniveau. Fur die Prufgroße erhalt

man den Wert

χ2 =(94− 46.12)2

46.12+ . . .+

(15− 16.97)2

16.97

= 138.30

Wegen

χ2(r−1)(s−1);1−α = χ2

9;0.95 = 16.919

(Tab. 14–8) gilt T > 16.919 und die Nullhy-

pothese wird abgelehnt. Der p–Wert, also die

Wahrscheinlichkeit, unter H0 einen Prufgroßen-

wert χ2 zu erhalten, der großer als der tatsachlich

beobachtete Wert 138.30 ist, betragt nahezu 0:

p(138.30) ≈ 0

StatBio 432

Tabelle 14–8 Kritische Werte des χ2–Tests fur α = 0.05und α = 0.01

df χ2df ;0.95 χ2

df ;0.99

1 3.841 6.6352 5.991 9.2103 7.815 11.3454 9.488 13.2775 11.070 15.086

6 12.592 16.8127 14.067 18.4758 15.507 20.0909 16.919 21.666

10 18.307 23.209

11 19.675 24.72512 21.026 26.21713 22.362 27.68814 23.685 29.14115 24.996 30.578

16 26.296 32.00017 27.587 33.40918 28.869 34.80519 30.144 36.19120 31.410 37.566

StatBio 433

14.3 Zusammenhangsmaße

Mit dem χ2–Test auf Unabhangigkeit lasst sich

die Existenz eines Zusammenhangs zwischen

zwei nominal skalierten Merkmalen nachweisen –

uber die Starke macht das Testergebnis jedoch

keine Aussage.

Begrundung: Der χ2–Wert hangt direkt propor-

tional mit dem Stichprobenumfang n ab. Etwa

eine Verdopplung der beobachteten Haufigkei-

ten (bei gleichbleibenden relativen Haufigkeiten)

fuhrt zu einer Verdopplung des χ2–Wertes. Der

χ2–Wert ist somit nach oben nicht beschrankt,

kann also beliebig große Werte annehmen. Man

kann die folgende Abschatzung zeigen: Fur r×s–

Kontingenztafeln gilt

0 ≤ χ2 ≤ n ·min(r − 1, s− 1)

Die drei gebrauchlichsten Zusammenhangsmaße,

StatBio 434

die auf der Prufgroße χ2 basieren, sind:

• Der Phi–Koeffizient: 1

Φ =

√χ2

n

Fur Vier–Felder–Tafeln gilt stets 0 ≤ Φ ≤ 1.

Der Koeffizient Φ kann fur großere Kontin-

genztafeln auch hohere Werte annehmen und

ist daher nur fur Vier–Feldertafeln zu empfeh-

len.

• Cramer’s V:

V =

√χ2

n ·min(r − 1, s− 1)

1Dieser wird ublicherweie mit Φ bezeichnet. Eine Verwechslung mit

der Verteilungsfunktion der Standardnormalverteilung, die ebenfalls

mit Φ bezeichnet wird, durfte aber aus dem Zusammenhang heraus

ausgeschlossen sein.

StatBio 435

Es gilt stets 0 ≤ V ≤ 1. Hinweis: Fur 2 × 2–

Tafeln (r = s = 2) gilt V = Φ.

• Der Kontingenz–Koeffizient C von Pear-son:

C =

√χ2

n+ χ2

Es gilt stets

0 ≤ C ≤

√min(r − 1, s− 1)− 1

min(r − 1, s− 1)

Hinweis: Der Kontingenz–Koeffizient C soll-

te nur beim Vergleich von Kontingenztabellen

mit gleicher Zeilen– und Spaltenzahl verwen-

det werden.

Interpretation: Wert des Zusammenhangsma-

ßes nahe bei 0 = schwacher Zusammenhang;

Wert des Zusammenhangsmaßes nahe am Ma-

ximum = starker Zusammenhang.

StatBio 436

Beispiele:

(i) In Bsp. 14.1 erhalt man

V = Φ =

√1.647

69= 0.154

(ii) In Bsp. 14.2 (Snee–Daten) erhalt man

V =

√138.30

592 ·min(4− 1, 4− 1)= 0.279

In Bsp. 14.1 war kein signifikanter Zusammen-

hang festzustellen; in Beispiel Bsp. 13.2 ist der

signifikante Zusammenhang als gering einzustu-

fen.

StatBio 437

Documents

14 Statistische Beziehungen zwischen nomi{ nalen Merkmalen · 14.1 Der Chi{Quadrat{Test auf Unabh an{gigkeit fur Vier{Feldertafeln Gegeben seien zwei bin are Merkmale Xund Y mit den