16

Click here to load reader

Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

  • Upload
    buinhi

  • View
    213

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

Kapitel 10

Stichproben und statistische Fehler

10.1 Verfahren zur Auswahl von Stichproben

Stichprobenauswahl als Bestandteil von Teilerhebungen: Aus dem Ergebnis der Untersuchungder Stichprobe soll dann auf die Grundgesamtheit geschlossen werden.

Ziel: Ergebnis der Untersuchung der Stichprobe= Ergebnis der Untersuchung der Grundgesamtheit, wenn sie exakt durchgefuhrt werdenkonnte, bis auf einen abschatzbaren Fehler, dessen Grenzen vor der Untersuchungfestgelegt werden sollten.

10.1.1 Zufallige Auswahlverfahren

Def. 10.1.1: Eine (streng) zufallige Auswahl einer Stichprobe liegt vor, wenn bei jederZiehung gilt: Jedes Element der Grundgesamtheit (bei ”m. Z.”) bzw. des Restes der Grundges.(bei ”o. Z.”) hat die gleiche Chance, gezogen zu werden.Wichtiges Hilfsmittel: Zufallszahlen.

Def. 10.1.2: (zi) heißt eine Folge von Zufallsziffern, wenn jedes zi eine Realisierung einer ZVZi ist, fur die gilt:

a) Zi nimmt die Werte 0, 1, . . . , 9 jeweils mit der Wahrscheinlichkeit 0.1 an.

b) Die Zi bilden eine Folge von unabhangigen ZV.

Def. 10.1.3: k ∈IN sei eine feste Zahl. (xi) heißt eine Folge von Zufallszahlen (mit Stellenzahl≤ k), wenn jedes xi eine Realisierung einer ZV Xi ist, fur die gilt:

a) Xi nimmt die Werte 0, 1, 2, . . . , 10k − 1 jeweils mit der Wahrsch. 10−k an.

b) Die Xi bilden eine Folge von unabhangigen ZV.

Die xi erhalt man durch Zusammenfassung von je k Zufallsziffern, wobei Lucken und Uber-lappungen vermieden werden sollten. Bei der Verwendung von Zufallszahlentabellen sollte dieAnfangsstelle zufallig ausgewahlt werden.

Def. 10.1.4 (xi) heißt eine Folge von z.B. reellen, auf (0, 1] gleichverteilten Zufallszahlen,wenn jedes xi Realisierung einer ZV Xi ist, fur die gilt:

a) Xi ist auf (0, 1] gleichverteilt, d.h. es gilt: 0 < Xi ≤ 1 und P (a < Xi ≤ b) = b − a fur0 ≤ a ≤ b ≤ 1.

b) Die Xi bilden eine Folge von unabhangigen ZV.

72

Page 2: Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

Statt “echter” Zufallszahlen verwendet man meist Pseudo-Zufallszahlen. Dies sind von Rechen-programmen erzeugte Zahlen, die deshalb keine Zufallszahlen sein konnen, aber in ausreichenderNaherung die gleichen Eigenschaften wie “echte” Zufallszahlen haben. So werden z.B. in Basicmit dem Befehl “rnd” auf [0, 1] gleichverteilte Pseudo-Zufallszahlen erzeugt.

Allg. Verf. zur (streng) zufalligen Auswahl einer Stichprobe vom Umfang n:

Annahme: Die Elemente der Grundgesamtheit sind registriert und durchnumeriert mit den Num-mern 1, 2, . . . , N .Ziehe n auf (0, 1] gleichverteilte (Pseudo-)Zufallszahlen xi. Bilde daraus zunachst die Zahlenyi := xi · N. Diese Zahlen sind auf (0, N ] gleichverteilte (Pseudo-)Zufallszahlen. Bestimme dar-aus fur jedes i = 1, . . . , n die Zahl ui als nachst großere ganze Zahl, d.h. ui ist die kleinste ganzeZahl mit der Eigenschaft ui ≥ yi. Die Elemente mit den Nummern u1, u2, . . . un bilden dann eine(streng) zufalligen Stichprobe vom Umfang n m.Z.Will man eine (streng) zufalligen Stichprobe vom Umfang n o.Z., so muß man die jedes ui, daszum zweitenmal vorkommt, streichen, und wenn notig weitere auf (0, 1] gleichverteilte(Pseudo-)Zufallszahlen xi ziehen und verarbeiten.

Quellen fur Folgen von Zufallsziffern und –zahlen:

a) Tabellen in Statistik–Lehrbuchern

b) The Rand Corporation: A Million Random Digits with 100,000 Normal Deviates, Glencoe(Illinois), 1955

c) Feste Unterprogramme in Rechenanlagen

10.1.2 Andere Auswahlverfahren

Grunde fur nicht streng zufallige Auswahlverfahren: Streng zuf. Verf. sind nicht immer moglichoder zu aufwendig, Vorkenntnisse bleiben unberucksichtigt, Vereinfachungen erwunscht.

Geschichtete Stichprobe:Aufteilung der Grundgesamtheit in Schichten (z.B. Arbeitnehmer, Freiberufliche ...).Zufallige Stichprobe aus jeder Schicht o.Z.

Bezeichnungen der relevanten Großen:

k SchichtenNi (keine ZV) Umfang der Schicht i (i = 1, 2, . . . , k)

ni(!≥ 1) Umfang der auf Schicht i entfallenden Teilstichprobe

µi arithmetisches Mittel der Merkmalswerte aller statistischenElemente in Schicht i

σi modifizierte Standardabweichung aller statistischen Elemen-te in Schicht i

µ arithmetisches Mittel der Merkmalswerte aller statistischenElemente in der Grundgesamtheit

σ modifizierte Standardabweichung der Merkmalswerte allerstatistischen Elemente in der Grundgesamtheit

73

Page 3: Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

n :=k∑

i=1ni Gesamtstichprobenumfang

N :=k∑

i=1Ni Umfang der Grundgesamtheit

xij Merkmalswert von dem statistischen Element Nummer j ausder Schicht i

Ai Menge der Nummern der statistischen Elemente aus Schichti, die fur die Teilstichprobe ausgewahlt werden. Die Auswahlaus einer Schicht geschieht unabhangig von der Auswahl ausjeder anderen Schicht.

Definitionen und Eigenschaften:

card Ai = ni

µi :=1

Ni

Ni∑

j=1

xij , σ2i :=

1

Ni − 1

Ni∑

j=1

(xij − µi)2

µ :=1

N

k∑

i=1

Ni∑

j=1

xij =1

N

k∑

i=1

µi · Ni

σ2 =1

N − 1

k∑

i=1

Ni∑

j=1

(xij − µ)2

=1

N − 1

k∑

i=1

Ni∑

j=1

(xij − µi + µi − µ)2

=1

N − 1

k∑

i=1

Ni∑

j=1

(xij − µi)2

+1

N − 1

k∑

i=1

Ni∑

j=1

2(xij − µi)

︸ ︷︷ ︸= 0

(µi − µ)

+1

N − 1

k∑

i=1

Ni∑

j=1

(µi − µ)2

=k∑

i=1

Ni − 1

N − 1σ2

i +k∑

i=1

1

N − 1Ni(µi − µ)2

Jedes Teilstichprobenmittel Y i :=1

ni

j∈Ai

xij ist ZV, da die Elemente j ∈ Ai zufallig ausgewahlt

werden.Y 1, . . . Y k sind unabhangig.Die Realisierung yi der ZV Y i (nach der Auswahl der Stichprobe) ist eine erwartungstreueSchatzung fur µi :E(Y i) = µi

Die Realisierung z :=1

N

k∑

i=1

Niyi der ZV Z :=1

N

k∑

i=1

NiY i ist eine erwartungstreue Schatzung

fur µ:

E(Z) =1

N

k∑

i=1

NiE(Y i) =1

N

k∑

i=1

Niµi = µ

74

Page 4: Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

Was ist nun uberhaupt der Vorteil der Schichtung? Dies sehen wir, wenn wir die Varianzen derZV bilden: Aus der Unabhangigkeit der Y i folgt:

V (Z) =k∑

i=1

N2i

N2V (Y i) =

k∑

i=1

N2i

N2

σ2i

ni(1 − ni

Ni)

Zum Vergleich:

A sei eine Zufallsauswahl (ohne Berucksichtigung der Schichten) aus {1, . . . , N} vom Umfang n,d.h. cardA = n

Y :=1

n

`∈A

x`, x1 := x11, x2 := x12, . . . , xn1:= x1n1

, xn1+1 := x21, . . . , xn1+n2:= x2n2

E(Y ) = µ

V (Y ) =σ2

n(1 − n

N)

Sind die σi bekannt, so wurde V (Z) minimal fur

ni = n · Ni · σi

k∑`=1

N` · σ`

Eine eventuell nicht–ganzzahlige rechte Seite ist auf eine ganze Zahl zu runden und fuhrt zueinem neuen (vom alten hochstens geringfugig abweichenden) Umfang

nneu =k∑

i=1

ni

Dies liefert die optimale Stichprobe.Sind die σi nicht bekannt, so wahlt man am besten

ni = n · Ni

N

Dies liefert die proportionale Stichprobe (wobei bei evtl. nicht–ganzzahliger rechter Seitewie bei der optimale Stichprobe zu verfahren ist.)Schon bei der proportionalen Stichprobe gilt mindestens im Fall, daß alle rechten Seiten ganz-zahlig sind und daß alle Ni groß gegenuber n sind, fur den Vergleich der Varianz der ZV Y ohneSchichtung mit der Varianz der ZV Z mit Schichtung:

V (Y ) ≈k∑

i=1

ni

n2σ2

i +k∑

i=1

ni

n2(µi − µ)2

> falls nicht alle µi gleich sind

V (Z) ≈k∑

i=1

ni · σ2i

n2

Def. 10.1.5: Beim Quotenverfahren (z. B. bei Umfragen) muß ein Interviewer Quoten (=Anteile, rel. Hf. en) bei der Auswahl der befragten Personen beachten. Ist z. B. der Anteilder freiberuflich Tatigen in der Grundges. p%, so mussen auch p% der befragten Personenfreiberuflich tatig sein. Sonst ist dem Interviewer die Auswahl in seinem Bereich freigestellt.Unterschied zu Def. 10.1.4: Keine zufallige Stichprobe in den einzelnen Gruppen, trotzdem haufig

75

Page 5: Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

gute Ergebnisse.

Def. 10.1.6: Eine Grundges. werde in kleinere Einheiten aufgeteilt. Dann wird bei dem Verf.der Klumpenstichprobe

a) eine zufallige Stichprobe von kleineren Einheiten gezogen,

b) bei jeder gezogenen kleineren Einheit eine zufallige Stichprobe von Elementen aus dieserkleineren Einheit gezogen. Haufig werden auch alle stat. Elemente aus der kleineren Einheituntersucht.

Ein Beispiel fur ein Auswahlverfahren einer systematischen Stichprobe vom Umfang n auseiner Grundgesamtheit von N Elementen, wobei N durch n teilbar sein soll, ist das folgende:

a) Wahle zufallig eine Zahl aus 1, 2, . . . , i := Nn . Das Ergebnis sei k.

b) Die Elemente mit den Nummern: k, k+i, k+2i, . . . , k+(n−1)i kommen in die Stichprobe.

Vorteile: Vereinfachung, Ahnlichkeit mit geschichteter StichprobeNachteil: Mogliche Gefahr durch Regelmaßigkeit, Abhilfe: Statt einer Zufallszahl k werden nZufallszahlen k0, k2, . . . , kn−1 (m. Z.) gezogen. Die Elemente mit den Nummern: k0, k1 + i, k2 +2i, . . . , kn−1 + (n − 1)i kommen in die Stichprobe.

10.2 Zufallige und systematische Fehler

Bei einer Messung treten nur zufallige Fehler auf, wenn die Meßwerte gleichmaßig um denrichtigen Wert streuen. Den richtigen Wert kann man dann nach den in Kap.7 besprochenenVerfahren schatzen. Ist aber z. B. das Meßinstrument falsch adjustiert, so kame zu dem zufalligenFehler auch ein systematischer: Die einzelnen Werte wurden nicht um den richtigen Wertstreuen, sondern um einen davon verschiedenen. Ein weiteres Beispiel fur einen zufalligen Fehlerist der Rundungsfehler, d. h. jener Fehler, der durch das Runden von Zahlen entsteht. Wirdz. B. auf ganze Zahlen gerundet, so wird der Rundungsfehler in der Regel im Intervall ±0.5gleichverteilt sein, d. h. die Verteilungsdichte der zugehorigen ZV ist = 1 zwischen -0.5 und +0.5und = 0 sonst.

Die Ursache fur zufallige Stichprobenfehler liegt in der Untersuchung der Stichprobe stattder Grundgesamtheit. Dieser Fehler ist mit Hilfe der Stichprobe der Wahrscheinlichkeitsrechnung(vgl. Kap.7,8,11) kontrollierbar und z. B. durch Erhohung des Stichprobenumfangs und durchBerucksichtigung von Vorkenntnissen reduzierbar.

Ursachen fur systematische Stichprobenfehler sind (z. T. unvermeidbare) Fehler bei derAuswahl der Stichprobe, der Datenerfassung, der Aufbereitung der Daten u. s. w.

10.3 Das Rechnen mit fehlerbehafteten Zahlen

Gegeben seien zwei Zahlen x und y, die mit gewissen Fehlern ∆x und ∆y behaftet sind. (x+∆x)und (y + ∆y) seien also die zugehorigen (unbekannten) exakten Werte. ∆x und ∆y werden alsabsolute, ∆x/x und ∆y/y als relative Fehler bezeichnet. Wir interessieren uns dafur, mit welchemFehler ein aus x und y berechneter Funktionswert f(x, y) behaftet ist. Wenn wir annehmen, daßdie relativen Fehler dem Betrage nach klein gegen 1 sind (d. h. |∆x| ist klein gegen |x|, und |∆y|ist klein gegen |y|), gilt:

76

Page 6: Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

(10.3.1) ∆f(x, y) := f(x + ∆x, y + ∆y) − f(x, y)

≈ fx(x, y)∆x + fy(x, y)∆y .

Dabei sind fx und fy die partiellen Ableitungen von f nach x bzw. y.

Spezialfalle:

a) f(x, y) = x ± y

∆(x ± y) := [(x + ∆x) ± (y + ∆y)] − [x ± y]

= ∆x ± ∆y

Fur den relativen Fehler gilt also

∆(x ± y)

x ± y=

∆x ± ∆y

x ± y.

Dieser relative Fehler kann dem Betrage nach sehr groß werden und den Zahlenwert (x±y)sogar unbrauchbar machen, wenn zwar die relativen Fehler von x und y dem Betrage nachklein gegen 1 sind, aber andererseits |x ± y| klein gegen |x| und gegen |y| ist.

b) f(x, y) = x · y. Es gilt: fx(x, y) = y ∧ fy(x, y) = x. Daraus folgt: ∆(x · y) ≈ y ·∆x + x ·∆y

und ∆(x·y)x·y ≈ ∆x

x + ∆yy .

c) f(x, y) = xy , Es gilt: fx(x, y) = 1

y ∧ fy(x, y) = − xy2 . Daraus folgt: ∆

(xy

)≈ ∆x

y − xy2 ∆y und

∆(

xy

)/(

xy

)≈ ∆x

x − ∆yy .

10.4 Bestimmung des Stichprobenumfangs

Je hoher der Stichprobenumfang ist, desto genauer, aber auch desto teurer ist ein statistischesVerfahren. Es empfiehlt sich also, den fur eine bestimmte Genauigkeitsforderung notigen Stich-probenumfang – wenn moglich – zu bestimmen oder wenigstens abzuschatzen. Als Beispiel dazunehmen wir an, daß wir ein 90%–Konfidenzintervall fur µ bei einer N(µ, σ)–verteilten ZV bestim-men wollen, wobei σ = 0.5 bekannt sei. Wie groß muß der Stichprobenumfang gewahlt werden,damit das Konfidenzintervall hochstens die Lange 0.3 hat, d. h. die Abweichung hochstens 0.15betragt? Da Φ streng monoton wachsend ist, gilt:

P (|Xn − µ| ≤ 0.15) = 2Φ(0.15

√n

0.5) − 1 ≥ 0.9 = 2Φ(1.65) − 1

⇔ 0.3√

n ≥ 1.65 ⇔ n ≥ 5.52 = 30.25

Der Stichprobenumfang sollte also 31 sein.

Allgemein erhalt man als Faustregel fur die Bestimmung des Stichprobenumfangs bei einerGrundgesamtheit vom Umfang N , die im wesentlichen auf der Naherung durch die Normalver-teilung beruht und nur als grobe Orientierung dienen kann:

P (|Schatz–ZV fur den Parameter θ − θ| ≤ d)!≥ γ,

wobei d und γ vorgegeben seien. Wir bestimmen ε aus der Formel Φ(ε) = (1+γ)2 , wobei σ

etwa aufgrund von fruheren Untersuchungen bekannt sei. Der Stichprobenumfang wird dann

77

Page 7: Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

naherungsweise nach der folgenden Formel bestimmt:

n ≈ 1

( dεσ )2 + 1

N

oder, wenn N sehr groß ist und damit praktisch eine fast ”unendliche” Grundgesamtheit vorliegt,

n ≈(

εσ

d

)2

.

78

Page 8: Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

Kapitel 11

Weitere Testverfahren statistischer

Hypothesen

11.1 Varianzanalyse

Mit Hilfe der Varianzanalyse soll untersucht werden, ob man aus vorliegendem Datenmateri-al uber k Meß– oder Beobachtungsgroßen mit ausreichender Sicherheit schließen kann, daß sieunterschiedliche Erwartungswerte haben. Bei jeder Große seien n0 Messungen oder Beobachtun-gen gemacht worden:

xj,1, . . . , xj,n0

seien die Ergebnisse bei der j–ten Große. Wir nehmen nun an, daß jedes dieser Meßergebnissexj,i (j = 1, 2, . . . , k; i = 1, 2, . . . , n0) eine Realisierung einer normalverteilten ZV Xj,i ist, wobeialle diese ZV unabhangig sind. Die Standardabweichung sei bei allen ZV gleich, aber unbekannt.Die Erwartungswerte sind bei den ZV Xj,i fur jedes feste j unabhangig von i, da diese ZV mitje einer Meßgroße zusammenhangen. Unter diesen Annahmen ist Xj,i also N(µj, σ)–verteilt. Essoll getestet werden, ob die Erwartungswerte µ1, µ2, . . . , µk unterschiedlich sind. Trifft das zu,so wird die Summe

(11.1.1)k∑

j=1(µj − µ)2 > 0

(µ := 1

k

k∑j=1

µj

)

sein. Je mehr sich die Werte µ1, . . . , µk unterscheiden, desto großer wird diese Summe. Setzenwir fur µj und µ geeignte Schatzungen ein, so erhalten wir folgenden Ausdruck:

(11.1.2)k∑

j=1(xj − x)2 mit xj := 1

n0

n0∑i=1

xj,i und x := 1k

k∑j=1

xj

Um die o. g. Hypothese zu prufen, stellen wir die gegenteilige Hypothese, namlich

(11.1.3) H0: µ1 = µ2 = . . . = µk =: µ

als Nullhypothese auf und prufen, ob wir aus den Ergebnissen xj,i der Untersuchung H0 mit aus-reichender Sicherheit verwerfen konnen. Das hangt offenbar davon ab, wie groß der Ausdruck in(11.1.2) ist. Um aber Wahrscheinlichkeitsaussagen machen zu konnen, mußten wir die Verteilungder zu (11.1.2) gehorenden ZV kennen. Nun ist E(X j) = µj = µ = µ und σ(X j) = σ/

√n0.

79

Page 9: Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

Außerdem sind die ZV X1, . . . , Xk unabhangig. Damit ist nach Satz 7.4.6 die ZV

(11.1.4) Z :=k∑

j=1

(Xj−Xσ/

√n0

)2

= n0

σ2

k∑j=1

(Xj − X)2

χ2–verteilt mit(k − 1) Freiheitsgraden. Da wir aber die Varianz σ2 nicht kennen, mussen wireine geeignete Schatzung verwenden:

(11.1.5) σ2 = 1k

k∑j=1

[ 1n0−1

n0∑i=1

(xj,i − xj)2]

Dabei ist der Ausdruck in der eckigen Klammer die erwartungstreue (vgl. Satz 7.3.1b) Schatzungfur σ2, bei der nur die Daten der j–ten Meßgroße verwendet werden. Zur Verbesserung derSchatzung wurde dann noch uber diese Ausdrucke gemittelt. Wegen der Unabhangigkeit der denAusdrucken in der eckigen Klammer zugeordneten ZV ist auch die Schatzfunktion in (11.1.5)

insgesamt erwartungstreu. Ersetzen wir in (11.1.4) σ2 durch die zu σ2 gehorende ZV, so erhaltenwir unter Einfuhrung eines geeigneten Normierungsfaktors, namlich 1/(k − 1), die ZV

(11.1.6) Y :=

n0k−1

k∑j=1

(Xj−X)2

1

nok−k

k∑j=1

n0∑i=1

(Xj,i−Xj)2.

Diese ZV besitzt unter der Hypothese H0 eine Verteilung, die in den statistischen Tabellen mitF–Verteilung mit (k − 1,n0k − k)–Freiheitsgraden bezeichnet wird. Mit Hilfe der Tabellenzu dieser Verteilung laßt sich dann der Test in folgender Weise durchfuhren:

Lege n0 und das Signifikanzniveau α vor der Untersuchung der Stichprobe fest.Bestimme d > 0 aus

(11.1.7) P (Y ≥ d|H0)!= α (Y vgl.(11.1.6))

(Dieser Wert d ist direkt aus den Tabellen fur die F–Verteilung zu bestimmen.)Untersuche fur jede der k Meßgroßen eine Stichprobe vom Umfang n0 und berechne aus derenDaten xj,i die Zahl y als Realisierung von Y aus (11.1.6).Ist y ≥ d, so ist H0 abzulehnen.Ist y < d, so kann man aus dem Datenmaterial nicht mit ausreichender Sicherheit (hier: Wahrsch.(1-α)) schließen, daß H0 falsch ist.

Bem.: Statt einer festen Zahl n0 nimmt man haufig auch verschiedene Zahlen nj (j = 1, 2, . . . , k),wobei die Formeln entsprechend zu verandern sind (vgl. z.B. J.Pfanzagl: Allgemeine Methoden-lehre der Statistik II, Abschn. 9.10). In diesem Fall ist also die Anzahl der Messungen bei deneinzelnen Meßgroßen u. U. verschieden, und zwar = nj bei der j–ten Meßgroße.

11.2 Kontingenztafeln

Problemstellung: X u. Y seien zwei ZV, die zwei Merkmale beschreiben, z. B. Kinderzahlu. Familieneinkommen. Kann man aufgrund von vorliegenden Daten auf die Abhangigkeit bzw.Unabhangigkeit schließen ?Fall 1: X u. Y seien ZV, die nur endlich viele Werte annehmen konnen. Die moglichen Wertevon X seien x1, x2, . . . , xr, die moglichen Werte von Y seien y1, y2, . . . , ys.Fur X u. Y wird dann eine Stichprobe vom Umfang n gezogen. Dabei ist zu beachten, daß die

80

Page 10: Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

Werte xi u. yj hier die gleiche Bedeutung wie im Abschnitt 6.7 und damit eine andere Bedeutungals xi und yj in den Kapiteln 7 und 8 haben.

Unter einer Kontingenztafel versteht man nun das folgende, der gemeinsamen Verteilung (vgl.6.7) analoge Schema:

↓ X| Y → y1 y2 y3 . . . ys

x1 f1,1 f1,2 f1,3 . . . f1,s f1,∗x2 f2,1 f2,2 f2,3 . . . f2,s f2,∗...

......

......

...

xr fr,1 fr,2 fr,3 . . . fr,s fr,∗

f∗,1 f∗,2 f∗,3 . . . f∗,s n

Dabei bedeuten:fi,j := absolute Haufigkeitdes gemeinsamen Auftretens von xi undyi in der Stichprobe,

fi,∗ :=s∑

j=1fi,j, f∗,j :=

r∑i=1

fi,j.

Es gilt:r∑

i=1

(s∑

j=1

fi,j) =r∑

i=1

fi,∗ =s∑

j=1

f∗,j = n(Stichpr. umf.)

Die rel. Haufigkeitenfi,j

n ,fi,∗

n bzw.f∗,j

n sind als Schatzwerte fur pi,j, pi,∗ bzw. p∗,j zu verwenden.Es werden dann die ZV Ni,j, Ni,∗ bzw. N∗,j eingefuhrt, deren Realisierungen fi,j, fi,∗ bzw. f∗,jsind. Dann gilt:

W :=r∑

i=1

s∑

j=1

(n · Ni,j − Ni,∗N∗,j)2

nNi,∗N∗,j

ist unter der Hyp. H0 (vgl. u.) und den Bedingungen in der Bemerkung am Schluß des Ab-schnitts naherungsweise χ2–verteilt mit (r − 1) · (s − 1) Fr. gr.

Test auf Unabhangigkeit zum Niveau α (α u. n vor d. Unters. festlegen):Hypothese H0: X, Y sind unabhangig.

Bestimme d > 0 so, daß P (W ≥ d) = 1 − Fχ2(d)!= α ist ((r − 1) · (s − 1) Freih. gr.).

Ist w =r∑

i=1(

s∑j=1

(n·fi,j−fi,∗·f∗,j)2

n·fi,∗·f∗,j) ≥ d, so ist H0 abzulehnen, d. h. es besteht ein Zusammenhang

zwischen X u. Y . Die Irrtumswahrsch. ist ≤ α. Ist w < d, so ist H0 (mit Vorbeh.) anzunehmen.

Fall 2: Vergleich zweier qualitativer Merkmale (nicht haufbar):Ersetze xi bzw. yj durch die Merkmalsauspragungen des 1. bzw. 2. Merkmals. fi,j bezeichnetdann die Haufigkeit des gemeinsamen Auftretens der i–ten Merkmalsauspragung beim 1. undder j–ten Merkmalsauspragung beim 2. Merkmal.fi,∗, f∗,j und w sind dann genau wie im Fall 1 zu bilden, und der Test ist ebenfalls wie imFall 1 durchzufuhren. Ablehnung von H0 bedeutet: Es kann (mit ausreichender Sicherheit) einZusammenhang zwischen den beiden Merkmalen angenommen werden.

Fall 3: X u. Y nicht–diskrete ZV (u. a.):Ersetze xi u. yj in der Kontingenztafel durch geeignete Intervalle. Die absolute Haufigkeiten inder Tafel sind dann wie folgt zu bilden:fi,j := Anzahl der Meßwertpaare (x, y) in der Stichprobe mit xi−1 ≤ x < xi und yj−1 ≤ y < yj.fi,∗, f∗,j und w sind dann genau wie in Fall 1 zu bilden, und der Test ist ebenfalls wie in Fall 1durchzufuhren.

81

Page 11: Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

Bem.: Damit die χ2–Verteilung naherungsweise anwendbar ist, sollten folgende Regeln beachtetwerden:n ≥ 50,

fi,∗·f∗,j

n ≥ 5 ( fur alle i = 1, . . . , r; j = 1, . . . , s) (Diese Bedingung laßt sich noch et-was abschwachen (vgl. J.Pfanzagl: Allgemeine Methodenlehre der Statistik II, Abschn. 8.3). DerStichprobenumfang n sollte also nicht zu klein gewahlt werden. Die zweite Teilbedingung ist inFall 3 bei der Wahl der Intervalle zu berucksichtigen. In Fall 2 sind dazu mehrere Merkmals-auspragungen zusammenzufassen, wenn die Teilbedingung zunachst nicht erfullt war. Ahnlichist im Fall 1 vorzugehen.

11.3 χ2–Test fur allgemeine Verteilungen

Wir sind bei den bisherigen stat. Untersuchungen mit Ausnahme von Abschn. 11.2 davon aus-gegangen, daß wir den Typ der Verteilung kennen, etwa Binomialvert., Normalvert. o. a.. Konfi-denzintervalle und Tests bezogen sich auf die jeweiligen Verteilungsparameter. Sie ergeben keineAussage daruber, ob der angenommene Verteilungstyp gerechtfertigt ist oder nicht, ob also z. B.eine ZV uberhaupt normalverteilt ist oder eine andere Art von Verteilung besitzt. In diesemAbschnitt sollen Fragen dieser Art behandelt werden.

Wie in den Kapiteln 7 und 8 gehen wir von einem Satz von n unabhangigen ZV X1, . . . , Xn aus,die alle die gleiche Verteilung besitzen. Dieser Satz ist wie bisher als Meß– oder Beobachtungs-reihe aufzufassen.

Fall 1: Die ZV Xi konnen nur die Werte k = 1, . . . ,m annehmen. Uber die Verteilung der Xi

wird dann folg. Hypothese aufgestellt:

(11.3.1) H0: P (Xi = k) = pk , k = 1, . . . ,m (i = 1, . . . , n) ,

wobei die pk vorgegebene (hypothetische) Wahrscheinlichkeiten sind und damit die Bedingungen

0 ≤ pk ≤ 1 f. a. k undm∑

k=1pk = 1 erfullen mussen. Diese Hypothese H0 soll gepruft werden.

Dazu wird eine Stichprobe vom Umfang n gezogen mit den Meß– oder Beobachtungsergebnissenx1, . . . , xn als Realisierungen der ZV X1, . . . , Xn. Die Haufigkeit des Wertes k bezeichnen wirdann wie bisher mit fk, d. h.

(11.3.2) fk := Anzahl der i mit xi = k .

Um die Hypothese H0 testen zu konnen, mussen wir aus den Haufigkeiten fk eine geigneteTestgroße bestimmen. Nun ist die relative Haufigkeit fk/n ein Schatzwert fur pk, und damitkommt es offenbar wesentlich auf die Differenzen zwischen den relativen Haufigkeiten und denWahrscheinlichkeiten pk an. Ist Nk wie in 11.2 die ZV, deren Realisierung fk ist, so sind offenbardie ZV

(11.3.3) Zk := Nk−npk√npkqk

(qk := 1 − pk , k = 1, . . . ,m)

von entscheidender Bedeutung. Nk ist namlich eine binomialvert. ZV mit den Parametern n, pk

und qk. Die ZV Zk hat damit den Erwartungswert 0 und die Standardabweichung 1 und ist alsonaherungsweise N(0, 1)–verteilt, wobei die Bedingungen n ≥ 50 und npk,nqk ≥ 5 erfullt seinsollten.Es ist nun naheliegend, analog zu Satz 7.4.5 oder besser noch zu Satz 7.4.6 die ZV

m∑

k=1

Z2k =

m∑

k=1

(Nk − npk)2

npkqk

82

Page 12: Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

als Test–ZV zu verwenden und von ihr anzunehmen, daß sie naherungsweise χ2–verteilt ist. Einegenauere Untersuchung, fur die in dieser Vorlesung aber die Hilfsmittel fehlen, zeigt jedoch, daßstattdessen die entsprechende ZV ohne die qk, namlich

(11.3.4) Y :=m∑

k=1

(Nk−npk)2

npk,

naherungsweise χ2–verteilt ist mit (m − 1) Freiheitsgraden. Das liegt u. a. an der besonderenArt der Abhangigkeit von N1, . . . , Nm. Der Test ist dann in folgender Weise durchzufuhren:

χ2–Test fur die Hypothese H0 (vgl. (11.3.1))

Schritt 1: Lege ein Signifikanzniveau α und einen Stichprobenumfang n fest.

Schritt 2: Bestimme eine kritische Große y0 > 0 mit

P (Y ≥ y0) ≈ 1 − Fχ2(y0)!= α , χ2–Vert. mit (m-1) Fr. gr.

Schritt 3: Werte eine Stichprobe vom Umfang n aus, bestimme aus den Ergebnissen die Haufig-keiten fk (vgl. (11.3.2)) und daraus eine Realisierung der ZV Y aus (11.3.4):

(11.3.5) y :=m∑

k=1

(fk−npk)2

npk

y ≥ y0 ⇒ Ablehnung von H0.y < y0 ⇒ Annahme von H0 mit Vorbehalt.

Hier ist der Vorbehalt in noch viel starkerem Maße als in 8.1 gerechtfertigt; denn die Negationvon H0 aus (11.3.1) ist noch viel weiter gefaßt als die Negation von H0 aus 8.1, namlich µ 6= µ0.

Fall 2: Uber die ZV Xi wird als Hypothese H0 aufgestellt, daß sie eine bestimmte Vert. fkt.F besitzen (z. B. F = Φ). Der Test soll analog zu Fall 1 durchgefuhrt werden. Dazu wird dieMenge uberhaupt moglicher Werte (z. B. IR =]−∞,∞[ oder [0,∞[) in Intervalle mit folgendenRandstellen aufgeteilt:

(11.3.6) a0 := −∞ < a1 < . . . < am−1 < am := +∞ (Aufteil. v. IR)

Fur diese Intervalle erhalten wir folg. hypothetische Wahrscheinlichkeiten:(11.3.7)

H0 =⇒ P (ak−1 < Xi ≤ ak) =

F (a1) − 0 =: p1 fur k = 1F (ak) − F (ak−1) =: pk fur k = 2, . . . ,m − 11 − F (am−1) =: pm fur k = m

Diesen Wahrscheinlichkeiten werden die Haufigkeiten fur die Intervalle gegenubergestellt:

(11.3.8) fk := Anzahl der i mit xi ∈]ak−1, ak]

Mit diesen Großen ist dann der Test genauso durchzufuhren wie in Fall 1.

Bem.: In beiden Fallen sollten folgende Bedingungen beobachtet werden, damit die verwende-ten Naherungen gerechtfertigt sind (vgl. Erlauterung zu (11.3.3)):

(11.3.9) n ≥ 50, n · pk ≥ 5 fur alle k = 1, . . . ,m (⇒ n · qk ≥ 5)

Ist die 2. Bedingung im Fall 2 nicht erfullt, so ist die Intervallaufteilung geeignet zu verandern,

83

Page 13: Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

indem man die betroffenen Intervalle vergroßert oder evtl. (zwei oder mehr) benachbarte Inter-valle zusammenfaßt. Ist die 2. Bedingung im Fall 1 verletzt, sollte man u. U. mehrere benachbarteWerte von k zusammenfassen. Bei Fall 2 ist noch zu beachten, daß verschiedene Verteilungs-funktionen und damit verschiedene Ausgangshypothesen auf die gleichen Wahrscheinlichkeitenpk fuhren konnen. Deshalb ist eine Annahme von H0 im Fall 2 noch problematischer als imFall 1.

11.4 Vorzeichentest

Die Ergebnisse einer Beobachtungsreihe, die durch einen Satz X1, . . . , Xn unabh. ZV mit dergleichen Verteilung gekennzeichnet ist, soll mit der Ergebnissen einer zweiten Beobachtungsrei-he, die in gleicher Weise durch Y1, . . . , Yn gekennzeichnet ist, verglichen werden. xi kann z.B.der Ertrag der Halfte des i-ten Versuchsfeldes sein, die mit einem konventionellen Dungemittelbehandelt wurde, wahrend yi der Ertrag der anderen Halfte ist, die mit einem neu entwickeltenDungemittel behandelt wurde. Mit Hilfe der Beobachtungsergebnissen soll uberpruft werden, obdie Ertrage des neuen Dungemittels besser sind als die des alten. Allgemein lauft das auf dieFragestellung hinaus, ob folgendes gilt:

(11.4.1) p+ := P (Xi < Yi) > p− := P (Xi > Yi)

Wegen der Gleichheit der Verteilungen der Xi untereinander und der Yi untereinander sind p+

und p− von i unabhangig. Zum Test der Hypothese (11.4.1) gehen wir von der gegenteiligenHypothese aus und haben also folg. Gegenuberstellung:

(11.4.2) H0 : p+ ≤ p− gegen H1 : p+ > p−

Der Test selbst ist recht einfach : Man uberpruft, bei wievielen Wertepaaren xi < yi gilt, wie oftalso yi − xi > 0 ist, d.h. positives Vorzeichen hat. Man pruft dann nach, ob das Ergebnis gegenH0 oder gegen H1 spricht, wobei die Fehler 1. bzw. 2. Art hochstens die Wahrscheinlichkeitenα bzw. β haben sollen. Bei einer Beobachtungsreihe der oben beschriebenen Art erhielt manfolgende Differenzen ( yi − xi ) ( i = 1, . . . , 10 ), wobei α = β = 0.05 vorher festgelegt wurde:

(11.4.3)(yi − xi) : 2.4, 1.0, 0.7, 0.0, 1.1, 1.6, 1.1, −0.4, 0.1, 0.7

Vorzeichen : + + + + + + − + +

Dieses Ergebnis scheint klar gegen H0 zu sprechen. Zur genaueren Untersuchung berucksichtigtman nur die Differenzen 6= 0, also 9 statt 10 Differenzen. Man erhalt dann :

(11.4.4)

P ( Mindestens 8-mal (Yi − Xi) > 0|H0 ∧ genau 9-mal (Yi − Xi) 6= 0)

=⊗

9∑

k=8

(9

k

)(p+

p+ + p−

)k( p−p+ + p−

)9−k∣∣∣∣p+≤p−

(⇔ p+

p++p−

≤ 1

2

)

(vgl. 8.2.2)≤

9∑

k=8

(9

k

)(1

2

)k(1

2

)9−k

=

(1

2

)9 9∑

k=8

(9

k

)

= 2−9(9 + 1) = 0.0195 < α = 0.05

Dabei ist ⊗ so zu erklaren (kein vollstandiger Beweis!):

84

Page 14: Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

P ((Yi − Xi) > 0|(Yi − Xi) 6= 0) = P (Xi < Yi|Xi 6= Yi)

:=P (Xi < Yi ∧ Xi 6= Yi)

P (Xi 6= Yi)=

P (Xi < Yi)

P (Xi < Yi) + P (Xi > Yi)=

p+

p+ + p−

P (Xi > Yi|Xi 6= Yi) =p−

p+ + p−

Aufgrund von (11.4.3) (8-mal ( yi − xi) > 0) kann man H0 mit einer Irrtumswahrsch. vonhochstens α = 0.05 ablehnen, was durch (11.4.4) teilweise, aber noch nicht vollstandig be-grundet wird. Zuvor aber soll des Test allgemein beschrieben werden:

Vorzeichentest von H0 gegen H1 (vgl. (11.4.2) u. (11.4.1)):

Schritt 1: Lege die Wahrscheinlichkeiten α, β fur den Fehler 1. bzw. 2. Art und den Stichpro-bennumfang n fest.

Schritt 2: Ziehe zwei Stichproben vom Umfang n . Bei diesen Stichproben sei ( yi − xi ) genaum-mal 6= 0 und genau km-mal > 0 (positives Vorzeichen) (0 ≤ km ≤ m ≤ n). Dann sind folgendeEntscheidungen zu treffen:

(11.4.5a) km ≥ m

2und 2−m

m∑

k=km

(m

k

)≤ α ⇒ Ablehnung v.H0

( wie etwa im ob. Bsp. )

(11.4.5b) km ≤ m

2und 2−m

km∑

k=0

(m

k

)≤ β ⇒ Ablehnung v.H1

In allen ubrigen Fallen ist keine Entscheidung mit ausreichender Sicherheit moglich.

Begrundung der Entscheidungsvorschrift (11.4.5a):Sei k′

m der kleinste der Werte km, die die Voraussetzungen in (11.4.5a) erfullen. Dann gilt analogzu (11.4.4) :

P (Ablehn.v.H0|H0 ∧ genau m-mal(Yi − Xi) 6= 0)

= P (Km := (Anzahl der i mit(Yi − Xi) > 0) erfullt d. Voraussetzungen

in (11.4.5a)|H0 ∧ genau m-mal(Yi − Xi) 6= 0)

= P (Km ≥ k′m|H0 ∧ genau m-mal(Yi − Xi) 6= 0)

= P (Mindestens k′m-mal(Yi − Xi) > 0|H0 ∧ genau m-mal(Yi − Xi) 6= 0)

(vgl.(11.4.4))≤ 2−m

m∑

k=k′

m

(m

k

)≤ α

=⇒

85

Page 15: Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

(11.4.6)

P(Ablehn. v H0|H0) (Wahrsch. f. e. irrtumliche Ablehn. v. H0)

=n∑

m=m0

P(Ablehn. v. H0∧ genau m-mal (Yi − Xi) 6= 0|H0)

=n∑

m=m0

P(Ablehn. v. H0|H0∧ genau m-mal (Yi − Xi) 6= 0) P(genau m-mal (Yi − Xi) 6= 0)

≤ αn∑

m=m0

P(genau m-mal (Yi − Xi) 6= 0) ≤ α · 1

m0 ist dabei die kleinste Zahl m, fur die uberhaupt ein km existiert, das die Voraussetzungen in(11.4.5a) erfullt. Ist m < m0, so ist damit die Zahl der fur den Test tatsachlich verwendbarenWertepaare ( xi, yi) zu klein, um Entscheidungen treffen zu konnen. Deshalb werden in (11.4.6)nur Summanden m ≥ m0 berucksichtigt. Damit es uberhaupt ein m0 ≤ n gibt, sollte

(11.4.7a) 2−nn∑

k=n

(nk

)= 2−n ≤ α

und moglichst auch

(11.4.7b) 2−n0∑

k=0

(nk

)= 2−n ≤ β

gelten. Sonst kommen wir beim Stichprobenumfang n nie zu einer Entscheidung gegen H0 bzw.gegen H1 mit ausreichender Sicherheit.Die Entsch.regel (11.4.5b) ist analog zu begrunden.

Bem.:

a) Bei der Durchfuhrung des Tests werden keine Voraussetzungen uber die Art der Vert. derXi bzw. der Yi gemacht wie etwa in Kap.8 od.Abschn. 11.1 ; daher ist der Vorzeichentestein Bsp. fur einem verteilungsfreien oder nicht-parametrischen Test. Kennt manden Verteilungstyp der Xi und der Yi, etwa Normalverteilung, so sind u.U. andere Testsanzuwenden.

b) Ahnlich wie in 8.2.2 ware manchmal folg. Gegenuberstellung zweckmaßiger:

H0 : p+ ≤ p− d.h. p+

p++p−≤ 1

2 gegen H1 : p+

p++p−≥ p1 > 1

2

Dann ist (11.4.5b) durch folg. Entsch.regel zu ersetzen:

(11.4.8) km ≤ q1 · m undkm∑k=0

(mk

)p1

kq1m−k(q1 := 1 − p1) ⇒ Ablehn.v.H1

c) Bei einem Signifikanztest uber die Hypothese H0 : p+ = p− gibt es folgende Entschei-dungsregel:

Sei lm :=

{km

m − km

, falls km < m − km ist ( weniger ”+” als ”−” )

sonst

2−m

lm∑

k=0

+m∑

k=m−lm

(

m

k

)≤ α ⇒ Ablehn. v.H0

86

Page 16: Stichproben und statistische Fehler - Universität · PDF fileKapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil

Eine Entsch. gegen p+ 6= p− kann nicht mit ausr. Sicherheit getroffen werden. H0 trifft zu,wenn die Vert. der Xi mit der Vert. der Yi ubereinstimmt. Eine Ablehn. v. H0 bedeutetdann auch, daß die Vert. der Xi mit ausreichender Sicherheit als verschieden von der Vert.der Yi angenommen werden kann. Es gilt aber nicht, daß aus p+ = p− auch die Gleichheitd. Verteilungen der Xi und Yi folgt.

87