16

Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

Statistische Anwendungen

Claudia Dilger

Ausarbeitung zum Vortrag im Seminar Mathematische Modellierung

(Wintersemester 2008/09, Leitung PD Dr. Gudrun Thäter)

Zusammenfassung: Für das Verständnis und die richtige Interpretation von Statistiken,

denen wir durch die Medien ununterbrochen in Form von Diagrammen, Hochrechnungen und

Kurven ausgesetzt sind, besteht in unserer Bevölkerung ein akuter Aufklärungsbedarf. Das

groÿe Problem liegt darin, dass in den Verö�entlichungen der Ergebnisse von statistischen

Tests vordergründig häu�g nur ungenaue oder keine Angaben zur Durchführung gemacht

werden. Allerdings kann die Aussagekraft je nach Stichprobenwahl oder auch Signi�kanz des

Ergebnisses stark variieren.

Dieser Vortrag zum Thema Statistische Modelle möchte nun einige Möglichkeiten aufweisen,

wie die gesammelten Daten eines solchen Tests ausgewertet und die Fehlerwahrscheinlichkeit

schrittweise berechnet werden kann. Dazu werden die grundlegenden statistischen Konzep-

te anschaulich anhand einiger Beispiele vorgestellt, wobei die schon bekannten elementaren

stochastischen Modelle angewendet werden. Man kann dabei des öfteren feststellen, dass die

Ergebnisse überraschend oder entgegen der Intuition undeutlich ausfallen können.

Am Ende wird das Thema Zufallszi�ern angesprochen, durch dessen Behandlung sich erken-

nen lässt, dass selbst vom Zufall eine gewisse Regelmäÿigkeit erwartet wird, die man sich in

vielfältiger Form zunutze machen kann.

Page 2: Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

Inhaltsverzeichnis

1 Einleitung 3

2 Statistik - Was ist das überhaupt? 32.1 Teilgebiete der Stochastik . . . . . . . . . . . . . . . . . . . . . . . . . 32.2 Etymologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42.3 Klassi�zierung der Statistik . . . . . . . . . . . . . . . . . . . . . . . . 4

3 Motivation des Vortrags 43.1 �Wusstest du schon...� . . . . . . . . . . . . . . . . . . . . . . . . . . . 43.2 Unter die Lupe genommen . . . . . . . . . . . . . . . . . . . . . . . . . 5

4 Hypothesentests 54.1 Die Idee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54.2 mathematische Betrachtung . . . . . . . . . . . . . . . . . . . . . . . . 54.3 Beispiel für einen einseitigen Test . . . . . . . . . . . . . . . . . . . . . 64.4 Beispiel für einen zweiseitigen Test . . . . . . . . . . . . . . . . . . . . 7

5 Das statistische Alternativproblem 85.1 Beispiel: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

6 Der Wald�sche Sequentialtest 106.1 Beispielaufgabe: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106.2 Graphische Deutung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

7 Der exakte Test von Fisher 117.1 Beispiel: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

8 Wie man sich den Zufall zunutze machen kann 128.1 Zufallszi�ern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128.2 Die Monte-Carlo-Methode . . . . . . . . . . . . . . . . . . . . . . . . . 14

9 Résumé 15

Abbildungsverzeichnis

2.1 Teilgebiete der Stochastik . . . . . . . . . . . . . . . . . . . . . . . . . 35.1 Kugelsequenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85.2 Berechnung der Pfade . . . . . . . . . . . . . . . . . . . . . . . . . . . 98.1 Quadrat mit Kreis�äche . . . . . . . . . . . . . . . . . . . . . . . . . . 148.2 Zeichen�äche mit Gitter . . . . . . . . . . . . . . . . . . . . . . . . . . 15

Tabellenverzeichnis

1 Ergebnis des Medikamententests . . . . . . . . . . . . . . . . . . . . . . 11

2

Page 3: Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

1 Einleitung

Dieses Zitat, das häu�g Winston Churchill zugesprochen wird, ist bestimmt jedem vonuns schon einmal begegnet:

Durch den Inhalt der Aussage und auch durch die Häu�gkeit des Zitierens dieses Aus-spruches wird deutlich, dass Statistiken, wie man sie so aus dem Alltag kennt, nichtviel Glauben geschenkt wird.In dieser Arbeit soll kurz angesprochen werden, inwieweit diese Zweifel berechtigt sindund dem Leser soll ein wenig das Gespür dafür gegeben werden, statistische Aussagenzumindest re�ektiert und kritisch betrachten zu können. Aus diesem Grund wurde dasobige Zitat als Rahmen gewählt.Um im Folgenden aber einige Bereiche der Statistik ansprechen zu können, soll zuerstdie folgende Frage besprochen werden:

2 Statistik - Was ist das überhaupt?

2.1 Teilgebiete der Stochastik

Stochastik - die Lehre der Beschreibung und Untersuchung von Zufallsexperimenten- lässt sich, wie im folgenden Schaubild erkennbar, in die Teilgebiete Wahrscheinlich-

keitstheorie und Statistik unterteilen.

Abbildung 2.1: Teilgebiete der Stochastik

Der Wahrscheinlichkeitstheorie liegt das Ziel der Berechnung von neuen Wahrschein-lichkeiten aus bekannten Wahrscheinlichkeiten zugrunde, während sich die Statistikdamit befasst, aufgrund von Beobachtungen Wahrscheinlichkeiten für das Auftretendieser Beobachtungen zu schätzen.

3

Page 4: Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

2.2 Etymologie

Der Begri� �Stochastik� leitet sich vom griechischen �stochastike techne� ab, welchesso viel bedeutet, wie �Ratekunst� und �Kunst des Vermutens�.Die Herkunft des Wortes �Statistik� ist der lateinische Ausdruck �statisticum� mit derBedeutung �den Staat betre�end�. Daraus lässt sich schon ablesen, dass der Grund-stein der Statistik in der heutigen Form ursprünglich durch Analysieren der politischenSituation und deren Auswirkungen gelegt wurde.

2.3 Klassi�zierung der Statistik

Auch im Bereich der Statistik lassen sich verschiedene Aufgabengebiete unterschei-den. So unterteilt man in die sogenannte deskriptive (beschreibende) und die induktive(schlieÿende) Statistik.Die deskriptive Statistik behandelt die mathematische Beschreibung gesammelter Da-tensätze, wohingegen sich die induktive Statistik zum Ziel setzt, durch Überprüfungvon Stichproben Aussagen über die Eigenschaften der zugrunde liegenden Grundmengeabzuleiten.Beide Aufgabenstellungen werden im Folgenden nochmals aufgegri�en.

3 Motivation des Vortrags

3.1 �Wusstest du schon...�

• Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von 35km/h.

• Das einzige Land, das 0 Geburten im Jahre 1983 verzeichnete, war der Vatikan.

• 53 Prozent Highschool Absolventen und 27 Prozent College Absolventen habendas meiste ihres Wissens aus dem Fernsehen.

• Jungen mit unkonventionellen Vornamen haben eher mentale Probleme, als Jungsmit einem üblichen Namen. Mädchen haben dieses Problem nicht.

• In Schweden passieren die wenigsten Morde auf der ganzen Welt.

• Die Wahrscheinlichkeit, dass man von einem Flugzeug getro�en wird, das vomHimmel stürzt: 1 zu 25 Millionen. Wahrscheinlichkeit, dass es heute passiert: 1zu 7 Trillionen.

• Ka�ee ist das zweitgröÿte Produkt auf der Liste des internationalen Verkaufs aufder Welt.

• Statistisch gesehen ist das sicherste Alter 10 Jahre.

• Laut einer Studie von 1991 wissen 49 Prozent der Amerikaner nicht, dass Weiÿ-brot aus Weizen besteht.

4

Page 5: Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

3.2 Unter die Lupe genommen

Aussagen dieser Art begegnen uns tagtäglich in den Medien oder auch in Gesprächenauf dem Weg zur Arbeit, beim Einkaufen... Von der sensationsfreudigen Gesellschaftwerden sie dankbar aufgenommen und als interessante Fakten unre�ektiert zu jedergünstigen Gelegenheit wiedergegeben. Betrachtet man diese �Fakten� allerdings genau-er, so sollte nach kurzer Zeit klar sein, dass die Formulierungen im Grunde nicht sehraussagekräftig sind. Meist erhält man keinerlei Informationen darüber, was genau undunter welchen Bedingungen auf welche Art und Weise getestet wurde oder wie signi�-kant das Ergebnis der Untersuchung aus�el. Wie kann man nun aber heraus�nden oderverstehen, ob den aufgestellten Behauptungen Glauben geschenkt werden kann?Die folgende Abhandlung soll dem Leser die Antwort auf diese Frage - zumindest zueinem kleinen Teil - näher bringen.

4 Hypothesentests

4.1 Die Idee

Häu�g werden Beobachtungen eines Experiments dazu genutzt, um eine Entscheidungzwischen konkurrierenden Modellen der Realität zu tre�en. Dabei lassen die alternati-ven Modelle unterschiedliche Ergebnisse erwarten. In der Regel sind die Beobachtungenaber von sehr vielen zufälligen äuÿeren Faktoren abhängig und die Entscheidung fürein bestimmtes Modell ist nur selten mit absoluter Sicherheit möglich. Egal wie dasExperiment ausgeht, der Ausgang könnte jederzeit auch auf den Zufall zurückgeführtwerden. Irrtümer in der Entscheidung können also nie vermieden werden. Allerdingslassen sich Kriterien �nden, um die Wahrscheinlichkeit, einen Fehler zu begehen, kleinzu halten.

4.2 mathematische Betrachtung

Sei X eine zufällige Gröÿe mit einer unbekannten Verteilung Pϑ und x der beobachteteWert der Zufallsvariablen, durch den entschieden werden soll, ob Pϑ einer bestimmtenMenge von Verteilungen zugeordnet werden kann oder nicht. In einem solchen Fallspricht man von einem Testproblem.Sei χ nun die Menge aller Werte x, welche die beobachtete Gröÿe X annehmen kann,der sogenannte Stichprobenraum und {Pϑ : ϑ ∈ Θ} die Menge der für X in Frage kom-menden Verteilungen. Dabei bezeichne Θ eine Menge, deren Elemente die möglichenVerteilungen parametrisieren (oft ein Intervall in R).Eine echte Teilmenge {Pϑ : ϑ ∈ H} 6= ∅ von {Pϑ : ϑ ∈ Θ} trage nun bestimmte Eigen-schaften.Unter einem Test versteht man nun eine Vorschrift Φ, die angibt, ob man sich aufgrundder Versuchsbeobachtung x für die Hypothese �ϑ ∈ H� (�Annahme der Hypothese�)oder für die Alternative �ϑ ∈ Θ \H� (�Verwerfen der Hypothese�) entscheiden soll.Es gelte also:

Φ(x) =

{ϑ ∈ H, fur x ∈ R

ϑ ∈ Θ \H, fur x /∈ R

5

Page 6: Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

wobei R den zuvor gewählten �kritischen Bereich� darstellt.Dabei können folgende Fehler auftreten:Fehler 1.Art: Annahme der Hypothese, obwohl ϑ /∈ HFehler 2.Art: Verwerfen der Hypothese, obwohl ϑ ∈ HEs werden zur Aufstellung des Tests nur Bereiche für R in Betracht gezogen, für diedie Wahrscheinlichkeit für einen Fehler 1.Art durch eine vorgegebene Zahl α > 0 be-schränkt ist.Quantitative Aussagen über die Qualität des Tests macht die sogenannte Gütefunktion

β(ϑ) = Pϑ(X ∈ R).

Sie ordnet jedem ϑ unter Pϑ die Verwerfungswahrscheinlichkeit zu. Gilt nun für alleϑ ∈ H: β(ϑ) ≤ α, so spricht man von einem Test mit dem Niveau α. Der Fehler 1.Artbleibt also kleiner als die Irrtumswahrscheinlichkeit α.Der Wert 1− α wird demzufolge auch als die statistische Sicherheit (bzgl. dem Fehler1.Art) bezeichnet.

4.3 Beispiel für einen einseitigen Test

Fragestellung: Kann ein neugeborenes Küken Körner erkennen oder lernt es dies erstdurch Erfahrung?

Um diese Frage zu untersuchen, könnte folgendes Experiment durchgeführt werden:Einem frisch geschlüpften Küken werden Kreise und Dreiecke aus Papier vorgelegt. Da-bei sollen beide Formen in gleicher Anzahl vorhanden sein, welche die gleicher Flächeund den gleichen Farbton tragen, um mögliche unnötige Verfälschungen des Ergebnis-ses zu vermeiden.Im Test soll nun also die folgende Hypothese untersucht werden:Gegenhypothese/Alternative H1: Bevorzugung runder Objekte. Falls diese Hypothesegültig ist, sollte also die Wahrscheinlichkeit, auf einen Kreis zu picken, gröÿer als 50%sein: pKreis > 0, 5.Zum Vergleich wird die sogenannteNullhypothese H0 aufgestellt, die von einem Laplace-Experiment 1 ausgeht. Laut der Nullhypothese verhält sich das Küken also indi�erentgegenüber den Kreisen und Dreiecken. Die Wahrscheinlichkeit, auf einen Kreis zu pi-cken, beträgt bei ihrer Gültigkeit 50%: pKreis = 0, 5In der Beobachtungsphase überwacht man nun das Küken beispielsweise so lange, bises sechzehn Mal gepickt hat. Dabei zählt man die Anzahl X, wie oft auf einen Kreisgepickt wurde. Eine mögliche Entscheidungsregel wäre in diesem Fall:Falls X < 12 wird H0 angenommen, falls X ≥ 12 wird H0 verworfen, also H1 ange-nommen.Für die Hypothese H1 sprechen dann die Werte aus dem kritischen Gebiet.

K = {12, 13, 14, 15, 16}

Um den Test auf seine Irrtumswahrscheinlichkeit hin zu überprüfen, berechnet mannun unter der Annahme, dass H0 wahr ist, die Wahrscheinlichkeit, mit der das Ergeb-nis in das kritische Gebiet fällt:

1Zur Erläuterung von Laplace-Experimenten siehe Ausarbeitung zum Thema Zufallsversuche.

6

Page 7: Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

Insgesamt mögliche gleichwahrscheinliche Pickfolgen der Länge 16:

216 = 65536

Mögliche Pickfolgen mit X ∈ K:(16

0

)+

(16

1

)+

(16

2

)+

(16

3

)+

(16

4

)= 2517

⇒ Irrtumswahrscheinlichkeit α = P (K) = 251765536

= 0, 0384 = 3, 84%⇒ In 3, 84% der Fälle wird folglich ein Fehler erster Art begangen.Damit nach einem solchen Test die Alternative auch wirklich mit einer maximalenstatistischen Sicherheit von 1−α angenommen werden kann, wird das kritische GebietK üblicherweise oft erst nach der Versuchsdurchführung aus dem Beobachtungswertund allen noch extremeren Werten de�niert.

4.4 Beispiel für einen zweiseitigen Test

Fragestellung: Sind Ratten farbenblind?

Durch folgende Beobachtung lieÿe sich diese Frage erforschen: Mehrere Ratten werdendurch einen Gang geschickt, der sich in einen grünen und einen roten Gang verzweigt.Hierbei soll gezählt werden, wie viele der getesteten Ratten sich für den grünen Gangentscheiden.In diesem Fall wird zwischen folgenden Hypothesen unterschieden:Nullhypothese: H0: Die Ratten sind indi�erent gegenüber den Farben;

pgrunerGang = 1/2

Alternative: H1: Die Ratten ziehen eine der beiden Farben vor;

pgrunerGang < 1/2 oder pgrunerGang > 1/2

Wir gehen nun davon aus, dass von 10 Versuchsratten X den grünen Gang gewählthaben. Da in diesem Fall sowohl groÿe, als auch kleine Werte von X gegen die Nullhypo-these H0 sprechen, bezeichnet man das Experiment in diesem Fall als einen sogenannten�zweiseitigen Test�.Angenommen, X = 8 Ratten haben sich für den grünen Gang entschieden. Wie signi-�kant ist das Auftreten dieses Ergebnisses?Dazu wird zuerst das kritische Gebiet bestimmt. In diesem Fall umfasst es für X dieWerte 8, 9 und 10.Da die Gegenhypothese nun aber nicht nur eine Vorliebe für den grünen Gang beinhal-tet, sondern allgemein die Präferenz für einen der beiden Gänge, müssen die analogenFälle für den roten Gang auch dem kritischen Gebiet zugeordnet werden. Die zur 8, 9

7

Page 8: Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

oder 10maligen Wahl des roten Ganges zählenden Werte für X sind 2, 1 und 0.Das kritische Gebiet K ist für diesen Versuchsausgang also:

K = {0, 1, 2, 8, 9, 10}

Unter der Annahme der Gültigkeit von H0 erhält man somit:Die Anzahl der für K günstigen Fälle beträgt:(

10

0

)+

(10

1

)+

(10

2

)+

(10

8

)+

(10

9

)+

(10

10

)= 112

Und insgesamt mögliche Fälle ergeben sich, da jede der 10 Ratten die Wahl zwischen2 Gängen hat:

210 = 1024

Daraus erhält man für die Irrtumswahrscheinlichkeit

α =112

1024≈ 0, 11

Sieht man den obigen Versuch als Laplace-Experiment an, so gilt also, dass die Wahr-scheinlichkeit für das Eintreten einer Beobachtung, die ins kritische Gebiet fällt, ca.11% beträgt. Will man eine statistische Sicherheit von 5% erhalten, so reicht das Er-gebnis dieser Beobachtung also nicht aus, um verwerfen zu können, dass es sich um denAusgang eines Zufallsexperimentes handelte.

5 Das statistische Alternativproblem

Der folgende Abschnitt beschäftigt sich mit einer Aufgabe aus dem Bereich der induk-tiven Statistik: Man möchte aufgrund einer Stichprobe Eigenschaften der zugrundelie-genden Menge bestimmen.

5.1 Beispiel:

Es seinen 9 Urnen mit je 3 Kugeln gegeben. In einer Urne be�nden sich 2 schwarze undeine weiÿe Kugel, in den anderen 8 Urnen sei die Verteilung umgekehrt. Nun werdeeine Urne zufällig ausgewählt und daraus soll 12 Mal mit Zurücklegen gezogen werden.Wir betrachten die folgende mögliche Sequenz:

Abbildung 5.1: Kugelsequenz

8

Page 9: Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

Im Folgenden möchten wir ermitteln, aus einer Urne welcher Verteilung gezogen wurde.Auf den ersten Blick ist das sehr schwer zu entscheiden. Einerseits spricht das häu�-ge Erscheinen einer schwarzen Kugel dafür, dass wohl aus einer Urne gezogen wurde,in der sich überwiegend schwarze Kugeln be�nden. Andererseits bestehen viel höhereChancen, anfänglich eine der acht gleichartigen Urnen ausgewählt zu haben. Die vor-liegende Sequenz könnte in einem Zufallsversuch auch hieraus erscheinen.Um zu einem Ergebnis zu kommen und zu testen, ob es eher eindeutig ausfällt odernicht, ist es wohl unabdingbar, die Wahrscheinlichkeiten zu vergleichen.Dazu berechnen wir die Wahrscheinlichkeiten der verschiedenen möglichen Pfade:

Abbildung 5.2: Berechnung der Pfade

a) Wahrscheinlichkeit, eine der acht Urnen mit zwei weiÿen Kugeln auszuwählen: 89

Wahrscheinlichkeit, aus der gewählten Urne achtmal eine schwarze und viermal eineweiÿe Kugel zu ziehen: (1

3)8(2

3)4

Somit ergibt sich insgesamt für den Pfad a):

P (a) =8

9(1

3)8(

2

3)4 =

27

314

b) Wahrscheinlichkeit, die Urne mit zwei schwarzen Kugeln zu wählen: 19

Wahrscheinlichkeit, aus dieser Urne achtmal eine schwarze und viermal eine weiÿe Kugelzu ziehen: (2

3)8(1

3)4

Somit ergibt sich folgende Wahrscheinlichkeit für den Pfad b):

P (b) =1

9(2

3)8(

1

3)4 =

28

314

Vergleicht man nun diese beiden Wahrscheinlichkeiten miteinander, erhält man:

P (b)

P (a)=

28

314

27

314

= 2

Obwohl achtmal so viele Urnen mit zwei weiÿen Kugeln zur Auswahl standen, ist dieWahrscheinlichkeit, aus der Urne mit 2 schwarzen Kugeln gezogen zu haben, doppeltso hoch!

9

Page 10: Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

6 Der Wald�sche Sequentialtest

Bei einem Experiment dieser Art lässt sich das Ergebnis mit beliebig kleiner Irrtums-wahrscheinlichkeit bestimmen. Dazu müssen nur hinreichend viele Ziehungen aus derausgewählten Urne durchgeführt werden.In der Praxis ist dies im Allgemeinen aber nicht praktikabel, da die �Ziehungen� unterUmständen sehr aufwändig und teuer sein können oder ein �Ziehen mit Zurücklegen�zum Beispiel durch Zerstörung der �Kugel� unmöglich gemacht werden kann.Man stelle sich beispielsweise die Qualitätskontrolle in der Fahrzeugindustrie vor, beider viele verschiedene physikalische Eigenschaften des Werkstücks getestet werden müs-sen, um einen gewissen Sicherheitsstandard einhalten zu können. Dazu sind teure Mess-geräte notwendig und die Überprüfung nimmt einige Zeit in Anspruch, damit die nötigePräzision gewährleistet ist. Eine solche Kontrolle ist also eine unumgängliche groÿe �-nanzielle Belastung für das Unternehmen. Oder betrachtet man gar einen Crash-Test,durch den ein Groÿteil des Fahrzeugs beschädigt wird und die Bauteile unbrauchbarwerden, so wird der �nanzielle Verlust besonders deutlich.Ebenso soll bei Medikamententests die Anzahl der Testpersonen möglichst klein gehal-ten werden, da unter Umständen Menschenleben dabei gefährdet werden.

6.1 Beispielaufgabe:

Ein Groÿhändler erhält zwei Waren-Lieferungen, obwohl er nur eine geordert hatte. Ervermutet, dass es sich bei der einen Lieferung um die bestellte Markenware und bei deranderen Lieferung um Fälschungen handelt.Erfahrungsgemäÿ beträgt die Wahrscheinlichkeit, absolut einwandfreie Waren von denFälschungen zu erhalten nur p1 = 1

4, während die Produktions�rma der Marke mit

einer Wahrscheinlichkeit von p2 = 34Waren ohne den geringsten Fehler liefern kann.

Der Händler nimmt sich zufällig eine der Lieferungen vor, um sie zu untersuchen. Ermöchte nun zwischen den folgenden Hypothesen unterscheiden:H1: Diese Lieferung ist die der Fälscher, also der Anteil einwandfreier Waren beträgtp = p1

H2: In dieser Lieferung be�ndet sich die originale Markenware, also der Anteil makel-loser Waren beträgt p = p2

Da die Untersuchung der Waren sehr teuer ist, soll sie abgebrochen werden, sobald es81:1 für eine der beiden Hypothesen steht.Die Qualitätskontrolle habe nun x einwandfreie und y fehlerhafte Waren untersucht.Die Wahrscheinlichkeit dafür istunter Annahme von H1:

q1 = (1

4)x · (3

4)y

und unter Annahme von H2:

q2 = (3

4)x · (1

4)y

⇒ q1

q2

=(1

4)x · (3

4)y

(34)x · (1

4)y

10

Page 11: Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

=(1

4)x · 3y · (1

4)y

3x · (14)x · (1

4)y

= 3y−x

Die Prüfung soll also so lange fortgeführt werden, wie 181

< 3y−x < 81 ⇒ 3−4 < 3y−x <34 ⇒ −4 < y − x < 4 gilt.Die Kontrolle wird bei dieser Versuchsplanung abgebrochen, sobald y − x = 4 odery − x = −4. Dabei entscheidet sich der Groÿhändler im ersten Fall für H1 und imzweiten Fall für H2. Im ersten Fall wird er also die Waren aus der nicht kontrolliertenLieferung weiterverkaufen, im zweiten Fall die übrigen aus der kontrollierten Lieferung.

6.2 Graphische Deutung

Man kann sich den sequentiellen Test leicht als einen Weg in der x-y-Ebene vorstellen.Dabei startet man im Punkt (0/0) und geht bei jedem untersuchten Werkstück eineLängeneinheit weiter; bei einem makellosen Warenteil in x-Richtung, bei einem fehler-haften in y-Richtung. Sobald der Weg auf eine der Geraden y = x− 4 bzw. y = x− 4tri�t, fällt die Entscheidung für H1 bzw. H2.

7 Der exakte Test von Fisher

Bei Tests mit sehr groÿen Datenmengen ist die Auswertung und die Feststellung derGültigkeit einer Vermutung meist recht eindeutig. Hat man allerdings nur eine geringeZahl an Daten - beispielsweise bei der Behandlung einer seltenen Krankheit -, so müssendie Ergebnisse sehr genau geprüft werden, da ganz besonders in diesen Fällen häu�gFehlschlüsse gezogen werden! Um die Daten möglichst übersichtlich zur Hand zu haben,kann man sie mit Hilfe einer sogenannten Vierfeldertafel veranschaulichen.

7.1 Beispiel:

Eine gefährliche Krankheit wurde bisher mit dem Mittel B behandelt. Es wurde einneues Mittel A entwickelt, das erprobt werden soll. Von 15 Patienten werden 8 mit Aund 7 mit B behandelt, wobei keiner der getesteten Patienten weiÿ, welches Mittel erbekommen hat. Das Ergebnis kann der folgenden Vierfeldertafel entnommen werden:

sterben überleben∑

Mittel A 2 6 8Mittel B 4 3 7∑

6 9 15

Tabelle 1: Ergebnis des Medikamententests

Auf den ersten Blick sprechen die Daten sehr deutlich für das neue Mittel A. Schlieÿlichsind in dieser Versuchsgruppe nur ein Viertel aller Teilnehmer der schweren Krankheiterlegen, während aus der Testgruppe für das Medikamt B über die Hälfte der Patienten

11

Page 12: Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

gestorben ist.An dieser Stelle soll wiederum getestet werden, wie hoch die Wahrscheinlichkeit, dassdieses Ergebnis eintritt, in einem Zufallsexperiment ist. Dazu testet man nun also dieHypothese �Das Schicksal der Patienten ist unabhängig von der Art der Medikamen-teneinnahme�. Unter dieser Annahme wären also 6 der 15 Patienten ohnehin gestorben,ganz egal, welches Medikament ihnen verabreicht wurde. Bei der Wahl der Versuchs-gruppe für Mittel A wurden somit völlig zufällig nur 2 von 6 �Todgeweihten� ausge-wählt. Man muss also prüfen, wie wahrscheinlich es ist, zwei oder weniger der sechs�Todgeweihten� bei Bestimmung der Versuchsgruppe für Medikament A auszuwählen:

α =

(60

)(98

)(158

) +

(61

)(97

)(158

) +

(62

)(96

)(158

) =1485

6435=

3

13≈ 0, 23

Dieses Ergebnis bedeutet, dass es mit einer Wahrscheinlichkeit von über 23% für dieKranken ganz egal ist, mit welchem der beiden Medikamente sie behandelt werden. DerTest kann bei einer so kleinen Stichprobe also kaum Auskünfte über eine Wirksamkeitvon Medikament A geben.

8 Wie man sich den Zufall zunutze machen kann

8.1 Zufallszi�ern

Ganz allgemein werden als Zufallszi�ern Ergebnisse von speziellen Zufallsexperimentenbezeichnet. Besonders populär sind sogenannte dezimale Zufallszi�ern, die aus einer zu-fälligen Sequenz der Zahlen von 0 bis 9 aufgebaut sind.Sie können beispielsweise durch vielmaliges Drehen eines dezimalen Laplace-Rades1 er-zeugt werden. Wichtig für die Erzeugung von Zufallszi�ern ist es, dass das Ergebnis derErzeugung einer einzelnen Zufallszi�er unabhängig von früheren Ergebnissen sein muss.Dies kann man beispielsweise kaum dadurch erreichen, dass sich Menschen scheinbarwahllos mehrere Zi�ern hintereinander einfallen lassen, da diese meist unbewusst schonvorher eine grobe Vorstellung davon haben, wie die �Zufalls�folge auszusehen hat.Hat man nun eine Auswahl an Zufallszi�ern gegeben, so �nden diese vielfältige An-wendungsmöglichkeiten.Zum Beispiel lässt sich jedes Zufallsgerät durch Zufallszi�ern simulieren. Dazu mussallerdings erstmal eine gewisse Auswahl an Zi�ernfolgen getro�en werden, die im An-schluss je einen Ausgang des Zufallsgerätes repräsentieren sollen. Die Wahrscheinlich-keit der Zi�ernfolge muss dazu der Wahrscheinlichkeit des zugeteilten Ergebnisses ent-sprechen. Hier einige Beispiele:

• Da dezimale Zufallszi�ern durch ein dezimales Laplace-Rad1 erzeugt werden kön-nen, liegt nahe, dass Zufallszi�ern auch als Ausgänge eines dezimalen Laplace-Rades1 gedeutet werden können. Die relative Häu�gkeit beträgt hier für jedeZi�er circa 0,1.

1Zur Erläuterung von Laplace-Experimenten siehe Ausarbeitung zum Thema Zufallsversuche.

12

Page 13: Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

• Die Zufallszi�ern können auch in Blöcke beliebiger Länge zerlegt werden. Da-durch erhält man dezimale Zi�ernblöcke der Länge n, die jeweils mit einer rela-tiven Häu�gkeit von 10−n auftreten. Damit können also Zufallsversuche mit 10n

gleichwahrscheinlichen Ausgängen dargestellt werden.

• Man kann aber auch Experimente mit einer beliebigen anderen Anzahl von Ergeb-nissen simulieren. Beim Münzwurf mit einer idealen Münze beispielsweise habendie beiden Ergebnisse �Kopf� und �Zahl� die gleiche Wahrscheinlichkeit p = 0, 5.Da bei dezimalen Zufallszi�ern gerade wie ungerade Zahlen ungefähr mit derrelativen Häu�gkeit 0,5 auftreten, könnte man nun aus der Zufallszi�ernfolgejede gerade Zi�er durch 0 und jede ungerade durch 1 ersetzen, um damit denMünzwurf nachzuahmen.

• Ebenso kann man die gleichwahrscheinlichen Ausgänge ω ∈ {1; 2; 3; 4; 5; 6} einesLaplace-Würfels1 aus der Zi�ernabfolge entnehmen. Dies geht beispielsweise, in-dem man die Zi�ern {0; 7; 8; 9} aus der Sequenz streicht und die übrigen als dasanaloge Ergebnis des Würfels au�asst.

Laplace-Zufallsgeräte1 in der Realität sind nur eine idealisierte Vorstellung. Dies kanndazu führen, dass sich die Wahrscheinlichkeiten der Ausgänge eines vermeintlichenLaplace-Zufallsgerätes1 nach ausgiebiger Untersuchung doch als nicht gleichverteilt ent-puppen. Aus diesem Grund müssen Zufallszi�ern nach ihrer Erzeugung auf verschiedeneEigenschaften geprüft werden.Zufallszi�ern bedeutet nicht nur, dass die einzelnen Zi�ern bei ihrer Erzeugung vonein-ander unabhängig sind, sondern auch, dass ihre relativen Häu�gkeiten in etwa überein-stimmen. Allerdings müssen auch die Häu�gkeiten einzelner Zi�ern-Phrasen stimmen.Als gute Testmethode für Zufallszi�ern hat sich der Poker-Test erwiesen. Hierbei wer-den die Zufallszi�ern in Fünferblöcke eingeteilt, deren Wahrscheinlichkeit je 10−5 ist.Nun werden die Fünferblöcke entsprechend ihrer Zi�ernzusammensetzungen in siebenKlassen eingeteilt. Die Wahrscheinlichkeiten des Auftretens der einzelnen Klassen sindleicht zu berechnen und diese werden nun mit den relativen Häu�gkeiten der Zi�ern-blöcke aus jeder Klasse verglichen. Die verschiedenen Klassen, in die eingeteilt wird,sind die der folgenden Zi�ernzusammensetzungen:

{abcde; aabcd; aabbc; aaabc; aaabb; aaaab; aaaaa} ,

wobei die Buchstaben nur die Häu�gkeiten des Auftretens einzelner Zi�ern bezeichen,nicht aber die Reihenfolge.Stimmen die Ergebnisse dieses Tests im Wesentlichen, so ist das ein gutes Indiz füreine hohe Güte der Zufallszi�ern (allerdings abhängig davon, mit welcher Präzision dieZufallszi�ern in ihrer Anwendung benötigt werden.)Um aufzuzeigen, dass Zufallszi�ern nicht nur zur Nachahmung von Zufallsgeräten die-nen, sondern auch auf anderen Gebieten einen wichtigen Beitrag leisten, soll an dieserStelle noch der Einsatz zur sehr sicheren Verschlüsselung von Daten genannt werden.Ein weiteres Anwendungsgebiet soll im Folgenden vorgestellt werden:

1Zur Erläuterung von Laplace-Experimenten siehe Ausarbeitung zum Thema Zufallsversuche.

13

Page 14: Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

8.2 Die Monte-Carlo-Methode

Da die Realität sehr vielen Ein�ussfaktoren unterliegt, sind Berechnungen oft sehrkompliziert. Einen Ausweg bietet an dieser Stelle die Simulation mit Zufallsgeräten.Benutzt man das eben schon angesprochene universelle Zufallsgerät der Zufallszi�ern,so spricht man von der Monte-Carlo-Methode.Beispielaufgabe: Wie viele Enten überleben im Durchschnitt, wenn 10 Jäger gleichzei-tig unabgesprochen je einen Schuss auf 10 Enten abfeuern (unter der optimistischenAnnahme, dass gilt Schuss=Tre�er)?Dieses Experiment lässt sich leicht durch Zufallszi�ern modellieren: Teilt man die Zu-fallszi�ern in Zehnerblöcke, so kann man dem i-ten Jäger jeweils die i-te Zi�er desBlockes zuteilen. Identi�ziert man nun jede Ente mit einer Zi�er, so könnte man dasAuftreten dieser Zi�er als Todesurteil für diese Ente deuten. Die im Block nicht auf-tretenden Zi�ern stehen dann für die Nummern der überlebenden Enten.In diesem Fall ist das Ergebnis auch leicht zu berechnen: Eine Ente überlebt genaudann, wenn jeder Jäger seinen Schuss auf eine andere Ente abgefeuert hat. Die Wahr-scheinlichkeit dafür ist 0, 910 ≈ 0, 349.⇒ Im Durchschnitt werden bei diesem Experiment rund 3,5 Enten überleben.

Eine weitere faszinierende Möglichkeit der Anwendung ist die Bestimmung der Kreis-zahl π mittels der Monte-Carlo-Methode.Dazu zeichne man ein Quadrat und den einbeschreibenden Kreis. Diese Zeichen�äche�beregne� man nun mit zufälligen Punkten.

Abbildung 8.1: Quadrat mit Kreis�äche

Eine Möglichkeit dafür ist beispielsweise die folgende: Man nehme sich Zufallszi�ern zurHand und teile sie in Zweierblöcke auf. Über der Zeichen�äche wird ein 10x10-Gitterde�niert und die Zweierblöcke der Zufallszi�ern werden nun als Koordinaten des Git-ters aufgefasst. Bei Auftreten des Tupels werde nun ein Punkt in das entsprechendeSegment des Gitters gesetzt.

Im Anschluss daran zähle man die Punkte innerhalb der Kreis�äche und jene im Qua-drat, die auÿerhalb des Kreises liegen. Teilt man nun die Anzahl der Kreistre�er durchdie Anzahl der Randtre�er, so erhält man (was für Schüler sehr verblü�end sein kann!)ganz unabhängig von der Gröÿe des gewählten Quadrates ungefähr einen Wert von 0,8.

14

Page 15: Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

Abbildung 8.2: Zeichen�äche mit Gitter

Es muss also eine gewisse Proportionalität bestehen.Es ist natürlich klar, dass wir auf diese Weise einen Näherungswert für π

4bestimmt

haben.Rechnen wir einfach nach:Sei r der Radius des Kreises. ⇒ das Quadrat hat eine Seitenlänge von 2r.⇒ Die Fläche des Kreises AK beträgt AK = πr2 unddie Fläche des Quadrates AQ beträgt AQ = (2r)2 = 4r2.Dividiert man nun die beiden durcheinander, so erhält man:

AK

AQ

=πr2

4r2=

π

4

9 Résumé

Statistik ist ein fester Bestandteil in einer Vielzahl von Berufsfeldern und im Studi-um oft eine gefürchtete Hürde. Durch die vorliegende Arbeit konnte ho�entlich gezeigtwerden, dass das Thema allerdings auch schon in der Schule gut behandelt werdenkann. Die grundlegenden Prinzipien, die sich nach dem ersten Kennenlernen vielfachwiederholen, sind überraschend leicht zu verstehen und ohne allzu tiefen mathemati-schen Hintergrund behandelbar.Im Gegenzug dazu erschien es mir sehr schwierig, die mit Beispielen vorgestellten Me-thoden mathematisch korrekt zu formulieren ohne die Anfänge einer Statistikvorlesungkomplett wiederholen zu müssen. Die Darstellung und präzise Erläuterung verschie-dener Verteilungen, Wahrscheinlichkeitsräume und die Prinzipien der Schätztheoriehätten den Rahmen dieser Arbeit gesprengt oder wären auf Kosten der Vielfalt an vor-gestellten Tests einge�ossen. Daraufhin habe ich beschlossen, davon in dieser Arbeitüberwiegend Abstand zu nehmen und mich hauptsächlich daran zu orientieren, wie dasThema in der Schule behandelt werden könnte.Interessant an diesem Thema �nde ich ganz besonders, dass man, wenn man sich eineWeile damit beschäftigt, feststellen kann, dass es eigentlich allgegenwärtig ist. Somitho�e ich auch bei den Schülern in ihrem Alltag auf einen gewissen �Aha-E�ekt�.Sehr zu empfehlen ist diesbezüglich das im Literaturverzeichnis genannte Buch vonArthur Engel. Von Grund auf wird darin in die Themen eingeführt und man �ndet

15

Page 16: Statistische Anwendungen - Heidelberg Universitythaeter/mathmod08/03Dilger.pdf · 3.1 Wu sstest du schon... • Der durchschnittliche Regentropfen erreicht eine Geschwindigkeit von

bestimmt für jede Klassenstufe eine anspruchsvolle, aber auch spannend aufbereiteteAufgabe.

Literatur

[1] Arthur Engel: Wahrscheinlichkeitsrechnung und Statistik, Klett Verlag, 1981.

[2] Ulrich Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik, ViewegVerlag, 2005.

[3] Hans-Otto Georgii: Stochastik, Einführung in die Wahrscheinlichkeitstheorie undStatistik, 3.Au�age, De Gruyter Verlag, 2007.

[4] http://de.wikipedia.org, Einträge zu �Statistik�, �Stochastik�, �Statistischer Test�,�Monte-Carlo-Simulation�

[5] http://interessante-fakten.de, Abschnitt �Statistiken�

Abbildungen 8.1, 8.2: de.wikipedia.org/wiki/Monte-Carlo-MethodeTabelle 1: Quelle [1]

16