83
Mathematik 2 Statistik Institut für Angewandte Simulation Autor: Olivier Merlo Datum: 16.2.2017 Version: 1.1 Studiengang: Chemie Zürcher Fachhochschule

Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

Mathematik 2

Statistik

Institut für Angewandte Simulation

Autor: Olivier MerloDatum: 16.2.2017Version: 1.1Studiengang: Chemie

Zürcher Fachhochschule

Page 2: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

Das Skript:

Dieses Skript wurde von Olivier Merlo geschrieben und wurde im Laufe der Jahre immer wieder

überarbeitet.

© 2016, Olivier Merlo, ZHAW. Dieses Skript darf ganz oder in Teilen weitergegeben und nicht

kommerziell verwendet werden, wobei dieser Copyright‐Vermerk mitkopiert werden muss.

Kommerzielle Verwendung nur mit Bewilligung des Autors.

Sowohl Olivier Merlo als auch die ZHAW lehnen jegliche Haftung ab für Schäden, die sich aus der

Verwendung dieses Skriptes ergeben.

Page 3: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

Inhaltsverzeichnis

1 Vorwort 51.1 Prufungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2 Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.3 Definitionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2 Einfuhrung 72.1 Begriff Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.2 Der Begriff der Wahrscheinlichkeit . . . . . . . . . . . . . . . . . 72.3 Wichtige Gesetze . . . . . . . . . . . . . . . . . . . . . . . . . . . 82.4 Kombinatorik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.4.1 Ziehung von Kugeln mit Berucksichtigung der Reihenfolge 122.4.2 Ziehung von Kugeln ohne Berucksichtigung der Reihenfolge 12

2.5 Bedingte Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . 142.6 Ereignisbaum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.7 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3 Deskriptive (beschreibende) Statistik 173.1 Datenerfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173.2 Datenbearbeitung . . . . . . . . . . . . . . . . . . . . . . . . . . . 183.3 Klassierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193.4 Lagemass fur ordinalskalierte Daten . . . . . . . . . . . . . . . . 20

3.4.1 Median . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203.4.2 Quantile . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.5 Lagemass fur metrisch skalierte Daten . . . . . . . . . . . . . . . 213.6 Standardisieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233.7 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . 23

4 Verteilungen 254.1 Diskrete Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . 25

4.1.1 Uniforme Verteilung . . . . . . . . . . . . . . . . . . . . . 264.1.2 Binomialverteilung B(n,p) . . . . . . . . . . . . . . . . . . 264.1.3 Poissonverteilung . . . . . . . . . . . . . . . . . . . . . . . 28

4.2 Kontinuierliche Verteilungen . . . . . . . . . . . . . . . . . . . . . 294.2.1 Uniforme Verteilung . . . . . . . . . . . . . . . . . . . . . 314.2.2 Maxwell-Boltzmann Verteilung . . . . . . . . . . . . . . . 324.2.3 Exponentialverteilung . . . . . . . . . . . . . . . . . . . . 334.2.4 Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . 34

4.3 Zusammenhang zwischen den verschiedenen Verteilungen . . . . 36

3

Page 4: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

4 INHALTSVERZEICHNIS

4.4 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . 38

5 Statistische Tests 395.1 Freiheitsgrade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395.2 Schatzer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

5.2.1 Beispiele fur verschiedene Schatzer . . . . . . . . . . . . . 405.3 Vertrauensintervall . . . . . . . . . . . . . . . . . . . . . . . . . . 415.4 Hypothesen-Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

5.4.1 Hypothese . . . . . . . . . . . . . . . . . . . . . . . . . . . 435.5 Welcher Test? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

5.5.1 Vorgehensweise . . . . . . . . . . . . . . . . . . . . . . . . 475.6 Test auf Normalverteilung . . . . . . . . . . . . . . . . . . . . . . 47

5.6.1 QQ-Plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475.6.2 Kolmogorov-Smirnov Test . . . . . . . . . . . . . . . . . . 505.6.3 χ2-Test auf Normalverteilung . . . . . . . . . . . . . . . . 515.6.4 t-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 545.6.5 Grubbs Test . . . . . . . . . . . . . . . . . . . . . . . . . . 58

5.7 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . 59

6 Messfehler 616.1 Ein Messwert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 616.2 Fehlerfortpflanzung . . . . . . . . . . . . . . . . . . . . . . . . . . 626.3 Korrelation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

6.3.1 Deskriptive Statistik . . . . . . . . . . . . . . . . . . . . . 636.4 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

6.4.1 Methode der kleinsten Quadrate . . . . . . . . . . . . . . 656.5 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . 72

7 Boltzmann Verteilung 737.1 Diskrete Boltzmann Verteilung . . . . . . . . . . . . . . . . . . . 73

7.1.1 spezifische Molwarme . . . . . . . . . . . . . . . . . . . . 737.2 kontinuierliche Boltzmann Verteilung . . . . . . . . . . . . . . . . 74

7.2.1 Maxwell-Boltzmann Verteilung . . . . . . . . . . . . . . . 747.3 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . 75

8 Tabellen 778.1 Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . 778.2 Student t Tabelle . . . . . . . . . . . . . . . . . . . . . . . . . . . 788.3 χ2 − Tabelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 798.4 Kolmogorov Smirnov Test . . . . . . . . . . . . . . . . . . . . . . 808.5 Grubbs-Test (Ausreissertest) . . . . . . . . . . . . . . . . . . . . 81

Page 5: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

Kapitel 1

Vorwort

Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffeund Methoden der Statistik. Spezielles Gewicht wird auf den Begriff der Vertei-lung gelegt, insbesondere im Zusammenhang mit der statistischen Physik.Wer sich spater wirklich mit Statistik beschaftigen muss, z.B. im Zusammen-hang mit Qualitatskontrolle, kommt um Weiterbildung und den Gebrauch eineranstandigen Statistiksoftware (nicht Excel) nicht herum.

1.1 Prufungen

Die Anerkennung des Kurses wird durch ein Modulexamen am Ende des Semes-ters und diverse Examen wahrend dem Semester gepruft. Die Modulprufungzahlt zu 70% und die Prufungen wahrend des Semesters zu 30% zur Gesamtbe-urteilung.

Die Note N errechnet sich immer aus der erreichten Punktzahl PE und denMaximalpunktzahl PM mittels:

N = 1 + 5 PE

PM

Die Prufung wahrend des Semesters erfolgt am

1. Freitag, 20. April 2018

Bei einer Absenz an einer Prufung muss eine schriftliche Begrundung bisspatestens 2 Wochen nach der Prufung bei mir eintreffen. Falls dies nicht erfolgt,muss die Prufung leider mit einer Note 1 gewertet werden.

Die Vornote des Kurses ist der Mittelwert der 3 Prufungen wahrend desSemesters.

5

Page 6: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

6 KAPITEL 1. VORWORT

1.2 Literatur

Das vorliegende Skript basiert auf dem Skript auf den Buchern:

1. Kohler und Schachtel, Biostatistik, Springer Verlag.

2. Moore, McCabe, Duckworth and Sclove, The practice of business sta-tistics, Freeman and Company.

3. Fur Regression: Mager, Moderne Regressionsanalyse, Otto Sale Ver-lag.

1.3 Definitionen

R Menge der reellen ZahlenN Menge der naturlichen Zahlen∈ ist Element vona, b, c, . . . , d Menge der dargestellten Elemente[a, b] abgeschlossenes Intervall von a nach b(a, b) offenes Intervall von a nach b|A | Anzahl der Elemente der Menge AA1 ∩A2 Schnittmenge von A1 mit A2

A1 ∪A2 Vereinigung der Mengen A1 mit A2

Ac Komplement der Menge AØ leere Mengelim Grenzwertl∑

k=i

Summe der Elemente von Index i bis l

A ⇒ B Aus A folgt BA ⇔ B Aus A folgt B und umgekehrt= gleich≈ naherungsweise∼ proportional

Page 7: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

Kapitel 2

Einfuhrung

2.1 Begriff Statistik

7. Jh.: Statistik = Lehre von den Staatsmerkwurdigkeiten (Anzahl der Einwoh-ner, der Soldaten; Steueraufkommen, etc.) [lat. statisticum: den Staat betreffend]

• als Datensammlung (z.B. Meldestatistik, Unfallstatistik)

• als mathematische Funktion (Schatzstatistik, Teststatistik)

• als Wissenschaft (Statistische Methodenlehre, Statistische Physik)

Statistische Methoden sind in allen empirischenWissenschaften zur Beschrei-bung und Beurteilung der erhobenen oder gemessenen Daten notwendig.

In diesem einfuhrenden Kapitel werden die wichtigsten Begriffe und Gesetzevorgestellt. Wir arbeiten dabei mit dem Beispiel des Wurfelns oder auch mitdem Werfen einer Munze.

2.2 Der Begriff der Wahrscheinlichkeit

Beispiel: Ein Wurfel wird sehr oft geworfen. Das Werfen eines Wurfels istein Zufallsexperiment. Die relative Haufigkeit die Zahlen 1, 2, . . . bzw. 6zu wurfeln konvergiert gegen einen bestimmten Wert p(Wurf=1), p(Wurf=2). . . p(Wurf=6). Der Wert p(. . . ) wird empirische Wahrscheinlichkeit ge-nannt. Dabei bedeutet p(. . . ) = 0 ein unmogliches Ereignis (z.B. Werfen derZahl 7) und p(. . . ) = 1 bedeutet ein sicheres Ereignis (man wirft eine der Zah-len 1 bis 6). Das Elementarereignis ω ist das Ereignis eines Experimentes,z.B. ”Werfen der Zahl 5”. Der Ereignisraum Ω ist die Menge aller moglicherElementarereignisse ωi; hier:

Ω = 1, 2, 3, 4, 5, 6 .

7

Page 8: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

8 KAPITEL 2. EINFUHRUNG

Definition 2.1 (Elementare Definitionen)Die Menge aller Elementarereignisse eines Zufallsexperiments wird Ereig-nisraum Ω genannt. Ein einzelnes Element ωi des Ereignisraums wird Elemen-tarereignis genannt. Die empirische Wahrscheinlichkeit das Elementarereigniszu erhalten wird durch p(ωi) gegeben. Das Ereignis wird nicht erhalten, fallsp(ωi) = 0 ist. Falls p(ωi) = 1 ist, so ist dies ein sicheres Ereignis. Eine Teil-menge A von Ω wird Ereignis genannt.

2.3 Wichtige Gesetze

In den nachsten Kapiteln gehen wir nicht von Experimenten aus, sondern eswird um theoretische Uberlegungen gehen.

Beispiel: Wir betrachten das Werfen von einem Wurfel. Die Elementarer-eignisse ωi sind gegeben durch das Werfen der Anzahl Augen 1, 2, 3, . . . , 6. DieAnzahl der Elementarereignisse ist also gegeben durch |Ω| = 6. Die AnzahlMoglichkeiten die Anzahl Augen gleich 1 zu werfen ist 1,A(ω = 1) = 1, dagenau eine Moglichkeit w1 besteht, diese Zahl zu wurfeln. Damit erhalt mandie Wahrscheinlichkeit eine Anzahl Augen von 1 zu werfen von p(A) = 1

6 . Manhat dazu die Anzahl der Moglichkeiten durch die gesamte Anzahl derEreignisse dividiert. Man geht also davon aus, dass alle Elementarereignissedie gleiche Wahrscheinlichkeit besitzen einzutreffen.

Definition 2.2 (Laplace Annahme)Hat der Ereignisraum Ω endlich viele Elemente ωi mit der gleichen Wahr-scheinlichkeit p. Dann gilt fur die Berechnung der Wahrscheinlichkeit:

p(A) = |A||Ω| =

Anzahl Elementarereignisse in AAnzahl Elementarereignisse in Ω

Beispiel: Wie gross ist die Wahrscheinlichkeit mit einem Wurfel eine geradeAnzahl Augen zu werfen?

Man hat die Elementarereignisse Werfen von 2, 4 oder 6. Wenn man aber dieAnzahl Augen gleich 2 geworfen hat, kann man nicht die 4 geworfen haben. DieseEreignisse schliessen einander aus. Solche Ereignisse werden disjunkte Ereig-nisse genannt. Bei disjunkten Ereignissen ist die gesamte Anzahl der Ereignissegleich der Summe der einzelnen Ereignisse. In diesem Fall ist A = 2, 4, 6. Ver-allgemeinert gesagt hat man die Ereignisse A1 = 2, A2 = 4 und A3 = 6,und das Ereignis eine gerade Anzahl Augen zu wurfeln ist gegeben durch dieVereinigung der Mengen Ai. Somit besitzt die Menge A = ∪3

i=1Ai = 2, 4, 6insgesamt 3 Elementarereignisse und die Wahrscheinlichkeit eine gerade Anzahl

Augen zu wurfeln ist gegeben durch p(A) = |A||Ω| =

36 = 1

2 .

Definition 2.3 (Disjunkte Ereignisse)Die Ereignisse A1 und A2 werden disjunkt genannt, falls die Schnittmenge A1∩A2 = Ø die leere Menge ist; also wenn sie keine gemeinsamen Elemente besitzen.Die Anzahl der Elemente der Menge A = A1∪A2 ist dann die Summe der AnzahlElemente der beiden Teilmengen.|A| = |A1|+ |A2|, falls A1 ∩ A2 = Ø.

Page 9: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

2.3. WICHTIGE GESETZE 9

Anmerkung:

1. Hat man n Ereignisse, die alle disjunkt sind, so ist die WahrscheinlichkeitEreignis A1 oder A2 oder . . . oder An zu erhalten (A = ∪n

i=1Ai) gegebendurchp(A) = |A|

|Ω| =|A1|+|A2|+...+|An|

|Ω| = p(A1) + p(A2) + . . .+ p(An).

Beispiele 2.1 Gesucht ist die Wahrscheinlichkeit, beim Werfen mit zweiWurfeln eine Gesamtaugenzahl von 7 zu erhalten.

Es existieren die Moglichkeiten 1 | 6, 2 | 5, 3 | 4, 4 | 3, 5 | 2, 6 | 1. Dabei be-deutet 1 | 6, dass wir mit dem ersten Wurfel die Zahl 1 und mit dem zweitenWurfel die Zahl 6 werfen. Alle diese Ereignisse sind disjunkt zueinander. DasEreignis 1 | 6 ist verschieden von dem Ereignis 6 | 1. Es spielt also eineRolle, mit welchem Wurfel man welche Zahl wirft. Damit ist die Anzahl der‘gunstigen Ereignisse‘ durch |A| = 6 gegeben. Der Ereignisraum besitzt 36 Er-eignisse |Ω| = 36. Daher ist die Wahrscheinlichkeit, dass die Augenzahl gleich7 ist: p(A) = 6

36 = 16 .

Zusatz: Wie gross ist die Wahrscheinlichkeit, dass die Augenzahl gleich 6 ist?(Losung: p(ω = 6) = 5

36)

Beispiel: Man betrachtet wieder das Werfen mit 2 Wurfeln. Wieviele An-zahl Kombinationen (Ereignisse) existieren insgesamt?

Es existieren 6 Moglichkeiten fur den ersten Wurfel und 6 weitere fur denzweiten Wurfel, namlich je die Zahlen 1 bis 6. Es hat keinen Einfluss auf den2. Wurfel, was ich mit dem ersten Wurfel geworfen habe. Solche Ereignissewerden unabhangige Ereignisse genannt. Hier ist die gesamte Anzahl derEreignisse gegeben durch Multiplikation der Anzahl der einzelnen Ereignissen|Ω| = 6 · 6 = 36.

Man erhalt also zuerst ein Ereignis und anschliessend ein zweites Ereignis.

Definition 2.4 (Unabhangige Ereignisse)Man habe die unabhangigen Ereignisse A1 und A2. Dann ist die Menge A =ωA1 | ωA2 mit ωA1 ∈ A1 und ωA2 ∈ A2. Die Anzahl der Elemente der MengeA ist dann das Produkt der Anzahl Elemente der beiden Teilmengen.|A| = |A1| · |A2|, falls A1 unabhangig von A2 ist.

Page 10: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

10 KAPITEL 2. EINFUHRUNG

Anmerkung

1. Hat man 2 Ereignisse die voneinander unabhangig sind, so kann die Wahr-scheinlichkeit, Ereignis A1 und A2 zu erhalten, berechnet werden. Manbenutzt dabei die einzelnen Wahrscheinlichkeiten in den Teilmengen. Man

definiert p(A1) =|A1||Ω1| und p(A2) =

|A2||Ω2| , wobei die Ωi die gesamte Anzahl

der Ereignisse von den Ereignissen i ist. Da die Ereignisse unabhangig sind,ist die Gesamtanzahl der Ereignisse gegeben durch |Ω| = |Ω1| · |Ω2|. Somit

ist die Wahrscheinlichkeit von A gegeben durch p(A) = |A||Ω| =

|A1|·|A2||Ω1|·|Ω2| =

p(A1) · p(A2).Man findet in Buchern haufig, dass die unabhangigen Ereignisse mit die-sem Resultat definiert werden.

2. Es ist fur Studierende nicht immer einfach zu entscheiden, ob zwei Ereig-nisse disjunkt oder unabhangig sind. Haufig funktioniert eine Verbalisie-rung mit dem Worten und resp. oder.

Ist man daran interessiert, ob der Wurfel 2 oder 4 oder 6 anzeigt, so sinddie Ereignisse 2 resp. 4 resp. 6 zu wurfeln disjunkt.

Ist man daran interessiert, ob zuerst mit dem ersten Wurfel etwas gewor-fen wird und anschliessend mit einem anderen Wurfel geworfen wird soist das Werfen der beiden Wurfel unabhangig.

Ist man daran interessiert, dass der erste Wurfel eine gerade Anzahl Augenanzeigt und der zweite die Anzahl Augen 2 oder 5. So hat man disjunkteund unabhangige Ereignisse.

Page 11: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

2.4. KOMBINATORIK 11

Beispiele 2.2

1. Man betrachtet wieder das Wurfeln mit 2 Wurfeln. Wie gross ist dieWahrscheinlichkeit, dass man mit dem ersten Wurfel eine gerade Zahlwurfelt und mit dem 2. Wurfel die Zahl 3 oder 5?

Es existieren 3 Moglichkeiten mit dem ersten Wurfel eine gerade Zahl und2 Moglichkeiten mit dem 2. Wurfel die Zahlen 2 oder 5 zu wurfeln.

Die Ereignisse sind disjunkt, daher ist die gesamte Anzahl der Ereignissegegeben durch |A| = 3 · 2 = 6. Die Wahrscheinlichkeit dieses Ereignis zuerhalten ist also gegeben durch p(A) = 1

6 .

2. Wie gross ist die Wahrscheinlichkeit mit einem Wurfel eine gerade Zahlund mit dem anderen Wurfel die Zahlen 2 oder 5 zu wurfeln?

Man hat also 6 Moglichkeiten mit dem ersten Wurfel eine gerade Zahlund mit dem 2. Wurfel die Zahl 2 oder 5 zu wurfeln. Man hat naturlichumgekehrt mit dem 2. Wurfel eine gerade Zahl zu wurfeln usw. auch 6Moglichkeiten. Die Wahrscheinlichkeit, dieses Ereignis A zu erhalten istaber gegeben durch p(A) = 11

36 . Das Problem liegt darin, dass die bei-den Mengen nicht disjunkt sind. Die Schnittmenge besitzt ein Element|A1 ∩ A2| = 1. Welches ist dieses?

2.4 Kombinatorik

In der Kombinatorik berechnet man die oben betrachtete Anzahl der gunstigenEreignisse |A| und die Anzahl aller Ereignisse |Ω|.

Wir benutzen eigentlich nur die Regeln fur disjunkte und unabhangige Er-eignisse um die Anzahl eines bestimmten Ereignisses zu berechnen.

Bemerkung 2.1 (Komplementare Ereignisse) Manchmal ist es einfacherdas komplementare Ereignis Ac zu betrachten. Dann gilt |A| = |Ω| − |Ac|.

Triviales Beispiel

Wir wollen wissen, wieviele Moglichkeiten man besitzt mit 1 Wurfel keine derZahlen 1, 2, 3, 4, 5 zu wurfeln. Das komplementare Ereignis ist, die Zahl 6 zuwurfeln. Somit ist die Anzahl Moglichkeiten gegeben durch 6− 1 = 5.

Historisch gesehen betrachtet man in der Kombinatorik eine Urne mit verschie-denfarbigen Kugeln, aus welcher man Kugeln zieht. Dies kann mit oder ohneZurucklegen der gezogen Kugel passieren. Auch die Reihenfolge des Ziehenskann eine Rolle spielen.

Page 12: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

12 KAPITEL 2. EINFUHRUNG

2.4.1 Ziehung von Kugeln mit Berucksichtigung der Rei-henfolge

1. mit Zurucklegen

In diesem Fall ist jedes Ziehen einer Kugel unabhangig von den anderenEreignissen(bei k-maligem Ziehen). Jedes Mal hat man bei einer Urne mitn Kugeln, n Moglichkeiten und erhalt so die Gesamtzahl der Moglichkei-ten zu |Ω| = nk.

Beispiel

(a) Mehrmaliges Werfen eines Wurfels oder einer Munze.

(b) Wie gross ist die Wahrscheinlichkeit bei 3 maligem Werfen einesWurfels dreimal eine gerade Anzahl Augen zu erhalten?

Losung:

|A| = 33 und |Ω| = 63 ⇒ p(A) = 33

63 = 18

2. ohne Zurucklegen

In diesem Fall hat man bei einer Urne mit n Kugeln das erste Mal nMoglichkeiten, anschliessend n−1 Moglichkeiten bis n−k+1Moglichkeitenbeim k-ten Mal zu ziehen. So ergibt sich die Gesamtzahl der Moglichkeitenzu |Ω| = n · (n− 1) · (n− 2) . . . (n− k+1) = n!

(n−k)! . Dabei ist die Funktion

n! durch n! = n · (n− 1) · (n− 2) . . . 1 definiert.

Beispiel

(a) Die Anzahl der hochstens vierstelligen Zahlen mit lauter verschiede-nen Ziffern von 0-9 ist. |A| = 10 · 9 · 8 · 7 = 5040. Man beachte, dasshier die Ziffer 0 auch am Anfang stehen kann.

2.4.2 Ziehung von Kugeln ohne Berucksichtigung der Rei-henfolge

Falls die Reihenfolge keine Rolle spielt, so muss man sich uberlegen auf wievieleArten man k-Objekte auf die k-Platze verteilen kann. Dies ist gegeben durchk · (k−1) · (k−2) . . . 1 = k!. Man kann sich das wie hinlegen ohne zurucknehmenvorstellen. Die verschiedenen Anordnung werden Permutationen genannt.Da alle diese Ereignisse unabhangig voneinander sind, ergibt sich dann die An-zahl der Ereignisse durch Division durch diese k! Moglichkeiten.

Page 13: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

2.4. KOMBINATORIK 13

Beispiele

1. mit Zurucklegen

Betrachten wir den Fall den 3-maligen Wurf einer Munze. Wir haben danndie Ereignisse 0, 1, 2 resp. 3 Mal Kopf zu werfen. Diese Ereignisse besit-zen aber nicht die gleiche Wahrscheinlichkeit, daher ist bei dieser betrach-tungsweise die Laplace Annahme nicht gultig. Diese Wahrscheinlichkeitenkonnen berechnet werden, indem man die Anzahl Permutationen der ein-zelnen Ereignisse bestimmt.Dazu schreibt man am besten eine 0 fur das Werfen von Kopf und eine1 fur das Werfen von Zahl. Dann schreibt sich das Ereignis 0 mal Werfenvon Kopf als 111. Schreiben wir eine Tabelle aller moglichen Ereignissemit den Anzahl der Permutationen.

Ereignis Anzahl Permutationen000 1001011111 1

Die Anzahl der Ereignisse konnen naturlich auf verschiedene Arten berech-net werden. Ich werde meine betrachtungsweise am Beispiel 001 zeigen.

Wir verteilen am Anfang 3 verschiedene Elemente auf 3 Platze. Wir be-trachten hier die beiden 0 als verschieden. Damit erhalt man 3! = 6Moglichkeiten, da es ohne zurucklegen ist. Nun betrachten wir die Elemen-te die gleich sind. Die beiden 0 werden nun wieder als gleich betrachtet.Man kann diese vertauschen und erhalt das gleiche Bild, damit erhalt dassman am Anfang alle Ereignisse doppelt gezahlt hat. Damit erhalt man dieAnzahl Ereignisse mit 2 Mal 0 und einmal 1 zu 3!

2!·1! = 3.

2. ohne Zurucklegen

(a) Die Anzahl der verschiedenen Kombinationen von Lottozahlen (manzieht 6 Kugeln aus 49 verschiedenen Kugeln) ist gegeben durch 49!

(49−6)! .

Nun spielt es aber keine Rolle, in welcher Reihenfolge die Zahlen ge-zogen werden. Diese 6 Zahlen konnen auf 6! verschiedene Arten ge-schrieben werden. Daher ergeben sich 49!

(49−6)!6! Moglichkeiten. Diese

Kombination ist so haufig, dass sie eine eigene Notation bekommen

hat

(496

)= 49!

(49−6)!6! . (Gesprochen 49 tief 6).

Es gilt: (496

)=

(49

49− 6

)

(b) Man hat in einem Modul 7 Vorlesungen, wobei man 4 davon besuchenmuss. Wieviele verschiedene Modulzusammenstellungen existieren?

|A| =(74

)= 7·6·5·4

4! = 35

Page 14: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

14 KAPITEL 2. EINFUHRUNG

Satz 2.1 (Berechnung der Anzahl Permutationen)Um die Anzahl Permutationen zu berechnen betrachtet man am besten alleMoglichkeiten und dividiert durch die Anzahl der identischen Moglichkeiten. Wirbetrachten k verschiedenfarbige Kugeln. Von jeder Kugelfarbe i besitzen wir ni

Kugeln. Die Gesamtzahl ist also n =k∑

i=1

ni und die Gesamtzahl der Anordnun-

gen ist dann gegeben durch n! (mit Unterscheidung). Jede Kugelart besitzt ni!Permutationen. Somit erhalt man die Anzahl der Moglichkeiten zu n!

n1!·n2!...nk!.

2.5 Bedingte Wahrscheinlichkeit

Beispiel

1. Neulich erfuhren wir durch die Wettervorhersage, dass es am Samstagmit funfzig-prozentiger Wahrscheinlichkeit und am Sonntag ebenfalls mitfunfzig-prozentiger Wahrscheinlichkeit regnen werde. Wie gross ist nun dieWahrscheinlichkeit, dass es am Wochenende regnet?

Anmerkung: Das Wetter von Morgen hat einen starken kausalen Zusam-menhang mit dem Wetter von heute. Daher ist das Ereignis am Sonntagregnet es”nicht unabhangig vom Ereignis am Samstag regnet es”. Wenndie Ereignisse vollkommen unabhangig waren, so ware die Wahrscheinlich-

keit gegeben durch p(A) = 1−(12

)2.

2. Wir betrachten die folgenden Wahrscheinlichkeiten.

(a) ein Schweizer hat die Muttersprache deutsch

(b) eine Person, die die Muttersprache deutsch hat, ist Schweizer

Antwort

Ohne die Auslandsschweizer ist die Wahrscheinlichkeit (a) ca. 60%. Fur(b) gilt: weltweit haben ca. 100 Millionen Menschen die Muttersprachedeutsch. Daraus ergibt sich, dass die Wahrscheinlichkeit (b) gegeben ist

durch 7·106·0.6100·106 = 0.042 = 4.2%

Definition 2.5 (Bedingte Wahrscheinlichkeit)Unter bedingter Wahrscheinlichkeit versteht man die Wahrscheinlichkeit, dassein Ereignis eintritt, vorausgesetzt dass ein anderes Ereignis vorher schoneingetreten ist. Die Wahrscheinlichkeit, dass ein Ereignis A eintritt, falls dasEreignis B schon eingetroffen ist, ist gegeben durch:

p(A | B) = Anzahl von A in BAnzahl von B

= |A∩B||B| = |A∩B|

|Ω||Ω||B| =

p(A∩B)p(B)

Kommentar

Sind 2 Ereignisse A und B unabhangig voneinander so gilt p(A ∩ B) =

p(A) · p(B). Dies fuhrt auf p(A | B) = p(A∩B)p(B) = p(A)·p(B)

p(B) = p(A). Das heisst

Page 15: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

2.6. EREIGNISBAUM 15

das Eintreffen vom Ereignis B hat keinen Einfluss auf das Eintreten von EreignisA (anders gesagt: die Wahrscheinlichkeit, dass A eintrifft ist gleich gross, ob Bvorher eingetroffen ist oder nicht).

2.6 Ereignisbaum

Beispiel

Wir betrachten den Munzwurf einer nicht genau symmetrischen Munze. Diesehabe die Wahrscheinlichkeit p = 0.4 Kopf (K) anzuzeigen und die Wahrschein-lichkeit q = 1 − p = 0.6 Zahl (Z) anzuzeigen. Nach zweimaligen Werfen derMunze wollen wir wissen, wie gross die Wahrscheinlichkeit ist, dass wir 1 MalKopf und 1 Mal Zahl geworfen haben.

In der Abbildung 2.1 haben wir den Ereignisbaum dieses Experiments ab-gebildet. Wir fangen ganz oben an und konnen beim ersten Mal entweder Kopfoder Zahl werfen. Man zeichnet fur jedes mogliche Ereignis eine Verzweigungund schreibt daruber, wie gross die Wahrscheinlichkeit fur dieses Ereignis ist.Die Ereignisse (K) und (Z) sind disjunkt und zusatzlich sind es alle Moglich-keiten, die die Munze besitzt. Somit muss die Summe der Wahrscheinlichkeitenvon (K) und (Z) 1 ergeben. Anschliessend konnen bei jedem Zweig wieder diebeiden Ereignisse Kopf oder Zahl eintreten. Der zweite Wurf ist unabhangigvom ersten. Falls man sich auf einem Zweig herunter bewegt sind die Ereig-nisse daher unabhangig voneinander. Man erhalt die Wahrscheinlichkeit, furden betrachteten Zweig durch Multiplikation der entsprechenden Wahrschein-lichkeiten. In der folgenden Tabelle sind die Wahrscheinlichkeiten des gezeigtenEreignisbaums gegeben.

Ereignis WahrscheinlichkeitKK p = 0.4 · 0.4 = 0.16KZ p = 0.4 · 0.6 = 0.24ZK p = 0.6 · 0.4 = 0.24ZZ p = 0.6 · 0.6 = 0.36

Falls man nur an den Ereignissen 2 Mal Kopf, 2 Mal Zahl und 1 Mal Kopfund 1 Mal Zahl interessiert ist, dann sind die Ereignisse KZ und ZK die gleichenund da diese Ereignisse disjunkt sind, konnen die beiden Wahrscheinlichkeiteneinfach addiert werden. So erhalt man die Wahrscheinlichkeit P = 0.48, dassman 1 Mall Kopf und 1 Mal Zahl wirft.

Die folgenden Regeln gelten in einem Ereignisbaum:

• Die Summe der Wahrscheinlichkeiten nach einer Verzweigung ist 1 (dis-junkte Ereignisse, von denen eines eintreten muss; jeder Zweig bedeuteteine Moglichkeit fur den Fortgang).

• Langs eines Weges mussen die Wahrscheinlichkeiten multipliziert werden(unabhangige Ereignisse).

• Wenn verschiedene Wege zum gleichen Resultat fuhren, mussen derenWahrscheinlichkeiten addiert werden (disjunkte Ereignisse).

Page 16: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

16 KAPITEL 2. EINFUHRUNG

p=0.

4

p=0.

4q=

0.4 p=

0.4 q=

0.4

K

K Z

q=0.6

Z

ZK disjunkt

unab

haen

gig

Abbildung 2.1: Der Ereignisbaum des 2maligen Werfens einer Munze, mit denWahrscheinlichkeiten p = 0.4 fur Kopf (K) und p = 0.6 fur Zahl (Z).

2.7 Zusammenfassung

Nach der Laplace Annahme ist die Wahrscheinlichkeit, dass ein Ereignis ein-tritt, gegeben durch die Anzahl der Ereignisse dividiert durch die Anzahl allerEreignisse. Man geht dabei davon aus, dass alle Ereignisse gleich wahrscheinlichsind.Man unterscheidet zwischen unabhangigen und disjunkten Ereignissen. Bei un-abhangigen Ereignissen werden die Anzahl der Moglichkeiten multipliziert undbei den disjunkten addiert.Dies fuhrt darauf, dass die Wahrscheinlichkeiten auch multipliziert oder addiertwerden konnen. (Hier muss man aufpassen: Wahrscheinlichkeit bezuglich was?)Folgenden Regeln sind zur Berechnung der Anzahl Moglichkeiten wichtig:

Berechnung

Ziehen von Kugeln mit zurucklegenReihenfolge spielt Rolle

Ziehen von Kugeln ohne zurucklegenReihenfolge spielt Rolle

Ziehen von Kugeln ohne zurucklegenReihenfolge spielt keine Rolle

Noch zwei Kontrollfragen.

1. Was ist eine bedingte Wahrscheinlichkeit?

2. Was ist ein Ereignisbaum und wie berechnet sich die Wahrscheinlichkeitfur ein Ereignis?

Page 17: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

Kapitel 3

Deskriptive (beschreibende)Statistik

Ziel

Beschreibende Statistik besteht in der Aufbereitung, Darstellung und Analy-se gesammelter Daten. Die Daten gehoren zu einer Vollerhebung (Volkszahlung)oder - viel haufiger - zu einer Stichprobe.

Man unterscheidet zwischen quantitativen und qualitativen Daten.

1. quantitative DatenDiese werden in diskrete (z.B. Noten einer Prufung, Anzahl Studenten)und kontinuierliche Daten (Grosse, Gewicht) unterschieden.

2. qualitative DatenHier unterscheidet man nominale Daten (z.B. Haarfarbe, Tierart), wo kei-ne sinnvolle Zuordnung zu Zahlen moglich ist und ordinale Daten (z.B.hervorragend, gut, usw.). Letztere beziehen sich normalerweise auf einegrosser/kleiner Relation (Mohs’sche Harteskala). Eine Zuordnung zu Zah-len ist moglich.

3.1 Datenerfassung

Typischerweise wird nicht eine Vollerhebung der Daten durchgefuhrt, sei es ausKostengrunden oder auch weil die Gesamtheit schlichtweg nicht bekannt ist;z.B. alle hochbegabten Kinder.

Daher wird haufig eine reprasentative Stichprobe ausgewahlt und es wirddanach aus den Eigenschaften der Stichprobe auf die Eigenschaften der Grund-gesamtheit geschlossen. Eine reprasentative Stichprobe auszuwahlen ist nichtimmer einfach zu realisieren.

Im folgenden sind die Voraussetzungen fur eine reprasentative Stichprobezusammengestellt:

17

Page 18: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

18 KAPITEL 3. DESKRIPTIVE (BESCHREIBENDE) STATISTIK

• Die Stichprobe ist homogen

• Es liegen gleiche Produktionsbedingungen fur die Stichprobe und die Grund-gesamtheit vor

• Das Fertigungsverfahren wird und wurde nicht geandert, der Prozess wur-de nicht gestort

Eine reprasentative Stichprobe erfordert, dass alle Vertreter der untersuchtenPopulation (z.B. Tieren, Pflanzen, Menschen) mit der gleichen Wahrscheinlich-keit in der Stichprobe vertreten sind. Dies kann einerseits dadurch erreicht wer-den, dass die Stichprobe vollkommen zufallig gezogen wird. Gerade bei kleinenStichprobengrossen kann jedoch eine solche zufallige Stichprobe zur Uber- oderUnter-Reprasentierung bestimmter Teilpopulationen fuhren. Zur Losung diesesProblems werden oftmals geschichtete (= stratifizierte) Zufalls-Stichproben ge-zogen, wobei zunachst festgelegt wird, welche Teilpopulationen zu welchen An-teilen in der Stichprobe vertreten sein sollen. Innerhalb dieser Teilpopulationenwerden die Stichproben dann zufallig gezogen.

3.2 Datenbearbeitung

Beispiel

Wir betrachten mehrere Wurfe mit 2 Wurfeln und zahlen die Gesamtzahlder Augen. Typischerweise werden dann in einer Tabelle die Haufigkeit der ver-schiedenen Ereignisse eingetragen. Dies kann relativ oder absolut erfolgen. Eineandere etwas weniger gebrauchliche Darstellung ist die kumulierte Haufigkeitoder Summenkurve. Dabei werden die Ereignisse, die einen kleineren oder gleich-grossen Wert einnehmen als die Zahl angegeben.

Beispiel: In der unteren Tabelle werde 7 Mal eine kleiner oder gleichgrosse Zahlals 3 geworfen.

Augenzahl 2 3 4 5 6 7 8 9 10 11 12absolut 2 5 5 10 15 21 13 9 8 7 5relativ 0.02 0.05 0.05 0.10 0.15 0.21 0.13 0.09 0.08 0.07 0.05abs. kum. 2 7 12 22 37 58 71 80 88 95 100rel. kum. 0.02 0.07 0.12 0.22 0.37 0.58 0.71 0.80 0.88 0.95 1

graphische Darstellung

Fur die Darstellung der Daten existieren verschiedeneMoglichkeiten. Erwahntseien Stabdiagramm, Saulendiagramm (Histogramm) und Kuchendiagramm.Die Hohe des Stabs bzw. die Flache der Saule oder des Kuchenstucks Nr. jentspricht der absoluten oder der relativen Haufigkeit (haufig in %). Die Datenkonnen naturlich auch durch die kumulierte Haufigkeit dargestellt werden.

In der Abbildung 3.1 wird die absolute und die absolute kumulierte Haufig-keit als Stabdiagramm dargestellt.

Page 19: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

3.3. KLASSIERUNG 19

0

5

10

15

20

2 3 4 5 6 7 8 9 10 11 12

rel.

Hae

ufig

keit

Anzahl Augen

0

5

10

15

20

2 3 4 5 6 7 8 9 10 11 12

rel.

Hae

ufig

keit

Anzahl Augen

0

20

40

60

80

100

2 3 4 5 6 7 8 9 10 11 12

Pro

zent

Anzahl Augen

0

20

40

60

80

100

2 3 4 5 6 7 8 9 10 11 12

Pro

zent

Anzahl Augen

Abbildung 3.1: Links ist die absolute Haufigkeit als Stabdiagramm dargestelltund rechts die absolute kumulierte Haufigkeit des Beispiels der Augenzahl mit2 Wurfeln.

3.3 Klassierung

Falls eine kontinuierlichen Messgrosse betrachtet wird, z.B. die Masse oder dieGrosse von Personen, dann bringt eine solche Haufigkeitstabelle nichts, da jederWert typischerweise nur einmal auftritt.

Histogramme sind gleichwohl eine effiziente und gebrauchliche Methode, umVerteilungen von kontinuierlichen Variablen zu beschreiben. Im Allgemeinenstellen Histogramme die Haufigkeit des Auftretens einer Beobachtung innerhalbgegebener Intervalle gleicher Breite dar. Histogramme konnen als eine Art Klas-sifikation von Daten betrachtet werden. Jeder Datenpunkt wird, abhangig vonseinem Wert, in eines der Intervalle sortiert.

Eine wichtige Frage ist die Zahl der Intervalle, die fur ein Histogramm ver-wendet werden soll. Falls die Zahl der Klassen zu niedrig oder zu hoch ist, konntedas Histogramm die Information in den Daten verdecken. Als Faustregel gilt,dass man fur einen Datensatz mit n Daten in etwa

√n Klassen verwendet.

Beispiel

Man untersucht das Gewicht von Schulern in einer Klasse. Die folgendeAufzahlung gibt die Masse der verschiedenen Schuler in kg an: 23, 26, 25, 27,25, 26, 24, 28, 35, 34, 29, 29, 35, 36, 34, 35, 37, 31, 30, 31

Es sind 20 Schuler und daher sollten in etwa√20 = 4.47 ∼ 4−5 Histogramm-

Klassen verwendet werden. Die unterste Grenze sollte 23 kg und die obersteGrenze 37 kg beinhalten. Die Breite eines Intervalls ist dann gegeben durch37.5−22.5

5 = 3. In der unten stehenden Tabelle sind die absolute Haufigkeit unddie dazugehorigen Intervalle angegeben. Typischerweise wird als Reprasentantdes Intervalls die Intervalmitte angegeben.

Page 20: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

20 KAPITEL 3. DESKRIPTIVE (BESCHREIBENDE) STATISTIK

Intervall Reprasentant abs. H.[22.5, 25.5) 24 4[25.5, 28.5) 27 4[28.5, 31.5) 30 5[31.5, 34.5) 33 2[34.5, 37.5) 36 5

Die Verteilung solcher Daten wird in einem Histogramm dargestellt. Die ku-mulierte Verteilungsfunktion ist eine Treppenfunktion mit Sprungstellen beimkleinsten prinzipiell moglichen Wert einer Klasse.

Anmerkungen

1. Werden ungleich breite Klassen verwendet, so ist unbedingt darauf zuachten, dass nicht die Hohe der Saule sondern deren Flache der Haufigkeitentspricht.

2. Man nutze die Freiheiten um ein moglichst schones Histogramm zu erhal-ten. Unschon kann z.B. sein, dass leere Klassen existieren. Die Freiheitenbestehen in der Anzahl der Klassen sowie oft in der Wahl freier Stellen anden Randern.

3.4 Lagemass fur ordinalskalierte Daten

3.4.1 Median

Definition 3.1 (Medianwert)Der Median Q50 ist derjenige Wert, der die der Grosse nach aufsteigend ge-ordnete Daten in zwei gleich grosse Werteintervalle teilt; oberhalb wie unterhalbdes Median liegen also 50% der Daten. Zur Berechnung des Medianwertes musszwischen einer geraden und einer ungeraden Anzahl Daten xi unterschiedenWerten.Fur n ungerade gilt, dass Q50 = xk mit k = n+1

2 . Falls n gerade ist, so ist der

Median durch Q50 =xn/2+xn/2+1

2 definiert.

Beispiele

1. x = 3, 4, 5, 6, 7, dann ist der Median Q50 = 5.

2. x = 3, 4, 5, 6, dann ist der Median Q50 = 4+52

Es gibt sehr viele verschiedene Definitionen des Medianwertes, alle sind mehroder weniger gleichwertig.

Page 21: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

3.5. LAGEMASS FUR METRISCH SKALIERTE DATEN 21

3.4.2 Quantile

Falls man das Prinzip des Medianwertes verallgemeinert, kommt man zum Be-griff des Quantils.

Definition 3.2 (Quantil)Das α%-Quantil Qα ist derjenige Wert, der die der Grosse nach aufsteigendgeordnete Daten so teilt, dass α% der Werte unterhalb von Qα liegen bzw.(100−α)% oberhalb. Die Berechnung ist ahnlich zu derjenigen des Medianwertes.

Sei n die Anzahl der Daten.Fall 1: k = n · α/100 ist eine ganze Zahl, dann ist Qα = xk+1+xk

2Fall 2: k = n · α/100 ist keine ganze Zahl, dann schneide man von k die Nach-kommastellen ab und mit diesem neuen k′ ist: Qα = xk′+1.

Achtung

1. In der Literatur gibt es verschiedenste Definitionen des Quantils. Die obengenannte ist nur eine davon. Daher kann es sein, dass bei Verwendungeines Programms (z.B. Excel) die erhaltenen Werte nicht mit dem durchdas oben genannte Verfahren erhaltenen ubereinstimmen.

2. In Programmen wird haufig anstatt α in % auch einfach die mehr mathe-matische Notation 100% = 1 verwendet.

Beispiel

Beispiel 1 von oben. Q25 = 4 oder Q20 = 3.5

Anmerkungen

1. Die 25%- Quantile wird auch 1.Quartile genannt.

2. Der Medianwert ist identisch mit Q50 und der 2.Quartile.

3. Die 75%- Quantile wird auch 3 Quartile genannt.

3.5 Lagemass fur metrisch skalierte Daten

Die Verteilung der Daten kann durch Kennzahlen charakterisiert werden, welchedie Lage und die Streuung beschreiben. Die wichtigsten Kennzahlen sind derMittelwert und die empirische Varianz.

Definition 3.3 (Mittelwert)Seien n Messwerte gegeben durch xi mit i = 1 . . . n. Dann ist der Mittelwert

gegeben durch x = 1n

n∑k=1

xk. Es wird haufig das Symbol µ fur den Mittelwert

benutzt.

Page 22: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

22 KAPITEL 3. DESKRIPTIVE (BESCHREIBENDE) STATISTIK

Anmerkungen

Fasst man alle gleichen Ereignisse xi zusammen, so ergibt sich die folgendeGleichung fur die Berechnung des Mittelwertes.

x = 1n

l∑k=1

hkyk, wobei die hi die absolute Haufigkeit des Ereignisses yi ist.

Die Ereignisse yk mussen disjunkt sein und alle Ereignisse von xi enthalten.Falls alle Ereignisse xk verschieden sind, so gilt yi = xi und hi = 1. Das obigeResultat kann nochmals umgeformt werden.

x =l∑

k=1

p(yk)yk. Hier ist p(yk) die empirische Wahrscheinlichkeit, dass das

Ereignisses yk eintritt.

Beispiel

Wir werfen einen Wurfel 9 mal und erhalten die Augenzahlen 3, 3, 2, 3,2, 2, 1, 2, 6. Wie wahrscheinlich ist es, dass die Zahl 4 nie gewurfelt wurde,falls man annimmt, dass alle Zahlen die gleichgrosse Wahrscheinlichkeit haben?(p = 0.161)

Dies ergibt einen Mittelwert der Anzahl Augen von x = 3.9. Den Mittel-wert kann man nun aber auch mittels der hi und der p(yi) berechnen. Wirdefinieren zuerst die y1 = 1, y2 = 2 . . . , y6 = 6. Also y1 entspricht dem Er-eignis, dass der Wurfel die Zahl 1 zeigt. Die verschiedenen hi sind dann durchh1 = 1, h2 = 4, h3 = 3, h4 = 0, h5 = 0, h6 = 1 gegeben. Die p(yi) sind danndurch hi/n gegeben. Ich gebe hier nur den Wert fur p(y1) = 1

9 an. Naturlicherhalt man mit allen Methoden den gleichen Mittelwert.

Die letzte Definition des Mittelwerts wird auch gewichteter Mittelwert ge-nannt. Die praktische Anwendung des gewichteten Mittelwertes ist vielfaltig.

Beispiel

Berechnung des Gebiets-Niederschlages auf der Basis punkthafter Nieder-schlagsmessungen an Messstationen. Nehmen wir an, dass 4 Messstationen denNiederschlag fur ein gewisses Gebiet reprasentativ messen.

Messstation Messwert Umgebung p(yi)[mm] [km2]

A 21 7 0.318B 18 6 0.273C 20 4 0.182D 4 5 0.227Summe 63 22 1Mittelwert 15.8gew. Mittelwert 16.1

Page 23: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

3.6. STANDARDISIEREN 23

weitere Definitionen

• Modalwert: das ist der wahrscheinlichste Wert. Dies bedeutet, dass derWert die grosste Wahrscheinlichkeit besitzt. In einem Histogramm ist diesalso der hochste Balken.

• empirische Varianz

s2x = 1n−1

k∑j=1

hj(yj − x)2 = nn−1

k∑j=1

p(yj)(yj − x)2

Dass man durch n − 1 dividiert hat mit der Anzahl Freiheitsgraden zutun, wir werden spater darauf zuruckkommen.Die empirische Standardabweichung ist dann durch sx =

√s2x gegeben.

• α−Quantile ist genau gleich definiert, wie bei den ordinalskalierten Daten.

• Spannweite = Differenz zwischen dem maximalen und dem minimalenWert

• Quartilsabstand = Differenz zwischen dem 1. Quartil und dem 3.Quartil

3.6 Standardisieren

Werden die xi auf zi =xi−xsx

transformiert (x ist der Mittelwert), so besitzendie zi einen Mittelwert von 0 und eine empirische Varianz von 1. Dies ist sehrnutzlich falls man zeigen mochte, dass eine Datenmenge eine gewisse Haufig-keitsverteilung besitzt.

Beispiel

Zeige, dass durch das Standardisieren der Mittelwert 0 und die empirischeVarianz 1 ist.

Losung

Es gilt also zi = xi−xsx

und damit berechnet sich der Mittelwert von zi zu

z = 1n

n∑i=1

(xi−xsx

)= 1

n

(n∑

i=1

xi

sx−

n∑i=1

xsx

)= 1

n

(n·xsx

− n·xsx

)= 0. Man erhalt die

Varianz s2x = 1(n−1)

n∑i=1

(xi−xsx

)2

= 1(n−1)s2x

n∑i=1

(xi − x)2= 1

3.7 Zusammenfassung

Ein paar Fragen.

1. Es existieren 2 grundsatzlich verschiedene Arten von Daten, welche sinddies?

2. Welche Probleme konnen bei der Datenerfassung auftreten?

3. Bei der Datenbearbeitung muss zwischen 2 Arten der Daten unterschiedenwerden, welche sind dies?

Page 24: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

24 KAPITEL 3. DESKRIPTIVE (BESCHREIBENDE) STATISTIK

4. Welche Art der Darstellung von Daten kennen sie?

5. Wieviele Klassen benutzen sie, falls sie n Daten besitzen?

Versuchen sie in der nachsten Tabelle die entsprechenden Lagemasse furmetrischskalierte Daten einzutragen.

fur ordinalskalierte Daten fur metrischskalierte Daten

Medianwert

α−Quantile

Quartile

6. Was ist der Modalwert?

7. Was ist die empirische Varianz?

8. Wo kann die Standardisierung Sinn machen?

Page 25: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

Kapitel 4

Verteilungen

4.1 Diskrete Verteilungen

Beispiel

Wir werfen eine Munze und ordnen dem Resultat eine Zahl zu. Zum Beispielsei X=1, falls man Kopf und X=0, falls man Zahl geworfen hat. Nun konnenwir das Ereignis des Werfens einer Munze mit Hilfe von Zahlen schreiben. Soeine Zuordnung wird Zufallsvariable genannt. Wir konnen auch die Wahr-scheinlichkeit fur so ein Ereignis angeben. Dies wird mit der folgenden Notationgeschrieben.

Die Wahrscheinlichkeit das Kopf geworfen wird ist gleich p(X = 0) = 12 und

fur Zahl p(X = 1) = 12 .

Beispiel Wurfeln mit 2 Wurfeln

Wir definieren die Zufallsvariable X als Anzahl der Augen und die EreignisseAi = i+ 1, i = 1, . . . , 11 (mit 2 Wurfeln kann man die Werte 2 bis 12 wurfeln).

Es gilt nun, dass man mit Sicherheit eine dieser Zahlen wirft11∑j=1

p(X = Ai) = 1

(∪Ai = Ω, Ai sind disjunkt).Jeder dieser Werte besitzt eine eigene Wahrscheinlichkeit, wie haufig dieser ge-worfen wird. Wir berechnen nun fur jede mogliche Anzahl Augen diese Wahr-scheinlichkeit.Dazu benutzt man die Laplace Annahme und zusatzlich, dass gewisse Ereignissedisjunkt und andere unabhangig sind.Wir berechnen dabei die Anzahl Moglichkeiten eine Zahl zu wurfeln. z.B. wirhaben die folgenden Moglichkeiten die Zahl 5 zu wurfeln.1|4, 2|3, 3|2, 4|1. Daher ist die Wahrscheinlichkeit eine 5 zu wurfeln gleichp(X = 5) = 5

36 .Diese Zuordnung der Ai zu den Wahrscheinlichkeiten wird Wahrscheinlichkeits-verteilung genannt.

In der Praxis wird oft versucht, eine empirische Verteilung mit der Vertei-

25

Page 26: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

26 KAPITEL 4. VERTEILUNGEN

lung eines Modells zu vergleichen. Die beiden werden praktisch gleich untersucht,aber es werden zum Teil andere Bezeichnungen benutzt.

Modellverteilung mit m Ereignissen Stichprobe vom Umfang n mit m Ereignissen

Wahrscheinlichkeitsverteilung p(X = Aj) Experimentelle Verteilung mit pk = hk

n

Erwartungswert E(X) =m∑j=1

p(X = Aj)Aj Arithmetischer Mittelwert x =m∑j=1

pjxj

Varianz V ar(X) =m∑j=1

p(X = Aj) (Aj − E(X))2

empirische Varianz s2x = nn−1

m∑j=1

pj(xj − x)2

Standardabweichung σ =√V ar(X) empirische Standardabweichung sx =

√s2x

Beispiel

Wir betrachten wieder das obige Beispiel des Werfens von 2 Wurfeln. DerErwartungswert ist, dann gegeben durchE(X) = 1

36 (1 ·2+2 ·3+3 ·4+4 ·5+5 ·6+7 ·6+8 ·5+9 ·4+10 ·3+11 ·2+12 ·1) = 7und die Varianz ist gegeben durch V ar(X) = 35

6 = 5.83. Daraus erhalt man eine

Standardabweichung von σ =√

356 = 2.42.

4.1.1 Uniforme Verteilung

Definition 4.1 (Uniforme Verteilung)Bei einer uniformen Verteilung sind alle Ereignisse gleich wahrscheinlich.

Beispiel

Berechne den Erwartungswert und die Varianz der Augenzahl beim Wurfelnmit einem Wurfel.

Jede der Zahlen ist gleich Wahrscheinlich p = 16 . Damit berechnet sich der

Erwartungswert zu E(X) =6∑

j=1

j · 16 = 3 + 1

2 und die Varianz zu V ar(X) =

6∑j=1

16

(j −

(3 + 1

2

))2= 35

12

4.1.2 Binomialverteilung B(n,p)

Beispiel

Wir werfen eine Munze n-Mal und fragen uns wie gross die Wahrscheinlich-keit ist k-Mal Kopf zu erhalten. Wie wir gesehen haben ist die Wahrscheinlich-keit eines solchen Ereignisses (die Reihenfolge spielt keine Rolle)

p(X = k) = B(n, p) =

(nk

)pk(1− p)n−k

Wobei die Wahrscheinlichkeit Kopf zu werfen p und die WahrscheinlichkeitZahl zu werfen 1− p ist.

Page 27: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

4.1. DISKRETE VERTEILUNGEN 27

0

0.05

0.1

0.15

0.2

0.25

1 2 3 4 5 6 7 8 9 10

p

Anzahl Kopf

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

1 2 3 4 5 6 7 8 9 10

p

Anzahl Kopf

Abbildung 4.1: Stabdiagramm von zwei Binomialverteilungen (symmetrisch undlinks schief)

Falls p < 0.5 ist, ist die Verteilung links schiefFalls p = 0.5 ist, ist die Verteilung vollkommen symmetrischFalls p > 0.5 ist, ist die Verteilung rechts schief

Die Kennzahlen der Verteilung ergeben sich zu E(X) = np und V ar(X) =np(1− p).

Anwendungen

• Wahrscheinlichkeitsberechnung von 2 disjunkten Ereignissen

• Ziehen mit Zurucklegen aus einer Grundgesamtheit

• Wiederholtes Werfen einer Munze

• Verteilungen zur Reinigung von Gemischen (Extraktion)

Anmerkung:Aus der Verteilung ergibt sich die folgende Beziehung

n∑

k=0

(nk

)pk(1 − p)n−k = (p+ (1− p))n = 1

Beispiel

1. Wir werfen eine Munze, welche die Wahrscheinlichkeit Kopf (K) zu erhal-ten p = 0.4 hat und q = 1−p = 0.6 Zahl (Z) zu erhalten. Die Wahrschein-lichkeiten sind dann gegeben durch:

KK p =

(22

)0.42(1− 0.4)(2−2) = 0.16

KZ p =

(21

)0.41(1− 0.4)(2−1) = 0.48

ZZ p =

(20

)0.40(1− 0.4)(2−0) = 0.36

Sie konnen dies mit dem Resultat vom Beispiel zum Ereignisbaum ver-gleichen.

Page 28: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

28 KAPITEL 4. VERTEILUNGEN

2. Man kann die Binomialverteilung auch zur Beschreibung irgendeiner Chro-matographie benutzen, sei es GC, HPLC usw.

Betrachten wir dazu ein paar Scheidetrichter, welche hintereinander ge-schaltet sind. Wir benutzen zur Extraktion Essigester und Wasser. Wirbestimmen das Losungsgleichgewicht und bemerken, dass von einer Sub-stanz A pA = 0.6 in der Essigesterphase und von einer anderen SubstanzB pB = 0.45 in der Essigesterphase ist. Nun stellen wir eine Reihe vonScheidetrichter (n=200) auf und wollen wissen, wo die Substanz nach 100maligen schutteln ist, falls der Essigester von Scheidetrichter 1 zu 2 resp.2 zu 3 usw. weitertransportiert wird.

Wir konnen nun den Erwartungswert und die Varianz fur die beiden Sub-stanzen getrennt berechnen.

Substanz E(X) V ar(X)

A E(X) = pAn = 60 V ar(X) = npA(1− pA) = 24 ⇒ σ =√24

B E(X) = 45 V ar(X) = 24.75 ⇒ σ =√24.75

Wir kommen spater nochmals auf dieses Beispiel zuruck.

4.1.3 Poissonverteilung

Die Poissonverteilung beschreibt die absolute Haufigkeit, mit welcher ein Er-eignis in einem bestimmten Zeitintervall τ auftritt. Voraussetzung ist, dass dieEreignisse unabhangig voneinander sind und mit einer im Mittel konstantenRate λ pro Zeitintervall τ eintreten.

Pλ(X = k) = λke−λ

k!

Die Kennzahlen sind E(X) = λ und V ar(X) = λ

Anwendungen

• Das sicher bekannteste Beispiel ist der radioaktive Zerfall. Die Zerfalle derAtome sind vollkommen unabhangig voneinander.

• Es treffen pro Minute λ Meteoriten auf die Erdatmosphare. Wie gross istdie Wahrscheinlichkeit, dass in einer Minute k Meteoriten auf die Atmo-sphare treffen?

Beispiel

1. An einer Kreuzung ereignen sich im Mittel 0.4 Unfalle pro Monat. Mitwelcher Wahrscheinlichkeit ereignet sich auf diesem Strassenstuck mehrals 1 Unfall in einem Monat?

Wir nehmen an, dass alle Unfalle vollig zufallig und unabhangig voneinan-der sind. Damit sind die Bedingungen fur die Poissonverteilung erfullt. Der

Page 29: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

4.2. KONTINUIERLICHE VERTEILUNGEN 29

Erwartungswert der Poissonverteilung ist λ, daher ist λ = 0.4 fur einenMonat. Die Wahrscheinlichkeit, dass sich mehr als 1 Unfalle ereignen istgleich p = 1− P0.4(X = 0)− P0.4(X = 1) = 0.062

2. Eines der klassischen Beispiele fur die Poisson-Verteilung ist die Anzahlder Kavalleristen der preussischen Armee, die durch Hufschlag getotetwurden. Bei zehn Truppenteilen gab es in 20 Jahren die folgenden Anzah-len von Toten pro Jahr und Truppenteil.

Anzahl der getoteten Soldaten Anzahl der Truppenteil-Jahre0 1091 652 223 34 1Summe 200

Man berechnet einen Mittelwert pro Jahr von

x =1

200(0 · 109 + 1 · 65 + 2 · 22 + 3 · 3 + 4 · 1) = 0.61

Da E(X) = λ bei der Poissonverteilung ist 0.61 eine Schatzung von λ.Man erhalt mit diesem λ die folgende Anzahl der getoteten Soldaten.

Anzahl der getoteten Anzahl der Truppenteile aus der Poissonverteilung0 108.71 66.32 20.13 4.14 0.6Summe 199.9

Man sieht also, dass die Abweichungen marginal sind.

4.2 Kontinuierliche Verteilungen

Beispiel

Bei einem Gas hat jedes Gasteilchen eine eigene Geschwindigkeit. Man kannsich nun fragen wie gross die Wahrscheinlichkeit ist, dass ein Gasteilchen einengewissen Betrag der Geschwindigkeit (oder Energie) besitzt. Der Betrag derGeschwindigkeit ist eine kontinuierliche Grosse, dadurch ist die Wahrscheinlich-keitsverteilung grundsatzlich verschieden von denjenigen der vorherigen Beispie-le. Diese Verteilung ist nun eine Funktion auf den positiven Zahlen. Eine solcheFunktion f(x) (diese kann auch auf ganz R definiert sein) heisst Wahrschein-lichkeitsdichte. Die Wahrscheinlichkeitsdichte muss die folgenden Eigenschaftenbesitzen.

Wir nehmen an, dass die Wahrscheinlichkeitsdichte (siehe Abbildung 4.2) imIntervall [a, b] definiert ist. Als Eselsleiter soll man beachten, dass bei alle De-finitionen der diskreten Statistik das Summenzeichen durch das Integralzeichen

Page 30: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

30 KAPITEL 4. VERTEILUNGEN

y

x

y = f(x)

p(x < b)

b

Abbildung 4.2: Die Darstellung einer Wahrscheinlichkeitsdichte.

zu ersetzten ist.

Eigenschaften der Wahrscheinlichkeitsdichte

1. f(x) ≥ 0 , ∀x ∈ [a, b]. Warum ist dies so?

2.d∫c

f(x)dx ist die Wahrscheinlichkeit, dass die Zufallsvariable einen Wert

zwischen c und d annimmt.

3.b∫a

f(x)dx = 1, Sicherheit einen Wert zwischen a und b zu erhalten.

4. Die kumulierte Wahrscheinlichkeit ist gegeben durch F (c) :=c∫a

f(x)dx,

wobei a die untere Grenze des Definitionsbereiches von f(x) ist.

5. Die α-Quantile ist derjenige Wert x, fur welchen gilt α = F (x). Also istdie Grosse der Flache welche links von x liegt genau α.

6. E(X) =b∫a

xf(x)dx ist der Erwartungswert (Mittelwert).

7. V ar(X) =b∫a

f(x)(x−E(x))2dx. Man sollte sich darunter die durchschnitt-

liche Abweichung vom Mittelwert vorstellen.

8. Erwartungswert irgendeiner Funktion g(x) ist gleichE(g(X)) =b∫a

g(x)f(x)dx

Im folgenden betrachten wir verschiedene Beispiele von kontinuierlichen Vertei-lungen.

Page 31: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

4.2. KONTINUIERLICHE VERTEILUNGEN 31

4.2.1 Uniforme Verteilung

Die Wahrscheinlichkeitsdichte sei auf einem Intervall uberall gleich gross undsonst 0.

p(x) =

12δ , falls x ∈ [µ− δ, µ+ δ],

0, sonst

Im folgenden sind die Kennzahlen dieser Wahrscheinlichkeitsdichte angege-ben.

F (x) =

0, falls x < µ− δ(x−µ+δ)

2δ , fur x ∈ [µ− δ, µ+ δ]

1, falls x > µ+ δ

, E(X) = µ, V ar(X) = δ2

3

Man kann auch die α Quantile dieser Verteilung ausrechnen. Das heisst αProzent liegen links vom Wert x(α). Man muss also die Gleichung F (x) = αnach x auflosen.

(x − µ+ δ)

2δ= α ⇒ 2αδ − δ + µ

Beispiel

1. Wie gross ist die Wahrscheinlichkeit, falls man vollig zufallig eine Zahlzwischen 0 und 1 wahlt, dass diese zwischen 1

4 und 34 liegt?

Intuitiv sollte klar sein, dass die Wahrscheinlichkeit durch p = 12 gegeben

ist. Da alle Zahlen gleich wahrscheinlich gezogen werden ist die Wahr-scheinlichkeitsdichte gegeben durch p(x) = 1. Kontrolliere, ob dies ei-ne Wahrscheinlichkeitsdichte ist! Dann ist die Wahrscheinlichkeit gegebendurch

p =

34∫

14

1dx =1

2

2. Man mochte wissen, wie gross die Wahrscheinlichkeit bei einem gleich-schenkligen Dreieck ist, dass die Seite s langer ist als diejenige der gleichenSchenkel d (Siehe Abbildung 4.3).

(a) Losung 1Wie wir wissen, liegt die Grenze zwischen grosser und kleiner beieinem Offnungswinkel von 60. Man kann den Winkel von 0 bis 180

wahlen. Somit ist die Wahrscheinlichkeit, dass die Seite s grosser alsd ist gegeben durch p = 1− 60

180 = 23 .

(b) Losung 2Wir zeichnen nun einen Kreis mit Radius 1 und definieren, dass dieobere Spitze des Dreiecks am hochsten Punkt dieses Kreises liegt, wiein der Abbildung 4.3 rechts. Nun definieren die Schnittpunkte dergleichen Schenkel mit dem Kreis eine horizontale Linie, zusammen

Page 32: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

32 KAPITEL 4. VERTEILUNGEN

s

d d

D

Abbildung 4.3: Wie gross ist die Wahrscheinlichkeit, dass die Seite s langer istals d.

mit dem obersten Punkt ein Dreieck. Falls D < 32 ist, dann ist s > d.

Somit ist die Wahrscheinlichkeit gegeben durch p = 32 · 1

2 = 34 .

Was stimmt nun, ist es 23 oder 3

4 . Man sieht hier, dass es auch auf dieAuswahl (Winkel, Strecke) ankommt.

4.2.2 Maxwell-Boltzmann Verteilung

Die Maxwell-Boltzmann Verteilung gibt die Wahrscheinlichkeit an, dass ein Gas-teilchen mit der Molmasse M bei der Temperatur T den Betrag der Geschwin-digkeit v besitzt (R ist die Gaskonstante). Die Wahrscheinlichkeitsdichte istgegeben durch:

p(v) =√

(MRT

)3/2v2e−

Mv2

2RT

Diese Wahrscheinlichkeitsdichte besitzt die oben beschriebenen Eigenschaf-ten und ist nur auf den positiven Zahlen v ≥ 0 definiert. In der Abbildung 4.4ist die Maxwell-Boltzmann Verteilung fur Stickstoff bei 25C abgebildet.

Um die folgenden Berechnungen durchzufuhren ist es vorteilhaft, die beidenfolgenden Integrale zu kennen (diese konnen mittels partieller Integration be-rechnet werden).

∞∫0

x2ne−x2/a2

dx =√π (2n)!

n!

(a2

)2n+1

∞∫0

x2n+1e−x2/a2

dx = (a2)n+1

2 n!

Berechne damit folgendes:

Page 33: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

4.2. KONTINUIERLICHE VERTEILUNGEN 33

p(v)

0 100 200 300 400 500 600 700 800 900 1000v

vh

E(v)

Abbildung 4.4: Die Maxwell Boltzmann Verteilung fur Stickstoff bei 25C.

1. Zeige, dass∞∫0

p(v)dv = 1, d.h die Funktion p(v) ist eine Wahrscheinlich-

keitsdichte (mit der Bedingung, dass p(v) ≥ 0).

2. Berechne die Geschwindigkeit, mit welcher die Gasteilchen am haufigstenim Gas vorkommen.

3. Berechne den Erwartungswert der Geschwindigkeit v.

Im folgenden berechnen wir den Erwartungswert der kinetischen EnergieEkin = 1

2Mv2.

E(Ekin) =∞∫0

12Mv2p(v)dv =

∞∫0

12Mv2

√2π

(M

2RT

)3/2v2e−Mv2/(2RT )dv =

12M

√2π

(M

2RT

)3/2 ∞∫0

v4e−Mv2/(2RT )dv = 32RT

Falls wir also Gasteilchen aus einem Gas herauspicken, so besitzen sie im Mitteldie Energie 3

2RT .

4.2.3 Exponentialverteilung

Diese Verteilung folgt aus der Poissonverteilung, wenn als Zufallsvariable dieDauer bis zum Eintreten des nachsten Ereignisses betrachtet wird. Dabei spieltes keine Rolle, ob gerade ein Ereignis eingetreten ist oder nicht (Unabhangig-keit).

Beispiel

1. Die Zeit zwischen zwei Zusammenstossen in einem Gas.

2. Besitzen die Zeiten zwischen Erdbeben in einem Gebiet diese Verteilung?Wie ist es, wenn man die Erdbeben in schwache und starke aufteilt?

p(x) =

0, falls x < 0

λe−λx, sonst

Page 34: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

34 KAPITEL 4. VERTEILUNGEN

Die Kenngrossen sind hier durch

F (x) =

0, falls x < 0

1− e−λx, sonst

die Variation ist V ar(X) = 1λ2 , der Erwartungswert E(X) = 1

λ und die α-

Quantile durch x(α) = − ln(1− α100 )

λ gegeben.

4.2.4 Normalverteilung

Die weitaus wichtigste Verteilung haben wir uns bis zum Schluss aufgespart.Die Bedeutung dieser Verteilung kommt vom zentralen Grenzwertsatz her.Dieser sagt aus, dass man von irgendeiner Grundgesamtheit mit irgendeinerVerteilung (kann auch 2 Maxima besitzen) m Mal den Mittelwert mit n An-zahl Daten bestimmt. Diese verschiedenen Mittelwerte dann den Mittelwert derVerteilung besitzen und dass ihre Verteilung fur den Grenzwert m → ∞, gegendie Normalverteilung konvergiert. Es spielt dabei keine Rolle ob man z.B. dieGrosse aller Menschen oder nur die von Erwachsenen benutzt. Die statistischenKenngrossen unterscheiden sich, aber nicht die Form der Verteilung.

p(x) =1√2πσ2

e−(x−µ)2

2σ2

Die statistischen Kenngrossen sind durch E(X) = µ (Mittelwert) undV ar(X) = σ2 (Standardabweichung) moglichst einfach gegeben. Hier haben wireinen Fall, bei der die kumulierte Haufigkeit F (X) nicht durch allgemeine In-tegrationsregeln berechnet werden kann. Diese Funktion ist normalerweise inComputerprogrammen enthalten und wird dort haufig als Fehlerfunktion be-zeichnet. Besser ware Gauss’sche Fehlerfunktion, da der Begriff Fehlerfunktionzum Teil auch eine andere Verwendung besitzt.

Frage

Skizzieren Sie die Funktion p(x) oben. Berechnen sie dazu die Extrema (Ma-xima bei x = µ) und zeigen sie, dass die Funktion bei µ± σ einen Wendepunkt(f ′′(x) = 0 und f ′′′(x) 6= 0) besitzt.

Eine weitere wichtige Eigenschaft der Normalverteilung ist der Additions-satz. Dieser besagt, dass falls man 2 Zufallsvariablen (X1 und X2) hat, welchenormalverteilt sind und die Kenngrossen (µ1, σ

21) und (µ2, σ

22) besitzen, die Ad-

dition und Subtraktion X1±X2 dieser beiden Zufallsvariablen auch normalver-teilt sind und die Kenngrossen (µ1 ± µ2, σ

21 + σ2

2) besitzen.

Folgerung

Fur den Mittelwert von n Messungen ergibt sich, dass der Mittelwert mit√

1n

gegen den Mittelwert der Verteilung konvergiert. Nun sieht man, dass Wieder-holungen von Messungen nur bis zu einer gewissen Anzahl Sinn machen.

Page 35: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

4.2. KONTINUIERLICHE VERTEILUNGEN 35

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

-3 -2 -1 0 1 2 3

x

p(x)F(x)

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

-3 -2 -1 0 1 2 3

x

p(x)F(x)

Abbildung 4.5: Standardnormalverteilung und ihre kumulierte Haufigkeit)

Beispiel

Abschatzungsweise kann die folgende Naherung benutzt werden. Spater werdenwir dann noch sehen, dass dies nur eine Naherung ist.Um die Genauigkeit eines Resultats zu erhohen kann man mehrere Messungenhintereinander durchfuhren.

Anzahl Messungen: 2, Verdoppelung der Genauigkeit des Mittelwertes bei 4 =22 · 2 Messungen.Anzahl Messungen: 10, Verdoppelung der Genauigkeit bei 40 = 22 · 10 Messun-gen.

Standardnormalverteilung

Die Standardnormalverteilung ist die Normalverteilung mit Mittelwert µ = 0und Standardabweichung σ2 = 1. Jede Normalverteilung kann durch die Trans-formation z = x−µ

σ in die Standardnormalverteilung transformiert werden. DieseTransformation ist vor allem fur die kumulierte Wahrscheinlichkeit wichtig, dain Buchern oft die Werte dieser Funktion tabeliert sind.

Im folgende ist angegeben wieviel Prozent der Werte bei der Standardabwei-chung innerhalb des Intervalls [−kσ, kσ] (siehe 8.1) liegen.

Intervall % aller Werte[−σ, σ] 68.3[−2σ, 2σ] 95.4[−3σ, 3σ] 99.7

Dieses Resultat ist wichtig, da es fur alle Normalverteilungen mit (µ, σ) gilt.Wie gross ist die Wahrscheinlichkeit von [0, σ]? (68.32 = 34.15)

Page 36: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

36 KAPITEL 4. VERTEILUNGEN

0

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0 20 40 60 80 100

p

Gefäss

Extraktion

Substanz A

Substanz B

Abbildung 4.6: Beispiel der Extraktion von 2 Substanzen. Die Trennung ist nochnicht gut.

4.3 Zusammenhang zwischen den verschiedenen

Verteilungen

Die Poissonverteilung und auch die Gaussverteilung sind Spezialfalle der Bino-mialverteilung. Es ist viel einfacher mit der Gaussverteilung oder der Poisson-verteilung als mit der Binomialverteilung zu rechnen, daher haben diese ihreBerechtigungen.

In der folgenden Tabelle sind die Bedingungen aufgestellt unter welchen dieBinomialverteilung durch die Gaussverteilung oder die Poissonverteilung an-genahert werden kann.

Bedingung Naherung durchFalls p < 0.05 und n > 10 Poissonverteilung mit λ = npFalls np(1− p) > 9 Gaussverteilung mit µ = np und σ2 = np(1− p)

Beispiel

1. Wir betrachten wieder das Beispiel der Extraktion. Nun konnen wir ohneProbleme mithilfe der Gaussverteilung die Graphen 4.6 zeichnen und auchdie Trennung der Substanzen abschatzen. Um die Trennung abschatzen zukonnen, berechnen wir ob sich die Intervalle in welchen 95% der SubstanzA resp. B sind, uberschneiden. Man erhalt fur Substanz A [50, 70] und furSubstanz B [35, 55]. Man konnte sich fragen, wieviel Extraktionen man ma-chen muss, damit sich die 99.7% Intervalle nicht uberschneiden. (Losung:n = 390).

2. Man habe einen Munzwurf mit der Wahrscheinlichkeit p = 0.01 Kopf zuerhalten.Wie gross ist dann die Wahrscheinlichkeit 10 Mal Kopf zu werfen,

Page 37: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

4.3. ZUSAMMENHANG ZWISCHEN DEN VERSCHIEDENENVERTEILUNGEN37

falls man die Munze 1000 man wirft?

Mit der Binomialverteilung: p(10) = 0.12574Mit der Poissonverteilung: p(10) = 0.12511

3. Betrachten wir noch einmal die Kreuzung auf welcher sich im Mittel 0.4Unfalle pro Monat ereignen.

Wir nehmen nun an, dass sich in einem Monat ein Unfall ereignet mitWahrscheinlichkeit p = 0.4, dann stimmt der Erwartungswert dieser Ver-teilung mit der Wirklichkeit uberein, aber es kann auch mehr als 1 Unfallpassieren, welches durch diese Verteilung nicht beschrieben wird.

Um das ganze zu verbessern teilen wir den Monat in n Zeitintervalle, mitn → ∞, p = µ

n → 0, µ = n · p = 0.4. Solche Ereignisse werden durch ei-ne Binomialverteilung B(n, 0.4

n ) beschrieben. Fur n gegen Unendlich kon-vergiert diese Binomialverteilung gegen die Poissonverteilung pλ=0.4 unddaher ist das Resultat bei der Poissonverteilung korrekt.

Page 38: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

38 KAPITEL 4. VERTEILUNGEN

4.4 Zusammenfassung

Die Wahrscheinlichkeitsverteilung gibt an, wie sich die Wahrscheinlichkeitenauf die moglichen Zufallsereignisse verteilen. Man unterscheidet zwischen derHaufigkeitsverteilung (empirische Daten) und den Verteilungen aus theoreti-schen Uberlegungen.

Fullen sie in die Tabelle die fehlenden Informationen ein.

Modellverteilung mit m Ereignissen Stichprobe vom Umfang n

Wahrscheinlichkeitsverteilung p(X = Aj) Experimentelle Verteilung mit pk = hk

n

Erwartungswert E(X) = Mittelwert x =

Varianz V ar(X) = emp. Varianz s2x =

Ein paar Fragen.

1. Was fur diskrete Verteilungen kennen sie? Und geben sie fur jede dieserVerteilungen ein typisches Beispiel an. Wie gross sind die Erwartungswerteund die Varianz dieser Verteilungen?

2. Welche Bedingungen muss eine Wahrscheinlichkeitsdichte erfullen?

3. Wie berechnet man den Erwartungswert, die Varianz und die α-Quantilebei einer Wahrscheinlichkeitsdichte?

4. Was fur kontinuierliche Verteilungen kennen sie? Geben sie fur jede dieserVerteilungen ein Beispiel an. Wie gross sind die Erwartungswerte und dieVarianz dieser Verteilungen?

5. Was ist standardisieren?

6. Was ist das spezielle der Gaussverteilung?Wieviel Prozent der Flache liegtzwischen µ± σ, µ± 2σ und µ± 3σ?

7. Skizziere die Gaussverteilung.

8. Wie hangen die Binomialverteilung, die Poissonverteilung und die Gaus-sverteilung zusammen?

-

Page 39: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

Kapitel 5

Statistische Tests

Man will hier aus den Daten einer zufalligen Stichprobe Aussagen uber Kenn-grossen oder auch uber die Wahrscheinlichkeitsdichte machen. Die Stichprobekann z.B. aus ein paar Exemplaren von Tabletten bestehen (Bestimmung derKonzentration des Wirkstoffs), welche zufallig entnommen wurden, die Grund-gesamtheit ist dann z.B. die Tagesproduktion.

Ublicherweise wird bei den folgenden Tests angenommen, dass die Datennormalverteilt sind.

5.1 Freiheitsgrade

Um die statistischen Tests zu verstehen, muss der Begriff des Freiheitsgradeseingefuhrt werden.

Bei der Berechnung eines statistischen Parameters eines Datensatzes ist esoft notwendig zunachst ein Zwischenergebnis zu berechnen (z.B. den Mittel-wert). Wenn solche Parameter bei der Berechnung berucksichtigt werden, wirddie Zahl der unabhangigen Werte reduziert, da das Zwischenergebnis ja bereitsalle Werte mit einbezieht.

Ein Beispiel soll das erklaren: Uberlegen Sie sich die Berechnung der empi-rischen Varianz, die durch Mitteln der Quadrate der Abweichungen vom Mit-telwert x berechnet wird.

s2x =1

n− 1

n∑

k=1

(xk − x)2

Weil der Mittelwert x von allen Werten bereits berechnet wurde, ist die An-zahl der unabhangigen Werte in der Formel fur die empirische Varianz um 1reduziert (man konnte ja einen der ursprunglichen Werte durch Verwenden desMittelwerts und aller anderen Werte berechnen).

Allgemein gesprochen hangen die Anzahl der Freiheitsgrade (FG) von derZahl an unabhangigen Beobachtungen ab: FG ist die Zahl der Beobachtungenn minus der Zahl der berucksichtigen Parameter a,

FG = (n− a) ,

wobei die Wahl der Verteilung auch ein Parameter sein kann.

39

Page 40: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

40 KAPITEL 5. STATISTISCHE TESTS

5.2 Schatzer

Im vorherigen Beispiel haben wir schon bemerkt, dass man aus den Daten derStichprobe die Kennwerte der Verteilung der Grundgesamtheit nur schatzenkann. Funktionen, welche das tun, heissen Schatzer. Wir haben schon solcheFunktion angetroffen, namlich den Mittelwert x, der den Erwartungswert derVerteilung E(X) schatzt. Der Schatzer sollte die folgenden Eigenschaften besit-zen.

1. Der geschatzte Wert (Mittelwert x einer Stichprobe mit n Elementen)sollte fur n → ∞ gegen den Erwartungswert E(X) der Grundgesamtheitkonvergieren (erwartungstreu).

2. Die Varianz des Schatzers sollte mit n → ∞ gegen 0 streben(konsistent).

Ein effizienter und konsistenter Schatzer des Erwartungswertes E(X) ist derarithmetische Mittelwert der Probe. Derjenige fur die Varianz ist die Stichpro-benvarianz.

5.2.1 Beispiele fur verschiedene Schatzer

1. Poissonstatistik

Wir haben im Abschnitt uber die Verteilungen gesehen, dass der Mittel-wert x ein Schatzer f ur den Parameter λ ist und dass auch die Standard-abweichung im Quadrat s2x ein Schatzer fur λ ist. Welcher soll man nunwahlen? Ist einer besser als der andere?

Wir mochten einen Schatzer, der bei Messwiederholung moglichst nahebei dem Erwartungswert des Schatzer liegt. Dies Abweichung beschreibenwir am einfachsten mit der Standardabweichung dieser ’identischen’ Mes-sungen.

In den beiden folgenden Graphen sind die Histogramme der Schatzungvon 100000 Experimenten aufgetragen.

0

1000

2000

3000

4000

5000

6000

7000

8000

9000

0 2 4 6 8 10

H

ä

u

g

k

e

i

t

λ

S hätzer x fuer λ

Abbildung 5.1: Histogram des Schatzersx fur λ fur 105 Experimente

0

1000

2000

3000

4000

5000

6000

7000

8000

0 2 4 6 8 10

H

ä

u

g

k

e

i

t

λ

S hätzer s2n fuer λ

Abbildung 5.2: Histogram des Schatzerss2x fur λ fur 105 Experimente

Page 41: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

5.3. VERTRAUENSINTERVALL 41

2. Federkonstante

Im Physikpraktikum haben wir die Federkonstante einer Feder bestimmt.Einzelne Studierende wollen die Federkonstante Di =

Fi

xifur jeden einzel-

nen Messwert der Auslenkung xi bezuglich angewandten Kraft Fi berech-nen. Danach mochten sie den Mittelwert der so erhaltenen Schatzer derFederkonstante berechnen.

Es kann gezeigt werden, dass dieser Schatzer fast immer schlechter ist,als derjenige der Regression. Dieser Schatzer besitzt eine deutlich grossereVarianz als derjenige der Regression.

5.3 Vertrauensintervall

Der arithmetischeMittelwert gibt eine Schatzung fur den ErwartungswertE(X).Dies ist aber genau ein Wert. Wir wissen aber, dass die Stichprobe mit grosserWahrscheinlichkeit nicht den wahren Wert ausgibt sondern einen Wert nahe desErwartungswertes. Man stellt sich nun die Frage: wie weit nach links und rechtsvom Mittelwert aus, erstreckt sich das Intervall, welches mit einer gewissenWahrscheinlichkeit (=gewahltes Vertrauensniveau) den wahren Wert enthalt.Dieses Intervall wird Vertrauensintervall genannt.

Wegen des zentralen Grenzwertsatzes liegen ca. 95% der Daten zwischenµ± 2 σ√

n. Dieses Intervall wird 95% Vertrauensintervall (Irrtumswahrscheinlich-

keit α = 1− 0.95) genannt. Nun kennen wir aber σ nicht genau sondern konnendieses nur mittels sx schatzen. In der Praxis kann man bei einer Anzahl Datenvon n > 30 mit sx rechnen. Bei weniger Messungen muss man einen Korrek-turfaktor einfuhren, weil die Standardabweichung der Stichprobe selbst eineZufallsvariable ist.Der Mathematiker Gosset hat die Verteilung dieser standardisierten Mittelwertsuntersucht und unter dem Pseudonym Student veroffentlicht. Sie hangt von nab und heisst Student t-Verteilung fur n− 1 Freiheitsgrade.

Die Student t-Verteilung geht fur n → ∞ in die Normalverteilung uber. Umdas σ zu schatzen muss nun die empirische Varianz sx nicht mit dem 1 − α/2-Quantil der Standardnormalverteilung, sondern mit derjenigen der Student t-Verteilung (siehe 8.2) mit n− 1 Freiheitsgrade multipliziert werden.Beispiel

Bestimmen Sie das 95%-Vertrauensintervall des folgenden Beispiels. Der arith-metische Mittelwert einer Stichprobe mit n = 8 sei x = 2.11 und die empirischeVarianz s2x = 1.22. Dies ergibt ein 95%-Vertrauensintervall von 2.11± 1.2·2.365√

7=

2.11 ± 1.07 (siehe Tabelle der Student t-Verteilung am Schluss des Skripts 8.2mit tα/2,8−1 = t0.025,7 = 2.365).

Page 42: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

42 KAPITEL 5. STATISTISCHE TESTS

Hilfsmittel

1. Statistikprogramm R

Daten seien im Vektor x, dann berechnet t.test(x) das Vertrauensintervallund gibt es aus.

Eingabe

t.test(x,conf.level=0.975)

Ausgabe

One-Sample t-Test

data:x

Hier Daten, welche dann fur den t-Test relevant sind.

97.5 percent confidence intervall:2803 6002

sample estimates:mean of x4360

2. Excel

Hier gibt es 2 Moglichkeiten.

(a) Im Moodle Kurs Hilfsmittel zur Datenanalyse kann das Excel File: 1Stichprobe metrisch benutzt werden.

(b) Es gibt den Befehl TINV (α, n − 1) im Excel um den t-Wert zu be-rechnen.

Page 43: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

5.4. HYPOTHESEN-TESTS 43

5.4 Hypothesen-Tests

5.4.1 Hypothese

Mit einem statistischen Test wird beurteilt, ob Daten mit einer Anfangshypo-these, der Nullhypothese, vereinbar sind oder Evidenz dagegen liefern und eherfur eine Alternativhypothese sprechen. Hypothesen sind Aussagen uber die Ver-teilung einer Zufallsvariable und/oder uber Parameter der Verteilung.

Ein Hypothesentest ist eine Entscheidungsgrundlage. Der P -Wert ist dieWahrscheinlichkeit, berechnet unter Annahme der Nullhypothese, einen mindes-tens so extremen Wert der Testgrosse zu erhalten wie derjenige, der beobachtetwurde. Wenn der P -Wert kleiner als eine vorgegebene Zahl α ist, dann ist derTest statistisch signifikant auf dem Signifikanzniveau α. Die Nullhypothese(NH) wird dann verworfen.

Bei einem Hypothesentest sind 4 Varianten denkbar.

NH wird beibehalten NH wird verworfenP > α P ≤ α

NH trifft zu Ok. (p = 1− α) Fehler 1.Art (α Fehler) (p = α)NH trifft nicht zu Fehler 2.Art (β Fehler) Ok! (p = 1− β wird Power genannt)

Bei einer Irrtumswahrscheinlichkeit von < 5% spricht man von signifikantenErgebnissen. Ist die Irrtumswahrscheinlichkeit < 1% spricht man von hochsi-gnifikant.

BemerkungenMan sollte darauf achten, dass eine Hypothese eigentlich nicht bewiesen werdenkann, sie kann im mathematisch strengen Sinne nur verworfen werden und die-ses auch nur mit einer gewissen Wahrscheinlichkeit.

Beispiel 1

In den folgenden Abbildungen 5.3 ist eine typische Situation eines Hypothe-sentests anhand eines Mittelwertes dargestellt. Vergesst in einem ersten Schritteinmal die rechte Glockenkurve im oberen Graphen. Trifft nun die Nullhypo-these zu, so liegen bei einer Messwiederholung α Prozent in den beiden grauenBereichen (symmetrisch um 0). Man wurde in diesem Fall die Nullhypotheseverwerfen, obwohl sie zutrifft. Nehmen wir nun an, dass unsere Probe einenErwartunsgwert von µ = 2 besitzt, dann trifft die Alternativhypothese zu. Indiesem Fall ist der β Fehler durch die rote Kurve links neben dem rechten Teilder den α Fehler repressentierenden Flache gegeben. In der unteren Grafik istdie gleiche Situation dargestellt, fur den Fall dass der Erwarttungswert der Pro-be bei 1 liegt. In diesem Fall ist die Trennscharfe des Tests stark verkleinert.

Page 44: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

44 KAPITEL 5. STATISTISCHE TESTS

µ1 = 0

α

2

α

µ2 = 2

µ1 = 0

α

2

α

µ2 = 1

Abbildung 5.3: Hypothesentest am Beispiel der Mittelwerte. Das obere Beispielbesitzt eine deutlich bessere Trennscharfe als das untere Beispiel.

Beispiel 2

Betrachten wir 2 Munzen. Eine sei vollig ausbalanciert, was bedeutet, dass dieWahrscheinlichkeit Kopf zu werfen gleich gross ist wie die WahrscheinlichkeitZahl zu werfen. Die andere Munze besitze eine Wahrscheinlichkeit p = 0.3 Kopfanzuzeigen und eine Wahrscheinlichkeit 1 − p = 0.7 Kopf anzuzeigen. Fallswir zufallig eine dieser beiden Munzen nehmen und diese werfen: existiert eineMoglichkeit, dass wir 100% sicher sein konnen, welche Munze wir in der Handhaben?Die Antwort ist “Nein”. Man musste die Munze unendlich oft werfen, um diesmit Sicherheit entscheiden zu konnen. Berechnen wir einmal ein paar Wahr-scheinlichkeiten dazu.

Page 45: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

5.5. WELCHER TEST? 45

Beispiele 5.1 Wir Werfen die Munze 3 Mal und mochten nun entscheiden,welche Munze wir in der Hand haben.

Berechnen wir die Wahrscheinlichkeiten, dass wir 0,1,2,3 Mal Kopf gewor-fen haben unter den Hypothesen, dass wir die ausgewogene Munze (H0) resp.die nicht ausgewogene Munze (H1) in der Hand haben. Dies sind bedingteWahrscheinlichkeiten. Man erhalt die folgende Tabelle.

Anzahl Zahl p(ω|H0) p(ω|H1)0 0.125 0.3431 0.375 0.4412 0.375 0.1893 0.125 0.027

Falls wir nun bei einem Experiment 0 Mal Zahl erhalten haben, so ist nach derobigen Tabelle die Wahrscheinlichkeit grosser, dass die Hypothese H1 eintrifft.Es kann aber nicht ausgeschlossen werden, dass die Hypothese H0 zutrifft.Im obigen Fall wurden wir also falls wir 0 oder 1 Mal Zahl geworfen haben,annehmen, dass wir die nicht ausgewogene Munze in den Handen halten. Habenwir hingegen 2 oder 3 Mal Zahl geworfen, so ist es wahrscheinlicher,dass wirdie ausgewogene Munze in den Handen haben.

Nehmen wir nun als Nullhypothese an, dass wir die ausgewogene Munze inden Handen haben. Wie gross ist nun die Wahrscheinlichkeit einen Fehler 1.Art (α- Fehler) zu begehen? Dies bedeutet, dass die NH verworfen wird, obwohldie NH zutrifft. Diese Wahrscheinlichkeit konnen wir mithilfe der obigenTabelle berechnen. Es ist dies pα = 0.125 + 0.375. Der β-Fehler (die NH wirdbeibehalten, obwohl sie nicht zutrifft) kann auch mithilfe der Tabelle berechnetwerden. Dort gilt pβ = 0.189 + 0.027.

Man sieht also, dass der α-Fehler nicht unabhangig vom β-Fehler ist.

5.5 Welcher Test?

Es gibt praktisch unendlich viele Tests. Diese werden auch haufig in grafischerForm zusammen gestellt, so dass man sich entscheiden kann, welchen Test mannehmen sollte. In der Abbildung 5.4 ist so ein Entscheidungsbaum abgebildet.Fur die Durchfuhrung der Tests empfehle ich die Statistiksoftware R, welchefrei verfugbar ist. Es gibt aber ein paar kleine Einstiegshurden. Um diese zuverkleinern, sollte man sich den Moodle Kurs (R-Online Course (DepartmentLife Science, Ubergreifend, Mathematik und Physik)) anschauen.

Page 46: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

46 KAPITEL 5. STATISTISCHE TESTS

Abbildung 5.4: Ein moglicher Entscheidungsbaum. Bei den Tests handelt es sichum eine kleine Auswahl.

Page 47: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

5.6. TEST AUF NORMALVERTEILUNG 47

5.5.1 Vorgehensweise

Bei einem statistischen Test, muss man vor dem Experiment schon bewusstsein,was man Testen will und wie!!

1. Was mochte man Testen?

2. Welche Methode und welche Signifiknazniveau? (Auswege falls Vorausset-zungen nicht erfullt schon im Hinterkopf haben)

3. Auswertung

5.6 Test auf Normalverteilung

Bei sogenannt parametrischen Tests wird haufig benotigt, dass die Daten nor-malverteilt sind (parametrische Tests). Dies kann man mit verschiedenen Testsherausfinden. Alle geben typischerweise leicht verschiedene p-Werte an.

Wir betrachten zuerst den QQ-Plot, welcher kein eigentlicher Test ist, abereine Methode um grafisch abzuschatzen, ob die Daten normalverteilt sind.

5.6.1 QQ-Plot

Beispiel

Ein Material soll den Volumenaufbau von Weichgeweben im Mund gewahr-leisten. Das Material wurde im Reaktor mit Zellen besiedelt und anschliessendunter statischen Bedingungen 14 Tage kultiviert. Danach wurde die Anzahl deraktiven Zellen auf dem Material gemessen. Man hat 19 verschiedene Probenhergestellt und ausgemessen.

Man hat die folgenden Messwerte 3211.44, 4038.14, 3226.97, 1239.87, 851.5,1769.38, 7615.08, 6865.6, 5109.29, 3221.19, 3267.5, 3930.4, 3301.19, 5270.05,4648.16, 7804.68, 12533.99, 2240.12, 2777.09 erhalten.

Theorie

Bei diesem Test werden die experimentellen Werte (Anzahl aktive Zellen) ge-gen die theoretische Quantile einer Normalverteilung aufgetragen, um die beidenVerteilungen zu vergleichen. Dazu ordnen wir zuerst die experimentellen Datender Grosse nach und nummerieren sie von 1 bis n durch. Nun wird zu jedemexperimentellen Wert die dazugehorige theoretische α−Quantile der Normalver-teilung berechnet. Dazu berechnen wir zuerst aus der Position i die kumulierteHaufigkeit P (i) von jedem der Grosse nach geordneten Messwert i. Es existie-ren viele mehr oder weniger aquivalente Methoden dies zu bewerkstelligen, aber

wir werden nur eine davon benutzen P (i) =i− 3

8

n+ 14

. Anschliessend wird mit der

kumulierten Haufigkeit Pi die α-Quantile der Normalverteilung αtheo berechnet

Page 48: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

48 KAPITEL 5. STATISTISCHE TESTS

oder aus einer Tabelle ausgelesen. Werden nun die Messwerte gegen die theo-retischen α-Quantilen der Normalverteilung aufgetragen, so mussen die Punkteauf einer Geraden liegen, falls sie normalverteilt sind. Oft wird die Gerade sogezeichnet, dass sie durch die 1. und die 3. Quartile geht, dies sind hier diePunkte (−0.6745, 2994) und (0.6745, 5190).

Anwendung auf das obige Beispiel

Nun sortieren wir die Messewerte der Proben der Grosse nach und numme-rieren sie durch. Anschliessend berechnen wir die kumulierte Haufigkeit mittels

P (i) =i− 3

8

n+ 14

.

Wir besitzen n = 19 Messwerte und fur den kleinsten Wert 851.5 ist i = 1und damit P (1) = 5

154 ≈ 0.03. Anschliessend wird aus der Tabelle die α-Quantileder Normalverteilung ausgelesen zth(1) = −1.85.

Wert i P (i) zth zex851.5 1 0.03 -1.85 -1.261239.87 2 0.08 -1.38 -1.121769.38 3 0.14 -1.1 -0.932240.12 4 0.19 -0.88 -0.762777.09 5 0.24 -0.71 -0.573211.44 6 0.29 -0.55 -0.413221.19 7 0.34 -0.4 -0.413226.97 8 0.4 -0.26 -0.413267.5 9 0.45 -0.13 -0.393301.19 10 0.5 0 -0.383930.4 11 0.55 0.13 -0.164038.14 12 0.6 0.26 -0.124648.16 13 0.66 0.4 0.15109.29 14 0.71 0.55 0.275270.05 15 0.76 0.71 0.336865.6 16 0.81 0.88 0.97615.08 17 0.86 1.1 1.177804.68 18 0.92 1.38 1.2412533.99 19 0.97 1.85 2.94

In der Abbildung 5.5 ist der Wert gegen die theoretische Quantilen aufgetra-gen und in der Tabelle sind die berechneten Werte enthalten. Es sieht in diesemFall nicht so aus, dass die Daten normalverteilt sind. Dies wollen wir aber nunmit dem Kolmogorov-Smirnov Test quantifizieren.

AnmerkungBetrachtet man diese Methode ein bisschen genauer, so sieht man direkt, dassman Daten damit auf eine beliebige Verteilung testen kann. Das einzige was sichandert sind die α−Quantile der theoretischen Verteilung. Diese kann man aberentweder ausrechnen oder aus einer Tabelle auslesen.

Page 49: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

5.6. TEST AUF NORMALVERTEILUNG 49

0

2000

4000

6000

8000

10000

12000

14000

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

E

x

p

e

r

i

m

e

n

t

zth

Daten

Linie

Abbildung 5.5: QQ Plot der Daten aus den Versuchen des Gewebeaufbaus.

Hilfsmittel

1. Statistikprogramm R

Daten seien im Vektor x, dann fuhrt qqplot(x) zum Graph und eine Liniewird mit qqline(x) dazu gebracht.

Befehl

qqplot(x)qqline(x)

Output

Es wird direkt der benotigte Graph produziert.

2. Excel

Im Moodle Kurs Hilfsmittel zur Datenanalyse kann das Excel File: 1 Stich-probe metrisch benutzt werden.

Page 50: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

50 KAPITEL 5. STATISTISCHE TESTS

5.6.2 Kolmogorov-Smirnov Test

Die Nullhypothese ist die, dass die Daten aus einer Grundgesamtheit mit nor-malverteilten Zufallsvariablen stammt. Dieser Test ist relativ einfach, leider istseine Trennscharfe nicht sehr gross.

Beispiel aus dem Kapitel QQ-Plot

Man hat die folgenden Messwerte 3211.44, 4038.14, 3226.97, 1239.87, 851.5,1769.38, 7615.08, 6865.6, 5109.29, 3221.19, 3267.5, 3930.4, 3301.19, 5270.05,4648.16, 7804.68, 12533.99, 2240.12, 2777.09 erhalten.

Als erstes berechnen wir den Mittelwert und die Varianz der Verteilung mitµ = 4365 und Standardabweichung zu 2782 und wahlen ein Signifikanzniveauvon 95% (α = 0.05) aus. Anschliessend werden die Werte wieder aufsteigendgeordnet und anschliessend wird die Summenfunktion berechnet. Um die Sum-menfunktion zu berechnen nimmt man im Gegensatz zum QQ-Plot an, dassjeder Wert das Gewicht 1/N mit N der Anzahl Messwerte besitzt. Danach wirdin einer Spalte die Differenz der Summenfunktion zu der theoretischen Funktion(theoretische Summenfunktion der Normalverteilung mit Mittelwert µ = 4365und Standardabweichung 2782) berechnet oder aus einer Tabelle ausgelesen.

i xi S(xi) F (xi) |S(xi−1)− F (xi)| |S(xi)− F (xi)|851.5 1 1

19 0.053 0.103 0.0511239.87 2 1

19 0.105 0.131 0.0251769.38 3 1

19 0.158 0.175 0.0182240.12 4 1

19 0.211 0.223 0.0122777.09 5 1

19 0.263 0.284 0.0213211.44 6 1

19 0.316 0.339 0.0233221.19 7 1

19 0.368 0.341 0.0283226.97 8 1

19 0.421 0.341 0.0803267.5 9 1

19 0.474 0.347 0.1273301.19 10 1

19 0.526 0.351 0.1753930.4 11 1

19 0.579 0.438 0.1414038.14 12 1

19 0.632 0.453 0.1784648.16 13 1

19 0.684 0.541 0.1445109.29 14 1

19 0.737 0.606 0.1315270.05 15 1

19 0.789 0.628 0.1626865.6 16 1

19 0.842 0.816 0.0267615.08 17 1

19 0.895 0.879 0.0167804.68 18 1

19 0.947 0.892 0.05512533.99 19 1

19 1.000 0.998 0.002

Man wahlt nun den absolut grossten Wert ∆max aus der Tabelle mit denDifferenzen aus und vergleicht diesen mit einer statistischen Grosse. Falls derWert ∆max ist als derjenige in der Tabelle (siehe 8.4) unten kann die Hypothese,dass die Messwerte von einer Normalverteilung kommen, auf einem Signifikanz-niveau von 95% verworfen werden.

Wir haben nun 19 Messwerte und unser ∆max ist 0.178 < 0.3 und daherkann die Nullhypothese nicht verworfen werden. Somit nehmen wir an, dass die

Page 51: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

5.6. TEST AUF NORMALVERTEILUNG 51

Stichprobe aus einer Grundgesamtheit, welche eine Normalverteilung besitztentstammt.

Hilfsmittel

1. Statistikprogramm R

Daten seien im Vektor x, dann fuhrt ks.test(x,”pnorm”,mean(x),sd(x))den SK-Test durch mit Ausgabe.

Befehl

ks.test(x,”pnorm”,mean(x),sd(x))

Output

One-Sample KS-Test

data: xD=0.178, p-Value=0.5246alternative Hypothesis: two.sided.

Hinweise: Die Funktionen mean und sd berechnen den Mittelwert und dieStandardabweichung des Datensatz x und der p-Value¿1-0.95, daher kanndie Nullhypothese der normalverteilung der Daten nicht verworfen werden.

2. Excel

Im Moodle Kurs Hilfsmittel zur Datenanalyse kann das Excel File: 1 Stich-probe metrisch benutzt werden.

5.6.3 χ2-Test auf Normalverteilung

Auch hier ist die Nullhypothese ist die, dass die Daten aus einer Grundgesamt-heit mit normverteilten Zufallsvariablen stammt und wir betrachten auch wiederden Datensatz aus dem Beispiel des QQ-Plots. Der Durchschnitt der Messwertebetragt µ = 4365 und die empirische Standardabweichung 2782. Zuerst werdenbei diesem Test die Daten in Klassen aufgeteilt. In der folgenden Tabelle sinddie Klassen und die entsprechende Anzahl der Messwerte, die in diese Klassegehoren, eingetragen. Es muss beachtet werden, dass man die Tabelle so erganzt,dass die Wahrscheinlichkeit 1 ergibt. Man hat da einfach nichts gefunden.

Page 52: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

52 KAPITEL 5. STATISTISCHE TESTS

0

2

4

6

8

10

0 2000 4000 6000 8000 10000 12000 14000

A

n

z

a

h

l

W

e

r

t

e

Anzahl Zellen

Gauss

Abbildung 5.6: χ2-Test auf Normalverteilung)

untere Grenze obere Grenze Anzahl n aus Gauss χ2

-∞ 0 0 1.11 1.110 2000 3 2.65 0.1392000 4000 8 4.75 0.0914000 6000 4 5.20 0.256000 8000 3 3.47 0.00468000 10000 0 1.41 0.2210000 12000 0 0.35 0.45712000 14000 1 0.052 0.6914000 ∞ 0 0.005 0.005Summe 19 19 22.6

Diese benutzt man um die theoretische Anzahl nth, die in den verschiedenenKlassen liegen sollten, zu berechnen. Mittels dieser theoretischen Anzahl kannman anschliessend den χ2-Test durchfuhren. Um den Wert zu berechnen wird

dabei die Summe χ2 =∑ (nexp,k−nth,k)

2

nth,kberechnet.

Nun sollte diese Zahl der χ2-Verteilung mit m− 3 = 9− 3 = 6 Freiheitsgra-den gehorchen. Man hat hier die Statistik, namlich die Gaussverteilung gewahlt,welche durch den Mittelwert und die empirische Varianz eindeutig definiert ist.Daher hat man n− 3 Freiheitsgrade (1 FG fur die Statistik und je 1 FG fur denMittelwert und die empirische Varianz)In unserem Fall ergibt sich fur 95% (siehe 8.3) ein χ2 von 12.59, dies besagt, dassdie NH (die Daten stammen aus einer Grundgesamtheit mit Gaussverteilung)auf dem Signifikanzniveau 95% verworfen werden kann.

Page 53: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

5.6. TEST AUF NORMALVERTEILUNG 53

Hilfsmittel

1. Statistikprogramm R

Daten seien im Vektor x, dann fuhrt chisq.test(x) einen Test durch, dassist aber nicht derjenige den wir wollen!! Er basiert auf gleicher Wahrschein-lichkeit fur jede Klasse. Wir mussen also zuerst die Wahrscheinlichkeitenberechnen.

Folgendes Programm sollte funktionieren.

Daten in x.

Befehle

histo=hist(x)probs=pnorm(histo$breaks,mean(x),sd(x))proba=c()for(i in 2:(length(probs)))delta=probs[i]-probs[i-1]proba=c(proba,delta)

delta=1-sum(proba)proba=c(proba,delta)coun=c(0,histo$counts,0)a=chisq.test(coun,p=proba)

Befehl fur Ausgabe p-Wert

1-pchisq(a$statistics,df=length(proba)-3)

Hinweis: Die Funktionen mean und sd berechnen den Mittelwert und dieStandardabweichung des Datensatz x.

Page 54: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

54 KAPITEL 5. STATISTISCHE TESTS

5.6.4 t-Test

Ein-Stichproben Test

Man untersucht hier mittels einer Stichprobe die Frage, ob eine Grundgesamt-heit einen bestimmten Mittelwert uberschreitet oder nicht. Die Voraussetzungist, dass die Daten normalverteilt sind. Sind die Daten nicht normalverteilt, somuss man den Wilcoxon-Test verwenden, welcher aber Mediane vergleicht.

BeispielDer Gehalt eines Wirkstoffs einer Tablette sollte innerhalb gewisser Grenzenliegen. Ist der Gehalt zu hoch, so kann dies gesundheitsschadlich sein, ist erdagegen zu tief, so ist die Tablette nicht mehr wirksam.

Die Entscheidung kann anhand der Tabelle getroffen werden (µ0 ist der Mit-telwert der Grundgesamtheit):

einseitiger Test zweiseitiger TestHypothese H0 : µ1 ≥ µ0 H0 : µ1 = µ0

H1 : µ1 < µ0 H1 : µ1 6= µ0

Testgrosse t = x−µ0

(sx/√n)

Ruckweisung H0 ablehnen falls t < −tα,n−1 H0 ablehnen falls |t| > tα/2,n−1

BeispielMan habe bei 5 Tablette den Wirkstoff (Sollwert=100mg) gemessen und erhaltx = 95.5 mg und eine empirische Varianz von sx = 4 mg2.

1. Kann auf einem Signifikanzniveau von 95% gesagt werden, dass der Ge-halt der Tablette grosser als 100mg ist?

Man erhalt t = 95.5−1004√5

= −2.52. Aus einer Tabelle erhalt man t0.05,5−1 =

2.132, daraus ergibt sich, dass die NH x ≥ 100mg abgelehnt werden muss(einseitiger Test).

2. Kann man mit auf einem Signifikanzniveauvon 95% sagen, dass der Gehaltder Tablette gleich 100mg ist?

Man erhalt wie oben t = 2.52 und daraus 2.52 < t0.05/2,5−1 = 2.776 (siehe8.2). Man kann also die NH, dass der Mittelwert 100mg betragt, nichtverwerfen.

Page 55: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

5.6. TEST AUF NORMALVERTEILUNG 55

−2 −1 0 1 2

1000

2000

3000

4000

Normal Q−Q Plot

Theoretical Quantiles

Sam

ple

Qua

ntile

s

Abbildung 5.7: QQ-Plot Datensatz 2

Beispiel 2

Beim Beispiel aus dem QQ-Plot Kapitel sind die Daten nicht normalver-teilt, daher kann der t-Test nicht angewandt werden. Ich habe aber nocheinen anderen Datensatz der Anzahl aktiver Zellen der Biotechnologen er-halten. Sie haben die Daten 543, 944, 1227, 1428, 1622, 1649, 1727, 1774,2188, 2356, 2402, 2517, 2529, 2771, 2809, 2892, 2906, 3076, 4485 erhalten.Im QQ-Plot (Abbildung 5.7) ist ersichtlich, dass diese schon eher normal-verteilt sind.

Die Daten sind nach dem KS-Test (p-Wert=0.94) und dem χ2 Test (p-Wert=0.62) normalverteilt. Der Mittelwert betragt x = 2202 und die Stan-dardabweichung sx = 908.

Wir konnen uns nun fragen, ob die Zellaktivitat bei einem Signifikanzni-veau von 98% 2000 betragt. Dazu berechnen wir den t-Wert:

t = |2202−2000|908√19

= 0.97115

Aus der Tabelle (siehe 8.2) liest man ein kritischen t-Wert von t0.02/2,19−1 =2.552, daher kann die Nullhypothese nicht verworfen werden.

Page 56: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

56 KAPITEL 5. STATISTISCHE TESTS

Hilfsmittel

(a) Statistikprogramm R

Daten seien im Vektor x, dann fuhrt t.test(x,alternative =”two.sided”resp.”less”resp. ”greater”, mu =) den t-Test durch.

Fur das obiges Beispiel.

Befehl

t.test(x,mu=2000,alternative=two.sided”)

Output

One-Sample t-Test

data: xt=0.97, df=18, p-value=0.34alternative Hypothesis: true mean is not equal to 200095% condidence interval:1764 2640

Der p-Wert ist grosser als 0.02/2, daher kann die NH nicht abgelehntwerden.

(b) Excel

Im Moodle Kurs Hilfsmittel zur Datenanalyse kann das Excel File: 1Stichprobe metrisch benutzt werden.

Zwei-Stichproben Test

Die Nullhypothese dieses t-Tests lautet, dass 2 Stichproben aus der selbenGrundgesamtheit mit demselben Erwartungswert stammen. Die Prufgrosse wirdaus der Anzahl der Daten, dem Mittelwert und der Standardabweichung der bei-den Messreihen gebildet. Sie gehorcht der Student-t-Verteilung.

Die Idee hinter dem Test ist sehr einfach. Man betrachtet die beiden be-rechneten Mittelwerte und schaut, wieviele Standardabweichungen sie vonein-ander entfernt sind. Die Standardabweichung ist dabei gegeben durch s2t =(n1−1)s21+(n2−1)s22

n1+n2−2 . Falls die Standardabweichungen stark verschieden sind, muss

der Welch-Test verwendet werden. Dabei wird s2t durchs21n1

+s22n2

berechnet. Umzu bestimmen ob die Varianzen gleich sind kann der Levene Test benutzt werden.

Page 57: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

5.6. TEST AUF NORMALVERTEILUNG 57

zweiseitiger TestHypothese H0 : µ1 − µ0 = ω

H1 : µ1 − µ0 6= ω

Testgrosse t =√

n1n2

(n1+n2)x1−x2−ω

st

Ruckweisung H0 ablehnen falls |t| > tα/2,n1+n2−2

BeispielMan habe bei einer Charge bei 5 Tablette den Wirkstoff gemessen und manerhalt x1 = 96 mg und eine empirische Varianz von s1 = 4.6 mg2 und bei einer2. Charge einen Mittelwert von x1 = 95.1 mg und eine empirische Varianz vons1 = 3.5 mg2. Die Varianzen seien gleich (Levene-Test p-Wert=0.686).

Kann auf einem Signifikanzniveau von 95% gesagt werden, dass der Gehaltin den Tabletten in den beiden Chargen gleich sind?

Man erhalt s2t = 15.88 und t =√

5·7(5+7)

(96−95.1)√15.88

= 0.367. Aus einer Tabelle

(siehe 8.2) erhalt man t0.025,5+7−2 = 2.228, daraus ergibt sich, dass die NH, dassbeide Mittelwerte identisch sind nicht abgelehnt werden kann.

Hilfsmittel

1. Statistikprogramm R

Daten seien im Vektor x1 und x2, dann fuhrt t.test(x1,x2,var.equal=TRUE)den t-Test durch. Aufpassen standardmassig ist der Welchtest eingestellt.

Fur das obiges Beispiel.

Befehl

t.test(x1,x2,var.equal=TRUE)

Output

Two-Sample t-Test

data: x1 and x2t=0.37, df=10, p-value=0.72alternative Hypothesis: true differences in means is not equal to 0

Der p-Wert ist grosser als 0.025, daher kann die NH nicht abgelehnt wer-den.

2. Excel

Im Moodle Kurs Hilfsmittel zur Datenanalyse kann das Excel File: 2 Stich-proben metrisch benutzt werden.

Page 58: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

58 KAPITEL 5. STATISTISCHE TESTS

Bemerkungen

1. Sind die Daten nicht normalverteilt, so sollte der Mann Whitney U-Testverwendet werden.

2. Besitzt man mehr als 2 Stichproben die man miteinander vergleichenmochte so sollte bei normalverteilten Daten ANOVA und sonst Kruskal-Wallis verwendet werden.

5.6.5 Grubbs Test

Beim Ausreissertest nach Grubbs wird getestet ob eine Stichprobe einen Aus-reisser enthalt. Die Voraussetzung fur den Grubbstest ist, dass die Stichprobenormalverteilt ist. Wir haben gesehen, dass man dies mittels eines QQ-Plotsoder einem χ2-Test herausfinden kann. Sind die Daten nun normalverteilt, sostandardisiert man diese zuerst. Anschliessend betrachtet man nur den Wert dervom Betrage her die grosste Abweichung vom Mittelwert besitzt und schaut inder Tabelle am Ende nach, ob dieser Wert grosser als der Tabellenwert ist. Ister grosser so wird er als Ausreisser betrachtet und aus der Stichprobe entfernt.Diese Prozedur darf man auch mehrmals Anwenden.

BeispielBeim Beispiel fur den Volumenaufbau von Mundgewebe (t-Test) haben wir be-merkt, dass die Daten normalverteilt sind. Besitzen wir da bei einem Signifi-kanzniveau von 95% einen Ausreisser? Der grosste (4485) resp. kleinste (543)Wert besitzt ein zex von 2.51 resp −1.83. Aus der Tabelle (siehe 8.5) liest manein zkr = 2.681. Damit ist keiner der Werte ein Ausreisser.

Page 59: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

5.7. ZUSAMMENFASSUNG 59

Hilfsmittel

1. Statistikprogramm R

Daten seien im Vektor x, dann fuhrt grubbs.test(x,two.sided=TRUE) denGrubbs-Test durch.

Fur das obiges Beispiel.

Befehl

grubbs.test(x,two.sided=TRUE)

Output

Grubbs test for one outlier

data: xG=2.51, U=0.629, p-value=0.108alternative Hypothesis: highest value 4485 is an outlier

Der p-Wert ist grosser als 0.05, daher kann die NH nicht abgelehnt werden.

5.7 Zusammenfassung

Ein paar Fragen

1. Was ist eine Freiheitsgrad? Worum dividiert man bei der empirischen Va-rianz durch n− 1?

2. Was fur verschiedene Tests zur Prufung auf Normalverteilung kennen sie?

3. Was kann man mittels χ2-Test testen?

4. Was ist ein Konfidenzintervall?

5. Wo kann die Student t-Verteilung benutzt werden?

6. Was fur verschiedene t-Tests existieren?

7. Wie kann man einen Ausreisser definieren?

8. Was fur einen Ausreissertest kennen sie? Welche Bedingungen mussenerfullt sein?

Page 60: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

60 KAPITEL 5. STATISTISCHE TESTS

Page 61: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

Kapitel 6

Messfehler

Bei einer Messung konnen grundsatzlich zwei verschiedene Fehler das Messre-sultat verfalschen.

BeispielWir werfen einen Stein aus dem 3. Stock und messen mit einer Stoppuhr, wielange der Stein braucht bis er unten auftrifft. Nun wiederholen wir das Expe-riment ein paar Mal und betrachten die erhaltenen Messwerte. Diese verteilensich gemass der Normalverteilung um den Mittelwert. Wir sehen also, dass dieeinzelnen Messungen zufallig um den Mittelwert verteilt sind. Solche Fehler wer-den statistische Messfehler genannt.Nehmen wir nun an, dass unsere Uhr nicht exakt lauft, was normalerweise derFall ist. Lauft sie zum Beispiel zu langsam, so messen wir grundsatzlich eine zukurze Zeit. Ein solcher Fehler wird systematischer Fehler genannt.

Im folgenden werden wir uns nur um die Behandlung von statistischen Fehlernkummern.

6.1 Ein Messwert

Normalerweise wird eine Messung wiederholt und danach bestimmt man denMittelwert und das Vertrauensintervall.

Die Wiederholung der Messung ergibt viel mehr Information als eine einzigeMessung. Mit der Wiederholung der Messung erhalt man auch eine Informationuber die Unsicherheit des Mittelwertes.

Bei einer einzelnen Messung muss man sich Informationen uber die Messun-genauigkeit σ beschaffen. Man hat verschiedene Moglichkeiten dazu.

1. Schatzung fur σ aus fruheren gleichartigen Messungen.

2. Die Geratebeschreibung enthalt eine Angabe zu σ.

61

Page 62: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

62 KAPITEL 6. MESSFEHLER

6.2 Fehlerfortpflanzung

BeispielWir betrachten zur Vereinfachung eine Messung, bei welcher das Resultat nurvon einer Variable abhangig ist. Nehmen wir dazu das Experiment der Bestim-mung der Federkonstanten D mittels der Schwingungsfrequenz einer Feder ausdem Physikpraktikum

D =4π2m

τ2.

Nehmen wir nun an, dass die Masse m sehr genau gemessen werden kannund daher dieser Fehler sicher viel kleiner ist als derjenigen der Messung derPeriodendauer τ0 = 0.5 s. Die Messung der Periodendauer sei auf ∆τ0 = 0.1 sgenau bestimmt. Um den Fehler der Federkonstante abzuschatzen, nahern wirdie Funktion D(τ) um den Punkt τ = τ0 durch eine Gerade an. Bei mehrdimen-sionalen Funktionen wird die Funktion dann durch eine Ebene approximiert.Diese Prozedur wird Linearisierung der Funktion genannt.

Die Linearisierung der Federkonstante D(τ) um den Punkt τ = τ0 ist gege-ben durch:

D(τ) =4π2m

τ20+

(−2 · 4π2m

τ3

)∣∣∣∣τ=τ0

(τ − τ0) .

Diese funktionelle Abhangigkeit liefert durch Einsetzen von τ = τ0 ±∆τ0

D =4π2m

τ20±∣∣∣∣(−2 · 4π2m

τ30

)∣∣∣∣∆τ0 .

In unserem Fall ergibt dies eine Federkonstante von D = 1.58 N/m und eineUnsicherheit von ±0.06 N/m.

Definition 6.1 (Fehlerfortpflanzung) Nehmen wir an, dass wir eineFunktion f(x1, x2 . . . xn) von mehreren Veranderlichen xi mit den Unsicher-heiten ∆xi haben. Nun wird diese Funktion bezuglich allen Veranderlichenlinearisiert und anschliessend nach Pythagoras die Distanz gemessen (Annah-me: Messgrossen sind unabhangig und normalverteilt). Dies ist dann genau dieabsolute Unsicherheit ∆ des Messresultats.

∆2 =(

∂f∂x1

∆x1

)2

+(

∂f∂x2

∆x2

)2

+ . . .+(

∂f∂xn

∆xn

)2

=n∑

i=1

(∂f∂xi

∆xi

)2

Spezialfalle

1. Funktion ist eine Summe:

f = x1 + x2 ⇒ ∆2 = ∆x21 +∆x2

2

2. Funktion ist ein Produkt

f = xα1 x

β2x

γ3 . . . ⇒

∆2

f2=

(α∆x1

x1

)2

+

(β∆x2

x2

)2

+

(γ∆x3

x3

)2

+ . . .

Page 63: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

6.3. KORRELATION 63

6.3 Korrelation

Haufig haben wir den Fall, dass man zwei Variablen misst und untersucht, obdiese einen Zusammenhang aufweisen; z.B. Messung der Fallzeit und Hohe einesFalles, die Konzentration einer Losung und Absorption von Licht.

6.3.1 Deskriptive Statistik

Es seien n Wertepaare (xi|yi) mit quantitativen Variablen (metrische Daten)erhoben worden. Nun stellt sich die Frage, ob ein Zusammenhang zwischen denGrossen x und y besteht. Dazu erstellt man zuerst einmal ein Streudiagrammund betrachtet dieses.

Es gibt statistische Kennzahlen, welche die Starke des Zusammenhangs be-schreiben. Die Pearson-Korrelation (meist kurz Korrelation genannt) misst Starkeund Richtung des linearen Zusammenhangs.

Definition 6.2 (Pearson-Korrelation) Seien x resp. y die Mittelwerte dersx resp. sy die empirischen Standardabweichungen der Variablen x resp. y, dannberechnet sich der Pearson Korrelationskoeffizient folgendermassen.

r =1

n− 1

((x1 − x)

sx

(y1 − y)

sy+

(x2 − x)

sx

(y2 − y)

sy+ . . .+

(xn − x)

sx

(yn − y)

sy

)

Man sieht, dass die Funktion symmetrisch in x resp. y ist.

Eigenschaften des Pearson Korrelationskoeffizienten

• +1, wenn alle Punkte exakt auf einer Geraden mit positiver Steigungliegen.

• −1, , wenn alle Punkte exakt auf einer Geraden mit negativer Steigungliegen.

• nahe bei -1 oder +1, wenn die Punkte eng um eine Gerade streuen.

• 0, wenn kein linearer Zusammenhang zwischen x und y besteht.

Wichtig: Ein Korrelationskoeffizient soll nie ohne Betrachtung des dazugehori-gen Streudiagramms betrachtet werden. Falls der Zusammenhang nicht linearist kann auch der Rangkorrelationskoeffizient nach Spearman benutzt werden.

Page 64: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

64 KAPITEL 6. MESSFEHLER

6.4 Regression

Falls die Punkte im Streudiagramm ’schon’ auf einer Linie liegen, so kann manversuchen, den Zusammenhang durch eine Funktion zu beschreiben. Dies machtvor allem dann Sinn, falls die Funktion aus theoretischen Uberlegungen be-kannt ist. Dann versucht man durch anpassen der Parameter die Daten so gutwie moglich durch die Funktion zu beschreiben. Diese Suche nach den Parame-tern wird Regression genannt. Ist die Funktion linear in den Parametern, dannkann die Methode aus dem Analysis-Skript benutzt werden. Haufig kann manaber die Werte auch so transformieren, dass man auf einen linearen Zusammen-hang kommt.

BeispielIm Praktikum haben wir den Wasserstand in einem Gefass mit Ausfluss inAbhangigkeit der Zeit gemessen. Dieser Ausfluss sollte gemass Theorie den fol-genden Zusammenhang besitzen:

V (t) = (A−B t)2.

Sind mehr Messpunkte (ti, Vi) als Parameter vorhanden so ist das Gleichungs-system uberbestimmt und man muss definieren, was beste Approximation heisst.Die obige Gleichung konnen wir umformen und erhalten

V (t)− (A−B t)2 = 0 .

Diese Relation sollte fur alle Wertepaare exakt stimmen, falls die Messungenexakt und das Modell exakt die Abhangigkeit der beiden Messwerte voneinan-der angibt. Dies ist aber nie der Fall!!!

Wir definieren zuerst das Residuum ri = Vi − V (ti).

Anmerkungen

Im folgenden werden wir die Regression fur Funktionen behandeln, bei wel-chen wir alles analytisch berechnen konnen. Es tauchen aber auch in der Chemiehaufig Falle auf, welche anders behandelt werden mussen. Im folgenden zahleich ein paar Beispiele auf.

1. Funktionen welche nicht-linear in den Koeffizienten sind

2. verschiedene Unsicherheiten fur verschiedene x−Werte

3. Berucksichtigung, dass x und y Werte Unsicherheiten aufweisen.

Benutzt fur solche Falle doch die Moglichkeit, dass ihr Anspruch auf Statis-tikberatung an unserem Institut habt.

Page 65: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

6.4. REGRESSION 65

6.4.1 Methode der kleinsten Quadrate

Um diese Methode anwenden zu konnen sollten alle Messfehler der Vi in et-wa gleich gross und diejenige der ti viel kleiner als diejenigen der Vi sein. ImPraktikum haben wir die Messwerte die beste Approximation an die Funktion√V = A−Bt gesucht. In diesem Fall sind dann ein paar der obigen Annahmen

nicht mehr genau erfullt. Aber haufig ist eine solche Approximation genugend.Die beste Approximation wird dann erreicht, falls die Summe aller Residuenn∑

j=1

r2j minimal ist.

Wie gut die Daten approximiert werden, wird durch das Bestimmtheits-mass R2 (0 ≤ R2 ≤ 1) angezeigt. Wie im Analysis Skript besprochen sollte nienur das Bestimmtheitsmass zur Kontrolle der Approximation betrachtet werden.

Definition 6.3 (Bestimmtheitsmass) Sei ri das Residuum und y der Mit-telwert aller yi, dann wird das Bestimmtheitsmass folgendermassen berechnet.

R2 = 1−

n∑j=1

r2j

n∑j=1

(yj − y)2

Grafische DarstellungDie Daten sollten in einem Plot als Punkte und die Regressionskurve als Liniedargestellt werden.

Lineare Regression in Koeffizienten

Ein Spezialfall der Regression ist die Anpassung an eine Gerade, welche nichtzwingendermassen durch den Nullpunkt geht (in den meisten praktischen Fallenist der Nullpunkt nicht absolut sicher, sondern das Resultat einer Justierung).In Analysis haben wir gesehen wir man die Regression mit Hilfe von Matrizenberechnet. Hier geben wir einmal die Resultate mit Hilfe von Summen an.

Gleichung:y(x) = ax+ b

Steigung:

a =

n∑i=1

(xiyi − x · y)n∑

i=1

(x2i − x2)

Achsenabschnitt:b = y − ax

Aus der Berechnung des Achsenabschnitts sieht man, dass die Summe der

Residuenn∑

i=1

ri = 0 ist (speziell). Die 2. spezielle Eigenschaft ist, dass das Be-

stimmtheitsmass exakt gleich dem Pearson- Korrelation Koeffizient ist: R2 = r2.

Page 66: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

66 KAPITEL 6. MESSFEHLER

Es gibt 2 grundsatzlich verschiedene Arten die Regression zu benutzen.

1. Wir haben ein lineares Gesetz und bestimmen Konstanten eines Systems(z.B. Bestimmung der Federkonstante)

2. Kalibrationsgerade

Die Unsicherheiten der Koeffizienten a und b kann mit Hilfe der Messwerteberechnet werden. In Analysis haben wir gesehen, dass man die Suche nachder besten Gerade auf ein uberbestimmtes lineares System von Gleichungenkommt, welches durch Ax = B gegeben ist. Die Losung ergibt sich dann durchBerechnung von x = (ATA)−1ATB. Die Unsicherheit der Koeffizienten sinddann durch die Diagonalelemente der folgenden Matrix gegeben.

∆x2 =rT r

(n− 2)

(ATA

)−1

Dabei ist r der Residuenvektor (ri = yi−(axi+b)) undA =

1 x1

1 x2

1 x3

· · ·1 xn

. Dann

ist die Unsicherheit ∆b von b gleich der Wurzel des ersten Diagonalelementes derMatrix ∆x2 und diejenige von a ist die Wurzel des zweiten Diagonalelementes∆a. Um die Vertrauensintervalle der Koeffizienten oder der Kalibriergeraden zuberechnen geht man davon aus, dass die Residuen normalverteilt sind. Dies sollteman ublicherweise noch testen (siehe Kapitel Hypothesentests). Sind die Resi-duen normalverteilt, dann gilt, dass kann man um die Vertrauensintervalle zuerhalten die Unsicherheit mit dem entsprechenden t-Wert (zweiseitig) multipli-zieren. Die Vertrauensintervalle der Parameter sind dann durch a±t1−α/2,n−2∆a

und b± t1−α,/2n−2∆b gegeben.

Man kann auch einen t-Test mithilfe dieser Infos durchfuhren (genaueressiehe folgendes Beispiel).

Mit Hilfe all dieser Informationen kann ein α Prozent Intervall fur den be-rechneten Funktionswert an der Stelle x0 angegeben werden. Wird dies fur vielePunkte x0 berechnet und anschliessend im Graphen eingetragen, so erhalt mandie Fehlertrompeten.

Man berechnet zuerst g(x0) = s2

1

n + (x0−x)2

n∑

i=1

(xi−x)2

mit s2 = 1

n−2

n∑j=1

r2j .

Anschliessend sind die beiden Fehlertrompeten gegeben durch

a · x0 + b ± t1−α/2,n−2

√g(x0)

.

Page 67: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

6.4. REGRESSION 67

Beispiel 1Wir haben im Physikpraktikum die Federkonstante durch anhangen von ver-schiedenen Gewichten an die Feder bestimmt.

Gewicht F [N] Auslenkung x [m]2 0.0194 0.046 0.067 0.071

Da man einen linearen Zusammenhang (mit Achsenabschnitt) erwartet (F =D ·x−D ·x0, D Federkonstante und x0 Gleichgewichtslage). Schreiben wir ein-mal die Gleichungen mit Steigung a und Achsenabschnitt b hin.

2 = a · 0.019 + b

4 = a · 0.04 + b

6 = a · 0.06 + b

7 = a · 0.071 + bDieses Gleichungssystem kann man nun mithilfe von Matrizen schreiben.

Ax = B mit A =

0.019 10.04 10.06 10.071 1

, B =

2467

und x =

(a

b

).

Man macht die folgenden Matrixmultiplikationen und erhalt:

ATA =

(0.010602 0.190.19 4

)

(ATA)−1 =

(634.1 −30.12−30.12 1.6807

)

ATB =

(1.05519

)

Damit berechnet man die Koeffizienten zu x = (ATA)−1ATB =

(96.70.16

)

Ein auslesen aus der Losung ergibt, dass F = 96.7x+ 0.16 ist. Durch Koef-fizientenvergleich erhalt man a = D = 96.7 und b = D · x0 = 0.16. Da es sichum eine Messung mit einer gewissen Unsicherheit handelt, konnen wir nun das95% Vertrauensintervall der beiden Koeffizienten bestimmen.

Dazu mussen wir zuerst die Residuen berechnen.

r = Ax−B =

−0.006020.02473

−0.0412180.02251

Die Residuen mussten nun auf Normalverteilung getestet werden, bei 4 Wer-ten macht das aber wenig Sinn, daher lassen wir das nun weg und berechnendirekt die geschatzten Varianzen der Faktoren.

Page 68: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

68 KAPITEL 6. MESSFEHLER

∆x2 = rTr

(n−2)

(ATA

)−1=

(0.905 −0.043−0.043 0.00240

)

Damit erhalt man also die folgenden Vertrauensintervalle (95%):

a: 96.7± tα/2,4−2

√0.905 = 96.7± 4.1

b: 0.16± tα/2,4−2

√0.00240 = 0.16± 0.21

Wir konnen nun auch einen t-Test durchfuhren (Annahme Residuen sindnormalverteilt) und uns Fragen ob die Federkonstante 100N/m und die Gleich-gewichtslage x0 gleich 0 ist.

Bei der Federkonstanten konnen wir direkt den t-Test (siehe 8.2 t-Wert(FG=4-2)= 4.3) anwenden. (Hinweis: der Wurzelfaktor wurde nicht vergessen!)

t = |100−96.7|√0.905

= 3.47

Damit kann die NH, dass die Federkonstante 100N/m betragt nicht verwor-fen werden.

Um zu testen, ob die Gleichgewichtslage 0 ist, mussen wir zuerst die Gleich-gewichtslage berechnen. Man erhalt durch Koeffizientenvergleich b = −D · x0,

also x0 = −bD = −0.0016. Die Unsicherheit dieses Wertes mussen wir mithilfe

der Fehlerfortpflanzung (partiellen Ableitungen) berechnen.

∆x0 =

√(− 1

D ·∆b)2

+(

bD2∆D

)2

= 5 · 10−4

Damit kann man nun den t-Wert fur die Hypothese x0 = 0 berechnen.

t = |0−(−0.0016)|5·10−4 = 3.19

Man erhalt also, dass die NH nicht verworfen werden.

Zum Abschluss wollen wir noch die Fehlertrompeten zeichnen. Das s2 ist

gleich 0.002654−2 = 0.00143, x = 0.0475 und

n∑i=1

(xi − x)2 = 0.001577 und damit

erhalt man g(x0) = 0.00143(14 + (x0−0.0475)2

0.001577

). In der Abbildung 6.1 sind die

Messwerte, die Approximation und die Fehlertrompeten abgebildet.

Man bemerkt nun, dass die Kurve viel zu genau ist. Von Auge sind die 3 Kur-ven praktisch identisch. Um bei solchen Fallen doch etwas aussagen zu konnentragt man die Residuen auf. Zusatzlich sieht man beim Auftragen der Residu-en, ob ein Trend in den Residuen steckt. Dies wurde darauf hindeuten, dass dieDaten durch durch eine andere Abhangigkeit zusammen verknupft sind, da dieMesspunkte statistisch um den Wert 0 verteilt sein mussen. In der Abbildung6.2 sind die Residuen und die Fehlertrompeten aufgetragen.

Page 69: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

6.4. REGRESSION 69

-2

0

2

4

6

8

10

12

0 0.02 0.04 0.06 0.08 0.1

F

[

N

x[m

Data

Regresssion

Vertrauensband

Abbildung 6.1: In dieser Abbildung sind die Messwerte der Bestimmung derFederkonstanten, die Approximation und die Fehlertrompeten eingezeichnet.

-0.25

-0.2

-0.15

-0.1

-0.05

0

0.05

0.1

0.15

0.2

0.25

0 0.02 0.04 0.06 0.08 0.1

R

e

s

i

d

u

u

m

x[m

Data

Regresssion

Vertrauensband

Abbildung 6.2: In dieser Abbildung sind Residuen der Bestimmung der Feder-konstanten und die Fehlertrompeten eingezeichnet.

Page 70: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

70 KAPITEL 6. MESSFEHLER

Hilfsmittel

1. Statistikprogramm R

Daten seien in den Vektoren x und y, dann fuhrt lm(y x) eine lineare Re-gression durch.

Fur das obiges Beispiel.

Befehl

a=lm(y x)

in a ist alles gespeichert.

summary(a)

Output

lm(formula=y x)

Residuals:1 2 3 4

−0.00602 0.02473 −0.041218 0.02251Coefficients:

Estimate StdError tvalue Pr(> |t|)(Intercept) 0.156 0.049 3.198 0.0854

x 96.7 0.95 102 9 · 10−5 ∗ ∗∗Multiple R-

Squared: 0.9998, adjusted R-Squared 0.9997

Beispiel 2Wir haben im Physikpraktikum den zeitlichen Verlauf des Ausflusses einerFlussigkeit aus einem zylinderformigen Gefass betrachtet. Wir haben gesehen,dass die zeitliche Abhangigkeit der Fullhohe im Gefass dem Gesetz h(t) =at2 + bt + c gehorcht. Im folgenden gebe ich die Daten nicht an und gebe einpaar Grafiken und ein paar p-Werte an.

Der lineare Fit ist in der Abbildung 6.3 ersichtlich. Man sieht direkt, dasseine lineare Funktion die Daten schlecht beschreibt.

Ein χ2Test auf normalverteilung der Residuen ergibt einen p-Wert von 0.57.Die Residuen sind also normalverteilt. Hier sieht man, dass ein normalvertei-lungstest fur die Residuen nicht reicht. Man kann auch die Korrelation derResiduen testen . In diesem Fall zeigt sich, dass die Residuen stark korrelliertsind.

Macht man nun einen quadratische Fit, so erhalt man die Abbildungen 6.4.Man sieht direkt, dass die Funktion viel besser ist.

Page 71: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

6.4. REGRESSION 71

0 20 40 60 80 100 120 140

0.05

0.10

0.15

0.20

linearer Fit

Zeit[s]

Hoe

he [m

]

0 20 40 60 80 100 120 140

−0.

010.

000.

010.

020.

03

Residuen linearer Fit

Zeit[s]

Res

idue

n

Abbildung 6.3: In der Abbildung links sind die Messwerte und der lineare Fitabgebildet. Im rechten Teil habe ich die Residuen geplottet.

0 20 40 60 80 100 120 140

0.05

0.10

0.15

0.20

quadratischer Fit

Zeit[s]

Hoe

he [m

]

0 20 40 60 80 100 120 140

−1e

−03

−5e

−04

0e+

005e

−04

Residuen quadratischer Fit

Zeit[s]

Res

idue

n

Abbildung 6.4: In der Abbildung links sind die Messwerte und der quadratischeFit mit den Konfidenzintervallen abgebildet. Die Konfidenzintervalle sind nichtsichtbar, da sie genau auf der Kurve liegen. Im rechten Teil habe ich die Residuenmit den Konfidenzintervallen geplottet.

Page 72: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

72 KAPITEL 6. MESSFEHLER

Ein χ2Test auf normalverteilung der Residuen ergibt einen p-Wert von 0.53.Die Residuen sind also normalverteilt. In diesem Fall zeigt sich, dass die Resi-duen noch leicht korreliert sind.

6.5 Zusammenfassung

Bei Messungen ergeben sich haufig Daten, welche einen Zusammenhang be-sitzen. Mittels der Methode der Regression konnen die Parameter der Kurvebestimmt werden, welche die beste Approximation ergibt. Es sollte aber ubli-cherweise der funktionale Zusammenhang zwischen den beiden Grossen bekanntsein.

Mittels Residuen muss das Resultat der Regression uberpruft werden. Einer-seits durch die Berechnung des Bestimmtheitsmasses und andererseits grafisch.

Page 73: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

Kapitel 7

Boltzmann Verteilung

Die Boltzmannverteilung beschreibt die Besetzungsverteilung eines physikali-schen Systems im thermischen Gleichgewicht.

7.1 Diskrete Boltzmann Verteilung

Gegeben sei ein quantenmechanisches System mit n moglichen diskreten Ener-giezustanden Ek mit der Temperatur T . Dann ist die Wahrscheinlichkeit pk, esim Zustand mit der Energie Ek zu finden gegeben durch:

Pk = gke−

EkkBT

nj=1 gje

−Ej

kBT

Dabei ist gk die Anzahl der entarteten Energiezustanden mit der Energie Ek,k die Boltzmannkonstante kB = R

Na= 1.38 · 10−23J/K (Na ist die Avogadro-

konstante). Wie ihr vielleicht schon gehort habt entspricht kBT der thermischenEnergie.

Die innere Energie pro Mol ist dann durch den Erwartungswert der Energiegegeben.

U = Na E(E) = Na

n∑k=1

pkEk

Die spezifische Molwarme wird dann durch die Ableitung der inneren Ener-gie nach der Zeit gegeben.

7.1.1 spezifische Molwarme

Wir betrachten ein System mit 2 Energiezustanden, welche nicht entartet sind.Nehmen wir dabei an, dass E1 = 0 und E2 = E ist. Da der Energienullpunktvollig willkurlich ist, kann man immer dies bei den statistischen Betrachtungenimmer machen. Dann ist die Summe der Exponentialfunktionen gegeben durch:

e0 + e− E

kBT = 1+ e− E

kBT , somit ergeben sich die Wahrscheinlichkeiten

73

Page 74: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

74 KAPITEL 7. BOLTZMANN VERTEILUNG

0

0.2

0.4

0.6

0.8

1

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

B

e

s

e

t

z

u

n

g

s

z

a

h

l

Temperatur

0

0.2

0.4

0.6

0.8

1

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

B

e

s

e

t

z

u

n

g

s

z

a

h

l

Temperatur

p1

p2

p1

p2

0

1

2

3

4

5

6

0 2 4 6 8 10

c v

T

0

1

2

3

4

5

6

0 2 4 6 8 10

c v

T

Abbildung 7.1: Links sind die Wahrscheinlichkeiten der beiden Zustande aufge-tragen in Abhangigkeit der Temperatur aufgetragen. Rechts wird die Abhangig-keit der molaren Warmekapazitat eines Systems mit 2 Zustanden von der Tem-peratur gezeigt.

p1 = 1

1+e− E

kBTund p2 = e

− EkBT

1+e− E

kBT

Man erhalt damit eine innere Energie von U = Na(p1E1 + p2E2) =

Na

(0 1

1+e− E

kBT+ E e

− EkBT

1+e− E

kBT

)= NaE

e− E

kBT

1+e− E

kBT.

Die spezifische Molwarme ist dann gegeben durch:

cv = Na·E2

kBT 2

(

1+e− E

kBT

)2 e− E

kBT

7.2 kontinuierliche Boltzmann Verteilung

Man kann eigentlich die diskrete Boltzmann Verteilung benutzen und die Sum-men durch Integrale ersetzen. Man muss sich dazu noch bewusst sein, dass essich am eine kontinuierliche Verteilung handelt. Die Wahrscheinlichkeitsdichtefur ein Teilchen mit der Energie E ist gegeben durch

p(E) = g(E)e− E

kBT

ganze Eg(E)e

− EkBT dE

g(E) ist die Zustandsdichte der Energie E.

7.2.1 Maxwell-Boltzmann Verteilung

Man sucht die Wahrscheinlichkeit, dass ein Teilchen mit der Masse m in ei-nem idealen Gas eine gewisse Geschwindigkeit v besitzt. Die Energie ist dannnaturlich durch die kinetische Energie des Teilchens gegeben (E = 1

2mv2). Dieseist immer grosser gleich 0. Daher sind die Integrationsgrenzen gegeben durchE = 0 und E = ∞. Nun stellt sich noch die Frage, wie gross g(E) ist. DieAnzahl der ’Zustande’ ist proportional zu der Flache der Kugel mit Radius v,

Page 75: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

7.3. ZUSAMMENFASSUNG 75

0

0.0005

0.001

0.0015

0.002

0.0025

0.003

0.0035

0 500 1000 1500 2000

p(v

)

v[m/s]

0

0.0005

0.001

0.0015

0.002

0.0025

0.003

0.0035

0 500 1000 1500 2000

p(v

)

v[m/s]

T = 100KT = 300

T = 2000K

T = 100KT = 300

T = 2000K

Abbildung 7.2: Die Geschwindigkeitsverteilung p(v) vom Gas N2 bei den ange-gebenen Temperaturen.

also zu 4πv2 .

Achtung: Hier ist m die reale Masse des Teilchens nicht die Molmasse.

p(E) = g(E)e− E

kBT

ganze Eg(E)e

− EkBT dE

= 4πv2e− mv2

2kBT

∞∫

0

4πv2e− mv2

2kBT dv

Wir haben gesehen, dass∞∫0

4πv2e− mv2

2kBT dv =(2πkB T

m

) 32 ist. Daher ist die

Wahrscheinlichkeitsdichte gegeben durch:

√2π

(m

kBT

) 32

e− mv2

2kBT

7.3 Zusammenfassung

Die Wahrscheinlichkeit ein physikalisches System mit der Energie E bei der

Temperatur T diesem Zustand zu finden ist proportional zu e− E

kBT . In derQuantenmechanik gibt es dann noch gewisse Einschrankungen, auf welche wirhier nicht eingehen.

Page 76: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

76 KAPITEL 7. BOLTZMANN VERTEILUNG

Page 77: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

Kapitel 8

Tabellen

8.1 Normalverteilung

Werte der Verteilungsfunktion der Standardnormalverteilung fur typische Wertevon z.

z 0.0000 0.0100 0.0200 0.0300 0.0400 0.0500 0.0600 0.0700 0.0800 0.09000.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.53590.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.57530.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.61410.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.65170.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.68790.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.72240.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.75490.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.78520.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.81330.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.83891.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.86211.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.88301.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.90151.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.91771.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.93191.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.94411.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.95451.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.96331.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.97061.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.97672.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.98172.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.98572.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.98902.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.99162.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.99362.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.99522.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.99642.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.99742.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.99812.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986

77

Page 78: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

78 KAPITEL 8. TABELLEN

8.2 Student t Tabelle

Tabelle der Quantile der Student’schen t-Verteilung. Die Zeilen geben bei fes-tem Wert des Freiheitsgrades fur typische Werte von q.

P (x < t) 0.600 0.750 0.900 0.950 0.975 0.990 0.995FG t0.4 t0.25 t0.1 t0.05 t0.025 t0.001 t0.00051 0.325 1.000 3.078 6.314 12.706 31.821 63.6572 0.289 0.816 1.886 2.920 4.303 6.965 9.9253 0.277 0.765 1.638 2.353 3.182 4.541 5.8414 0.271 0.741 1.533 2.132 2.776 3.747 4.6045 0.267 0.727 1.476 2.015 2.571 3.365 4.0326 0.265 0.718 1.440 1.943 2.447 3.143 3.7077 0.263 0.711 1.415 1.895 2.365 2.998 3.4998 0.262 0.706 1.397 1.860 2.306 2.896 3.3559 0.261 0.703 1.383 1.833 2.262 2.821 3.25010 0.260 0.700 1.372 1.812 2.228 2.764 3.16911 0.260 0.697 1.363 1.796 2.201 2.718 3.10612 0.259 0.695 1.356 1.782 2.179 2.681 3.05513 0.259 0.694 1.350 1.771 2.160 2.650 3.01214 0.258 0.692 1.345 1.761 2.145 2.624 2.97715 0.258 0.691 1.341 1.753 2.131 2.602 2.94716 0.258 0.690 1.337 1.746 2.120 2.583 2.92117 0.257 0.689 1.333 1.740 2.110 2.567 2.89818 0.257 0.688 1.330 1.734 2.101 2.552 2.87819 0.257 0.688 1.328 1.729 2.093 2.539 2.86120 0.257 0.687 1.325 1.725 2.086 2.528 2.84521 0.257 0.686 1.323 1.721 2.080 2.518 2.83122 0.256 0.686 1.321 1.717 2.074 2.508 2.81923 0.256 0.685 1.319 1.714 2.069 2.500 2.80724 0.256 0.685 1.318 1.711 2.064 2.492 2.79725 0.256 0.684 1.316 1.708 2.060 2.485 2.78726 0.256 0.684 1.315 1.706 2.056 2.479 2.77927 0.256 0.684 1.314 1.703 2.052 2.473 2.77128 0.256 0.683 1.313 1.701 2.048 2.467 2.76329 0.256 0.683 1.311 1.699 2.045 2.462 2.75630 0.256 0.683 1.310 1.697 2.042 2.457 2.750

Page 79: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

8.3. χ2 − TABELLE 79

8.3 χ2 − Tabelle

Tabelle der Quantile der χ2-Verteilung. Die Zeilen geben bei festem Wert desFreiheitsgrades fur typische Werte von q.

P (x < t) 0.600 0.750 0.900 0.950 0.975 0.990 0.995FG χ2

0.4 χ20.25 χ2

0.1 χ20.05 χ2

0.025 χ20.001 χ2

0.0005

1 0.708 1.323 2.706 3.841 5.024 6.635 7.8792 1.833 2.773 4.605 5.991 7.378 9.210 10.5973 2.946 4.108 6.251 7.815 9.348 11.345 12.8384 4.045 5.385 7.779 9.488 11.143 13.277 14.8605 5.132 6.626 9.236 11.070 12.833 15.086 16.7506 6.211 7.841 10.645 12.592 14.449 16.812 18.5487 7.283 9.037 12.017 14.067 16.013 18.475 20.2788 8.351 10.219 13.362 15.507 17.535 20.090 21.9559 9.414 11.389 14.684 16.919 19.023 21.666 23.589

10 10.473 12.549 15.987 18.307 20.483 23.209 25.18811 11.530 13.701 17.275 19.675 21.920 24.725 26.75712 12.584 14.845 18.549 21.026 23.337 26.217 28.30013 13.636 15.984 19.812 22.362 24.736 27.688 29.81914 14.685 17.117 21.064 23.685 26.119 29.141 31.31915 15.733 18.245 22.307 24.996 27.488 30.578 32.80116 16.780 19.369 23.542 26.296 28.845 32 34.26717 17.824 20.489 24.769 27.587 30.191 33.409 35.71818 18.868 21.605 25.989 28.869 31.526 34.805 37.15619 19.910 22.718 27.204 30.144 32.852 36.191 38.58220 20.951 23.828 28.412 31.410 34.170 37.566 39.99721 21.991 24.935 29.615 32.671 35.479 38.932 41.40122 23.031 26.039 30.813 33.924 36.781 40.289 42.79623 24.069 27.141 32.007 35.172 38.076 41.638 44.18124 25.106 28.241 33.196 36.415 39.364 42.980 45.55925 26.143 29.339 34.382 37.652 40.646 44.314 46.92826 27.179 30.435 35.563 38.885 41.923 45.642 48.29027 28.214 31.528 36.741 40.113 43.195 46.963 49.64528 29.249 32.620 37.916 41.337 44.461 48.278 50.99329 30.283 33.711 39.087 42.557 45.722 49.588 52.33630 31.316 34.800 40.256 43.773 46.979 50.892 53.672

Page 80: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

80 KAPITEL 8. TABELLEN

8.4 Kolmogorov Smirnov Test

∆max > Tabellenwert =⇒ Nicht normalverteilt

Anzahl Messwerte N Signifikanzlevel0.2 0.15 0.1 0.05 0.01

1 0.9 0.93 0.95 0.98 12 0.68 0.73 0.78 0.84 0.933 0.57 0.6 0.64 0.71 0.834 0.49 0.53 0.56 0.62 0.735 0.45 0.47 0.51 0.57 0.676 0.41 0.44 0.47 0.52 0.627 0.38 0.41 0.44 0.49 0.588 0.36 0.38 0.41 0.46 0.549 0.34 0.36 0.39 0.43 0.5110 0.32 0.34 0.37 0.41 0.4911 0.31 0.33 0.35 0.39 0.4712 0.3 0.31 0.34 0.38 0.4513 0.28 0.3 0.33 0.36 0.4314 0.27 0.29 0.31 0.35 0.4215 0.27 0.28 0.3 0.34 0.416 0.26 0.27 0.3 0.33 0.3917 0.25 0.27 0.29 0.32 0.3818 0.24 0.26 0.28 0.31 0.3719 0.24 0.25 0.27 0.3 0.3620 0.23 0.25 0.26 0.29 0.3625 0.21 0.22 0.24 0.27 0.3230 0.19 0.2 0.22 0.24 0.2935 0.18 0.19 0.21 0.23 0.27

> 35 1.07/√N 1.22/

√N 1.36/

√N 1.52/

√N 1.63/

√N

Page 81: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

8.5. GRUBBS-TEST (AUSREISSERTEST) 81

8.5 Grubbs-Test (Ausreissertest)

PW = |xi−x|sx

, ist PW >Tabellenwert(P%,N), so liegt ein Ausreisser vor.

n 95% 97.5% 99%3 1.154 1.155 1.1554 1.481 1.491 1.55 1.715 1.742 1.7836 1.887 1.933 2.027 2.02 2.081 2.2178 2.127 2.201 2.3839 2.215 2.3 2.52410 2.29 2.383 2.64511 2.355 2.455 2.7512 2.412 2.519 2.84313 2.462 2.574 2.92414 2.507 2.624 2.99715 2.548 2.669 3.06316 2.586 2.71 3.12317 2.62 2.748 3.17718 2.652 2.782 3.22619 2.681 2.814 3.27220 2.708 2.843 3.31421 2.734 2.871 3.35322 2.758 2.897 3.38923 2.78 2.921 3.42324 2.802 2.944 3.45525 2.822 2.965 3.48426 2.841 2.986 3.51327 2.859 3.005 3.53928 2.876 3.023 3.56429 2.893 3.041 3.58830 2.908 3.058 3.61

Page 82: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

Institut für Angewandte Simulation ZHAW LSFM

Forschungsprojekte

iGräser App – Pflanzen bestimmen leicht ge-macht

Prognosesystem für nachhaltiges Verkehrs-management

Expertensystem für Werbeartikel

Mit iGräser kann man die 111 häufigsten ein-heimischen Wald- und Freiland-Grasarten (Po-aceae) der Schweiz sowohl im nicht-blühen-den als auch im blühenden Zustand einfach, schnell, zuverlässig und unter Einbezug der Verbreitungsdaten via GPS-Ortung bestim-men. Die App ermöglicht ein mobiles Lernen (E-Learning) für die Studierenden.Im Rahmen des Projektes wurden vom Institut für Angewandte Simulation mit wissenschaftlich systematischem Vorgehen «Effiziente Bestim-mungsalgorithmen» entwickelt. Die programm-technische Umsetzung für iPhone und Android erfolgte ebenfalls am IAS.

Projektpartner:Institut für Umwelt und Natürliche Ressourcen, Fachstelle Vegetative Analyse.Info Flora Schweizhttp://www.igraeser.ch

Das richtige Werbegeschenk zu finden ist eine langwierige, repetitive Aufgabe. Durch intelligenten Einsatz von bekanntem Wissen über die Zielgruppen, Einsicht in die Struktur des Verkaufsgesprächs und dem Einsatz von statistischer Programmierung können nun die Ressourcen von Lieferanten und Käufern bes-ser und zielführender eingesetzt werden, ohne dabei die Fachkompetenz der Verkäufer aus-ser Acht zu lassen. Das Resultat ist die vom IAS in Zusammenarbeit mit der HSG erstellte Experten-Plattform dayzzi.com.

Projektpartner:Institut für Marketing Universität St.Gallen dayzzi (Schweiz) AG

Förderung:Kommission für Technologie und Innovation KTI

Die zunehmende Stauhäufigkeit im Verkehr, die mit grossen Kosten für die Umwelt und die Gesellschaft verbunden ist, konfrontiert die Strassenbenutzer/-innen und die Stras-senbetreiber mit dem Problem, die Strassen-nutzung zu optimieren. Dafür braucht es ein intelligentes Verkehrsmanagement, welches das Verkehrsgeschehen gesamthaft überblickt und es erlaubt, die Entwicklung des Verkehrs-zustandes vorauszusehen. Solche Verkehrs-prognosen ermöglichen es, mit frühzeitigen Massnahmen den Verkehr besser zu verteilen und gewisse Stauspitzen schon vor der Ent-stehung zu brechen.

Im Rahmen dieses Projektes werden die Rah-menbedingungen, die ein solches innovatives Verkehrsprognosesystem erfüllen muss, unter-sucht und ein entsprechendes System für das Schweizer Nationalstrassennetz mit den dafür geeigneten Prognosemethoden und Algorith-men entwickelt. Projektpartner: RappTrans AG, Bundesamt für Strassen ASTRA Projektförderung: Bundesamt für Strassen ASTRA

Page 83: Mathematik 2 · 2018-02-21 · Kapitel 1 Vorwort Es handelt sich hier um eine sehr knappe Einfuhrung in die wichtigsten Begriffe¨ und Methoden der Statistik. Spezielles Gewicht

Institut für Angewandte Simulation ZHAW LSFM

Lehrangebot des IAS

BT CH LM UI FM

Studien-vorbereitung

Vorkurs Mathematik

Vorkurs Physik

eLearning-Einheit Mathi-Fitnessstudio

eLearning-Einheit Energie

eLearning-Einheit Hydrostatik

eLearning-Einheit Kalorik

Angebote imBachelor-Programm

Informatik Informatik Informatik Informatik Informatik

Mathematik Mathematik Mathematik Mathematik Mathematik

Physik Physik Physik Physik

Statistik Statistik Statistik Statistik

SCM SCM

Sys. Eng.

Literaturar.

Semesterarbeiten

Bachelor-Thesis

Angebote in Master-programmen

Data Management and Visualisation (T4)

Modeling of Complex Systems (T15)

SCM

Statistik

Biostatistik

Master-Thesis