115
Statistik Dr. rer. nat. J¨ urgen Vogel 13. Februar 2005

Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Embed Size (px)

Citation preview

Page 1: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Statistik

Dr. rer. nat. Jurgen Vogel

13. Februar 2005

Page 2: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Diese Seite bleibt fur gewohnlich weiß

Page 3: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Inhaltsverzeichnis

I Deskriptive Statistik 7

1 Grundbegriffe 91.1 GrundgesamtheitGrundgesamtheit und Merkmale . . . . . . . . . 91.2 Ermittlung von Beobachtungswerten . . . . . . . . . . . . . . . . 101.3 Quellen wirtschaftsstatistischer Daten . . . . . . . . . . . . . . . 10

2 Haufigkeitsverteilungen 112.1 Prim. Haufigkeitstabelle . . . . . . . . . . . . . . . . . . . . . . . 112.2 Sekundare Haufigkeitstabelle (Klassenbildung) . . . . . . . . . . 132.3 Grafische Darstellung von Haufigkeiten . . . . . . . . . . . . . . . 14

2.3.1 Fur metrische Daten . . . . . . . . . . . . . . . . . . . . . 142.3.2 Fur ordinale Daten . . . . . . . . . . . . . . . . . . . . . . 162.3.3 Fur nominale Daten . . . . . . . . . . . . . . . . . . . . . 16

3 Statistische Maßzahlen 173.1 Lageparameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3.1.1 Arithmetisches Mittel . . . . . . . . . . . . . . . . . . . . 173.1.2 Der empirische Median (Zentralwert) . . . . . . . . . . . . 183.1.3 Modalwert (Modus) . . . . . . . . . . . . . . . . . . . . . 183.1.4 Gewogenes arithmetisches Mittel . . . . . . . . . . . . . . 193.1.5 Geometrisches Mittel . . . . . . . . . . . . . . . . . . . . . 19

3.2 Streuungsmaße . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193.2.1 Empirische Varianz . . . . . . . . . . . . . . . . . . . . . . 193.2.2 Quartilsabstand . . . . . . . . . . . . . . . . . . . . . . . 20

3.3 Box-Whisker-Plot . . . . . . . . . . . . . . . . . . . . . . . . . . . 213.4 Empirische Momente . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.4.1 Interpretation von Exzess und Schiefe . . . . . . . . . . . 23

4 Indexzahlen 274.1 Empirische Indizes . . . . . . . . . . . . . . . . . . . . . . . . . . 274.2 Zusammengesetzte Indizes . . . . . . . . . . . . . . . . . . . . . . 27

4.2.1 Indexformeln . . . . . . . . . . . . . . . . . . . . . . . . . 284.3 Einige Indizes aus der Wirtschaft der BRD . . . . . . . . . . . . 29

5 Zusammenhange zwischen Merkmalen 315.1 Der empirische Korrelationskoeffizient . . . . . . . . . . . . . . . 315.2 Der Rangkorrelationskoeffizient . . . . . . . . . . . . . . . . . . . 325.3 Kontingenzkoeffizient . . . . . . . . . . . . . . . . . . . . . . . . . 33

3

Page 4: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

4

6 Lineare Regression 376.1 Einfache Lineare Regression . . . . . . . . . . . . . . . . . . . . . 376.2 Curvilineare Regression . . . . . . . . . . . . . . . . . . . . . . . 39

6.2.1 Weitere Beispiele fur linear transformierbare Ansatze . . . 40

7 Wahrscheinlichkeitsrechnung 417.1 Zufallige Ereignisse . . . . . . . . . . . . . . . . . . . . . . . . . . 41

7.1.1 Beziehungen zwischen Ereignissen und Operationen mitEreignissen . . . . . . . . . . . . . . . . . . . . . . . . . . 42

7.2 Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . 447.2.1 Eigenschaften von Wahrscheinlichkeiten . . . . . . . . . . 45

7.3 Wahrscheinlichkeitsverteilungen . . . . . . . . . . . . . . . . . . . 457.4 Diskrete Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . 467.5 Stetige Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . 477.6 Parameter von Verteilungen . . . . . . . . . . . . . . . . . . . . . 49

7.6.1 Weitere Parameter . . . . . . . . . . . . . . . . . . . . . . 497.7 Spezielle diskrete Verteilungen . . . . . . . . . . . . . . . . . . . 50

7.7.1 Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . 507.7.2 Hypergeometrische Verteilung . . . . . . . . . . . . . . . . 507.7.3 Poissonverteilung . . . . . . . . . . . . . . . . . . . . . . . 51

7.8 Spezielle stetige Verteilungen . . . . . . . . . . . . . . . . . . . . 517.8.1 Rechteckverteilung . . . . . . . . . . . . . . . . . . . . . . 517.8.2 Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . 52

7.9 Grenzwertsatze . . . . . . . . . . . . . . . . . . . . . . . . . . . . 537.9.1 Zentraler Grenzwertsatz . . . . . . . . . . . . . . . . . . . 53

II Schliessende Statistik 55

8 Grundbegriffe der schl. Stat. 57

9 Wichtige Stichprobenfunktionen 599.1 Das Stichprobenmittel . . . . . . . . . . . . . . . . . . . . . . . . 599.2 Die Stichprobenvarianz . . . . . . . . . . . . . . . . . . . . . . . . 599.3 Die Verteilungen von X und S2 fur normalverteiltes Merkmal . . 60

10 Punktschatzungen 6310.1 Definition und Beispiele . . . . . . . . . . . . . . . . . . . . . . . 6310.2 Wunschenswerte Eigenschaften . . . . . . . . . . . . . . . . . . . 63

11 Bereichsschatzungen 6711.1 Definitionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6711.2 Quantile von Prufverteilungen . . . . . . . . . . . . . . . . . . . . 68

11.2.1 Standardnormalverteilung . . . . . . . . . . . . . . . . . . 6811.2.2 t-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . 6911.2.3 χ2-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . 70

11.3 Konfidenzintervalle fur die Parameter eines normalverteilten Merk-mals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7111.3.1 Konfidenzintervall fur µ . . . . . . . . . . . . . . . . . . . 7111.3.2 Konfidenzintervall fur σ2 = D2X . . . . . . . . . . . . . . 72

TU-Ilmenau: Statistik

Page 5: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

5

11.3.3 Konfidenzintervall fur σ = DX . . . . . . . . . . . . . . . 7211.4 Konfidenzintervall fur eine Wahrscheinlichkeit p . . . . . . . . . . 72

12 Signifikanztests 7512.1 Grundbegriffe der Testtheorie . . . . . . . . . . . . . . . . . . . . 7512.2 Paramtertests fur normalverteiltes Merkmal . . . . . . . . . . . . 76

12.2.1 Herleitung des einfachen t-Tests . . . . . . . . . . . . . . . 7612.2.2 Der χ2-Streuungstest . . . . . . . . . . . . . . . . . . . . . 77

12.3 Test auf Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . 78

13 Statistische Qualitatskontrolle 7913.1 Kontrollkarten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

13.1.1 Die x-Karte . . . . . . . . . . . . . . . . . . . . . . . . . 7913.1.2 Die x/s Karte . . . . . . . . . . . . . . . . . . . . . . . . . 8113.1.3 Die p-Karte . . . . . . . . . . . . . . . . . . . . . . . . . . 82

13.2 Stichprobenplane . . . . . . . . . . . . . . . . . . . . . . . . . . . 8313.3 Kennwerte fur OC-Funktionen . . . . . . . . . . . . . . . . . . . 84

14 Anpassungstests 8714.1 Der χ2-Anpassungstest . . . . . . . . . . . . . . . . . . . . . . . . 8714.2 Test auf Normalverteilung mittels Schiefe und Exzess . . . . . . . 88

15 Unabhangigkeit von Merkmalen 9115.1 Zweidimensionale Verteilungen . . . . . . . . . . . . . . . . . . . 9115.2 Unabhangigkeit von Zufallsgroßen . . . . . . . . . . . . . . . . . 9215.3 Unkorreliertheit von Zufallsgroßen . . . . . . . . . . . . . . . . . 9315.4 Test auf Unabhangigkeit/Unkorreliertheit . . . . . . . . . . . . . 9315.5 χ2-Unabhangigkeitstest . . . . . . . . . . . . . . . . . . . . . . . 94

16 Stichprobenvergleiche 9716.1 Der doppelte t-Test (Mittelwerttest) . . . . . . . . . . . . . . . . 9716.2 Die F-Verteilung (R.A. Fisher) . . . . . . . . . . . . . . . . . . . 9816.3 Der F-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9916.4 Varianzanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10016.5 Der Vorzeichen-Test . . . . . . . . . . . . . . . . . . . . . . . . . 102

A Klausuraufgaben 105A.1 Klausur Statistik 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 105

A.1.1 Aufgabe 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . 105A.1.2 Aufgabe 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 106A.1.3 Aufgabe 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . 107A.1.4 Aufgabe 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . 107A.1.5 Aufgabe 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

A.2 Klausur Statistik 2 . . . . . . . . . . . . . . . . . . . . . . . . . . 109A.2.1 Aufgabe 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . 109A.2.2 Aufgabe 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 109A.2.3 Aufgabe 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . 110A.2.4 Aufgabe 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . 111A.2.5 Aufgabe 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

TU-Ilmenau: Statistik

Page 6: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht
Page 7: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Teil I

Deskriptive Statistik

7

Page 8: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht
Page 9: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Kapitel 1

Grundbegriffe

1.1 GrundgesamtheitGrundgesamtheit und Merk-male

Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersuchtwerden soll.Merkmal: Diese Eigenschaft [Maßeinheit]Auspragungen: Werte, die das Merkmal annehmen kannDie Elemente der Grundgesamtheit nennt man Untersuchungseinheiten oderstatistisches Element. Sie tragen die Information. Grundgesamtheit muss klardefiniert sein, also abgrenzen: sachlich, zeitlich, ortlich.

Beispiele

Studienwunsch von Abiturienten. Grundgesamtheit: Alle Schuler von 12.Klassen in Thuringen im April 2004. Untersuchungseinheit: Schuler. Merk-mal: 1. Studienwunsch. Auspragungen: WI, WIW, Medizin, Jura, . . .

Altersstruktur der deutschen Bevolkerung. Grundgesamtheit: DeutscheBevolkerung am 31.12.2003 . Untersuchungseinheit: Einwohner Deutsch-lands. Merkmal: Lebensalter [Jahre]. Auspragungen: 0,1,2, . . . , 120

Volkswirtschaftliche Daten der Lander. Grundgesamtheit: Alle Staaten,die am 31.12.2003 der EU angehorten. Untersuchungseinheit: Staat. Merk-male:

– BIP [Mrd. ¿ ]. Auspragungen: 23,1 . . . 2129,2

– Arbeitslosenquote [%]. Auspragungen: 3,7 . . . 11,3

– Inflationsrate [%]. Auspragungen: 1,0 . . . 4,0

Statistische Untersuchungen verlangen viele Untersuchungseinheiten, weilstatistische Gesatzmaßigkeiten erst bei Beteiligung vieler offenbar werden. Ur-sache: Gesetz der großen Zahlen.

9

Page 10: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

10

Beispiel: Wurf einer Munze Grundgesamtheit: Alle Munzwurfe am 07.04.2004in HS2. Untersuchungseinheit: Munzwurf. Merkmal: Oben liegende Seite. Aus-pragungen: Zahl, Wappen.

Anzahl der Wurfe davon Wappen rel. Haufigkeit3 2 0,6667

300 148 0,49331000 478 0,478010000 4984 0,498424000 12012 0,5005

Gesetzmaßigkeit: Die Wahrscheinlichkeit, dass beim Wurf mit einer Munze“Wappen” oben liegt betragt 0,5. Die tatsachlich gemessenen oder beobachtetenMerkmalswerte nennt man Beobachtungswerte. Die 1. Auflistung solcher Wertenennt man Urliste.

1.2 Ermittlung von Beobachtungswerten

Befragung (mundlich, schriftlich)

Beobachtung (z.B. Verkehrszahlung)

Experiment (z.B. Intelligenztest)

Automatische Erfassung (z.B. Computer, Zahlwerk)

Sekundarerhebung (z.B. Veroffentlichung, statistisches Jahrbuch)

Datenerfassung kann erfolgen als:

Vollerhebung (Grundgesamtheit prufen) (z.B. Volkszahlung)

Teilerhebung (z.B. Mikro-Zensus)

Die Teilerhebung ist die Voraussetzung fur die schließende Statistik. Hier:Beobachtungswerte = Stichprobe.

1.3 Quellen wirtschaftsstatistischer Daten

Amtliche Statistiken

– Statistische Jahrbucher (UN, EU, Bund, Lander, Stadte)

– Zeitschrift “Wirtschaft & Statistik”

– Ressortstatistiken der Ministerien (z.B. Arbeitslosenstatistik von derBundesagentur fur Arbeit)

Nicht amtliche Statistiken

– Betriebsstatistiken

– Statistiken von Wirtschaftsverbanden, Forschungsinstituten, Meinungs-forschungsinstituten

TU-Ilmenau: Statistik

Page 11: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Kapitel 2

Haufigkeitsverteilungen

Bezeichnungen :Merkmale:

X, Y, Z

Beobachtungswerte:x1, x2, x3, . . . , xn

y1, y2, y3, . . . , ym

Beobachtungsumfang = Stichprobenumfang:

n

Anliegen :Urliste meist unubersichtlich, Verteilung der Beobachtungswerte sichtbar ma-chen.

Vorbereitender Schritt :Eventuell: Ordnen der Beobachtungswerte der große nach (ordinal Skala). Zuresthat man die Urliste, nach der Ordnung eine Variationsreihe:

x(1), x(2), . . . , x(n)

mitx(1) ≤ x(2) ≤ . . . ≤ x(n)

2.1 Prim. Haufigkeitstabelle

Sinvoll, wenn die meisten Auspragungen in der Urliste mehrfach vorkommen.Es seien:

X

ein Merkmal,a1, a2, . . . , ak

die Auspragungen von X,x1.x2, . . . , xn

11

Page 12: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

12

die Beobachtungswerte zu X, wobei gilt,

n > k

Beispiel 1 :Abweichungen vom Sollmaß: (eine bestimmte Lange von Teilen aus der laufen-den Produktion) [µm]Urliste: 3, 2,−1,−2, 0, 1, 2,−1, 1, 0, 0, 0, 0,−4, 3, 1,−2,−1,−3, 4n=20Auspragungen:

-4 -3 -2 -1 0 1 2 3 4a1 a2 a3 a4 a5 a6 a7 a8 a9

Absolute Haufigkeit :der Auspragung aj (j = 1, 2, . . . , k).

hj = h(aj) (2.1)

“Anzahl des Auftretens von aj in der Urliste”

Relative Haufigkeit :der Auspragung aj(j = 1, 2, . . . , k)

fj = f(aj) =h(aj)

n(2.2)

Es gilt:k∑

j=1

hj = n ;k∑

j=1

fj = 1 (2.3)

Die Summe uber alle Absoluten Haufigkeiten ist gleich dem Stichprobenumfangund die Summe uber alle Relativen Haufigkeiten ist 1.

Zum Beispiel 1 :Haufigkeitstabelle in Minimalformj aj hj Strichliste fj Summenhaufigkeit Hj Summenhaufigkeit Fj

1 -4 1 1 0,05 1 0,052 -3 1 1 0,05 2 0,103 -2 2 2 0,10 4 0,204 -1 3 3 0,15 7 0,355 0 5 5 0,25 12 0,606 1 3 3 0,15 15 0,757 2 2 2 0,10 17 0,858 3 2 2 0,10 19 0,959 4 1 1 0,05 20 1,0

Kummulative Haufigkeit (Summenhaufigkeit) :Absolut:

Hj =j∑

i=1

hi (2.4)

TU-Ilmenau: Statistik

Page 13: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

13

Relativ:

Fj =j∑

i=1

fj (2.5)

In einer primaren Haufigkeitstabelle ist die gesamte Information der Urliste nochenthalten.

2.2 Sekundare Haufigkeitstabelle (Klassenbildung)

Ziel: Informationsgehalt verdichten, um Gesetzmaßigkeiten besser sichtbar zumachen.Methode: Benachbarte oder ahnliche Auspragungen werden zu Klassen zusam-mengefasst.a2 Mitte der 2.ten Klasseaj Mitte der j.ten Klassehi absolute Haufigkeit der i.ten Klassefi relative Haufigkeit der i.ten KlasseSekundare Haufigkeitstabelle :

Klasse Mitte abs. Hfgk. rel. Hfgk.(-4,5;-2,5) -3,5 2 0,10[-2,5;-0,5) -1,5 5 0,25[-0,5;1,5) 0,5 8 0,40[1,5;4,5) 3,0 5 0,25∑

20 1,00Regeln fur das erstellen von sekundaren Haufigkeits-Tabellen: Eigentlich nie we-niger als 5 Klassen bilden. Eindeutige Klassenbezeichnungen wahlen (genau indie Mitte von 2 Werten gehen). Mitte in der Mitte lassen (Intervall). Moglichstaquidistante Klasseneinteilungen wahlen, da die Anzeige sonst verfalscht wird(aquidistant bedeutet gleichbreite Klassen). In unserem Beispiel sind die Klas-sen 2 bzw. 3 µm breit. Offene Flugelklassen vermeiden. Die Anzahl der Klassenhangt vom Stichprobenumfang ab. Anzahl m der Klassen:

n m50 . . . 200 5 . . . 12

200 . . . 1000 121000 . . . 10 . . . 20

Faustformel:

m = 1 + 1, 44 ∗ ln n (2.6)

aj hj

-3,5 2-1,5 50,5 83,0 5

TU-Ilmenau: Statistik

Page 14: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

14

2.3 Grafische Darstellung von Haufigkeiten

2.3.1 Fur metrische Daten

1. HistogrammAbweichungen vom Sollmaß

Beachte:

(a) Abzisse metrisch skalieren, nicht Klassen-Namen sondern die Abwei-chungen.

(b) Ordinate: absolute oder relative Haufigkeiten, Fußpunkt der Saulensoll 0 sein, keine Lucken zwischen die Saulen, es sei denn, man mochtedie Haufigkeit 0 darstellen.

(c) Histogramm ermoglicht auch die Darstellung nicht aquidistanter Klas-sen. Dabei gilt:

i. Flacheninhalt ∼ Haufigkeit.ii. Ordinate bedeutungslos.iii. Da am Flacheninhalt ausgerichtet, mußman breitere oder kurzere

Klassen beachten und darf die Hohe nicht einfach blind eintragen(Klasse 4 hat nur eine Hohe von 3,33)

TU-Ilmenau: Statistik

Page 15: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

15

2. Haufigkeitspolygonnur fur aquidistante Klassen oder primare Haufigkeitstabellen.

(a) Punkt ist uber der Klassenmitte bzw. Auspragung.

(b) Ordinate: Nullpunkt = Fußpunkt.

(c) Beide zusatzlichen Flugelklassen mit einzeichnen.

TU-Ilmenau: Statistik

Page 16: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

16

2.3.2 Fur ordinale Daten

1. BalkendiagrammDie Balkenhohe sollte der Haufigkeit entsprechen, Lucken mussen zwi-schen den Balken gezeichnet werden, sonst Verwechslung mit Histogrammmoglich.Mitgliederzahlen in einem Verband:

2.3.3 Fur nominale Daten

1. Balkendiagramm

2. Kreisdiagramm

(a) Winkel ∼ Haufigkeit

(b) ϕi = hi

n = 360

TU-Ilmenau: Statistik

Page 17: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Kapitel 3

Statistische Maßzahlen

3.1 Lageparameter

3.1.1 Arithmetisches Mittel

Fur metrische Daten:

x =1n

n∑

i=1

xi (3.1)

Fur gehaufte Daten:

x =1n

k∑

j=1

ajhj (3.2)

Fur gruppierte Daten (sekundares Haufigkeitsdiagramm):

x =1n

m∑

j=1

ajhj (3.3)

Beispiel 1 Abweichungen vom Sollmaß:

x =120

(3 + 2− 1− 2− 0 + . . . + 4) =120∗ 3 = 0, 15µm

Die Abweichungen vom Sollmaß betragen im Mittel 0, 15µm. Oder: Die Teilewerden mit einem systematischen Fehler von 0, 15µm produziert. Zum Vergleichx aus der Klasseneinteilung.

x =120

(−3, 5 ∗ 2− 1, 5 ∗ 5 + 0, 5 ∗ 3 + 3, 0 ∗ 5) =120∗ 4, 5 = 0, 225

Minimaleigenschaft des arithmetischen Mittels: Die mittlere quadratische Ab-weichung der Beobachtungswerte xi von einer reellen Zahl a:

1n

=n∑

i=1

(x− i− a)2 (3.4)

wird genau dann minimal, wenn a = x

17

Page 18: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

18

3.1.2 Der empirische Median (Zentralwert)

x?1, x

?2, . . . , x

?n geordnete Stichprobe fur ordinale Daten.

Med =

x?

n+12

falls n ungerade12 (x?

n2

+ x?n2 +1) falls n gerade

(3.5)

Vereinfacht: Die Halfte aller Beobachtungswerte ist kleiner als der Median, dieandere Halfte ist großer.

Beispiel 2 7 zufallig ausgewahlte SchulerMerkmal X = Mathe-Note; Stichprobe: 2, 1, 2, 5, 3, 4, 3Variationsreihe: 1 = x?

1, 2 = x?2, 2 = x?

3, 3 = x?4, 3 = x?

5, 4 = x?6, 5 = x?

7; n=7, alsoungerade

Med = x?7+12

= x?4

Beispiel 1 Abweichungen vom Sollmaßn=20, also gerade.

Med =x?

10 + x?11

2=

0 + 02

Minimaleigenschaft des Medians: Die mittlere absolute Abweichung der Beob-achtungswerte von einer reellen Zahl a,

1n

n∑

i=1

| xi − a |

wird minimal, wenn a der Median ist.

3.1.3 Modalwert (Modus)

Fur nominale Daten. Der Modalwert befindet sich dort, wo das Histogrammseinen Hohepunkt hat. Definition:Mod = aj mit hj ≥ hi fur alle i = 1, 2, . . . , kWenn es nur einen Modalwert gibt, dann nennt man das Unimodal. Modalwertist die Auspragung mit der großten Haufigkeit (entsprechend: modale Klasse).

Beispiel 1 Abweichungen vom Sollmaß

Mod = 0

Beispiel 2 Mathe Noten

Mod = 2 ∧Mod = 3

Modalwerte: 2 und 3.

TU-Ilmenau: Statistik

Page 19: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

19

3.1.4 Gewogenes arithmetisches Mittel

Fur metrische Daten. Beobachtungswerte sollen mit unterschiedlichen Gewich-ten in die Mittelwertbildung eingehen:

xgew =∑n

i=1 xigi∑ni=1 gi

(3.6)

Beispiel :3 Arbeiter am Fließband schaffen 450, 430 bzw. 500 Stuck pro Stunde. Letzte-rer arbeitet 4h taglich, die beiden anderen jeweils 8h. welche durchschnittlicheArbeitsleistung erbringen die 3 Arbeiter zusammen?

xgew =450 ∗ 8 + 430 ∗ 8 + 500 ∗ 4

20= 452[Stueck/Stunde]

Wenn man nicht gewichtet hatte so ergabe sich x = 460.

3.1.5 Geometrisches Mittel

Fur metrische, positive Daten. Einleitendes Beispiel: Der Wert eines Warenkor-bes wachst jahrlich mit den Faktoren c1, c2, . . . , cn und erreicht nach n-Jahrenden Wert

Wn = W0∗c∗c∗c∗. . .∗c =⇒ cn = c1∗c2∗c3∗. . .∗cn =⇒ c = n√

c1 ∗ c2 ∗ . . . ∗ cn = n

√Wn

W0

xgeo = n√

x1 ∗ x2 ∗ . . . ∗ xn (3.7)

xn > 0Wachstumsrate im i.ten Jahr

ri := (ci − 1) ∗ 100%

r = (cgeo − 1) ∗ 100%

Es gilt: xgeo ≤ xBeispiel: Familie Muller verbraucht im 1. Jahr 6200 KWh Heizenergie, im 6.Jahr 5055 KWh. Wie groß ist die mittlere Jahrliche Wachstumsrate bei dieserHeizenergie?

cgeo = 5

√50556200

≈ 0, 96 ⇒ r = (0, 96− 1) ∗ 100 = −4%

3.2 Streuungsmaße

3.2.1 Empirische Varianz

Fur metrische Daten.

s2 =1

n− 1

n∑

i=1

(xi − x)2 =1

n− 1

[(n∑

i=1

x2i

)− n ∗ x2

](3.8)

Fur gruppierte metrische Daten:

s2 ≈ 1n

∑(x2

i ∗ hi

)− x (3.9)

TU-Ilmenau: Statistik

Page 20: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

20

Mittlere Quadratische Abweichung der Beobachtungswerte vom arith-metischen Mittel . Bei gruppierten Daten:

s2 ≈ 1n− 1

m∑

j=1

(aj ∗ hj)− n ∗ x2 (3.10)

Wobei aj die klassenmitte bezeichnet, und x die Naherung fur x aus der se-kundaren Haufigkeitstabelle.

Empirische Standardabweichung:

s =√

s2

Variationskoeffizient (normierte Standardabweichung, sie dient zum Vergleichvon Streuungen auf verschiedenen Skalen):

v =s

x∗ 100%

Beispiel 1 Abweichungen vom Sollmaß

s2 =119

[(3− 0, 15)2 + . . . + (4− 0, 15)2

] ≈ 4, 24[µm]

s =√

4, 24 ≈ 2, 06[µm]

Die Abweichungen vom Sollmaß schwanken mit der empirischen Varianz 4, 24µm2

um den Mittelwert. Aus der Klasseneinteilung ergibt sich:

s2 = 4, 30; s = 2, 07

3.2.2 Quartilsabstand

Fur ordinale Daten. Man braucht hierzu die Variationsreihe x?1, x

?2, . . . , x

?n mit

x?1 ≤ x?

2 ≤ . . . ≤ x?n. dxe bedeutet, x soll auf die nachste ganz Zahl aufgerundet

werden.

Unteres Quartil:

x0,25 :=

12 (x?

n4

+ x?n4 +1) falls n durch 4 teilbar

xdn4 e sonst (3.11)

Oberes Quartil:

x0,75 :=

12 (x?

3n4

+ x?3n4 +1

) falls n durch 4 teilbarxd 3

4 ne sonst (3.12)

Quartilsabstand:d 75

25= x0,75 − x0,25 (3.13)

TU-Ilmenau: Statistik

Page 21: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

21

Beispiel 1 Abweichungen vom SollmaßVariationsreihe: (n = 20)−4,−3,−2,−2,−1,−1,−1, 0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 3, 3, 4

x0,25 =12(x?

5 + x?6); x0,75 =

12(x?

15 + x?16)

x0,25 = −1; x0,75 = 1, 5

d = 1, 5− (−1) = 2, 5

Beispiel 2 Mathe NotenVariationsreihe: (n = 7)1, 2, 2, 3, 3, 4, 5

x0,25 = x?2 = 2

x0,75 = x?6 = 4

d 7525

= 2

3.3 Box-Whisker-Plot

Fur ordinale Daten. Grafische Darstellung von 5 Meßdaten: xmin, unteres Quar-til, Median, oberes Quartil, xmax

Beispiel 1 Abweichungen vom Sollmaß

Bemerkungen:

Zum Box-Plot gehort eine Skala

Box-Plots sind besonders sinnvoll zum Vergleich mehrerer Haufigkeitsver-teilungen

TU-Ilmenau: Statistik

Page 22: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

22

Die Spannweite R = xmax − xmin = D wurde fruher als Streungsmaßbenutzt

3.4 Empirische Momente

Fur metrische Daten.

Anfangsmoment:

MA;k =1n

n∑

i=1

xki (3.14)

Zentralmoment:

MZ;k =1n

n∑

i=1

(xi − x)k (3.15)

k-ter Ordnung (k = 1, 2, 3, . . .). Schon benutzt: MA;1 = x ; MZ;1 = 0 ; MZ;2 =n−1

n s2

Noch interessant: MZ;3 ; MZ;4

Empirische Schiefe:

Sch =MZ;3

(MZ;2)32

(3.16)

(−∞ < Sch < ∞)

Exzess (Wolbung):

Exz =MZ;4

(MZ;2)2− 3 (3.17)

(−3 < Exz < ∞)

TU-Ilmenau: Statistik

Page 23: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

23

3.4.1 Interpretation von Exzess und Schiefe

Symmetrisch (Schiefe = 0):

Rechtsschief (Schiefe > 0) (linkssteil):

TU-Ilmenau: Statistik

Page 24: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

24

Linksschief (Schiefe < 0) (rechtssteil):

Normal gewolbt (Exzess = 0) (Wolbung der Gaußschen Glocke) (mesokur-tisch):

TU-Ilmenau: Statistik

Page 25: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

25

Spitz gewolbt (Exzess > 0) (leptokurtisch)

Flach gewolbt (Exzess < 0) (platykurtisch)

Schiefe und Exzess werden benotigt, um zu beurteilen, ob ein Merkmal normal-verteilt sein kann.

TU-Ilmenau: Statistik

Page 26: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

26

Beispiel 1 Abweichungen vom Sollmaß

MZ;2 =120

20∑

i=1

(xi − x)2 = 4, 0275[µm]2

MZ;3 =120

20∑

i=1

(xi − x)3 = −0, 466[µm]4

MZ;4 =120

20∑

i=1

(xi − x)4 = 40, 985[µm]4

Sch =−0, 466

(4, 0275)32≈ −0, 06

Exz =40, 9854, 02752

− 3 ≈ −0, 47

Die Haufigkeitsverteilung ist symmetrisch und leicht flach gewolbt.

TU-Ilmenau: Statistik

Page 27: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Kapitel 4

Indexzahlen

Index ist der Quotient zweier gleichartiger Maßzahlen, wobei der Nenner dieBasis reprasentiert.

4.1 Empirische Indizes

Gegeben sei eine Reihe von Beobachtungswerten xo, x1, x2, . . .Wahl eines Basiszeitpunktes z.B. t = 0

I0T :=xk

x0∗ 100% (4.1)

Liefert fur t = 0, 1, 2, . . . eine folge einfacher Indizes I00, I01, . . ..

Beispiel Anzahl der Studierenden an deutschen Hochschulen im Winterseme-ster [Tsd.]

t Jahr Anzahl Index I0t Index I5t

0 1960 247 100 % 13,7 %1 1970 422 170,9 % 23,5 %2 1980 1036 419,4 % 57,6 %3 1990 1719 696,0 % 95,6 %4 1995 1858 752,2 % 103,3 %5 2000 1799 728,3 % 100 %

Basis 1960 Basis 2000Umbasieren von t = 0 auf t = k:

Ikt =I0t

I0k(4.2)

4.2 Zusammengesetzte Indizes

Beobachtungswerte werden zunachst gewichtet, bevor man sie ins Verhaltnissetzt. Wichtung kann fiktiv sein, z.B. Sterbeziffer der Stadt A, wenn sie dieAltersstruktur der Stadt B hatte. Fur die Wirtschaft:

Preisindex

27

Page 28: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

28

Mengenindex

Umsatzindex

Im Nenner: Basiszeitpunkt (-zeitraum): “BaZ”Im Zahler: Berichtszeitpunkt (-zeitraum): “BeZ”

Beispiel Durchschnittlicher Verbrauch an Fleisch der privaten Haushalte unddie Fleischpreise einer Gemeinde in einem Monat:

Fleischsorte Preis BaZ Preis BeZ Menge BaZ Menge BeZRindfleisch (kochen) 3,8 3,5 1,45 1,41Rindfleisch (braten) 6,0 6,2 1,31 1,04

Schweinefleisch 4,5 4,3 4,74 4,43

Preisindex:

Ip =∑3

i=1 MengeBaZ ∗ PreisBeZ∑3i=1 MengeBaZ ∗ PreisBaZ

=3, 5 ∗ 1, 45 + 6, 2 ∗ 1, 31 + 4, 3 ∗ 4, 743, 8 ∗ 1, 45 + 6, 0 ∗ 1, 31 + 4, 5 ∗ 4, 74

≈ 96, 77%

Der Fleischpreis ist im Mittel um 3,2 % gefallen.Der Preisindex setzt die Preise von BeZ und BaZ ins Verhaltnis. Die Ver-brauchsmengen fungieren als Gewichte. Im Zahler und Nenner wird einheit-lich gewichtet. Zum Baz: Laspeyres-Index, zum BeZ: Paasche-Index. Allgemein:Von k Gutern seien fur BaZ und BeZ die Mengen und die Preise bekannt.Gut Preis BaZ Preis BeZ Menge BaZ Menge BeZ1 p01 p11 q01 q11

2 p02 p12 q02 q12

......

......

...k p0k p1k q0k q1k

4.2.1 Indexformeln

Umsatzindex:

I(u) =∑

p1i ∗ q1i∑p0i ∗ q0i

(4.3)

Laspeyres :Preisindex:

I(p)L =

∑p1i ∗ q0i∑p0i ∗ q0i

(4.4)

Mengenindex:

I(q)L =

∑p0i ∗ q1i∑p0i ∗ q0i

(4.5)

TU-Ilmenau: Statistik

Page 29: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

29

Paasche :Preisindex:

I(p)P =

∑p1i ∗ q1i∑p0i ∗ q1i

(4.6)

Mengenindex:

I(q)P =

∑p1i ∗ q1i∑p1i ∗ q0i

(4.7)

Beispiel Fleischverbrauch

I(p)L ≈ 96, 77%

I(q)L ≈ 90, 87%

I(p)P ≈ 96, 51%

I(q)P ≈ 90, 63%

I(u) ≈ 87, 70%

4.3 Einige Indizes aus der Wirtschaft der BRD

Werden alle nach Laspeyres berechnet

1. Preisindex fur die Lebenserhaltung. Es gibt 4 Stuck:

Alle Private Haushalte

4 Personen (Arbeitnehmer) mit mittlerem Einkommen

4 Personen (Beamte) mit hoherem Einkommen

2 Personen (Rentner / Sozialhilfeempfanger)

Warenkorb aus 750 Waren und Dienstleistungen, 400000 Preisreihen aus100 Gemeinden, einfacher bis mittlerer Qualitat.

2. Index der Einzelhandelspreise:Verkaufspreise inkl. MwSt. des Einzelhandels, 600 Waren, auch Maschinen,LKW, Buroeinrichtungen, keine Dienstleistungen.

3. Index der GroßhandelsverkaufspreiseVerkaufspreise exkl. MwSt., 800 Waren, 7000 Preisreihen.

4. Produktionsindex fur das produzierende GewerbeIndex der kurzfristigen Wirtschaftsentwicklung, Mengenindex! Nettopro-duktionsleistungen einzelner Wirtschaftszweige. → Gesamtindex mittelsWichtung nach Bruttowertschopfung.

5. Lohnindizes

Nominallohnindizes

– Index der tariflichen Stundenlohne– Index der Monatsgehalter

(Preisindizes)

TU-Ilmenau: Statistik

Page 30: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

30

Reallohnindex=NominallohnindexPreisindex

6. Der Deutsche AktienindexPreisindex der 30 wichtigsten deutschen Aktien (blue-chips). Basis: 31.12.1987.Aktienkapital alle 15 s berechnet durch die Deutsche Borse AG. Basis =1000.

TU-Ilmenau: Statistik

Page 31: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Kapitel 5

Zusammenhange zwischenMerkmalen

X, Y seien zwei untereinander verbundene Merkmale. An jeder Untersuchungs-einheit werden beide Merkmale beobachtet. Stichprobe (x1, y1), (x2, y2), . . . , (xn, yn)(Beobachtungspaare)

Beispiel Nettosozialprodukt und StaatsverschuldungGrundgesamtheit: Alle Staaten der Erde am 31.12.2003.X Nettosozialprodukt im zuruckliegenden Jahr.Y Staatsverschuldung am 31.12.2003.Gesucht wird eine Maßzahl fur den Zusammenhang zwischen X und Y .

5.1 Der empirische Korrelationskoeffizient

X und Y sind metrisch skaliert. x, y, sx, sy seien die empirischen Mittelwerteund Standardabweichungen der x- bzw. y-Werte. Empirischer Korrelationskoef-fizient von X und Y (Bravais/Pearson):

rxy =1

n−1

∑ni=1(xi − x) ∗ (yi − y)

sx ∗ sy(5.1)

oder:

rxy =1

n−1 (∑n

i=1 (xi ∗ yi))− n ∗ x ∗ y

sx ∗ sy(5.2)

Eigenschaften des Korrelationskoeffizienten :

1. Es gilt −1 ≤ rxy ≤ 1

2. rxy = ryx

3. rxy misst den linearen Zusammenhang zwischen X und Y . rxy = 0 → keinlinearer Zusammenhang zwischen X und Y . rxy = ±1 → Alle Beobach-tungspaare liegen auf einer Geraden. Somit bestunde direkter Zusammen-hang.

31

Page 32: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

32

4. r2xy gibt an, zu wieviel Prozent sich die Beziehung durch lineare Abhangig-

keit erklaren lassen.

Beispiel Niederschlag und KornertragJahr xi yi x2

i y2i xi ∗ yi

1981 30 403,6 900 162892,96 12108,01982 51 339,5 2601 115260,25 17314,51983 112 395,5 12544 156420,25 442961984 61 435,1 3721 189312,01 26541,11985 23 428,8 529 183869,44 9862,41986 113 396,9 12769 157529,61 44849,71987 64 444,5 4096 197580,25 284481988 15 406,1 225 164917,21 6091,51989 16 346,0 256 119716 55361990 33 335,9 1089 112828,81 11084,7

Das ergibt:x = 51, 8

y = 393, 19

sx = 36, 35871

sy = 39, 92080

rxy =1

n−1

∑ni=1 xi ∗ yi − n ∗ x ∗ y

sx ∗ sy

=19 [206131, 9− 10 ∗ 51, 8 ∗ 393, 19]

36, 36 ∗ 39, 92≈ 0, 188

Es besteht kein linearer Zusammenhang zwischen Regenmenge und Hektarertrag(−1 und 1 wurden Abhangigkeit bedeuten).

5.2 Der Rangkorrelationskoeffizient

Von Spearman fur Ordinal skalierte Daten. Stichprobe mit WertepaarenRangzahlen:Rg(xi) Position von xi in der geordneten x-Reihe.Rg(yi) Position von yi in der geordneten y-Reihe.Der kleinste xi-Wert hat den Rang Rg(xi) = 1, der großte xi Wert den Rangn. Berechnet man den emp. Korrelationskoeffizienten mit den Rangzahlen stattder Originalwerte (Rg(xi) statt xi) erhalt man den Spearmanschen Rangkorre-lationskoeffizienten.

ϕ =∑n

i=1 Rg(xi) ∗Rg(yi)− n∗(n+1)2

4√(∑n

i=1 Rg(xi)2 − n(n+1)2

4 ) ∗ (∑n

i=1 Rg(yi)2 − n(n+1)2

4 )(5.3)

TU-Ilmenau: Statistik

Page 33: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

33

Beispiel Abhangigkeit vom Sitzplatz im Horsaal zu der KlausurnoteX Entfernung zum Pult [m]Y Punkte in der Statistik Arbeit

i xi yi Rg(xi) Rg(yi)1 3,6 7,5 1,5 12 3,6 21 1,5 133 4,3 26 3,5 154 4,3 13 3,5 45 5,0 16,5 5,5 5,56 5,0 17,5 5,5 9,57 6,0 17 7 7,58 6,9 8 8 29 7,75 25,5 9,5 1410 7,75 28 9,5 1711 8,5 26,5 11 1612 9,3 20 12,5 11,513 9,3 11 12,5 314 11,0 16,5 16,5 5,515 11,0 17 16,5 7,516 10,0 20 14,5 11,517 10,0 17,5 14,5 9,5

ϕ = 0, 080(r = 0, 12)

Es besteht kein Zusammenhang zwischen Sitzplatz und Note.Hinweise:

1. Kommen gleiche Auspragungen mehrmals vor, so gibt man beiden dengleichen Rang, und zwar den Mittelwert aus den in der Reihenfolge zuvergebenden Rangen (Rang 12 und 13 haben die gleiche zugrunde liegen-de Auspragung, so bekommen beide die 12,5; Rang 12, 13, 14 mit dergleichen zugrunde liegenden Auspragung wurde bedeuten, alle bekommenden Rang 13).

2. Sind keine mittleren Rangzahlen vergeben worden, vereinfacht sich dieFormel zu:

ϕ = 1− 6∑n

i=1 d2i

n ∗ (n2 − 1)

wobei di = Rg(xi)−Rg(yi). Im Beispiel:

1− 6 ∗ 74617 ∗ (172 − 1)

≈ 0, 086 ≈ ϕ

Ergebnis falsch, wir haben mittlere Rangzahlen.

5.3 Kontingenzkoeffizient

Fur nominale Daten oder Klasseneinteilung.

TU-Ilmenau: Statistik

Page 34: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

34

Beispiel Epidemie Untersuchung mit 120 PatientenX HeilungserfolgY BehandlungsmethodeKontingenztafel (2-dimensionale Haufigkeitsverteilung), Frage: git es einenZusammenhang?

X\Y rein symptomatisch ubliche Dosis doppelte Dosisschnell geheilt 14 22 32langsam geheilt 14 10 4

gestorben 16 8 0Allgemein:Merkmal X mit Auspragungen: a1, a2, a3, . . . , an

Merkmal Y mit Auspragungen: b1, b2, b3, . . . , bn

Stichprobe vom Umfang n (x1, y1), (x2, y2), . . .hij : absolute Haufigkeiten der Auspragung (aibj) in der Stichprobe.Kontingenztafel:

X\Y b1 b2 . . . bl

a1 h11 h12 . . . h1l h1·a2 h21 h22 . . . h2l h2·...

......

. . ....

...ak hk1 hk2 . . . hkl hk·

h·1 h·2 . . . h·l h·· = n

mit den Randhaufigkeiten:

h·j =k∑

i=1

hij

hi· =l∑

j=1

hij

Es bezeichnen eij := h·j∗hi·n die Erwartungshaufigkeiten. Wurde man alle hij

durch eij ersetzen erhalt man eine Kontingenztafel mit den selben Randsum-men die den Fall “X und Y sind unabhangig” reprasentiert. Große Unterschiedezwischen hij und eij bedeuten Abhangigkeit zwischen X und Y . Um eine Kon-tingenztafel zu konstruieren, die vollige Unabhangigkeit der Merkmale zeigensoll, kann man folgenden Ansatz verwenden:

hij = eij =hi· ∗ h·j

n

Die Stichproben Funktion :

Pearsonsches Chi-Quadrat:

χ2 =k∑

i=1

l∑

j=1

(hij − eij)2

eij= n

k∑

i=1

l∑

j=1

h2ij

hi· ∗ h·j− 1

(5.4)

TU-Ilmenau: Statistik

Page 35: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

35

Kontingenzkoeffizient:

C =

√χ2

χ2 + n(5.5)

Normierter Kontingenzkoeffizient:

CNorm = C ∗√

min(k, l)min(k, l)− 1

(5.6)

Es gilt:0 ≤ CNorm ≤ 1CNorm ≈ 0 ⇒ X und Y unabhangigCNorm ≈ 1 ⇒ X und Y abhangig, stark

TU-Ilmenau: Statistik

Page 36: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht
Page 37: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Kapitel 6

Lineare Regression

Fur metrische Daten. Begriff Regression von Galton. Universales Gesetz derRegression.

6.1 Einfache Lineare Regression

X,Y : zwei verbundene Merkmale.Frage: Welche Gerade, y = a + bx ist am besten geeignet, den Zusammenhangzu beschreiben? Die Regressionsgerade mit y = a + b ∗ x

Beispiel 11 private Haushalte werden nach ihrem monatlichen Nettoeinkom-men [¿ ] und ihren monatlichen Konsumausgaben [¿ ] befragt:Haushalt i Nettoeinkommen xi Konsum yi

1 1780 16002 1480 14803 1540 15004 2070 17505 3390 23006 1900 17507 4220 27508 2800 20509 2700 185010 3990 250011 4600 3000

Die Regressionskoeffizienten a undb werden nach der Methode der klein-sten Quadrate (MKQ) bestimmt.

a, b :n∑

i=1

(yi − a− b ∗ xi) → Min

Also muss hier nun die Ableitung gebildet werden. 1. Ableitung:

δ

δa

∑(yi − a− bxi)2 = 2

∑(yi − a− bxi)

37

Page 38: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

38

δ

δb

∑(yi − a− bxi)2 = −2

∑(yi − a− bxi) ∗ xi

Null setzen:

(1)∑

(yi − a− bxi) =∑

yi − n + a− b ∗∑

xi = 0

(2)∑

(xi ∗ gi − a ∗ xi − b ∗ x2i ) =

∑xi ∗ yi − a

∑xi − b

∑x2

i = 0

Die Losung der Gleichung liefert extremwertverdachtige Punkte. Mit 1n mul-

tiplizieren:

(1)1n

∑yi − a− b

1n

∑xi = y − a− b ∗ x

(2)1n

∑xi ∗ yi − a

1n

∑xi − b

1n

∑x2

i =1n

∑xi ∗ yi − a ∗ x− b ∗ 1

n

∑x2

i = 0

(1) in (2) nach a umgeformt einsetzen:

1n

∑xi ∗ yi − (y − b ∗ x− b ∗ 1

n

∑x2

i = 0

1n

∑xiyi − x ∗ y = b ∗ (

1n

∑x2

i − x2)

b =1n

∑xi ∗ yi − x ∗ y

1n

∑x2

i − x2=

∑x ∗ yi − n ∗ x ∗ y∑

x2i − n ∗ x2

Optimale Regressionskoeffizienten:

b =1

n−1 [∑

xi ∗ yi − n ∗ x ∗ y]1

n−1 [∑

x2i − n ∗ x2]

=1

n−1

∑(xi − x) ∗ (yi − y)

1n−1

∑(xi − x)2

(6.1)

b = rxy ∗ sy

sx

a = y − b ∗ x

TU-Ilmenau: Statistik

Page 39: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

39

In unserem Beispiel:x = 2770, 00 ; sx = 1128, 450 ; r = 0, 988 ; y = 2048, 18 ; sy = 520, 323

b = 0.988 ∗ 520, 3231128, 45

≈ 0, 456

a = 2048, 18− 0, 456 ∗ 2770 ≈ 786, 3

Als Regressionsgerade ergibt sich somit:

y = 0, 456 ∗ x + 786, 3

Interpretation: Bei Erhohung der Nettoeinkunfte um ¿ 100 werden im Mittel¿ 45,60 mehr fur Konsum ausgegeben. Vorsicht bei Interpretationen außerhalbdes Wertebereichs: Bei ¿ 0 Einkunft sind im Mittel ¿ 786,3 fur Konsum ausge-geben worden???

6.2 Curvilineare Regression

Wortbedeutung: Nichtlineare Regressionsansatze, die sich mittels Transforma-tion auf lineare Ansatze zuruckfhren lassen.

Beispiel Ein Thuringer Getrankehandler verandert alle 3 Wochen systema-tisch den Preis von Kostritzer Schwarzbier, um die Auswirkungen auf den Ab-satz zu ergrunden.xi Preis [¿ /Stuck] yi Absatz [Stuck] ln xi ln yi

0,57 2140 -0,562 7,6690,54 2400 -0,616 7,7830,47 4120 -0,755 8,3240,59 1980 -0,528 7,5910,49 3060 -0,713 8,026

Zur Anpassung soll eine Absatzfunktion mit konstanter Preiselastizitat benutztwerden.x: Preis ; y: Absatz

ε =dyy

dxx

=dydxyx

= const = b

b = y′ ∗ x

y

y′ = b ∗ y

x

Diese Differenzialgleichung hat die Losung: y = a ∗xb. Welche Parameter a undb passen die Funktion optimal an und welcher 3 Wochen Absatz ist bei einemPreis von ¿ 0,52/Flasche zu erwarten ?

TU-Ilmenau: Statistik

Page 40: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

40

Der Ansatz y = a ∗ xb ist nicht linear in a und b. Durch Logarithmieren er-gibt sich: ln y = ln a+ b∗ ln x. Die lineare Regression fur die Punkte (lnxi; ln yi)liefert:b = −2, 999; ˆln a = 5, 975 ⇒ a = e5,975 = 393, 4 Daraus folgt fur die Regressi-onsfunktion: y = 393, 4 ∗ x2,999 Optimale Werte waren: b = −3, 144; a = 3292,diese erreichen wir auf diese Weise nicht, da wir nur nahern. Das Verfahren istdamit nach MKQ nicht optimal.2796 Flaschen Absatz sind zu erwarten.

6.2.1 Weitere Beispiele fur linear transformierbare Ansatze

Exponentialfunktion: y = a ∗ ebx → ln y = ln a + b ∗ xTornquist-Funktion (Sattigungsfunktion): y = x

a+b∗x → 1y = a ∗ 1

x + b

Logistische Funktion: y = 1a+b∗e−x → 1

y = a + b ∗ e−x

Zur Beurteilung der Gute der Anpassung kann man die Stichprobenreststreu-ung benutzen.

σ2 =1

n− 2

∑(yi − yi)2

Dabei ist yi der Wert der Regressionsfunktion an der Stelle xi. Je kleiner σ2

desto besser die Anpassung.

TU-Ilmenau: Statistik

Page 41: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Kapitel 7

Wahrscheinlichkeitsrechnung

7.1 Zufallige Ereignisse

Zufalliger Versuch: Versuch (in einem sehr weiten Sinne), der unter gleichenaußeren Bedingungen beliebig oft wiederholbar ist (zumindest gedanklich), unddessen Ausgang im Rahmen verschiedener Moglichkeiten ungewiss ist.Beispiele:

1. Werfen einer Munze

2. Messen einer Lange [cm]

3. Bestimmung der Anzahl der Patienten in einem Wartezimmer

4. Zufallige Auswahl einer Person und Befragung nach ihrem Alter [Jahre]

Ergebnismenge: Menge aller moglichen, sich gegenseitig ausschließenden Ausgangeeines zufalligen Versuches. Bezeichnung: Ω.

1. Ω = Zahl, Wappen2. Ω = (0, ∞)

3. Ω = 0, 1, 2, . . . , 174. Ω = 2, 3, . . . , 111

Die Elemente von Ω heißen Ergebnisse. Die Teilmengen von Ω heißen zufalligeEreignisse. Die einelementige Teilmengen ω von Ω nennt man Elementarer-eignisse.

1. A=Wappen ist das Ereignis mit der Munze Wappen zu werfen.

2. B = [12,∞) ist das zufallige Ereigniss, Langen von uber 12 [Maßeinheit]zu messen.

3. C = 0, 1, 2, 3 ist das zufallige Ereignis, dass sich im Wartezimmer nichtmehr als 3 Patienten befinden.

4. D = 20 ist das Ereignis das die ausgewahlte Person 20 Jahre alt ist.

41

Page 42: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

42

Gegeben seien zufallige Ereignisse A,B, C ⊂ Ω. Die Darstellung erfolgt inVenn Diagrammen. Wenn das Elementarereignis ω1 realisiert wird, dann trittA ein. Wennn das Elementarereignis ω2 realisietr wird, tritt A nicht ein. Einenzufalligen Versuch durchzufuhren heißt ein Ergebnis ω ∈ Ω zufallig auszuwahlen(zu realisieren).

7.1.1 Beziehungen zwischen Ereignissen und Operationenmit Ereignissen

C := A ∪B “oder”

TU-Ilmenau: Statistik

Page 43: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

43

C := A ∩B “und”

Ω heißt sicheres Ereignis, ∅ heißt unmogliches Ereignis.A = Ω\A “nicht A”

TU-Ilmenau: Statistik

Page 44: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

44

A ⊂ B “A zieht B nach sich”

A ∩B = ∅ “miteinander unvereinbar”

7.2 Wahrscheinlichkeit

Definition (Kolmogorov, 1933): Eine Funktion P, die jedem Ereignis eine re-elle Zahl zuordnet heißt Wahrscheinlichkeitsmaß, wenn sie folgenden Axiomengenugt:

(A1): P (A) ≥ 0 fur alle A ⊂ Ω

(A2): P (Ω) = 1

(A3): P (∪Ai) =∑

P (Ai), wenn Ai ∩ Aj = ∅ fA¼r i 6= j (wenigstens einsder Ereignisse tritt ein.

Sprechweise: P (A) nennt man Wahrscheinlichkeit von A.

TU-Ilmenau: Statistik

Page 45: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

45

7.2.1 Eigenschaften von Wahrscheinlichkeiten

(1) A ∩B = ∅ ⇒ P (A ∪B) = P (A) + P (B)

(2) P (A) = 1− P (A)

(3) P (∅) = 0

(4) A ⊂ B ⇒ P (A) ≤ P (B)

(5) 0 ≤ P (A) ≤ 1∀A ⊂ Ω

(6) P (A ∪B) = P (A) + P (B)− P (A ∩B)

(7) P (A ∪B) ≤ P (A) + P (B)

Spezialfall: klassische Wahrscheinlichkeit (LaPlace, 1812)

Ω bestehe aus n Elementen die alle gleich wahrscheinlich sind. P (ω) = 1n fur

alle ω ∈ Ω. Dann gilt: P (A) = 1n + 1

n + . . . + 1n = m

n = Anz.ElementeAAnz.ElementeΩ .

Beispiel :Wie groß ist die Wahrscheinlichkeit bei 3 Wurfeln mit einem Wurfel mindestensSechs zu wurfeln (Start bei Mensch argere dich nicht). A . . . mindestens eineSechs. A . . . keine Sechs. Ω = (e1, e2, e3)|ei ∈ 1, 2, 3, 4, 5, 6. ei . . . Ergebnisdes i-ten Wurfes.Ω hat 63 Elemente.A hat 53 Elemente.⇒ P (A) = 1− P (A) = 1− 53

63 ≈ 0, 42

7.3 Wahrscheinlichkeitsverteilungen

Zufallsgroße: Funktion Ω → RModellvorstellung: Im Rahmen einens zufalligen Versuches wird “durch Zufall”ein sogenanntes Ergebnis aus Ω gewahlt. Die Realisierung x = X(ω) von X istals Versuchsergebnis beobachtbar.

Beispiel :Ω sei zerlegbar in B und B. Ω = B ∪ B, B ∩ B = ∅ω ∈ B . . . “gut”ω ∈ B . . . “schlecht”Zufallsgroße

X(ω) :=

1 , wenn ω ∈ B0 , wenn ω ∈ B

Zweipunkt-Verteilung: P (x = 1) := P (B), P (x = 0) := 1− P (B)

TU-Ilmenau: Statistik

Page 46: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

46

diskrete Zufallsgroße :Der Werteberiech von X ist eineendliche oder abzahlbar unendli-che Menge (meist ganze Zahlen).Beispiele: Anzahl der Faden-bruche in einer Webmaschiene,Anzahl der Kunden, Lange einerWarteschlange [in Personen].Die Wahrscheinlichkeitsver-teilung einer ZufallsgroßeX ist bekannt wenn man:Zu jedem Wert, den X anneh-men kann, die Wahrscheinlich-keit kennt, mit der er angenom-men wird. pi = P (X = xi).

stetige Zufallsgroße :Der Wertebereich von X ist dieMenge der reellen Zahlen oderein Intervall.Beispiele: Fullmenge einerMilchflasche, Wartezeit bei . . .,Lange eines Werkstucks.Die Wahrscheinlichkeitsver-teilung einer Zufallsgroße Xist bekannt wenn man: Vonjedem Intervall weiß, wie großdie Wahrscheinlichkeit ist, dassX Werte in diesem Intervall ann-nimmt. P (X ∈ I)

7.4 Diskrete Verteilungen

x1, x2, . . . Werte, die die Zufalssgroße X annehmen kann.p1, p2, . . . Wahrscheinlichkeit, mit denen X den Wert xi annimmt.Es muß gelten: 0 ≤ pi ≤ 1;

∑pi = 1

Beschreibungsmoglichkeiten :

Tabelle, z.B.:xi 0 1pi

23

13

Formel, z.B.: P (X = k) = (1− p) ∗ pk

(k = 0, 1, 2) fur ein p ∈ (0, 1) (“geometrische Verteilung”)

Diagramm z.B.:

TU-Ilmenau: Statistik

Page 47: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

47

7.5 Stetige Verteilungen

Fur jeden Einzelwert x gilt P (X = x) = 0. Angabe der Verteilungen durch eineVerteilungsdichte f |R→ R+ Es muss gelten: f(x) ≥ 0 und

∫∞−∞ f(x)dx = 1

Bestimmung von Wahrscheinlichkeiten :x1: Untergrenze des Intervalls dessen Wahrscheinlichkeit bestimmt werden soll.x2: Obergrenze des Intervalls dessen Wahrscheinlichkeit bestimmt werden soll.

P (x1 ≤ X ≤ x2) = P (x1 < X < x2) =∫ x2

x1

f(x)dx

P (X < x) =∫ x

−∞f(s)ds = F (x)

F (x): Verteilungsfunktion. Es gilt: f(x) = ddxF (x)

TU-Ilmenau: Statistik

Page 48: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

48

Beispiel : Exponentialverteilung mit Parameter λ > 0

f(x) =

λe−λx fur x > 00 fur x < 0

TU-Ilmenau: Statistik

Page 49: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

49

7.6 Parameter von Verteilungen

X sei eine Zufallsgroße, die dis-kret verteilt ist.Auf dem Punkte x1, x2, . . . mitden Einzelwerten P (X = xi) =pi. Der Erwartungswert ist:

EX =∑

xi ∗ pi

Interpretation: Mittelpunkt,Schwerpunkt.Varianz=Streuung:

D2X =∑

((xi − EX)2 ∗ pi)

Interpretation: Mittlere Quadra-tische Abweichung vom Erwar-tungswert.Standardabweichung:

DX =√

D2X

Wurzel aus der Standardabwei-chung.

X sei eine Zufallsgroße, die ste-tig verteilt ist.Mit der Dichte f . Der Erwar-tungswert ist:

EX =∫ ∞

−∞x ∗ f(x)dx

Interpretation: Mittelpunkt,Schwerpunkt.Varainz=Streuung:

D2X =∫ ∞

−∞(x−EX)2 ∗ f(x)dx

Interpretation: Mittlere Quadra-tische Abweichung vom Erwar-tungswert.Standardabweichung:

DX =√

D2X

Wurzel aus der Standardabwei-chung.

Bemerkungen

1. EX und D2X mussen nicht existieren.

2. Es sei g|R→ R eine stetige Funktion. Dann ist g(x) eine Zufallsgroße, undes gilt:

diskret: Eg(x) =∑

g(xi) ∗ pi

stetig: Eg(x) =∫∞−∞ g(x) ∗ f(x)dx

3. Es gilt: D2X = E(x−EX)2 = E(X2)− (EX)2 mit E =∫∞−∞ x2 ∗ f(x)dx

4. Es gilt: E(x1 + x2 + . . . + xn) = Ex1 + Ex2 + . . . + Exn

5. Es gilt: D2(x1 + x2 + . . . + xn) = D2x1 + D2x2 + . . . + D2xn Wenn dieZufallsgroßen x1, x2, . . . , xn voneinander unabhangig sind.

7.6.1 Weitere Parameter

Schiefe: (wenn symmetrisch, dann S = 0)

S =E(x− EX)3

(DX)3

Exzess:

W =E(x−EX)4

(DX)4− 3 (−3 < W < ∞)

TU-Ilmenau: Statistik

Page 50: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

50

7.7 Spezielle diskrete Verteilungen

7.7.1 Binomialverteilung

Mit den Parametern n und p. (n ∈ N, 0 < p < 1)

P (X = k) =(

n

k

)∗ pk ∗ (1− p)n−k (k = 0, 1, . . . , n) (7.1)

EX = n ∗ p; D2X = n ∗ p ∗ (1− p)∑

P (X = k) = 1

Entstehung: Bernoulli-SchemaIn einem Versuch kann ein Ereignis A mit der Wahrscheinlichkeit p = P (A)eintreten. Der Versuch wird insgesamt n-mal unabhangig voneinander durch-gefuhrt. X bezeichne die Anzahl des Eintretens von A in den n Versuchen. Mankann zeigen, dass X binomialverteilt mit den Parametern n und p ist.

Beispiel :10 Huhnereier liegen im Brutkasten. Wie groß ist die Wahrscheinlichkeit dassmindestens 3 Hahnchen das Licht der Welt erblicken?X . . . Anzahl der Hahnchen unter den 10 Kucken.X . . . ist binomial verteilt mit n = 10 und p = 0, 5.Gesucht wird P (X ≥ 3)

P (X ≥ 3) = P (X = 3) + P (X = 4) + . . . + P (X = 10)

= 1− P (X < 3) = 1− P (X = 0)− P (X = 1)− P (X = 2)

= 1−(

100

)∗ 0, 50 ∗ 0, 510 −

(101

)∗ 0, 51 ∗ 0, 59 −

(102

)∗ 0, 52 ∗ 0, 58

= 1− 0, 510

((100

)+

(101

)+

(102

))= 1− 1 + 10 + 45

1024= 1− 56

1024≈ 0, 945

7.7.2 Hypergeometrische Verteilung

Mit den Parametern N ,M , und m.Entspricht dem Ziehen aus einer Urne ohnezurucklegen. (n,N, M ∈ N ; n ≤ N ; M ≤ N) .

P (X = k) =

(Mk

) ∗ (N−Mn−k

)(Nn

) (7.2)

(max(0, n + M −N) ≤ k ≤ min(N,n))

EX = n ∗ M

N; D2X = n ∗ M

N∗ (1− M

N) ∗ (

N − n

N − 1)

Entstehung: In einer Kiste sin N Teile, davon M defekte. Aus der Kiste wer-den n Teile zufallig entnommen (ohne zurucklegen). X bezeichne die zufalligAnzahl defekter Teile in der Stichprobe (unter n). Man kann zeigen, daß Xhypergeometrisch verteilt ist.

TU-Ilmenau: Statistik

Page 51: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

51

Beispiel :Wie groß ist die Wahrscheinlichkeit, im Lotto “6 aus 49” mit einem Tipp min-destens einen Funfer zu gewinnen?N = 49; n = 6 Gewinnzahlen durch ziehen; M = 6 angekreuzte Zahlen.X . . . Anzahl der angekreuzten Gewinnzahlen, hypergeometrisch verteilt.

P (X ≥ 5) = P (X = 5) + P (X = 6)

=

(65

) ∗ (49−66−5

)(496

) +

(66

) ∗ (49−66−6

)(496

) =6 ∗ 43 + 1 ∗ 1

13983816≈ 0, 00001852

7.7.3 Poissonverteilung

Mit dem Parameter λ > 0

P (X = k) = e−λ ∗ λk

k!; (k = 0, 1, 2, . . .) (7.3)

EX = λ ; D2X = λ

Die Poissonverteilung ist die “Verteilung der kleinen Zahlen”. Sie kommt imGrenzfalle des Bernoulli-Schemas vor: n →∞ ; n ∗ p → λ.

7.8 Spezielle stetige Verteilungen

7.8.1 Rechteckverteilung

Gleichmaßige, stetige Verteilung auf dem Intervall [a, b]

f(x) =

1b−a fur a ≤ x ≤ b0 sonst

(7.4)

EX =a + b

2; D2X =

(b− a)2

12S = 0 ; W = −1, 2

TU-Ilmenau: Statistik

Page 52: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

52

Beispiel :Nagelfabrik produziert 80er Nagel, abgeschnitten wird von einer ca. 400m langenDrahtrolle. 85mm lange Stucke. Wie groß ist die Wahrscheinlichkeit, dass einStuck ubrig bleibt, dass langer als 54mm ist?X . . . Lange des Restes, gleichmaßig verteilt auf dem Intervall [0, 85]

P (X > 54) =∫ 85

54

f(x)dx =∫ 85

54

185

dx =85− 54

85≈ 0, 365

Pseudo Zufallszahlen von Computerprogrammen sind meist stetig verteilt aufdem Intervall [0; 1)

7.8.2 Normalverteilung

Mit den Parametern µ und σ2 (−∞ < µ < ∞ ; σ2 > 0).

f(x) =1√

2 ∗ π ∗ σ2∗ e

−(x−µ)2∗σ2

Bezeichnung: X ∼ N(µ, σ2)

Es gilt:EX = µ ; D2X = σ2 ; S = 0 ; W = 0

µ ist die x-Koordinate des Maximums, σ die Strecke ∆x vom Maximum bis zumWendepunkt. Vertafelt ist die Verteilungsfunktion,

Φ(x) =∫ x

−∞ϕ(t)dt

(F (x) = P (X ≤ x))

der standardisierten Normalverteilung

(N(0; 1)) : ϕ(t) =1√

2 ∗ π∗ e−

t22

da die Stammfunktion der Normalverteilung nicht eindeutig bestimmbar ist,daher muss man dei Spezialfalle auf den allgemeinen zuruckfuhren.

TU-Ilmenau: Statistik

Page 53: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

53

7.9 Grenzwertsatze

X1, X2, X3 . . . sei eine Folge unabhangiger Zufallsgroßen, die alle dieselbe Ver-teilung besitzen. µ = EXi; σ2 = D2Xi

Gesetz der großen Zahlen: Es gilt mit Wahrscheinlichkeit 1:

limn→∞

X1 + X2 + . . . + Xn

n= µ

Beispiel : Munzwurf

xi =

1 , wenn im i-ten Wurf Zahl oben ist0 , wenn im i-ten Wurf Wappen oben ist

EXi = 1 ∗ 12

+ 0 ∗ 12

= 0, 5

h(A) =X1 + X2 + . . . + Xn

n=

AnzahlWappen

AnzahlWuerfe

−→n →∞0, 5

7.9.1 Zentraler Grenzwertsatz

Die Verteilung von:X1 + X2 + . . . + Xn − n ∗ µ√

n

konvergiert gegen die N(0, σ2)-Verteilung. Der ZGWS ist die theoretische Be-grundung fur das haufige Auftreten von Normalverteilung.

TU-Ilmenau: Statistik

Page 54: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht
Page 55: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Teil II

Schliessende Statistik

55

Page 56: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht
Page 57: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Kapitel 8

Grundbegriffe der schl.Stat.

Schluß von der Stichprobe auf die Grundgesamtheit. Einbettung der Statistikin die Wahrscheinlichkeitsrechnung:

Wahrscheinlichkeitstheoretoscher Begriff Statistischer BegriffErgebnismenge Ω GrundgesamtheitZufallsgroße X | Ω → < Merkmal XZufallsgroßen X1, X2, . . . , Xn Stichprobe

Definition:

Unter einer mathematischen Stichprobe zu dem Merkmal X versteht man n un-abhangige identisch wie X verteilte Zufallsgroßen X1, X2, . . . , Xn. Jede Realisie-rung x1, x2, . . . , xn der mathematischen Stichprobe ist eine konkrete Stichprobe

ω ∈ Ω

Xi(ω) = xi

Mathematische Stichprobe Konkrete StichprobeX1, X2, . . . , Xn x1, x2, . . . , xn

Theorie praktische Durchfuhrung

Aufgabe der Statistik Die Verteilung Px des Merkmals X sei ganz oderteilweise unbekannt. Es gilt, aus der Stichprobe Kenntnisse uber Px zu gewin-nen.

2 Hauptmethoden

Schatzen von unbekannten Parametern, Wahrscheinlichkeiten, Dichtefunk-tionen

Testen von Hypothesen uber die unbekannte Verteilung

Beispiel In einem Wald wurde stichprobenartig ermittelt, das 39,4% allerBaume geschadigt sind. Kann es sein, dass der Anteil geschadigter Baumein Wirklichkeit bei 42% liegt? Drei Jahre vorher hatte eine Stichprobe einenSchadigungsgrad von 37,7% ergeben. Ist der jetzt erkennbare Zuwachs signifi-kant?

57

Page 58: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht
Page 59: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Kapitel 9

WichtigeStichprobenfunktionen

Es seien X ein Merkmal mit Erwartungswert µ und Varianz σ2 und

X1, X2, X3, . . . , Xn ⇒ EX1 = EX2 = EX3 = . . . = EXn

E(X1 + . . . + Xn) = EX1 + . . . EXn = n ∗ µ

D2X1 = D2X2 = . . . = D2Xn = n ∗ σ2

9.1 Das Stichprobenmittel

X =1n

n∑

i=1

Xi (9.1)

X ist eine Zufallsgroße. Es gilt:

EX =1n

E(X1 + . . . + Xn) =1n∗ n ∗ µ

D2X =1n2

D2(X1 + . . . + Xn) =1n2∗ n ∗ σ2 =

σ2

n−−−−→n →∞0

Wegen dem Gesetz der großen Zahlen: X−−−−→n →∞µ Anwendung: Falls derMittelwert des Merkmals X nicht bekannt ist, kann er durch x = 1

n

∑ni=1 xi

geschatzt werden. Diese Schatzung ist umso besser, je großer der Stichproben-umfang ist.

9.2 Die Stichprobenvarianz

S2 =1

n− 1

n∑

i=1

(Xi − X)2 (9.2)

S2 ist zufallig. Es gilt:

ES2 = σ2, D2(S2) → 0, S2 → σ2(n →∞)

59

Page 60: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

60

Anwendung:

S2 =1

n− 1

n∑

i=1

(xi − x)2

ist gut als Schatzung fur σ2 geeignet, wenn σ2 und µ unbekannt sind.

9.3 Die Verteilungen von X und S2 fur normal-verteiltes Merkmal

2 neue Verteilungen die zu den sogenannten Prufverteilungen gehoren.

Definition:

1. Eine stetige Verteilung mit der Dichte

g(x) = c1 ∗ (1 +X2

f)−

t+12 (−∞ < X < ∞)

nennt man t-Verteilung mit f Freiheitsgraden f = 1, 2, . . .

2. Eine stetige Verteilung mit der Dichte

g(x) =

c2 ∗ xf2−1 ∗ e−

x2 fur x > 0

0 fur x ≤ 0

heißt χ2-Verteilung mit f Freiheitsgraden (f = 1, 2, . . .). Die Konstantenc1 und c2 hangen von f ab.

Bemerkungen zur t-Verteilung: Die t-Verteilung ist symmetrisch bezuglichder Null. Mit f → ∞ nahert sich die t-Verteilung der N(0, 1) Verteilung. Esgilt: ETf = 0 fur f ≥ 2 und D2Tf = f

f−2 fur f ≥ 3Bemerkungen zur χ2-Verteilung: EX2

f = f ; D2χ2f = 2 + f ; Med(χf ) = f − 2

fur f ≥ 3

X =1n

n∑

i=1

Xi

S2 =1

n− 1

i=1

n(Xi − X)2

Satz Es sei X ∼ N(µ; σ2). Dann gilt:

1. Z = X−µσ ist N(0; 1) verteilt.

2. T = X−µS

√n ist t-verteilt mit n− 1 Freiheitsgraden.

3. χ2 = (n−1)∗S2

σ2 ist χ2-verteilt.

TU-Ilmenau: Statistik

Page 61: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

61

i=1

n(Xi − µ

σ)2

ist χ2-verteilt mit Xi ∼ N(µ; σ2) und n Freiheitsgraden.

χ2 =n∑

i=1

(X1 − X

σ)2

ist χ2-verteil mit n− 1 Freiheitsgraden.

TU-Ilmenau: Statistik

Page 62: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht
Page 63: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Kapitel 10

Punktschatzungen

Merkmal X. Verteilung Px von X hange ab von einem Parameter ϑ ∈ Θ, dessenwahrer Wert unbekannt ist (Θ = nicht leere Parametermenge)

10.1 Definition und Beispiele

Eine Punktschatzung fur ϑ ist eine Stichprobenfunktion ϑn = Tn(X1, X2, . . . , Xn)mit Werten in Θ

Bemerkung Fur die Parametermenge Θ gilt haufig:Θ ⊂ R→ ein unbekannter Parameter ϑ ∈ RΘ ∈ Rk → k unbekannte Parameter.

ϑ =

ϑ1

...ϑk

Beispiele fur Punktschatzungen

µ = X ist eine Punktschatzung fur µ = EX Θ = R

S2 ist eine Punktschatzung fur σ2 = D2X Θ = [0,∞)

Das Merkmal X sei rechtecksverteilt im Intervall [0; b] wobei die obereGrenze b ∈ (0,∞) unbekannt ist. Dann ist b = max(X1, X2, . . . , Xn) einePunktschatzung fur b.

Das empirische Zentralmoment l-ter Ordnung: MZen;l = 1n

∑ni=1(Xi−X)l

ist eine Punktschatzung fur das l-te Zentralmoment von X.µZen,l = E(X − EX)l l = 2, 3, 4.

10.2 Wunschenswerte Eigenschaften

Erwartungstreue: Eϑn = ϑ∀n (im Mittel schatzt ϑn richtig)

63

Page 64: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

64

Asymptotische Erwartungstreue: Eϑn−−−−→n →∞ϑ (schatzt im Mittel asym-

ptotisch richtig)

Konsistenz: ϑn−−−−→n →∞ϑ (ϑn nahert sich mit wachsendem Stichproben Um-

fang n dem wahren Wert)

Effizienz: ϑn hat von allen Erwartungstreuen Punktschatzungen fur ϑ diekleinste Varianz. ϑn ist der beste Schatzer fur ϑ

Bemerkung Hinreichend fur die Konsistenz einer erwartungstreuen Punktschatzungist Dlϑn → 0

Beispiele

EX = µ ; X → µ ⇒ µ = X ist erwartungstreu und konsistent fur µ

ES2 = σ2 ; S2 → σ2 ⇒ σ2 = S2 ist eine erwartungstreue und konsi-stente Punktschatzung fur σ2. Bemerkung:

√S2 ist im allgemeinen nicht

erwartungstreu fur σ

X sei gleichmaßig stetig verteilt auf [0; b]. Der Schatzer b = max(X1, X2, . . . , Xn)hat den Erwartungswert Eb = n

n+1 ∗ b. b ist nicht erwartungstreu. b istasymptotisch erwartungstreu und konsistent

Das empirische Zentralmoment 1n

∑ni=1(Xi − X)l ist nur asymptotisch

Erwartungstreu fur MZen,l, Speziell l = 2MZen,2 = 1

n

∑(Xi − X)2 ist nicht Erwartungstreu fur MZen,2 = σ2

aber S2 = 1n−1

∑(Xi − X)2 ist Erwartungstreu fur σ2

Bemerkung Ob empirische Momente effektive Schatzer sind fur die ent-sprechenden Momente hangt vom Verteilungstyp des Merkmals ab. Solasst sich zeigen, daß bei normalverteilten Merkmal X das empirische Mit-tel X effizient fur µ ist

hn(A) sei die relative Haufigkeit eines Ereignisses A in n Versuchen.

Xi =

1, wenn A im i-ten Versuch eintritt0, wenn A im i-ten Versuch nicht eintritt

Die Versuche werden unabhangig voneinander unter gleichen außeren Be-dingungen wiederholt.

hn(A) =X1 + X2 + . . . + Xn

n=

Anz. des Eintretens

Anz. aller V ersuche

Ehn(A) =1n

E(X1 + X2 + . . . + Xn) =1n∗ n ∗ p = p = P (A)

D2hn(A) =1p2

D2(X1+X2+. . .+Xn) =1n2∗n∗p∗(1−p) =

p(1− p)n

→ 0

Wobei (X1 + X2 + . . . + Xn) binomial verteilt mit p = P (A) und n.

TU-Ilmenau: Statistik

Page 65: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

65

Also: Die relative Haufigkeit von A ist eine Erwartungstreue und konsi-stente Punktschatzung fur die Wahrscheinlichkeit von A. Man kann zeigen:hn(A) ist auch effizient fur P (A).

TU-Ilmenau: Statistik

Page 66: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht
Page 67: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Kapitel 11

Bereichsschatzungen

(Konfidenzintervall, Vertrauensbereich)

11.1 Definitionen

Die Verteilung des Merkmals X hangt von einem Parameter ϑ ab, dessen wahrerWert unbekannt ist.

Beispiel: Abweichugen vom Sollmaß (in µm) bei Werkstucken.X ∼ N(µ, σ2) wird vorausgesetzt. Stichprobe vom Umfang n = 20 aus der lau-fenden Produktion:3 2 -1 -2 0 1 2 -1 0 0 0 0 -4 3 1 -2 -1 -3 4 1

Punktschatzungen:fur µ: x = 1

20

∑201 xi = 0, 15

fur σ: s =√

1n−1

∑ni=1(xi − x)3 = 2, 06

Die Teile werden mit einem systematischen Fehler von 0, 15µm produziert unddie Abweichungen vom Sollmaß streuen mit einer empirischen Standardabwei-chung von 2, 06µm um den Mittelwert 0, 15µm. Der tatsachliche Mittelwertµ = EX des Merkmals X bleibt unbekannt. Kann man Grenzen angeben, in-nerhalb derer der wahre Wert von µ liegt? Ja → Konfidenzintervall. Aber: DasKonfidenzintervall kann falsch sein. Die Wahrscheinlichkeit α fur diesen Irrtumkann man (klein) vorgeben: 1− α =Konfidenzeniveau=Statistische Sicherheit.

Definition: Ein Intervall KIϑ = (Gu,Go), dessen Grenzen Gu(X1, X2, . . . , Xn)und Go(X1, X2, . . . , Xn) Stichprobenfunktionen sind, heißt Konfidenzintervallfur ϑ zum Konfidenzniveau 1 − α, wenn P (Gu < ϑ < Go) = 1 − α fur denwahren Wert von ϑ und P (Gu < ϑ′ < Go) ≤ 1− α fur jeden anderen Wert ϑ′.

Mit anderen Worten: Der wahre Wert wird mit einer Wahrscheinlichkeitvon 1− α uberdeckt, ein falscher mit einer Wahrscheinlichkeit, die nicht großerist als 1− α

Fur α benutzt man Standardwerte:α = 0, 05 normale Sicherheitα = 0, 01 hohe Sicherheitα = 0, 001 sehr hohe Sicherheit

67

Page 68: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

68

11.2 Quantile von Prufverteilungen

Prufverteilungen: Wahrscheinlichkeitsverteilungen zur Durchfuhrung von Hypo-thesenprufungen oder zur Berechnung vom Konfidenzintervall.

11.2.1 Standardnormalverteilung

Normalverteilung mit µ = EX = 0 und D2X = σ2 = 1. N(0, 1)-Dichte.

ϕ(x) =1√2π

e−x22 (−∞ < x < ∞)

Zα = P (Z ≤ Zα) = αZ0,5 =MedianZ0,25, Z0,75 =Quartile

Die Quantile sind vertafelt:

α Zα

0, 95 1, 6450, 975 1, 960, 99 2, 3260, 995 2, 576

Es gilt:

Z1−α = −Zα

TU-Ilmenau: Statistik

Page 69: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

69

11.2.2 t-Verteilung

Es gilt:tf ;1−α = −tf ;α

tf ;α Quantile der t-Verteilung mit f Freiheitsgraden der Ordnung α. Die Quan-tile sind vertafelt, fehlende Freiheitsgrade sind linear zu interpolieren. Es gilt:

limf→∞

tf = Zα

TU-Ilmenau: Statistik

Page 70: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

70

11.2.3 χ2-Verteilung

Quantile der χ2-Verteilung mit f Freiheitsgraden. Die Quantile sind bis f = 30vertafelt. Fur f > 30 gibt es eine gute Naherungsformel:

χ2f ;α ≈ f

(1− 2

9f+ Zα

√29f

)3

(11.1)

TU-Ilmenau: Statistik

Page 71: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

71

11.3 Konfidenzintervalle fur die Parameter ei-nes normalverteilten Merkmals

Es sei X ∼ N(µ; σ2) wobei µ = EX und σ2 = D2X unbekannt sein sollen.

11.3.1 Konfidenzintervall fur µ

KIµ =(

X − S√n∗ tn−1;1−α

2; X +

S√n∗ tn−1;1−α

2

)(11.2)

Herleitung:

T =X − µ

S

√n

ist t-verteilt mit n− 1 Freiheitsgraden (vgl. Satz aus Kapitel 2.3)

P

(−tn−1; α

2<

X − µ

S

√n < tn−1;1−α

2

)= 1− α

P

(− S√

ntn−1;1−α

2< X − µ <

S√n

tn−1;1−α2

)=

P

(−X − S√

ntn−1;1−α

2< −µ < −X +

S√n

tn−1;1−α2

)=

P

(X − S√

ntn−1;1−α

2< µ < X +

S√n

tn−1;1−α2

)= 1− α

TU-Ilmenau: Statistik

Page 72: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

72

Bemerkungen

1. Der Zufall steckt in den Grenzen des Konfidenzintervalles. Deswegen dieseFormulierung: “Das Konfidenzintervall uberdeckt den unbekannten Para-meter mit der Wahrscheinlichkeit 1− α ”

2. Je großer n, desto kleiner das Konfidenzintervall

3. Je großer 1− α, desto großer wird das Konfidenzintervall

1− α → 1 ⇒ K ′µ → (−∞,∞)

Merkmal X ∼ N(µ; σ2); Konfidenzniveau 1− α.

KIµ =(

X − S√n

tn−1;1−α2; X +

S√n

tn−1;1−α2

)

Beispiel: Abweichungen vom Sollmaß95% Konfidenzintervall fur µx = 0, 15 s = 2, 06 n = 20 α = 0, 05 aus Tabelle: t19;0,975 = 2, 093⇒ s√

ntn−1;1−α

2= 2,06√

20∗ 2, 093 ≈ 0, 964 (hier immer aufrunden)

⇒ KIµ(0, 15− 0, 964; 0, 15 + 0, 964) = (−0, 814; 1, 114)Mit 95% iger Wahrscheinlichkeit liegt die Mittlere Abweichung vom Sollmaßzwischen −0, 814 und 1, 114µm

11.3.2 Konfidenzintervall fur σ2 = D2X

KIσ2 =

((n− 1)S2

χ2n−1;1−α

2

;(n− 1)S2

χ2n−1; α

2

)(11.3)

11.3.3 Konfidenzintervall fur σ = DX

KIσ =

(√(n− 1)S2

χ2n−1;1−α

2

;

√(n− 1)S2

χ2n−1; α

2

)(11.4)

Beispiel: Abweichungen vom Sollmaßs2 = 2, 062 = 4, 24 α = 0, 10 n = 20 aus Tabelle: χ2

19;0,95 = 30, 1 χ219;0,05 =

10, 1KIσ2 =

(19∗4,24

30,1 ; 19∗4,2410,1

)≈ (2, 676; 7, 976)

KIσ ≈(√

2, 676;√

7, 976) ≈ (1, 631; 2, 824)

Die Standardabweichung des Merkmal liegt mit 90% iger Wahrscheinlichkeitzwischen 1, 631 und 2, 824µm. Fur den Fall, dass der andere Parameter bekanntsein sollte, siehe Formelsammlung.

11.4 Konfidenzintervall fur eine Wahrscheinlich-keit p

Eine Punktschatzung fur die Wahrscheinlichkeit p = P (A) eines zufalligen Er-eignisses A ist die relative Haufigkeit p = hn(A). Bereichsschatzung fur p:

TU-Ilmenau: Statistik

Page 73: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

73

KIp ≈(

p− Z1−α2∗

√p ∗ (1− p)

n; p + Z1−α

2∗

√p ∗ (1− p)

n

)

Die Schatzung gilt nur Naherungsweise, weil Approximationen benutzt wer-den. Nur benutzen, wenn gilt: n∗p > 5 und n∗(1−p) > 5. Damit das Konfidenz-niveau sicher großer ist als 1− α, fugt man die sogenannte Stetigkeitskorrekturin das obige Konfidenzintervall ein:

KIp ≈(

p− Z1−α2∗

√p ∗ (1− p)

n− 1

2n; p + Z1−α

2∗

√p ∗ (1− p)

n+

12n

)

Beispiel Es soll die Wahrscheinlichkeit geschatzt werden, dass ein bestimmtesKopiergerat innerhalb von 24 Stunden nach der Wartung kaputt geht. Dazuwerden 30 solcher Wartungsvorgange beobachtet. In 12 Fallen ging der Kopiererinnerhalb von 24 Stunden wieder kaputt.Punktschatzung: p = 12

30 = 0, 4Bereichsschatzung mit 1− α = 0, 95:n = 30 Z1−α

2= Z0,975 = 1, 96

n ∗ p = 12 > 5 n ∗ (1− p) = 18 > 5

KIp = (0, 4− 1, 96 ∗√

0,4∗0,630 − 1

60 ; 0, 4 + 1, 96 ∗√

0,4∗0,630 + 1

60 )= (0, 4− 0, 192; 0, 4 + 0, 192) = (0, 208; 0, 592)Die Wahrscheinlichkeit p fur den Ausfall des Kopierers innerhalb von 24 Stundenliegt mit 95% iger Wahrscheinlichkeit zwischen 0, 208 und 0, 592.Ist der Bereich zu grob? Dann ist die Erhohung des Stichprobenumfangs dasMittel der Wahl, z.B. n = 300.Ergebnis bei n = 300 p = 0, 4 ⇒ KIp = (0, 343; 0, 457)

TU-Ilmenau: Statistik

Page 74: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht
Page 75: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Kapitel 12

Signifikanztests

Im Beispiel “Abweichungen vom Sollmaß ”aus n = 20 Beobachtungen Punktschatzungfur µ = EX µ = x = 0, 15 [µm] Kann es sein, dass µ = 0 gilt? (also ohne sy-stematischen Fehler produziert wird?)

12.1 Grundbegriffe der Testtheorie

Anliegen eines Tests: Uberprufen eine Annahme (=Hypothese) uber die unbe-kannte Verteilung des Merkmals X anhand einer Stichprobe zum Merkmal X.Die zu uberprufende Hypothese nennt man Nullhypothese H0.

Beispiele

H0 : EX = µ0 (µ0 Vorgegebener hypothetischer Mittelwert)

H0 : Px = P0 (P0 ist eine vorgegebene hypothetische Verteilung)

H0 : X ist normalverteilt (zusammengesetzte Nullhypothese)

Der statistische Test soll Entscheidungen fallen, ob die Stichprobe mit der Null-hypothese vertraglich ist. 2 Entscheidungen moglich: H0 wird abgelehnt oderH0 wird “angenommen ”. Somit sind aber 2 Fehlentscheidungen denkbar:

1. H0 wird abgelehnt, obwohl H0 richtig ist → Fehler 1. Art

2. H0 wird angenommen, obwohl H0 falsch ist → Fehler 2. Art

Die Wahrscheinlichkeit fur die Fehler sollte moglichst klein sein. Aber mankann nicht beide Fehlerwahrscheinlichkeiten beliebig klein halten. Ausweg: Nurdie Fehlerwahrscheinlichkeit 1. Art wird klein gehalten durch eine obere Schran-ke, das sogenannte Signifikanzniveau α. Fehlerwahrscheinlichkeit 2. Art wirdnicht begrenzt. Keine Vorgaben. Ein solcher Test heißt Signifikanztest. Konse-quenz: Nur die Ablehnung von H0 ist eine signifikante Entscheidung, weil dieIrrtumswahrscheinlichkeit bekannt ist. Also: P (H0 ablehnen| H0 richtig) ≤ α.

Standardwerte fur α:0, 05 0, 01 0, 001

hoch signifikant hochst signifikantα = 0: H0 wird niemals abgelehnt.

75

Page 76: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

76

12.2 Paramtertests fur normalverteiltes Merk-mal

Voraussetzung: Merkmal X ∼ N(µ, σ2),µ und σ2 unbekannt. Gegeben: Stich-probe X1, X2, . . . , Xn zu X, Signifikanzniveau α

Der einfache t-Test (Mittelwerttest)Hypothese:

H0 : µ = µ0(µ0 vorgegebener Erwartungswert) (12.1)

Testgroße:

T =X − µ0

S

√n (12.2)

Ablehnungsbereich:

K? = (−∞;−tn−1;1−α2) ∪ (−tn−1;1−α

2,∞) (12.3)

Testentscheidung (gilt fur alle Signifikanztests)

wenn T ∈ K?, dann H0 ablehnen.Z.B.: “Der Mittelwert von X ist signifikant von µ0 verschieden.”

Wenn T /∈ K?, dann wird H0 nicht abgelehnt.Z.B.: “Es gibt keine Einwande gegen die Annahme, dass µ0 der Mittelwertist.”

Abweichungen vom Sollmaßn = 20 x = 0, 15 s = 2, 06Es soll uberpruft werden mit α = 0, 05, ob es im Mittel keine Abweichun-gen gibt.

H0 : µ = 0 t19;0,975 = 2, 093

t =x− 0

s

√n =

0, 152, 06

√20 ≈ 0, 33

K? = (−∞;−2, 093) ∪ (2, 093;∞)

Keine Ablehnung von H0. Antwort: Es kann sein, dass ohne systematischenFehler produziert wird.

12.2.1 Herleitung des einfachen t-Tests

1. H0 wahr ist (µ = µ0); dann ist T = X−µ0S

√n t-verteilt mit n − 1 Frei-

heitsgraden.

P (H0 ablehnen |H0 wahr) = P (T ∈ k?|T ist vertafelt) =α

2+

α

2= α

TU-Ilmenau: Statistik

Page 77: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

77

2. H0 ist falsch (also µ 6= µ0), dann ist T “Verschoben”t-verteilt.

P (H0ablehnen|H0falsch) = P (T ∈ K?|T ist verschoben t-verteilt) > α

Also: Die wahre Nullhypothese wird mit Wahrscheinlichkeit α (Falsch-licherweise) abgelehnt. Eine falsche Nullhypothese wird mit einer Wahr-scheinlichkeit großer als α abgelehnt.

12.2.2 Der χ2-Streuungstest

H0 : σ2 = σ20(σ2

0 vorgegebene Varianz) (12.4)

T =(n− 1)S2

σ20

=1σ2

0

n∑

i=1

(Xi − X)2 (12.5)

K? =(0; χ2

n−1; α2

)∪

(χ2

n−1; α2;∞

)(12.6)

Abweichungen vom Sollmaß :s = 2, 06 n = 20 es soll mit α = 0, 05 uberpruft werden, ob die Standardab-weichungen der gemessenen Werte gleich 3, 0 [µm] sein kann

H0 : σ = 3

t =19 ∗ 2, 062

32≈ 8, 96

K? =[0; χ2

19;0,025

) ∪ (χ2

19;0,975;∞)

= [0 : 0, 891) ∪ (32, 8;∞)

Ja.Die meisten Parameter lassen auch sogenannte einseitige Fragestellungen zu:

H0 : µ ≤ µ0 mit K? = (tn−1;1−α;∞) (12.7)

H0 : µ ≥ µ0 mit K? = (−∞;−tn−1;1−α) (12.8)

H0 : σ2 ≤ σ20 mit K? = (χ2

n−1;1−α;∞) (12.9)

H0 : σ2 ≥ σ20 mit K? = [0; χ2

n−1;α] (12.10)

Abweichungen vom Sollmaß Es soll nachgewiesen werden, dass die Stan-dardabweichung signifikant kleiner als 3µm ist. (α = 0, 05)

H0 : σ ≥ 3 s = 2, 06

gibt eine Chance H0 zu verwerfen.

t =(n− 1)s2

σ20

≈ 8, 96

K? = [0; 10, 1)

t ∈ K? ⇒ ablehnung von H0 Die Standardabweichung ist signifikant (α = 0, 05)kleiner als 3µm.

TU-Ilmenau: Statistik

Page 78: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

78

12.3 Test auf Wahrscheinlichkeit

(Test auf vorliegen eines Anteilswertes).A zufalliges Ereignis mit P (A) = p (unbekannt).p wird geschatzt durch p = h(A) relative Haufigkeit von A in n Versuchen.

H0 : p = p0 (12.11)

T =| h0(A)− p0 | − 1

2n√p0(1−p0)

n

(12.12)

K∗ ≈ (Z1−α2,∞) (12.13)

Bemerkung: T ist unter H0 nur annahernd normalverteilt. Test ist also Nahe-rungsverfahren. Empfehlung:n− p ≥ 5 und 1− p ≥ 5

Beispiel : Munze wird 250 mal geworfen, Sie zeigt dabei 140 mal Kopf und110 mal Zahl. Ist die Munze signifikant asymmetrisch? α = 0, 05

n = 250 p0 =12

h0(A) =140250

Z0,975 = 1, 96 H0 : p = 0, 5

t =| 14

25 − 0, 5 | − 1500√

0,5∗0,5250

≈ 1, 834

K? = (1, 96,∞)

t /∈ K? → keine Ablehnung von H0. Nein, das lasst sich nicht nachweisen. Fuhrtman den Test exakt durch, mit Quantilen der Binomialverteilung, ergibt sichauch keine Ablehnung von H0.

TU-Ilmenau: Statistik

Page 79: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Kapitel 13

StatistischeQualitatskontrolle

Statistische Qualitatskontrolle (Teilgebiet der Statistik mit solchen statistischenVerfahren die zur Qualitatsprufung benutzt werden.)

Statistische Prozesskontrolle:Laufende Uberwachung des Fertigungsprozesses, sofortiges Eingreifen moglich.⇒Kontrollkarten

Annahmekontrolle:Eingangs- und Endkontrolle zur Feststellung der Qualitat der Erzeugnisse.⇒Stichprobenplan

13.1 Kontrollkarten

Laut DIN 55350 “Qualitatsregelkarte ”. Auch: ISO 7870. Diagramme der Qua-litatslage und Kontrollgrenzen. USA, 1931, Stewart. Japan 18.10. Tag der Sta-tistik. Kontrollkarten fur:

Messende Prufungx-Karte, Median-Karte, s-Karte (Empirische Standardabweichung), R-Karte (Spannweite)

Zahlende Prufung p-Karte (Ausschussquote), x-Karte (Absolute Haufig-keit der schlechten Teile), u-Karte (mehrere Merkmale)

13.1.1 Die x-Karte

X . . . ein bestimmtes Maß am Erzeugnis, das kontrolliert werden soll. Aus derlaufenden Prouktion werden zu festgelegten Zeitpunkten t1, t2, . . . jeweils n Teilezufallig entnommen, gemessen und daraus das arithmetische Mittel berechnet.

ti : xi =1n

n∑

j=1

xij

(Messwerte der i-ten Stichprobe)

79

Page 80: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

80

Beispiel : Walzlager (Kugellager) vom Typ 0815X . . . Aussendurchmesser, Sollmaß µ0 = 65, 000mm. Alle 2 Stunden werdenn = 7 Walzlager gepruft. Ergebnisse der letzten 15 Prufungen:x1 = 65, 0010x2 = 64, 9998x3 = 64, 9993x4 = 64, 9991x5 = 64, 9987x6 = 65, 0006x7 = 65, 0001x8 = 65, 0000x9 = 64, 9998x10 = 64, 9995x11 = 64, 9993x12 = 64, 9990x13 = 64, 9991x14 = 64, 9989x15 = 64, 9984

Ko,Ku obere bzw. untere Kontrollgrenze = Eingreifgrenze. Sprechweise: Allexi liegen innerhalb der Kontrollgrenzen: “Prozess ist unter Kontrolle ”. Ein xi

verlasst die Kontrollgrenzen: “Prozess ist ausser Kontrolle ”→ Eingreifen in dieProduktion. 100% Kontrolle aller Teile.Berechnung der Kontrollgrenzen:

Ko/u = µ0 ± 3 ∗ σ√n

(13.1)

µ0 . . . Sollwertσ . . . standardabweichung des Merkmals Xn . . . Stichprobenumfang (ublich 3,5,7)Berechnung der Warngrenzen:

Wo/u = µ0 ± 2 ∗ σ√n

(13.2)

TU-Ilmenau: Statistik

Page 81: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

81

Bei uberschreiten der Warngrenzen: Kein Eingreifen, Mahnung zur besonderenAufmerksamkeit. Zum Beispiel Walzlager: Aus Erfahrung sei bekannt σ = 1µm.Kontrollgrenzen: Ku/o = 65 ± 3 0,0001√

7= 65 ± 0, 0013 Warngrenzen: Wu/o =

65± 2 0,0001√7

= 65± 0, 0008Bemerkungen:

1. Wenn X ∼ N(µ, σ2) und alle Beobachtungswerte voneinander unabhangigsind, dann ist die Wahrscheinlichkeit α, die Grenzen zu uberschreiten(Fehlalarm):Standard USA: Kontrollgrenzen: ±3 ∗ σ α = 0, 0027 Warngrenzen:±2 ∗σ α = 0, 0455Standard Europa: Kontrollgrenzen: ±2, 58 ∗ σ α = 0, 01 Warngrenzen:±1, 96 ∗ σ α = 0, 05

2. Ist die technische Toleranz enger als das Intervall [µ0 − 3 ∗ σ, µ0 + 3 ∗ σ]Ist der Prozess “nicht fahig ”

KO/U = µ0 ± 3 σ√n

Konfidenzintervall mit 1 − α = 0, 9973 Standardabwei-chung σ haufig unbekannt → Schatzen aus einem Vorlauf. Vor Anlegen derKontrollkarte werden k (20 . . . 30) Stichproben jeweils vom Umfang n gezogenund daraus empirische Standardabweichungen Si (i = 1, 2, . . . , k) berechnet.Dann Schatzung fur σ :

s =1h

k∑

i=1

Si

13.1.2 Die x/s Karte

Zweispurige Kontrollkarte. x-Karte und s-Karte

TU-Ilmenau: Statistik

Page 82: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

82

S-Karte

uberwacht die Standardabweichung, die vor allem nicht zu groß werden darf.Gezeichnet werden die empirischen Standardabweichungen S1, S2, S3 . . .

Si =

√√√√ 1n− 1

n∑

j=1

(xij xi)2 (13.3)

13.1.3 Die p-Karte

zur Attributprufung (gut-schlecht). Uberwacht wird die Ausschussquote p. Schatzungfur p:

p =x

n

wobei x die Anzahl der schlechten in der Stichprobe und n der Stichprobenum-fang ist. Taglich werden ni Teile kontrolliert (n ≥ 100).

pi =xi

ni

Ausschussquote am i-ten Tag. werden uber der Zeitachse (i) graphisch darge-stellt. Kontrollgrenzen:

KO/U = p0 ± 3

√p0(1− p0)

ni(13.4)

Wenn KU < 0, dann dann KU = 0. p0 Ausschussquote des ungestorten Pro-zesses. Haufig unbekannt: Dann schatzen aus einem Vorlauf von K = 20 . . . 30Tagen

p =1k

k∑

i=1

pi

Beispiel: Rote Luftballons

Taglich 20000 Stuck. Aus einem Vorlauf ist bekannt: Ausschusssquote =1, 4% Aus 10 Tagen werden Stichproben vom Umfang ni zufallig entnommenund die defekten Ballons gezahlt.

i ni xi pi Ku Ko

1 120 0 0,0000 0 0,04622 120 1 0,0083 0 0,04623 135 1 0,0074 0 0,04434 120 2 0,0167 0 0,04625 100 2 0,0200 0 0,04926 118 3 0,0254 0 0,04647 120 4 0,0333 0 0,04628 120 3 0,0250 0 0,04629 119 5 0,0420 0 0,046310 120 6 0,0500 0 0,0462

TU-Ilmenau: Statistik

Page 83: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

83

In die Grafik dann schon p0 eintragen uber die Tage, dann Ober- und Unter-gerenze, dann die tatsachlichen Werte und schon gehts ab. Beim Uberschreitenvon Ko: Eingreifen! Beim Unterschreiten von Ku: Unsachlichkeit?

13.2 Stichprobenplane

Wareneingangs- oder -ausgangskontrolle. Losen, Posten aus N Teilen. n Teilewerden als Stichprobe zufallig entnommen und gepruft.

Gut-Schlecht-Prufung Prufplan zur Attributsprufung (DIN ISO 2859)

messende Prufung Prufplan zur Variablenprufung (DIN ISO 9951)

Hier nur:

Einfacher Prufplan zur Attribtusprufung :Prufplan: (N(Losumfang),n(Stipro Umfang n ≤ N),c (Annahme Zahl c =0, 1, . . . , n))

Bezeichnungen :X . . . Anzahl der Fehrlerhaften in der Stichprobe (Zufallsgroße)M . . . Anzahl der Fehlerhaften im Los (unbekannt)p = M

N . . . Ausschussquote des Loses (unbekannt)

Prufentscheidung :X ≤ c → Posten annehmenX ≥ c+1 → Posten zuruckweisen (auf Kosten des Lieferanten) (Falls c+2 dannist das ein mehrfacher Prufplan)

TU-Ilmenau: Statistik

Page 84: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

84

Die Qualitat eines Prufplanes wird vollstandig beschrieben durch die Operati-onscharakteristik (OC - Funktion):

L(p) = P (X ≤ c | p) (0 ≤ p ≤ 1) (13.5)

Wahrscheinlichkeit, den Posten anzunehmen, wenn p die Ausschussquote desPostens ist.

X ist hypergeometrisch verteilt. Deshalb: L(p) =∑c

k=0 hy(k | N,M, n) =∑c

k=0(M

k )(N−Mn−k )

(Nn) mit p = M

N

13.3 Kennwerte fur OC-Funktionen

Produzentenrisiko Zu vereinbaren zwischen Produzent und Konsument isteine akzeptierbare Ausschussquote (AQL), die sogenannte Gutlage pProd.

Produzentenrisiko α = P (X > c | p = pProd) = 1 − L(pprod) Wahrschein-lichkeit, den Posten zuruckzuweisen, obwohl er in Ordnung ist.

Konsumentenrisiko Der Abnehmer legt (fur sich) eine Obergrenze fur dieAusschussquote, die sog. Schlechtlage pKons(LQ)Konsumentenrisiko β = P (X ≤ c | p = pKons) = L(pkons) Wahrscheinlich-keit, die Posten anzunehmen, obwohl die Ausschussquote L im t ist (entsprichtIrrtumswahrscheinlichkeit 2. Art). Es muss gelten pprod < pkons

Indifferenzpunkt p0,5 = Prufpunkt = Medianpunktp0,5 : L(p0,5) = 0, 5An der Stelle des Prufpunktes ist das Gefalle des OC annahernd maximal. DerPrufplan kann also Qualitatslagen rechts und links von p0,5 gut unterscheiden.

p0,5 ≈c + 2

3

n

Steilheit Beschreibt die Trennscharfe des Stichprobenplanes. Je steiler dieOC im Prufpunkt, desto besser werden gute und schlechte Qualitatslagen un-terschieden. Steilheit hangt von n ab.

n →∞⇒ ideale OC

Durchschlupf Ausschussquote der durch die Prufung gekommenen Teile. NachDIN sind zuruckgewiesene Lose einer 100% Prufung zu unterziehen und fehler-hafte Teile durch fehlerfreie zu ersetzen.Formel der totalen Wahrscheinlichkeit

P (A) = P (A | B) ∗ P (B) + P (A | B) ∗ P (B)

D(p) = p ∗ L(p) + 0 ∗ (1− L(p)) = p ∗ L(p)

p = Ausschussquote des angenommenen Loses,L(p) = Wahrscheinlichkeit, das Los anzunehmen,

TU-Ilmenau: Statistik

Page 85: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

85

0 = Ausschussquotes des zuruckgewiesenen Loses,1− L(p) Wahrscheinlichkeit, das Los zuruckzuweisen.

D(p) = p ∗ L(p) . . . mittlerer Durchschlupf, wenn p die Ausschussquote derursprunglich angelieferten Teile ist.D(p) < p Ein (von p) unabhangiger Konsumwert des Prufplans ist Dmax =AOQL Da pAOQL ≈ 0, bringt der Wert AOQL keine neue Erkenntnis ≈ 0, 5∗p0,5

Weitere varianten von Prufplanen nach DIN ISO 2859

Prufstufen:

– normal

– reduziert: α großer, n kleiner

– verscharft: α kleine, n großer

In welcher Prufstufe gepruft wird, hangt von der Prufgeschichte ab. Be-gonnen wird stets mit normal.

Prufniveaus

– S1 Sonderprufniveau fur teure Prufung und somit kleine n

– S2 Sonderprufniveau fur teure Prufung und somit kleine n

– S3 Sonderprufniveau fur teure Prufung und somit kleine n

– S4 Sonderprufniveau fur teure Prufung und somit kleine n

– I

– II normales Prufniveau

– III

– IV

Prufniveau ist zu vereinbaren zwischen Produzenten und Konsumenten.

Mehrfache Prufplane Annahmezahl c und Rucknahmezahl d mit c+1 ≤ dX ≤ c → Annahme des PostensX ≥ d → Ruckweisung des Postensc < X < d → weitere Stichprobe ziehen

TU-Ilmenau: Statistik

Page 86: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht
Page 87: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Kapitel 14

Anpassungstests

Stichprobe X1, X2, X3, . . . , Xn zu Merkmal X. Verteilung Px von X sei un-bekannt. Anpassungstest prufen Hypothesen auf Vorliegen einer bestimmtenVerteilung P0 also: H0 : Px = P0.P0 sei eine hypothetische Verteilung.

14.1 Der χ2-Anpassungstest

Erfordert gruppierte Daten; z.B.: Klasseneinteilungm Klassen: K1,K2, . . . , Km

abs. Haufigkeit: h1, h2, . . . , hm∑mi=1 hi = n

pj := P0(X ∈ Kj) Wahrscheinlichkeit, dass das Merkmal X in der j-ten KlasseWerte annimmt, wenn H0 wahr ist.

Klassen Abs. Hfgk. Klassen Wahrschkt. Erwartungs-Hfgk. (hj−npj)2

npj

K1 h1 p1 np1(h1−np1)

2

np1

K2 h2 p2 np2

......

......

...Km hm pm npm

(hm−npm)2

npm∑n 1 n T

Test

H0 : Px = P0 (14.1)

T =m∑

j=1

(hj − npj)2

npj(14.2)

K? ≈ (χ2m−1;1−α,∞) (14.3)

87

Page 88: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

88

Ziffer hj pj npj (hj − npj)2

0 28 0,1 40 1441 42 0,1 40 42 44 0,1 40 163 39 0,1 40 14 44 0,1 40 165 40 0,1 40 06 43 0,1 40 97 42 0,1 40 48 38 0,1 40 49 40 0,1 40 0∑

400 1 400 198

Beispiel Bei der Untersuchung von 100 vierstelligen Pins werde die Haufigkeitder einzelnen Ziffern ausgezahlt n = 400. Man prufe mit α = 0, 05 ob jede Ziffergleich wahrscheinlich ist.

H0 : X ist gleichmaßig diskret verteilt auf 0, 1, . . . , 9

t =∑10

j=1(hj−npj)

2

npj= 1

40 ∗ 198 = 4, 95

K? = (χ29;0,95,∞) = (16, 9;∞)

t /∈ K? ⇒ Es gibt keine Einwande gegen die Annahme, die zehn Ziffern seienalle gleich wahrscheinlich.Bemerkungen:

1. Der χ2-Anpassungstest ist wenig wirksam, aber universell anwendbar. Furdiskrete Verteilungen unentbehrlich.

2. K? gilt nur Naherungsweise richtig. Empfehlung: Klasseneinteilung sowahlen, dass npj ≥ 5∀j.

3. Wurden zur Prazisierung von P0 zunachst r Parameter aus der Stichprobegeschatzt, dann die Freiheitsgrade um r reduzieren.

Beispiel Es soll getestet werden:H0 : X ist Poisson-verteilt. Es wird getestet:H0 : X ist Poisson-verteilt mit λ = 3, 17 wobei 3, 17 aus der Stichprobe mittelsx = 3, 17 geschatzt wird.→ FG = m− 2 Im stetigen Fall: Kolmogorov-Smirnov-Test.

14.2 Test auf Normalverteilung mittels Schiefeund Exzess

X normalverteilt ⇒ S = 0 und W = 0S = E(X−EX)3

σ2

W = E(X−EX)4

σ4 − 3Ist die empirische Schiefe oder die emprisiche Wolbung weit von der null weg,so spricht das gegen die Normalverteilung.

TU-Ilmenau: Statistik

Page 89: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

89

→ 2 TestsH0 : X normalverteilt (14.4)

Testgroßen:

TS =1n

∑(x1 − x)3

( 1n

∑(xi − x)2)1,5

=Schiefe (14.5)

TW =1n

∑(x1 − x)4

( 1n

∑(xi − x)2)2

=Woelbung (14.6)

Ablehnungsbereiche:

K?S = (−∞;−Sn;1−α

2) ∪ (Sn;1−α

2 ;∞) (14.7)

K?W = (0; Wn; α

2) ∪ (Wn;1−α

2;∞) (14.8)

Beispiel Abweichungen vom Sollmaß. Man prufe mit α = 0, 05, ob die Ab-weichungen vom Sollmaß normalverteilt angenommen werden konnen.n = 20; 1

n

∑(xi− x)2 = 4, 0275; 1

n

∑(xi− x)3 = −0, 466; 1

n

∑(xi− x)4 = 40, 985

tS = −0,466√4,02753 ≈ −0, 06

tW = 40,9854,02752 ≈ 2, 53

K?S = (−∞;−0, 951) ∪ (0, 951,∞)Keine Ablehnung von H0

K?W = (0; 1, 73) ∪ (4, 68,∞)Keine Ablehnung von H0

Es gibt keine Einwande gegen die Annahme, die Abweichungen vom Sollmaßseien normalverteilt.

TU-Ilmenau: Statistik

Page 90: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht
Page 91: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Kapitel 15

Unabhangigkeit vonMerkmalen

Beispiel : Zuf. Auswahl einer Person aus einer Adressdatei.Merkmal: X: Nikotinverbrauch[1,2,3];Y : Alkoholkonsum[1,2,3]

15.1 Zweidimensionale Verteilungen

X und Y seien zwei Zufallsgroßen (Merkmale) auf der selben Ergebnismenge Ω.X =

(XY

)ist ein zweidimensionaler Zufallsvektor X | Ω → R2

Diskreter Fall X kann die Werte x1, x2, . . . , xk annehmen.Y kann die Werte y1, y2, . . . , yk annehmen.Die Einzelwahrscheinlichkeiten pij := P (X = xi;Y = yj) beschreiben die Ver-teilungen von X . Eventuell als Tabelle:

X/Y y1 y2 . . . ym

x1 p11 p12 . . . p1m

x1 p21 p22 . . . p2m

......

......

xk pk1 pk2 . . . pkm

mit p− ij ≥ 0∀i, j

Beispiel: Personen, zufallig ausgewahlt. X : Nikotinverbrauch (1=Nichtrau-cher, 2=Raucher, 3=starker Raucher)Y : Alkoholkonsum (1=Antialkoholiker, 2=Gelegenheitstrinker, 3=Alkoholiker)Verteilungstabelle

X/Y 1 2 31 0,4 0,15 0,05 0,6=P(X=1)2 0,1 0,1 0,05 0,25=P(X=2)3 0,05 0,05 0,05 0,15=P(X=3)

0,55 0,3 0,15

91

Page 92: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

92

Stetiger Fall Wenn eine Dichtefunktion f | R2 → R+ existiert, so dass

P (X ≤ x, Y ≤ y) =∫ x

−∞

∫ y

−∞f(s, t)dtds ∀x, y ∈ R

so heißt X =(XY

)stetige verteilt. Es gilt also stets:

∫ ∞

−∞

∫ ∞

−∞f(x, y)dydx = 1

Randverteilungen: Dichte von X:

fX(x) =∫ ∞

−∞f(x, y)dx

Dichte von Y:

fY (y) =∫ ∞

−∞f(x, y)dy

Beispiel

f(x, y) =1

2πσxσyexp

−1

2

[(x− µx)2

σ2x

+(y − µy)2

σ2j

]

ist die Dichte einer zweidimensionalen Normalverteilung

Randverteilung

fX(x) =1√

2πσx

∗ e(x−µx)2

2σ2x

also X ∼ N(µx, σ2x)

fX(x) =1√

2πσy

∗ e(y−µy)2

2σ2y

also Y ∼ N(µy, σ2y)

15.2 Unabhangigkeit von Zufallsgroßen

Definition: X und Y heißen unabhangig voneinander, wenn:

im diskreten Fall: P (X = xi, Y = yi) = (P (X = xi) ∗ (P (Y = yi)

im stetigen Fall: f(x, y) = fX(x) ∗ fY (y)∀x, y ∈ R

Beispiel obige Normalverteilung: fX(x)fY (y) = f(x, y) X und Y ist hier un-abhangig.

Beispiel Nikotin-, Alkoholverbrauch p11 = 0, 4 6= 0, 6 ∗ 0, 55 (X und Y sindhier unabhangig voneinander.

TU-Ilmenau: Statistik

Page 93: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

93

15.3 Unkorreliertheit von Zufallsgroßen

Definition Die Zahl

Cov(X, Y ) := E [(X − EX) ∗ (Y − EY )] = E(X, Y )− EX ∗ EY

heißt Kovarianz von X und YSpeziell Y = X:

Cov(X, X) = E[(XEX)2

]= V ar(X)

BemerkungE(X ∗ Y ) =

∑∑xi ∗ yj ∗ pij

E(X ∗ Y ) =∫ ∫

x ∗ y ∗ f(x, y)dydx

Definition Es seien X und Y zwei Zufallsgroßen mit positiven Streuungen.Die Kenngroße:

ρxy :=Cov(X, Y )√D2X ∗D2Y

heißt Korrelationskoeffizient von X und Y . Ist ρxy = 0, so nennt man X und Yunkorreliert.

Eigenschaften des Korrelationskoeffizienten

1. −1 ≤ ρxy ≤ 1

2. X,Y unabhangig ⇒ X,Y unkorreliert

3. | ρxy |= 1 ⇒ Alle realisierungen von X =(XY

)liegen exakt auf einer

Geraden

Satz: Es seien X und Y unkorrelierte Zufallsgroßen dann gilt E(X, Y ) = EX ∗EY ; D2(X + Y ) = D2X + D2Y

Die Dichte der zweidim. Normalverteilung mit Korrelationskoeff. ρ(| ρ |6= 1)lautet:

fXY (x, y) =1

2πσxσy

√1− ρ2

exp

−12 ∗ (1− ρ2)

[(x− µx

σ − x)2 − 2ρ

x− µx

σx

y − µy

σy+ (

y − µy

σy)2

]

Satz: der Zufallsvektor(XY

)sei normalverteilt Dann gilt:

X,Y und X + Y sind ebenfalls normalverteilt

X, Y unkorrelliert ⇔ X,Y unabhangig.

15.4 Test auf Unabhangigkeit/Unkorreliertheit

Zwei verbundene Stichproben x1, x2, . . . , xn zu Merkmal X und y1, y2, . . . , yn

zu Merkmal Y .

TU-Ilmenau: Statistik

Page 94: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

94

Voraussetzung(XY

)ist normalverteilt.

Test x und y sind unabhangig.

H0 : ρ = 0 (15.1)

T =r√

n− 2√1− r2

(15.2)

K? = (−∞;−tn−2;1−α2) ∪ (tn−2;1−α

2;∞) (15.3)

Bemerkung

r =1

n−1

∑(xi − x)(yi − y)Sx ∗ Sy

ist eine asymptotisch erwartungstreue und konsistente Punktschatzung fur :

ρ =E [(X − EX) (Y − EY )]√

D2X ∗√

D2Y

Beispiel X: Korpergroße, Y: Korpergewicht. Bei n = 62 zufallig ausgewahltenPersonen wurde Korpergroße und Korpergewicht ermittelt und daraus r = 0, 76berechnet. Lasst sich ein signifikanter (α = 0, 001) Zusammenhang zwischenGroße und Gewicht nachweisen? (x, y sind normalverteilt).H0 : ρ = 0t = 0,76

√60√

1−0,762≈ 9, 05

t60;0,9995 = 3, 46K? = (−∞;−3, 46) ∪ (3, 46;∞)t ∈ K? ⇒ Ablehnung von H0

Antwort: Ja, der Zusammenhang zwischen Große und Gewicht ist hochst signi-fikant!

15.5 χ2-Unabhangigkeitstest

Beispiel Eine Epedemie; n = 120 Patienten; X: Heilungserfolg , Y : Behand-lungsmethode

Kontingenztafel :sympt. Behandlung ubliche Dosis erhohte Dosis

Schnell geheilt 14 22 32 68langsam geheilt 14 10 4 28

gestorben 16 8 0 2444 40 36 120

Kontingenzkoeffizient: C =√

χ2

n+χ2 mit χ2 =∑k

i=1

∑lj=1

(hij−eij)2

eijund

eij = hi?∗h?j

n

Die Beobachtungswerte liegen als 3x3 -Kontingenztafel vor. Daraus wurdeberechnet:

TU-Ilmenau: Statistik

Page 95: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

95

χ2 = 28, 21; Kontingenzkoeffizient C = 0, 436 → Korrigierter Kontingenzkoeffi-

zient CKorr = C ∗√

32 = 0, 53 Interpretation damals (Vgl. Statistik 1 Kapitel

6.3): Es besteht eine Abhangigkeit zwischen Behandlungsmethode und Heilungs-erfolg. Wirklich? Ist sie Signifikant?

TestH0 :X und Y sind voneinander unabhangig (15.4)

T = χ2 (aus der Kontingenztafel) (15.5)

χ2 =k∑

i=1

l∑

j=1

(hij − eij)2

eijk = Anzahl der Zeilen und j = Anzahl der Spalten

(15.6)K? = (χ2

(k−1)(l−1);1−α,∞) (15.7)

Beispiel EpidemieMan prufe mit α = 0, 01, ob Behandlungsmethode und Heilungserfolg vonein-ander abhangen.H0: X und Y sind voneinander unabhangigt = 28, 21 χ2

(3−1)(3−1);0,99 = χ24;0,99 = 13, 3

K? = (13, 3;∞) t ∈ k? ⇒ Ablehnung von H0.Antwort: Der Zusammenhang zwischen Behandlungsmethode und Heilungs-

erfolg ist hochsignifikant.

Bemerkung zum χ2-Unabhangigkeitstest Die Testgroße (= personschesChi-Quadrat) ist unter H0 nur Naherungsweise χ2-verteilt. → Empfehlung: alleErwartungshaufigkeiten eij ≥ 5. Wenn nicht dann eventuell in Klassen zusam-menfassen.

TU-Ilmenau: Statistik

Page 96: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht
Page 97: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Kapitel 16

Stichprobenvergleiche

16.1 Der doppelte t-Test (Mittelwerttest)

X, Y seien zwei voneinander unabhangige Merkmale. Zum Beispiel die Klausu-rergebnisse in Statistik 2 am 24.2.2004.X Punktzahl der Studenten, die uber die volle Zeit schreiben nx.Y Punktzahl der Studenten, die vorzeitig abgeben ny.Voraussetzung: X ∼ N(µx; σ2

x), Y ∼ N(µy, σ2y), σ2

x = σ2y

TestH0 : µx = µy (16.1)

T =(X − Y )

√nx ∗ ny(nx + ny − 2)√

(nx + ny) ∗ [(nx − 1) ∗ S2

x + (ny − 1) ∗ S2y

] (16.2)

mit X = 1nx

∑nx

i=1 xi Y = 1ny

∑ny

i=1 yi

und S2x = 1nx−1

∑nx

i=1(xi − x)2 S2x = 1ny−1

∑ny

i=1(yi − y)2

K? =t :| t |> tnx+ny−2;1−α

2

(16.3)

Bemerkungen:

Der t-Test ist robust gegen Verletzungen der Normalverteiltheit

Die sogenannte Varianzhomogenitat (σx2 = σy2) wird mit dem F-Testuberpruft.

Beispiel Klausurergebnisse in Prozentnx = 115, volle Zeit geschrieben: x = 61, 22% bei Sx = 20, 9%ny = 17, volle Zeit geschrieben: y = 60, 34% bei Sy = 21, 8%

Man prufe, ob es einen Signifikanten Unterschied (α = 0, 05) zwischen denbeiden Gruppen gibt (Normalverteilung unterstellt).

97

Page 98: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

98

H0 : µx = µy

t = (61,22−60,34)∗√115∗17∗130√132[114∗20,92+16∗21,82]

≈ 0,88∗504,12752,6 ≈ 0, 16

t130;0,975 = 1, 98 K? = (−∞; 1, 98) ∪ (1, 98;∞) t /∈ K? ⇒ Keine Ableh-nung von H0. Die beiden Studentengruppen unterscheiden sich bezuglich ihrerKlausurergebnisse nicht Signifikant voneinander.

16.2 Die F-Verteilung (R.A. Fisher)

Definition Die stetige verteilung mit der Dichte:

g(x) =

c ∗ xfz2 −1 ∗ (1 + fz

fn∗ x) fur x > 0

0 sonst

heißt F-Verteilung mit (fz, fn) Freiheitsgraden. Fur fz ≥ 3 existiert derErwartungswert, er ist fn

fn−2 . Erwartungswert und Modalwert nahe Eins.

Bemerkung zur Entstehung der F-Verteilung Der Quotient 2-er χ2-Verteilungen.

X1, X2, . . . , Xn, Y1, Y2, . . . , Yn seien unabhangige, identisch normalverteilteZufallsgroßen:

Xi ∼ N(µx; σ2) Yi ∼ N(µy;σ2)

Empirische Varianzen der jeweiligen Stichproben:

S2x =

1n− 1

n∑

i=1

(Xi − X)2

S2y =

1m− 1

m∑

i=1

(Yi − Y )2

TU-Ilmenau: Statistik

Page 99: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

99

Satz Die zufallsgroße S2x

S2y

ist F-verteilt mit n − 1 Zahlerfreiheitsgraden undm− 1 Nennerfreiheitsgraden

Quantile der F-Verteilung Die Quantile der F-Verteilung sind vertafelt. Esgilt:

F(fz,fn)1−α =

1

F(fn,fz)α

16.3 Der F-Test

Varianzvergleich X, Y seien zwei unabhangige, normalverteilte merkmale

X ∼ N(µx;σ2x) Y ∼ N(µy;σ2

y)

Zwei Stichproben:

X1, X2, . . . , Xnx , Y1, Y2, . . . , Yny

H0 : σ2x = σ2

y (16.4)

T =S2

x

S2y

=1

nx−1

∑n−xi=1 (Xi − X)2

1ny−1

∑n−yi=1 (Yi − Y )2

(16.5)

K? =[0; F (nx−1;ny−1)

α2

)∪

(F

(nx−1;ny−1)1−α

2;∞

)(16.6)

Beispiel Punktzahl in der Klausur in Prozent: Studenten auf voller Zeit:

nx = 115 x = 61, 22 Sx = 20, 9

Studenten die vorzeitig abgegeben haben:

ny = 17 y = 60, 34 Sy = 21, 8

Beim doppelten t-Test wurde Varianzhomogenitat (σ2x = σ2

y) vorausgesetzt.Stimmt das? Teste mit α = 0, 10.

H0 : σ2x = σ2

y t =S2

x

S2y

=20, 92

21, 82≈ 0, 92

Kritische Schranken:

F 114;160,05 =

1F 16;114

0,95

=1

1, 733≈ 0, 58

F 114;160,95 = 2, 06

K? = [0; 0, 58) ∪ (2, 06;∞)

t /∈ K? ⇒ keine Ablehnung von H0. Wir konnen die Varianzen als gleich anse-hen.

TU-Ilmenau: Statistik

Page 100: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

100

16.4 Varianzanalyse

(multipler Mittelwertvergleich) genauer: ANOVA, Modell 1, einfache Klassifi-kation. Das ist eine Verallgemeinerung der doppelten t-Tests auf mehr als zweiMerkmale.

Beispiel Neues Waschpulver, Werbekampagne beendet. 3 Stadte, jeweils 8Supermarkte, ein Tag. Anzahl verkaufter Packungen per 1000m2 Verkaufsflache.

Berlin Hamburg Munchen184 231 204230 224 331216 223 317212 182 311137 311 281142 196 237215 218 356312 151 267

φ 206 φ217 φ288

Allgemein K Merkmale X1, X2, . . . , Xk unabhangig voneinander. Vorausset-zung: Alle Xi normalverteilt mit derselben Streuung σ2.

Xi ∼ N(µi;σ2)

StichprobenGruppenmittelwerte:

Xi• =1ni

∑Xij (16.7)

TU-Ilmenau: Statistik

Page 101: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

101

1 2 . . . kx11 x21 . . . xk1

x12 x22 . . . xk2

......

...x1n1 x2n2 . . . xknk

X1• X2• . . . Xk• X••

Gesamtmittel:

Xn =1n

k∑

i=1

j=1

Xij (16.8)

Sprechweise: ”Faktor wirkt in k Gruppen“. Gepruft wird die Hypothese, dieErwartungswerte µi aller Gruppen (=Merkmale) seien gleich groß. Kernpunktder Analyse ist eine ”Streuungs“-zerlegung:

k∑

i=1

ni∑

j=1

(Xij − X••)2

SQT

=k∑

i=1

ni∑

j=1

(Xij − Xi•)

SQI

+k∑

i=1

ni(Xi• − x••)2

SQZ

(16.9)

Eigentlich ”Quadratsummen“ Analyse. Empirische Varianz=QuadratsummeFreiheitsgrade =

SQ?FG = MQ?. Freiheitsgrade sind hierbei: Anzahl der Summanden minus Anzahlder die Summanden verbindenden Punktschatzungen.

Empirische Varianz zwischen den Gruppen:

MQZ =SQZ

k − 1

D2Xij = σ2

Empirische Varianz innerhalb der Gruppen

MQI =SQI

n− k

Empirische Varianz total

MQT =SQT

n− 1

TestH0 = µ1 = . . . = µn (16.10)

T =MQZ

MQI(16.11)

K? = (F (k−1,n−k)1−α ;∞) (16.12)

Zum Beispiel ”Waschpulver“: k = 3; n1 = n2 = n3 = 8;n = 24

TU-Ilmenau: Statistik

Page 102: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

102

Ursache der Varianz Quadratsumme FG Varianz Tzwischen den Gruppen 31696 2 15848,0 6,1innerhalb der Gruppen 54500 21 2595,2

total 86196 23

Varianztabelle

K? = (F 2,210,95 ) = (3, 4668;∞)

t ∈ K? ⇒ Ablehnung von H0. Der Faktor Stadt hat einen signifikanten Ein-fluß auf das Kauferverhalten. Nun konnte man noch paarweise vergleichen, obMunchen nur aus der Reihe tanzt und Hamburg und Berlin ein gleiches Kaufer-verhalten haben (Diese Vermutung liegt bei Betrachtung der Boxplots nahe).

16.5 Der Vorzeichen-Test

Auch: Median-Test. Zwei verbundene Merkmale, stetig verteilt: X, Y , ihre Ver-teilungen sollen heißen PX bzw. PY .Stichprobe: (X1, Y1), (X2, Y2), . . . , (Xn, Yn)Voraussetzung: X1, . . . , Xn unabhangig voneinader. Y1, . . . , Yn unabhangig von-einader.Aber: X − i darf von Yi abhangig sein. H0 : PX = PY (genauer Median(X −Y )=0)T = Z?

n := Anzahl der i, fur die Xi > Y − i

K? =z : z ≤ n− bn;1−α

2oder z ≥ n− bn;1−α

2

Quantile der Binomialverteilung mit p = 12 siehe Tafel IV.10

Bewertung Theoretisch ist P (Xi = Yi) = 0. Falls in Einzelfallen doch Xi =Yi auftritt, geht jeder dieser Falle in die Zahlung der Pluszeichen mit 1

2 ein. Istn > 20, kann Z+

n (binomial verteilt) als normalverteilt angesehen werden. Dannbenutzt man

T =Z+

n − n2√

n 12

K? = (−∞;−Z1−α2) ∪ (Z1−α

2;∞)

Der Vorzeichentest kann auch auf 1-Stichproben-Probleme angewandt werden,z.B.:Test auf Median m0: Z+

n = Anzahl der i mit Xi > m0. Test auf Symmetrie m0:Z+

n = Anzahl der i mit Xi > 0.

Beispiel Neue Rasierklinge ”Mars“. Vergleich mit dem Konkurrenzprodukt

”Merkur“. n = 12 Manner, 5 Tage, eine gesichtshalfte mit ”Mars“, die andermit ”Merkur“. Summe der Wertungspunkte kann zwischen 0 und 100(am besten)liegen. ”Mars“ wird nur auf den markt gebracht, wenn es signifikant besser istals ”Merkur“ (α = 0, 05).

X Punktzahl fur Mars H0 : Med(X − Y ) ≤ 0 Y Punktzahl fur Merkurt = Z+

n = 8, 5 K? = [b12,1−α; n] = [10; 12] t /∈ K? ⇒ keine Ablehnung von H0.

TU-Ilmenau: Statistik

Page 103: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

103

Nr. der Person Punkte Mars Punkte Merkur Vorzeichen1 96 90 +2 84 80 +3 77 78 -4 85 77 +5 61 64 -6 84 88 -7 75 71 +8 92 87 +9 88 88 tie10 89 85 +11 70 68 +12 83 82 +

Also: Es kann nicht nachgewiesen werden, dass ”Mars“ signifikant besser ist als

”Merkur“.

TU-Ilmenau: Statistik

Page 104: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht
Page 105: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Anhang A

Klausuraufgaben

A.1 Klausur Statistik 1

A.1.1 Aufgabe 1

Bei LCD Bildschirmen kann es vorkommen, dass einzelne Pixel ausfallen. Ausder laufenden Produktion solcher Bildschirme werden 40 zufallig ausgewahlt unddie Anzahl der ausgefallenen Pixel ermittelt. Es ergaben sich folgende Anzahlen.0 1 0 0 3 0 1 0 0 00 0 1 0 0 2 0 0 0 02 0 0 1 0 4 0 2 3 01 0 0 2 0 1 0 0 1 0

1. Erstellen sie eine primare Haufigkeitstabelle mit absoluten und relativenHaufigkeiten.Losung:xi Strichliste hi fi

0 26 26 0,651 7 7 0,1752 4 4 0,13 2 2 0,054 1 1 0,025∑

40 1

105

Page 106: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

106

2. Stellen sie die Haufigkeitsverteilung als Histogramm grafisch dar.Losung:

3. Ist anhand diess Diagramms die Haufigkeitsverteilung linksschief, rechts-schief oder eher symmetrisch?Losung:Rechtsschief, da sie linkssteil ist.

4. Berechnen sie x und s.Losung:

x = 0, 625

s = 1, 030

5. Interpretieren Sie den Wert fur x in einem Satz.Losung:Die Bildschirme werden mit einem, im mittel, Fehler von 0,625 ausgefal-lenen Pixeln produziert.

A.1.2 Aufgabe 2

Fur drei Produkte erzielte ein mittelstandisches Unternehmen im Jahre 2000(Basisjahr) die folgenden Umsatze:Produkt A ¿ 10000Produkt B ¿ 12000Produkt C ¿ 5000

Die Preise der Produkte haben sich vom Jahr 2000 auf das Jahr 2002 wie folgtverandert:Produkt A +25%Produkt B +10%Produkt C +15%

TU-Ilmenau: Statistik

Page 107: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

107

1. Berechnen sie hieraus den Preisindex nach Laspeyres.Losung:1, 1648

2. Interpretieren Sie den errechneten Wert.Losung:Der Preis ist im mittel um 16,48% gestiegen.

A.1.3 Aufgabe 3

Zur Analyse des Fertigungszeitaufwandes eines Teiles liegen folgende Ausgangs-daten vor:Jahr Zeitpunkt t Fertigungszeit in Minuten pro 100 Stuck1995 1 1141996 2 1121997 3 1101998 4 1081999 5 1072000 6 1052001 7 1042002 8 100

1. Berechnen Sie den linearen Trend als Funktion von t nach der Methodeder kleinsten Quadrate.Losung:

f(t) = −1, 833x + 115, 75

2. Welche durchschnittliche Fertigungszeit ist mittels dieser Trendegeradenfur das Jahr 2003 zu erwarten?Losung:

f(9) = 99, 253

Im Jahr 2003 wird die Produktion von 100 Teilen vermutlich 99,253 Mi-nuten dauern.

A.1.4 Aufgabe 4

Zwei konkurrierende Kleinwagen wurden von einer Autozeitschrift ausfuhrlichgetestet und einem Vergleich unterzogen. Unter anderem wurde bei jeweils 25Testfahrten der Benzinverbrauch ermittelt. Das ergebnis ist in folgendem Dia-gramm dargestellt:

TU-Ilmenau: Statistik

Page 108: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

108

Der Ursprung bezeichnet 3 Liter Spritverbrauch, jeder weitere Strich be-zeichnet eine weiteren Liter. Der obere Box-Whisker-Plot bezeichnet Wagen 1,der untere Wagen 2.

1. Vergleichen Sie die beiden Wagen im Benzinverbrauch bezuglich Mittel-wert und Varianz.Losung:Im Mittel verbraucht der 1. Wagen 5,5 Liter, der 2. Wagen 5 Liter. DerBenzinverbrauch des 1. Wagen streut weniger.

2. Bei wie viel Prozent aller Fahrten lag der Benzinverbrauch unter 5 Liter/ 100 km bei Wagen 1 bzw. Wagen 2?Losung:Wagen 1: 25 % ; Wagen 2: 50%.

A.1.5 Aufgabe 5

Auf der Autobahn A4 werden am Freitagnachmittag im Rahmen einer Verkehrs-kontrolle 20 LKW zufallig aus dem fließenden Verkehr gewunken und einer tech-nischen Uberprufung unterzogen. Es sei bekannt, dass ein Funftel aller LKW,die um diese Uhrzeit auf der A4 fahren, technische Mangel haben.

1. Die Anzahl X der bei der Verkehrskontrolle zu beanstandenden LKW istbinomialverteilt mit den Parametern n und p. Wie groß ist hier n und p?Losung:

n = 20 ; p = 0, 2

2. Wie groß ist die Wahrscheinlichkeit, dass die Polizeiinspekteure genau zweimit Mangeln behaftete LKW finden?Losung:

P (2) =(

102

)∗ 0, 22 ∗ (1− 0, 2)18 = 45 ∗ 0, 04 ∗ 0, 018 = 0, 1369

TU-Ilmenau: Statistik

Page 109: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

109

3. Wie groß ist die Wahrscheinlichkeit, dass mehr als zwei LKW zu bean-standen sein werden?Losung:

P (X > 2) = 1− (P (0) + P (1) + P (2))

P (0) =(

100

)∗ 0, 20 ∗ (1− 0, 2)20 = 0, 012

P (1) =(

101

)∗ 0, 21 ∗ (1− 0, 2)19 = 0, 058

P (2) =(

102

)∗ 0, 22 ∗ (1− 0, 2)18 = 0, 1369

P (X > 2) = 0, 7931

4. Mit wie vielen mangelhaften LKW muss die Polizei bei der Kontrolle von20 Fahrzeugen im Mittel rechnen?Losung:

EX = n ∗ p = 4

A.2 Klausur Statistik 2

A.2.1 Aufgabe 1

Ein Prufer soll eine Lieferung von N = 40 elektronischen Bauteilen gleicherBauart auf gut/schlecht testen. Aus Zeitgrunden kann er nur n = 5 Teile unter-suchen.Die Anzahl der defekten ist ihm unbekannt. Eine gute Lieferung wurde ver-tragsgemaß nicht mehr als 10% schlechte enthalten. Wenn das vorliegend derFall ist, so bestimme man exakt die Wahrscheinlichkeit fur den Prufer, maximal1 defektes Teil in der Stichprobe zu finden.

Losung

AQ =M

N=

M

40→ M = 4

1∑

i=1

= hy(i|40; 4; 5) =

(4i

)(40−45−i

)(405

)

= 0, 57292 + 0, 358081

A.2.2 Aufgabe 2

Die Prufplane PP (1) = (N∞; 100; 0) und PP (2) = (N∞; 500; 1) stehen furzwei Geschaftspartner einer Liefer-Abnehmer-Beziehung bei Attributsprufungzur Diskussion.

1. Wie groß ware der am jeweiligen Medianpunkt einer betreffenden OC(1)-Funktion und OC(2)-Funktion der mittlere Durchschlupf, ausgedruckt inProzent?

TU-Ilmenau: Statistik

Page 110: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

110

2. Welcher Plan pruft weniger “scharf”?

3. Erstellen Sie eine grafische Darstellung, in der beide OC-Funktionen ent-halten sind.

Losung

1. Mittlerer Durchschlupf: D(p0,5) = p0,5 ∗ 0, 5

p(1)0,5 =

0 + 23

100= 0, 006

p(2)0,5 =

1 + 23

100= 0, 003

D(1)p0,5

= 0, 006 ∗ 0, 5 = 0, 0033=0, 33%

D(2)p0,5

= 0, 003 ∗ 0, 5 = 0, 0016=0, 16%

2. der Prufplan PP (1) = (N∞; 100; 0) pruft weniger scharf als PP (2), dap(1)0,5 > p

(2)0,5.

3. Zeichnung fehlt noch

A.2.3 Aufgabe 3

Ein empfindliches Messgerat eines technischen Labors, von dem bekannt ist, dasssein Messfehler mit N(0; 0; 12) normalverteilt ist, ist versehentlich von einemungeubten Mitarbeiter beschadigt worden. Es wird daraufhin repariert und neugeeicht, so dass µ weiterhin Null ist. Durch 30 Probemessungen soll gepruftwerden, ob nach der Reparatur wieder die alte Messgenauigkeit vorliegt. Dabeiergibt sich s2 = 0, 15. Prufen sie mit α = 0, 05, ob ein signifikanter Unterschiedzur Genauigkeit vor der Reperatur vorliegt.

Losung

H0 : σ2 = σ20

T =(n− 1)s2

σ20

=29 ∗ 0, 15

0, 12= 36, 25

K? = (0; χ2n−1;1−α

2) ∪ (χ2

n−1; α2;∞) = (0; 16, 0) ∪ (45, 7;∞)

T /∈ K? ⇒ H0 nicht ablehnen

Es gibt keinen signifikanten Unterschied zur Varianz vor der Reparatur.

TU-Ilmenau: Statistik

Page 111: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

111

A.2.4 Aufgabe 4

Eine Verbraucherzentrale hat fur einen a,tlichen Warenkorb in der EuropaischenUnion (3-Personen Hauhalt) qEU nach den neuen EURO-Preisen monatliche Ko-sten von

∑peuro ∗ qEU = 900Euro vorausberechnet.

Dieser Warenkorb soll zur Berechnung der mittleren Kaufkraftparitat USA/Eurolandmonatlich

∑p$ ∗ qEU = 720$ kosten, wobei amerikanische Preise in Dollar ver-

wendet wurden. Ein amtlicher amerikanischer Warenkorb (3-Personen Haushalt)qUS kostet

∑p$qUS = 775 Euro. Man berechne die mittlere Kaufkraftparitat

KPUS/EU unter Verwendung der beiden Warenkorbe qEU und qUS sowie derangegebenen Kosten. Interpretieren sie das Ergebnis mit einem Satz.

Losung

KKPUS =∑

pEuro ∗ qUS∑p$ ∗ qUS

=775Euro

620$= 1, 25

Euro

$

KKPEU =∑

p$ ∗ qEU∑pEuro ∗ qEU

=720$

900Euro= 0, 8

$Euro

KKPUS/EU =√

KKPEU

KKPUS=

√720900

∗ 620775

=√

0, 64 = 0, 8$

Euro

Das heißt, fur einen Euro kann man in der EU (Bei den betrachteten Preisni-veaus und Warenkorben) durschnittlich soviel kaufen, wie fur 0, 8$ in den USA.(Kurz: 1 Euro entspricht 0,8 $)

A.2.5 Aufgabe 5

Die durchschnittliche jahrliche Anzahl X der Abwesenheitstage einer bestimm-ten Arbeitnehmergruppe werde mittels einer einfachen Stichprobe vom Um-fang n erhoben. Welcher Stichprobenumfang N garantiert, dass die Lange desauf der Normalverteilungsannahme berechneten Konfidenzintervalls fur E(X)zum Konfidenzniveau 0, 99 hochstens 3 ist, wenn aus fruheren Untersuchungenσ = 15 bekannt ist?

Losung

n ≥ (zα2∗ 2 ∗ σ

∆)2 ⇒ n ≥ (2, 576 ∗ 2 ∗ 15

3)2

∆= Lange des KI= 3 n ∼ 664

zα2

= z0,005 = 2, 576

Der erforderliche Mindeststichprobenumfang betragt n = 664.

Aufgabe 6 Eine Baumarktkette betreibt 47 Filialen. Mittles linearer Regres-sion soll der Einfluss der Verkaufsflache (Merkmal X in m2) auf den Jahres-umsatz (Merkmal Y in Millionen Euro) der Filialen analysiert werden. Ausden 47 Beobachtungspaaren (xi, yi) wurde der empirische Korrelationskoeffizi-ent r = 0, 96 und nach der Methode der kleinsten Quadrate die Regressionsge-rade y = 0, 03x + 10 berechnet. Außerdem ist bekannt, dass die Verkaufsflachenzwischen 280 und 3010m2 liegen, den Mittelwert x = 2200m2 und die empirischeStandardabweichung sx = 480m2 haben.

TU-Ilmenau: Statistik

Page 112: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

112

1. Wie groß ist das empirische Mittel und empirische Standarabweichung desJahresumsatzes?

2. Wie groß ist das lineare Bestimmtheitsmaß, und wie ist dieser Wert zuinterpretieren ?

3. Ist ein linearer Ansatz hier uberhaupt sinnvoll? (Begrundung!)

4. Eine 48. Filiale wird eine Verkaufsflache von 3000 m2 haben. Mit welchemJahresumsatz ware zu rechnen?

Losung

1.y = a + b ∗ x = 0, 03 ∗ 2200 + 10 = 76 Mill. ¿

sy = b ∗ sx

r= 0, 03 ∗ 480

0, 96= 15 Mill. ¿

2.B = r2 = 0, 962 = 0, 9216

92 % der Varianz der y-Werte wird durch die Gerade verursacht.

3. Ja, weil | r | nahe bei Eins.

4.y(3000) = 0, 03 ∗ 3000 + 10 = 100

Es sind 100 Mill. Euro Jahresumsatz zu erwarten.

TU-Ilmenau: Statistik

Page 113: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

Index

χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34χ2-Unabhangigkeitstest . . . . . . . . . 94χ2-Verteilung . . . . . . . . . . . . . . . . . . . 70

Absolute Haufigkeit . . . . . . . . . . . . . 12Abweichungen vom Sollmaß . . . . . 12Anfangsmoment . . . . . . . . . . . . . . . . 22Attributsprufung . . . . . . . . . . . . . . . 83Auspragungen . . . . . . . . . . . . . . . . . . . 9Ausschussquote . . . . . . . . . . . . . . . . . 82

Balkendiagramm. . . . . . . . . . . . . . . . 16Beispiel 1 . . . . . . . . . . . . . . . . . . . . . . . 12Beispiel 2 . . . . . . . . . . . . . . . . . . . . . . . 18Beobachtungspaare . . . . . . . . . . . . . 31Bereichsschatzungen . . . . . . . . . . . . 67Binomialverteilung . . . . . . . . . . . . . . 50Box-Whisker-Plot . . . . . . . . . . . . . . . 21Bravais/Pearson . . . . . . . . . . . . . . . . 31

Chi-Quadrat . . . . . . . . . . . . . . . . . . . . 34

Diskrete Verteilungen . . . . . . . . . . . 46Durchschlupf . . . . . . . . . . . . . . . . . . . 84

Effizienz . . . . . . . . . . . . . . . . . . . . . . . . 64Eingreifgrenze . . . . . . . . . . . . . . . . . . 80Empirische Momente. . . . . . . . . . . .22

” Anfangsmoment, 22” Zentralmoment, 22

Empirische Schiefe . . . . . . . . . . . . . . 22” Interpretation, 23

empirische Varianz . . . . . . . . . . . . . . 19empirischer Median . . . . . . . . . . . . . 18Ergebnismenge. . . . . . . . . . . . . . . . . .41

Ergebnisse . . . . . . . . . . . . . . . . . . . . . . 41Erwartungstreue . . . . . . . . . . . . . . . . 63Exponentialfunktion . . . . . . . . . . . . 40Exzess . . . . . . . . . . . . . . . . . . . . . . . . . . 22

” Interpretation, 24

F-Test . . . . . . . . . . . . . . . . . . . . . . . . . . 99F-Verteilung . . . . . . . . . . . . . . . . . . . . 98Fehler . . . . . . . . . . . . . . . . . . . . . . . . . . 75

geometrisches Mittel . . . . . . . . . . . . 19gewogenes arithmetisches Mittel 19Grenzwertsatze . . . . . . . . . . . . . . . . . 53Gutlage. . . . . . . . . . . . . . . . . . . . . . . . .84

Haufigkeitspolygon. . . . . . . . . . . . . .15Haufigkeitstabelle . . . . . . . . . . . . . . . 12Histogramm . . . . . . . . . . . . . . . . . . . . 14Hypergeometrische Verteilung. . .50

Indexformeln . . . . . . . . . . . . . . . . . . . 28Indexzahlen. . . . . . . . . . . . . . . . . . . . .27

” empirische Indizes, 27” Indexformeln, 28” ” Mengenindex . . . . . 28, 29” ” Preisindex . . . . . . . . 28, 29” ” Umsatzindex . . . . . . . . . 28” Preisindex, 28” Zusammengesetzte Indizes, 27

Indifferenzpunkt . . . . . . . . . . . . . . . . 84

Konfidenzintervall . . . . . . . . . . . . . . 67Konsistenz . . . . . . . . . . . . . . . . . . . . . . 64Konsumentenrisiko. . . . . . . . . . . . . .84Kontingenzkoeffizient. . . . . . . .33, 35

113

Page 114: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

114

” normierter, 35Kontingenztafel . . . . . . . . . . . . . . . . . 34Kontrollgrenze . . . . . . . . . . . . . . . . . . 80Kontrollkarte, zweispurige . . . . . . 81Korrelationskoeffizient . . . . . . . . . . 31

” Eigenschaften, 31Kreisdiagramm . . . . . . . . . . . . . . . . . 16Kummulative Haufigkeit . . . . . . . . 12

” relativ, 13Kummulative Haufigkeit

” absolut, 12

Laspeyres . . . . . . . . . . . . . . . . . . . . . . . 28Lineare Regression . . . . . . . . . . . . . . 37Logistische Funktion . . . . . . . . . . . . 40

Mathe Noten . . . . . . . . . . . . . . . . . . . 18Median . . . . . . . . . . . . . . . . . . . . . . . . . 18Merkmale . . . . . . . . . . . . . . . . . . . . . . . . 9Mittelwerte

” gewogenes arithmetisches Mit-tel, 19

” empirischer Median, 18” geometrisches Mittel, 19” Modalwert, 18

Mittelwerttest . . . . . . . . . . . . . . . . . . 97Modalwert . . . . . . . . . . . . . . . . . . . . . . 18Modus . . . . . . . . . . . . . . . . . . . . . . . . . . 18

Normalverteilung . . . . . . . . . . . . . . . 52

Operationscharakteristik . . . . . . . . 84

p-Karte . . . . . . . . . . . . . . . . . . . . . . . . . 82Paasche. . . . . . . . . . . . . . . . . . . . . . . . .28Pearson. . . . . . . . . . . . . . . . . . . . . . . . .34Poissonverteilung . . . . . . . . . . . . . . . 51Prufniveaus . . . . . . . . . . . . . . . . . . . . . 85Prufplan . . . . . . . . . . . . . . . . . . . . . . . . 83Prufstufen . . . . . . . . . . . . . . . . . . . . . . 85Prufverteilung . . . . . . . . . . . . . . . . . . 60Preisindex . . . . . . . . . . . . . . . . . . . . . . 28Produzentenrisiko. . . . . . . . . . . . . . .84Prozesskontrolle . . . . . . . . . . . . . . . . 79

Punktschatzungen . . . . . . . . . . . . . . 63

Quartil . . . . . . . . . . . . . . . . . . . . . . . . . 20” oberes, 20” unteres, 20

Quartilsabstand. . . . . . . . . . . . . . . . .20

Rechteckverteilung . . . . . . . . . . . . . . 51Regression . . . . . . . . . . . . . . . . . . . . . . 37

” Curvilineare, 39Regressionsgerade. . . . . . . . . . . . . . .37Regressionskoeffizienten . . . . . . . . . 37

” optimale, 38Relative Haufigkeit . . . . . . . . . . . . . 12

S-Karte . . . . . . . . . . . . . . . . . . . . . . . . . 82Schatzungen . . . . . . . . . . . . . . . . . . . . 64Schiefe . . . . . . . . . . . . . . . . . . . . . . . . . .22

” Interpretation, 23Sekundare Haufigkeitstabelle . . . . 13Signifikanztests . . . . . . . . . . . . . . . . . 75Standardabweichung . . . . . . . . . . . . 20statistisches Element . . . . . . . . . . . . . 9Steilheit . . . . . . . . . . . . . . . . . . . . . . . . 84Stetige Verteilungen . . . . . . . . . . . . 47Stichprobe . . . . . . . . . . . . . . . . . . 10, 57Stichproben Funktion . . . . . . . . . . . 34Stichprobenmittel . . . . . . . . . . . . . . .59Stichprobenplane . . . . . . . . . . . . . . . 83Stichprobenreststreuung . . . . . . . . 40Stichprobenumfang . . . . . . . . . . . . . 11Stichprobenvarianz. . . . . . . . . . . . . .59Stichprobenvergleich . . . . . . . . . . . . 97Streuungsmaße . . . . . . . . . . . . . . . . . 19

” empirische Varianz, 19” Quartilsabstand, 20

t-Test. . . . . . . . . . . . . . . . . . . . . . . . . . .97t-Verteilung. . . . . . . . . . . . . . . . . . . . .69Tornquist-Funktion . . . . . . . . . . . . . 40Teilerhebung. . . . . . . . . . . . . . . . . . . .10

Umsatzindex. . . . . . . . . . . . . . . . . . . .28Unimodal . . . . . . . . . . . . . . . . . . . . . . . 18

TU-Ilmenau: Statistik

Page 115: Statistik - todesbahn.de · Kapitel 1 Grundbegriffe 1.1 GrundgesamtheitGrundgesamtheit und Merk-male Menge gleichartiger Objekte, an denen mindestens eine Eigenschaft untersucht

115

Untersuchungseinheiten . . . . . . . . . . 9Urliste . . . . . . . . . . . . . . . . . . . . . . 10, 11

Variablenprufung . . . . . . . . . . . . . . . 83Varianz . . . . . . . . . . . . . . . . . . . . . . . . . 19Varianzanalyse . . . . . . . . . . . . . . . . 100Variationskoeffizient . . . . . . . . . . . . 20Variationsreihe. . . . . . . . . . . . . . . . . .11Vertrauensbereich. . . . . . . . . . . . . . .67Vollerhebung . . . . . . . . . . . . . . . . . . . 10Vorzeichen-Test . . . . . . . . . . . . . . . .102

Wolbung . . . . . . . . . . . . . . . . . . . . . . . 22” Interpretation, 24

Wachstumsrate . . . . . . . . . . . . . . . . . 19Warngrenzen . . . . . . . . . . . . . . . . . . . 80

Zentraler Grenzwertsatz . . . . . . . . 53Zentralmoment . . . . . . . . . . . . . . . . . 22Zentralwert . . . . . . . . . . . . . . . . . . . . . 18Zufalliger Versuch . . . . . . . . . . . . . . 41

TU-Ilmenau: Statistik