Institut für Mathematik und Informatik Lehrstuhl für Algebra und funktionalanalytische Anwendungen

Preview:

Citation preview

Institut für Mathematik und Informatik

Lehrstuhl für Algebra und funktionalanalytische Anwendungen

http://www.math-inf.uni-greifswald.de/algebra/

Statistische Methoden I+II2009/2010Literatur

1) G. Bamberg, F. Baur: Statistik. Oldenbourg 2) G. Bamberg, F. Baur: Statistik-Arbeitsbuch. Oldenbourg 3) L. Fahrmeir, R. Künstler, I. Pigeot, G. Tutz: Statistik. Springer 4) J. Schira: Statistische Methoden der VWL und BWL. Pearson Education 5) H. Haase: Stochastik für Betriebswirte. Shaker 6) J. Hartung: Statistik. Oldenbourg 7) R. Schlittgen: Einführung in die Statistik. Oldenbourg 8) A. Quatember: Statistik ohne Angst vor Formeln. Pearson Studium 9) H.-D. Radke: Statistik mit Excel. Markt + Technik

Statistische Methoden I+II 2009/2010

Einleitung: Wie schätzt man die Zahl der Fische in einem See?Zur Geschichte der Statistik

I. Beschreibende Statistik

1. Grundlegende Begriffe

2. Eindimensionales Datenmaterial2.1. Der Häufigkeitsbegriff2.2. Lage- und Streuungsparameter2.3. Konzentrationsmaße (Lorenz-Kurve)

3. Mehrdimensionales Datenmaterial3.1. Korrelations- und Regressionsrechnung3.2. Indexzahlen3.3. Saisonbereinigung

II. Wahrscheinlichkeitstheorie1. Laplacesche Wahrscheinlicheitsräume

1.1. Kombinatorische Formeln1.2. Berechnung von Laplace-Wahrschein-

lichkeiten2. Allgemeine Wahrscheinlichkeitsräume

2.1. Der diskrete Fall2.2. Der stetige Fall2.3. Unabhängigkeit und bedingte

Wahrscheinlichkeit3. Zufallsvariablen

3.1. Grundbegriffe3.2. Erwartungswert und Varianz

3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz

4. Markov-Ketten 4.1. Übergangsmatrizen 4.2. Grenzverhalten irreduzibler Markov-

Ketten 4.3. Gewinnwahrscheinlichkeiten 4.4. Beispiel „Ruin der Spieler“ 4.5. Anwendungen

III. Induktive Statistik

1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung

2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle

3. Tests 3.1. Grundbegriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse

Beschreibende Statistik(= Deskriptive Statistik)

Beschreibung von Datenmaterial

Vorstufe zur

Schließenden Statistik(= Induktive Statistik)

Analyse von Datenmaterial,Hypothesen, Prognosen

1. Semester

2. Semester

Wahrscheinlichkeitstheorie

Die wichtigsten Tabellen

Übersicht IKonfidenzintervalle

für den Erwartungswert

Übersicht IIKonfidenzintervalle

für die Varianz

Test für den ErwartungswertVarianz bekannt

Fall Normalverteilung

Test für den ErwartungswertVarianz unbekannt

Fall Normalverteilung

Chi-Quadrat-Tests

Übersicht

Faustregeln Chi-Quadrat-TestsChi-Quadrat-Tests

Test auf Anpassung

Test auf Unabhängigkeit

Test auf Homogenität

Beschreibende Statistik

Darstellung von Daten (Box-Plot) Absolute und relative Häufigkeiten Empirische Verteilungsfunktion Lageparameter (arithmetisches Mittel, Median, Quantile, Quartile) Streuungsparameter (Varianz, emp. Varianz, Streuung) Lorenz-Kurve, Gini-Koeffizient Kovarianz

Korrelationskoeffizient nach Bravais-Pearson Regressionsrechnung (lineare Regression, Regressionsgerade, Bestimmtheitsmaß)

Peisindex nach Laspeyres und nach Paasche

Zentrale Themen(praktischer Teil)

Beschreibende Statistik(= Deskriptive Statistik)Beschreibung von Datenmaterial

Schließenden Statistik(= Induktive Statistik)Analyse von Datenmaterial,Hypothesen, Prognosen

1. Semester

2.Semester

Wahrscheinlich-keitstheorie

1. Semester

HäufigkeitenGegeben ist eine Datenliste (Urliste)

(hier z. B. die Klausur-Noten von 50 Studenten) 3 3 4 5 2 1 3 3 4 3

2 3 4 4 4 5 2 1 3 33 3 4 4 4 5 4 3 4 32 3 3 2 4 3 2 1 5 44 4 5 4 5 1 1 3 3 3

Hier die geordneten Daten

1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 45 5 5 5 5 5

Absolute Häufigkeiten

H(1) = 5H(2) = 6H(3) = 18H(4) = 15H(5) = 6

h(1) = 0.1 h(2) = 0.12h(3) = 0.36h(4) = 0.3h(5) = 0.12

Relative Häufigkeiten

Kumulierte relative Häufigkeiten

F(1) = 0.1F(2) = 0.22F(3) = 0.58F(4) = 0.88F(5) = 1

Fakultäten EMAUBerechnung der Winkel für ein Kreisdiagramm

T: TheologischeRSW: Rechts- und Staatswiss.Med: MedizinischePhil: PhilosophischeMathNat: Mathematisch-Naturwiss.K: Studienkolleg, ...

h(T) = 0.011 h(RSW) = 0.22h(Med) = 0.164h(Phil) = 0.309h(MathNat) = 0.273h(K) = 0.022

3.96 Grad 79.2 Grad 59.04 Grad111.24 Grad 98.28 Grad 7.92 Grad

Kreisdiagramm Fakultäten EMAU

Stabdiagramm „Zähne“

Histogram „Zähne“

Empirische Verteilungsfunktion„Zähne“

Charakterisierung von Merkmalen

Merkmalen

quantitative: Merkmale unterscheiden sich nach der Größequalitative: Merkmale unterscheiden sich nach der Art

Unterscheidung nach der zugrundeliegenden Werteskala

Nominal-Ordinal-metrische

Skala

Unterscheidung zwischen

qualitativenquantitativen

Nominal: keine RangordnungOrdinal: Rangordnung, aber Zwischenwerte nicht interpretierbarmetrisch: Rangordnung, Werte zwischen 2 Werten erlauben eine Interpretation

Unterscheidung nach

diskretenstetigen Merkmalen

diskret: Menge der Werte abzählbar (evtl. abzählbar unendlich)stetig: Menge der Werte kontinuierlich, (z.B. reelle Zahlen oder ein Intervall reeller Zahlen)

Ordinal, diskret

metrisch, diskret

metrisch, stetig

Ordinal, diskret

Arithmetisches Mittel

Merkmal

Datensatz

Median

Merkmal

Geordneter Datensatz

n ungerade: Wert, der in der Mitte steht

n gerade: arithmetisches Mittel der beiden Werte, die in der Mitte stehen

Aufgabe 1

Richtig sind nur die Antworten

(a) und (b)

(c) und (b)

(a) und (c)

(a), (b) und (c)

Aufgabe 2

Richtig sind nur die Antworten

(a) und (b)

(c) und (b)

(c) und (e)

(a), (b) und (e)

Quantile

Boxplot

Ober-, Untergrenze der „Box“: oberes, unteres Quartil„dicker Strich“ in der Box: Median

Ausreißer nach oben:Werte > oberes Quartil + 1.5 Quartilsabstand

Ausreißer nach unten:Werte < unteres Quartil - 1.5 Quartilsabstand

Jeder Ausreißer wird mit einem Symbol gesondert einge-tragen. Antennen: größter und kleinster Wert in der Datenliste, der kein Ausreißer ist

Aufgabe 3

Arithmetisches Mittel und Median betragen

150,5 und 150

144,6 und 168

164,6 und 168

144 und 142

Unteres und oberes Quartil betragen

150 und 175

175 und 150

145 und 165

135 und 155

Der Boxplot ergibt sich

so

so

so

oder so

Aufgabe 4

Der Median ergibt sich zu

45,5

34,5

67

63,5

Unteres und oberes Quartil ergeben sich zu

58 und 72,5

58,5 und 72

58 und 72

58,5 und 72,5

Die Quantile betragen

70 und 104

60 und 105,5

65,5 und 105

60 und 106,5

Mittelwert oder Median

Grobe Faustregeln

Metrische Skalierung

Ordinale Skalierung

Ausreißer wahrscheinlich

Wenn sich die Werte „irdendwie“gegeneinander ausgleichen

Mittelwert

Median

Median

Mittelwert

Streuungsparameter

Median

Mittlere Abweichung vom Median

Die Ungleichung gilt für jede Konstante c.

StreuungsparameterMittelwert

Varianz

Die Ungleichung gilt für jede Konstante c.

Rechenregeln für Mittelwert, Varianz und Streuung

Recommended