Upload
melusina-redinger
View
103
Download
0
Embed Size (px)
Citation preview
Institut für Mathematik und Informatik
Lehrstuhl für Algebra und funktionalanalytische Anwendungen
http://www.math-inf.uni-greifswald.de/algebra/
Statistische Methoden I+II2009/2010Literatur
1) G. Bamberg, F. Baur: Statistik. Oldenbourg 2) G. Bamberg, F. Baur: Statistik-Arbeitsbuch. Oldenbourg 3) L. Fahrmeir, R. Künstler, I. Pigeot, G. Tutz: Statistik. Springer 4) J. Schira: Statistische Methoden der VWL und BWL. Pearson Education 5) H. Haase: Stochastik für Betriebswirte. Shaker 6) J. Hartung: Statistik. Oldenbourg 7) R. Schlittgen: Einführung in die Statistik. Oldenbourg 8) A. Quatember: Statistik ohne Angst vor Formeln. Pearson Studium 9) H.-D. Radke: Statistik mit Excel. Markt + Technik
Statistische Methoden I+II 2009/2010
Einleitung: Wie schätzt man die Zahl der Fische in einem See?Zur Geschichte der Statistik
I. Beschreibende Statistik
1. Grundlegende Begriffe
2. Eindimensionales Datenmaterial2.1. Der Häufigkeitsbegriff2.2. Lage- und Streuungsparameter2.3. Konzentrationsmaße (Lorenz-Kurve)
3. Mehrdimensionales Datenmaterial3.1. Korrelations- und Regressionsrechnung3.2. Indexzahlen3.3. Saisonbereinigung
II. Wahrscheinlichkeitstheorie1. Laplacesche Wahrscheinlicheitsräume
1.1. Kombinatorische Formeln1.2. Berechnung von Laplace-Wahrschein-
lichkeiten2. Allgemeine Wahrscheinlichkeitsräume
2.1. Der diskrete Fall2.2. Der stetige Fall2.3. Unabhängigkeit und bedingte
Wahrscheinlichkeit3. Zufallsvariablen
3.1. Grundbegriffe3.2. Erwartungswert und Varianz
3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz
4. Markov-Ketten 4.1. Übergangsmatrizen 4.2. Grenzverhalten irreduzibler Markov-
Ketten 4.3. Gewinnwahrscheinlichkeiten 4.4. Beispiel „Ruin der Spieler“ 4.5. Anwendungen
III. Induktive Statistik
1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung
2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle
3. Tests 3.1. Grundbegriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse
Beschreibende Statistik(= Deskriptive Statistik)
Beschreibung von Datenmaterial
Vorstufe zur
Schließenden Statistik(= Induktive Statistik)
Analyse von Datenmaterial,Hypothesen, Prognosen
1. Semester
2. Semester
Wahrscheinlichkeitstheorie
Die wichtigsten Tabellen
Übersicht IKonfidenzintervalle
für den Erwartungswert
Übersicht IIKonfidenzintervalle
für die Varianz
Test für den ErwartungswertVarianz bekannt
Fall Normalverteilung
Test für den ErwartungswertVarianz unbekannt
Fall Normalverteilung
Chi-Quadrat-Tests
Übersicht
Faustregeln Chi-Quadrat-TestsChi-Quadrat-Tests
Test auf Anpassung
Test auf Unabhängigkeit
Test auf Homogenität
Beschreibende Statistik
Darstellung von Daten (Box-Plot) Absolute und relative Häufigkeiten Empirische Verteilungsfunktion Lageparameter (arithmetisches Mittel, Median, Quantile, Quartile) Streuungsparameter (Varianz, emp. Varianz, Streuung) Lorenz-Kurve, Gini-Koeffizient Kovarianz
Korrelationskoeffizient nach Bravais-Pearson Regressionsrechnung (lineare Regression, Regressionsgerade, Bestimmtheitsmaß)
Peisindex nach Laspeyres und nach Paasche
Zentrale Themen(praktischer Teil)
Beschreibende Statistik(= Deskriptive Statistik)Beschreibung von Datenmaterial
Schließenden Statistik(= Induktive Statistik)Analyse von Datenmaterial,Hypothesen, Prognosen
1. Semester
2.Semester
Wahrscheinlich-keitstheorie
1. Semester
HäufigkeitenGegeben ist eine Datenliste (Urliste)
(hier z. B. die Klausur-Noten von 50 Studenten) 3 3 4 5 2 1 3 3 4 3
2 3 4 4 4 5 2 1 3 33 3 4 4 4 5 4 3 4 32 3 3 2 4 3 2 1 5 44 4 5 4 5 1 1 3 3 3
Hier die geordneten Daten
1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 45 5 5 5 5 5
Absolute Häufigkeiten
H(1) = 5H(2) = 6H(3) = 18H(4) = 15H(5) = 6
h(1) = 0.1 h(2) = 0.12h(3) = 0.36h(4) = 0.3h(5) = 0.12
Relative Häufigkeiten
Kumulierte relative Häufigkeiten
F(1) = 0.1F(2) = 0.22F(3) = 0.58F(4) = 0.88F(5) = 1
Fakultäten EMAUBerechnung der Winkel für ein Kreisdiagramm
T: TheologischeRSW: Rechts- und Staatswiss.Med: MedizinischePhil: PhilosophischeMathNat: Mathematisch-Naturwiss.K: Studienkolleg, ...
h(T) = 0.011 h(RSW) = 0.22h(Med) = 0.164h(Phil) = 0.309h(MathNat) = 0.273h(K) = 0.022
3.96 Grad 79.2 Grad 59.04 Grad111.24 Grad 98.28 Grad 7.92 Grad
Kreisdiagramm Fakultäten EMAU
Stabdiagramm „Zähne“
Histogram „Zähne“
Empirische Verteilungsfunktion„Zähne“
Charakterisierung von Merkmalen
Merkmalen
quantitative: Merkmale unterscheiden sich nach der Größequalitative: Merkmale unterscheiden sich nach der Art
Unterscheidung nach der zugrundeliegenden Werteskala
Nominal-Ordinal-metrische
Skala
Unterscheidung zwischen
qualitativenquantitativen
Nominal: keine RangordnungOrdinal: Rangordnung, aber Zwischenwerte nicht interpretierbarmetrisch: Rangordnung, Werte zwischen 2 Werten erlauben eine Interpretation
Unterscheidung nach
diskretenstetigen Merkmalen
diskret: Menge der Werte abzählbar (evtl. abzählbar unendlich)stetig: Menge der Werte kontinuierlich, (z.B. reelle Zahlen oder ein Intervall reeller Zahlen)
Ordinal, diskret
metrisch, diskret
metrisch, stetig
Ordinal, diskret
Arithmetisches Mittel
Merkmal
Datensatz
Median
Merkmal
Geordneter Datensatz
n ungerade: Wert, der in der Mitte steht
n gerade: arithmetisches Mittel der beiden Werte, die in der Mitte stehen
Aufgabe 1
Richtig sind nur die Antworten
(a) und (b)
(c) und (b)
(a) und (c)
(a), (b) und (c)
Aufgabe 2
Richtig sind nur die Antworten
(a) und (b)
(c) und (b)
(c) und (e)
(a), (b) und (e)
Quantile
Boxplot
Ober-, Untergrenze der „Box“: oberes, unteres Quartil„dicker Strich“ in der Box: Median
Ausreißer nach oben:Werte > oberes Quartil + 1.5 Quartilsabstand
Ausreißer nach unten:Werte < unteres Quartil - 1.5 Quartilsabstand
Jeder Ausreißer wird mit einem Symbol gesondert einge-tragen. Antennen: größter und kleinster Wert in der Datenliste, der kein Ausreißer ist
Aufgabe 3
Arithmetisches Mittel und Median betragen
150,5 und 150
144,6 und 168
164,6 und 168
144 und 142
Unteres und oberes Quartil betragen
150 und 175
175 und 150
145 und 165
135 und 155
Der Boxplot ergibt sich
so
so
so
oder so
Aufgabe 4
Der Median ergibt sich zu
45,5
34,5
67
63,5
Unteres und oberes Quartil ergeben sich zu
58 und 72,5
58,5 und 72
58 und 72
58,5 und 72,5
Die Quantile betragen
70 und 104
60 und 105,5
65,5 und 105
60 und 106,5
Mittelwert oder Median
Grobe Faustregeln
Metrische Skalierung
Ordinale Skalierung
Ausreißer wahrscheinlich
Wenn sich die Werte „irdendwie“gegeneinander ausgleichen
Mittelwert
Median
Median
Mittelwert
Streuungsparameter
Median
Mittlere Abweichung vom Median
Die Ungleichung gilt für jede Konstante c.
StreuungsparameterMittelwert
Varianz
Die Ungleichung gilt für jede Konstante c.
Rechenregeln für Mittelwert, Varianz und Streuung