23
WISTA WIRTSCHAFTSSTATISTIK PROF. DR. ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 07.05.2013 Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Mittelwerte und Lagemaße II 1. Anwendung und Berechnung der wichtigsten Mittelwerte Modus Median Arithmetisches Mittel Geometrisches Mittel Harmonisches Mittel 2. Verfahren der Gewichtung und Interpolation 3. Weitere Eigenschaften von Mittelwerten 4. Ein Anwendungsbeispiel Literatur: Degen, Horst / Lorscheid, Peter: Statistik-Lehrbuch, 2. Aufl., München-Wien 2002, S. 37-43. Mosler, Karl und Schmid, Friedrich: Beschreibende Statistik und Wirtschaftsstatistik, Berlin- Heidelberg-New York 2003, S. 34-42. von der Lippe, Peter: Deskriptive Statistik, Stuttgart 1993, Online Ausgabe S. 46-82. und S. 318. Weitere Übungsaufgaben zu Mittelwerten: SAK WS 07/08, A2. SAK SS 08, A1. SAK SS 09, A2. SAK SS 10, A3. SAK SS 12, A2.

Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

WISTA WIRTSCHAFTSSTATISTIK

PROF. DR. ROLF HÜPEN

FAKULTÄT FÜR

WIRTSCHAFTSWISSENSCHAFT

Seminar für Theoretische Wirtschaftslehre

Vorlesungsprogramm 07.05.2013

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Mittelwerte und Lagemaße II

1. Anwendung und Berechnung der wichtigsten Mittelwerte

• Modus

• Median

• Arithmetisches Mittel

• Geometrisches Mittel

• Harmonisches Mittel

2. Verfahren der Gewichtung und Interpolation

3. Weitere Eigenschaften von Mittelwerten

4. Ein Anwendungsbeispiel

Literatur: Degen, Horst / Lorscheid, Peter: Statistik-Lehrbuch, 2. Aufl., München-Wien 2002, S. 37-43.

Mosler, Karl und Schmid, Friedrich: Beschreibende Statistik und Wirtschaftsstatistik, Berlin-

Heidelberg-New York 2003, S. 34-42.

von der Lippe, Peter: Deskriptive Statistik, Stuttgart 1993, Online Ausgabe S. 46-82. und S.

318.

Weitere Übungsaufgaben zu Mittelwerten: SAK WS 07/08, A2. SAK SS 08, A1. SAK SS 09, A2. SAK

SS 10, A3. SAK SS 12, A2.

Page 2: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

2

Mittelwerte und Lagemaße Datenlage B

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Datenlage B: Häufigkeitstabellen

Liste der von einander verschiedenen Merkmalsausprägungen und deren Häufigkeit

Nr. Merkmals-

ausprägung

einfache Häufigkeit kumulierte Häufigkeit

absolut relativ absolut relativ

i xi hi fi Hi Fi

1 x1 h1 f1 H1 F1

2 x2 h2 f2 H2 F2

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

m xm hm fm Hm= n Fm=1

Summe n 1

Page 3: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

3

Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel

Stabdiagramm

0

0,05

0,1

0,15

0,2

0,25

0,3

1 2 3 4 5 6 7 8

Merkmal x

Rela

tive H

äu

fig

keit

f

Häufigkeitstabelle

xi hi fi Hi Fi

1 1 0,05 1 0,05

2 2 0,1 3 0,15

3 3 0,15 6 0,3

4 3 0,15 9 0,45

5 5 0,25 14 0,7

6 3 0,15 17 0,85

7 2 0,1 19 0,95

8 1 0,05 20 1

Summe 20 1

Fiktives Zahlenbeispiel, quantitatives Merkmal x, 20 Beobachtungswerte:

5,6,4,2,8,3,7,5,5,3,6,4,2,3,4,6,5,7,5,1

Quelle für das Zahlenbeispiel: Abels, Heiner: Wirtschafts- und Bevölkerungsstatistik, 4. Aufl., Wiesbaden 1993, S. 209

Geordnete Urliste

i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

x(i) 1 2 2 3 3 3 4 4 4 5 5 5 5 5 6 6 6 7 7 8

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Page 4: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

4

Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel

max𝑖

ℎ𝑖 = ℎ5 = 5

max𝑖

𝑓𝑖 = 𝑓5 = 0,25

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Häufigkeitstabelle

xi hi fi Hi Fi

1 1 0,05 1 0,05

2 2 0,1 3 0,15

3 3 0,15 6 0,3

4 3 0,15 9 0,45

5 5 0,25 14 0,7

6 3 0,15 17 0,85

7 2 0,1 19 0,95

8 1 0,05 20 1

Summe 20 1

Modus = Merkmalsausprägung mit der

größten absoluten oder relativen

Häufigkeit

→ Modus = 𝒙𝟓 = 𝟓

Page 5: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

5

Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Häufigkeitstabelle

xi hi fi Hi Fi

1 1 0,05 1 0,05

2 2 0,1 3 0,15

3 3 0,15 6 0,3

4 3 0,15 9 0,45

5 5 0,25 14 0,7

6 3 0,15 17 0,85

7 2 0,1 19 0,95

8 1 0,05 20 1

Summe 20 1

Median = Zentralwert. Merkmalsausprä-

gung, die in der Mitte der

geordneten Urliste steht. Teilt

die Liste in zwei Hälften.

Median = 𝑥𝑖 für 𝐹𝑖−1 < 0,5 < 𝐹𝑖

12∙ 𝑥𝑖 + 𝑥𝑖+1 für 0,5 = 𝐹𝑖

Median = 𝑥𝑖 für 𝐻𝑖−1 < 𝑛

2< 𝐻𝑖

12∙ 𝑥𝑖 + 𝑥𝑖+1 für 𝑛

2= 𝐹𝑖

oder alternativ:

𝐹4 = 0,45 < 0,5 < 0,7 = 𝐹5 ⟹ Median = 𝒙 = 𝒙𝟓 = 𝟓

𝐻4 = 9 < 10 < 14 = 𝐻5 ⟹ Median = 𝒙 = 𝒙𝟓 = 𝟓

Page 6: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

6

Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Arbeitstabelle

xi hi fi 𝑥𝑖 ∙ ℎ𝑖 𝑥𝑖 ∙ 𝑓𝑖

1 1 0,05 1 0,05

2 2 0,1 4 0,2

3 3 0,15 9 0,45

4 3 0,15 12 0,6

5 5 0,25 25 1,25

6 3 0,15 18 0,9

7 2 0,1 14 0,7

8 1 0,05 8 0,4

Summe 20 1 91 4,55

Arithmetisches Mittel

Rechnerischer Durchschnitt, Summe der

Beobachtungswerte dividiert durch deren

Anzahl. Bei Datenlage B ist eine Gewichtung

der Merkmalsausprägungen mit den absoluten

oder relativen Häufigkeiten erforderlich.

→ Gewichtetes arithmetisches Mittel (GAM)

GAM = 𝑥 =1

𝑛∙ 𝑥𝑖 ∙ ℎ𝑖

𝑚

𝑖=1

oder alternativ:

𝑥 =91

20= 4,55

𝑥 = 4,55 GAM = 𝑥 = 𝑥𝑖 ∙ 𝑓𝑖

𝑚

𝑖=1

Page 7: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

7

Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Arbeitstabelle

xi hi fi ℎ𝑖 𝑥𝑖 𝑓𝑖 𝑥𝑖

1 1 0,05 1 0,05

2 2 0,1 1 0,05

3 3 0,15 1 0,05

4 3 0,15 0,75 0,0375

5 5 0,25 1 0,05

6 3 0,15 0,5 0,025

7 2 0,1 0,2857 0,01429

8 1 0,05 0,125 0,0063

Summe 20 1 5,6607 0,2830

Harmonisches Mittel

Rechnerischer Durchschnitt, Kehrwert des

arithmetischen Mittels der Kehrwerte der

Beobachtungswerte. Bei Datenlage B ist eine

Gewichtung der Kehrwerte der Merkmals-

ausprägungen mit den absoluten oder relativen

Häufigkeiten erforderlich.

→ Gewichtetes harmonisches Mittel (GHM)

GHM = 𝑛 ℎ𝑖𝑥𝑖

𝑚

𝑖=1

oder alternativ:

GHM =20

5,6607= 3,5331

GHM = 1 𝑓𝑖𝑥𝑖

𝑚

𝑖=1

GHM =1

0,2830= 3,5331

Page 8: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

8

Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Arbeitstabelle

xi hi fi 𝑥𝑖ℎ𝑖

1 1 0,05 1

2 2 0,1 4

3 3 0,15 27

4 3 0,15 64

5 5 0,25 3.125

6 3 0,15 216

7 2 0,1 49

8 1 0,05 8

20 1 1.828.915.200.000

Geometrisches Mittel

Rechnerischer Durchschnitt, n-te Wurzel aus

dem Produkt der Beobachtungswerte. Bei

Datenlage B sind die Merkmalsausprägungen

mit den absoluten Häufigkeiten zu potenzieren.

→ Gewichtetes geometrisches Mittel (GGM)

GGM = 𝑥𝑖ℎ𝑖

𝑚

𝑖=1

𝑛

GGM = 182891520000020

= 4,1031

Page 9: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

9

Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Nr. Merkmals-

ausprägung

einfache Häufigkeit kumulierte Häufigkeit

absolut relativ absolut relativ

i xi hi fi Hi Fi

1 23 1 0,0256 1 0,0256

2 24 1 0,0256 2 0,0513

3 25 6 0,1538 8 0,2051

4 26 10 0,2564 18 0,4615

5 27 4 0,1026 22 0,5641

6 28 5 0,1282 27 0,6923

7 29 4 0,1026 31 0,7949

8 30 4 0,1026 35 0,8974

9 31 2 0,0513 37 0,9487

10 32 1 0,0256 38 0,9744

11 33 0 0,0000 38 0,9744

12 34 1 0,0256 39 1

Summe 39 1

Zahlenbeispiel Absolventenumfrage 2002, Merkmal „Alter“:

max ℎ𝑖 = 10 Modus = 26

0,4615 < 0,5 < 0,5641 Median = 27

Page 10: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

10

Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Nr. Merkmals-

ausprägung

einfache Häufigkeit

absolut relativ

i xi hi fi 𝑥𝑖 ∙ ℎ𝑖

1 23 1 0,0256 23

2 24 1 0,0256 24

3 25 6 0,1538 150

4 26 10 0,2564 260

5 27 4 0,1026 108

6 28 5 0,1282 140

7 29 4 0,1026 116

8 30 4 0,1026 120

9 31 2 0,0513 62

10 32 1 0,0256 32

11 33 0 0,0000 0

12 34 1 0,0256 34

Summe 39 1 1069

Zahlenbeispiel Absolventenumfrage 2002, Merkmal „Alter“:

max ℎ𝑖 = 10 Modus = 26

0,4615 < 0,5 < 0,5641 Median = 27

Arithmetisches Mittel

GAM = 𝑥𝑖 ∙ ℎ𝑖

𝑚

𝑖=1

ℎ𝑖

𝑚

𝑖=1

GAM =1069

39= 27,41

Page 11: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

11

Mittelwerte und Lagemaße Datenlage C

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Datenlage C

Gegeben sind: k Klassen 𝐺1, … , 𝐺𝑘

mit den Mittelpunkten 𝑥1, … , 𝑥𝑘

und den Grenzen 𝑎𝑖−1, 𝑎𝑖)

mit der Klassenbreite ∆𝑖= 𝑎𝑖 − 𝑎𝑖−1

und den absoluten Häufigkeiten ℎ𝑖

der Klasse 𝐺𝑖, wobei 𝑖 = 1,… , 𝑘

Häufigkeitstabelle:

Klasse Grenzen Klassen-

mitte

Klassen-

breite

einfache

Häufigkeit

kumulierte

Häufigkeit

absolut relativ absolut relativ

i 𝑎𝑖−1, 𝑎𝑖) xi Δ𝑖 ≔ 𝑎𝑖 − 𝑎𝑖−1 hi fi Hi Fi

1 𝑎0, 𝑎1) x1 ∆1 h1 f1 H1 F1

2 𝑎1, 𝑎2) x 2 ∆ 2 h2 f2 H2 F2

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

k 𝑎𝑘−1, 𝑎𝑘) x k ∆ k hk fk Hk = 1 Fk = 1

Summe n 1

Page 12: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

12

Mittelwerte und Lagemaße Datenlage C Zahlenbeispiel

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Zahlenbeispiel: Absolventenumfrage, Merkmal „Alter beim Examen“ 5 Klassen, identische Breite D = 3

i ai-1 ai xi ∆i hi fi Hi Fi

1 21 24 22,5 3 1 0,0256 1 0,0256

2 24 27 25,5 3 17 0,4359 18 0,4615

3 27 30 28,5 3 13 0,3333 31 0,7949

4 30 33 31,5 3 7 0,1795 38 0,9744

5 33 36 34,5 3 1 0,0256 39 1

Summe 39 1

Modus: Mittelpunkt der modalen Klasse. Modus = 25,5

Median: Interpoliertes 0,5-Quantil. Median = 27,3

Arithmetisches Mittel: GAM der Klassenmittelpunkte. GAM = 27,7

Annahme: Entweder Gleichverteilung oder symmetrische Verteilung innerhalb der Klassen

Page 13: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

13

Mittelwerte und Lagemaße Datenlage C Modus

Ermittlung des Modus durch quadratische Interpolation:

Man bestimmt zunächst die Klasse 𝐺𝑖 mit der größten Häufigkeit. 𝐺𝑖 heißt modale Klasse. Sind die

Klassenbreiten unterschiedlich, so ist zur Ermittlung der modalen Klasse auf die Häufigkeitsdichte ℎ𝑖/∆𝒊

zurückzugreifen. Die modale Klasse ist in diesem Fall diejenige mit der größten Häufigkeitsdichte. Dann

betrachtet man das Histogramm für die Klasse 𝐺𝑖 und die beiden benachbarten Klassen 𝐺𝑖−1 und 𝐺𝑖+1. Modus, quadratische Interpolation

ufi

gk

eit

sd

ich

te

xi-1 xi+1xi Modus

hi

Di

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Man legt ein quadratisches Polynom 𝑦 = 𝑓 𝑥 = 𝑎 ⋅ 𝑥2 + 𝑏 ⋅ 𝑥 + 𝑐 durch die drei Mittelpunkte der oberen

Rechteckseiten mit den Koordinaten 𝑥𝑖−1,ℎ𝑖−1

Δ𝑖−1𝑥𝑖 ,

ℎ𝑖

Δ𝑖𝑥𝑖+1,

ℎ𝑖+1

Δ𝑖+1. Diese bestimmen a, b und c eindeutig.

Die Stelle, für die 𝑓(𝑥) das Maximum annimmt, wird als Modus gewählt.

Dieses Verfahren berücksichtigt die gegebene Häufigkeitsverteilung derart, dass sich der Modus innerhalb der modalen Klasse nicht im

Mittelpunkt dieser Klasse, sondern näher an der dichter besetzten Nachbarklasse befindet.

Page 14: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

14

Mittelwerte und Lagemaße Datenlage C Modus

Näherungslösung zur quadratischen Interpolation (nur bei exakt gleichen Gruppenbreiten)

Modus, quadratische Interpolation

Näherungslösung

ufi

gk

eit

sd

ich

te

xi-1 xi+1xi Modus

hi

Di

ai-1 ai

Du

D

Achtung:

Bei unterschiedlichen Klassenbreiten sind in

der Formel die absoluten Häufigkeitsdichten

𝑔𝑖 = ℎ𝑖 ∆𝑖 anstelle von ℎ𝑖 zu verwenden.

Modus − 𝑎𝑖−1𝑎𝑖 −𝑀

=Δ𝑢

Δ𝑜=

ℎ𝑖 − ℎ𝑖−1ℎ𝑖 − ℎ𝑖+1

⇔ Modus =𝑎𝑖 ⋅ ℎ𝑖 − ℎ𝑖−1 + 𝑎𝑖−1 ⋅ (ℎ𝑖 − ℎ𝑖+1)

ℎ𝑖 − ℎ𝑖−1 + ℎ𝑖 − ℎ𝑖+1

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Es gilt (nach Strahlensätzen):

Page 15: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

15

Mittelwerte und Lagemaße Datenlage C Modus

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Zahlenbeispiel: Absolventenumfrage, Merkmal „Alter beim Examen“

5 Klassen, identische Breite D = 3

i ai-1 ai xi ∆i hi fi Hi Fi

1 21 24 22,5 3 1 0,0256 1 0,0256

2 24 27 25,5 3 17 0,4359 18 0,4615

3 27 30 28,5 3 13 0,3333 31 0,7949

4 30 33 31,5 3 7 0,1795 38 0,9744

5 33 36 34,5 3 1 0,0256 39 1

Summe 39 1

Modale Klasse: Identische Klassenbreiten Klasse mit der größten absoluten oder relativen Häufigkeit

max ℎ𝑖 = 17 Klasse 2

Modus: Mittelpunkt der modalen Klasse Modus = 𝟐𝟓, 𝟓

Modus: Quadratische Interpolation: M =𝑎𝑖⋅ ℎ𝑖−ℎ𝑖−1 +𝑎𝑖−1⋅(ℎ𝑖−ℎ𝑖+1)

ℎ𝑖−ℎ𝑖−1 + ℎ𝑖−ℎ𝑖+1

=27⋅ 17−1 +24⋅(17−13)

17−1 + 17−13=

528

20= 26,4 Modus = 𝟐𝟔, 𝟒

Falls in der Aufgabenstellung nichts anderes gesagt wird, reicht es aus, den Modus als Mittelpunkt der

modalen Klasse zu bestimmen!

Annahme: Entweder Gleichverteilung oder symmetrische Verteilung innerhalb der Klassen

Page 16: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

16

Mittelwerte und Lagemaße Datenlage C Zusammenfassung

Berechnung der Mittelwerte bei Datenlage C:

Modus

Schritt 1: Ermittlung der modalen Klasse i.

Bei identischen Klassenbreiten: max (ℎ𝑖)

Bei unterschiedlichen Klassenbreiten: max 𝑔𝑖 = max ℎ𝑖 ∆𝑖

Schritt 2: Einfache Variante: Modus = Mittelpunkt der modalen Klasse

Quadratische Interpolation: Modus =𝑎𝑖⋅ ℎ𝑖−ℎ𝑖−1 +𝑎𝑖−1⋅(ℎ𝑖−ℎ𝑖+1)

ℎ𝑖−ℎ𝑖−1 + ℎ𝑖−ℎ𝑖+1

bzw. Modus =𝑎𝑖⋅ 𝑔𝑖−𝑔𝑖−1 +𝑎𝑖−1⋅(𝑔𝑖−𝑔𝑖+1)

𝑔𝑖−𝑔𝑖−1 + 𝑔𝑖−𝑔𝑖+1

Median

Berechnung des 0,5-Quantils durch lineare Interpolation

𝑥 0,5 ≈ 𝑎𝑖−1 + Δ𝑖 ∙ 0,5 − 𝐹𝑖−1𝐹𝑖 − 𝐹𝑖−1

= 𝑎𝑖−1 + Δ𝑖 ∙ 0,5 ∙ 𝑛 − 𝐻𝑖−1

𝐻𝑖 −𝐻𝑖−1

Arithmetisches, harmonisches und geometrisches Mittel

werden wie bei Datenlage B als gewichtete Mittelwerte berechnet, aber unter Verwendung der

Klassenmittelpunkte als Merkmalsausprägung xi.

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Page 17: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

17

Mittelwerte und Lagemaße Datenlage C Zahlenbeispiel

Mit Klassenbildung Ohne Klassenbildung Abweichung

Modus, Klassenmitte 25,5 26 – 1,92%

Modus, quadratisch interpoliert 26,4 26 + 1,54%

Median 27,3461 27 + 1,28%

Arithmetisches Mittel 27,7308 27,4103 + 1,17%

Vergleich mit den Ergebnissen ohne Klassenbildung:

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Zahlenbeispiel: Absolventenumfrage, Merkmal „Alter beim Examen“

5 Klassen, identische Breite D = 3

Page 18: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

18

Mittelwerte und Lagemaße Datenlage C Allgemeine Aussagen, Anwendbarkeit

Nominalskala Ordinalskala Intervallskala Verhältnisskala

Modus

Median

AM

GM

HM

Anwendbarkeit der Mittelwerte in Abhängigkeit vom Skalenniveau

Allgemeine Aussagen

• 𝑥𝑖 = const. ∀𝑖 = 1, … , 𝑛 ⇒ Modus = Median = AM = GM = HM

• HM < GM < AM, falls 𝑥𝑖 nicht konstant.

• Lageregel von Fechner:

Modus Median Arithmetisches Mittel linkssteile Verteilung

Arithmetisches Mittel Median Modus rechtssteile Verteilung

Modus Median Arithmetisches Mittel symmetrische Verteilung

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Page 19: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

19

Mittelwerte und Lagemaße Datenlage C Allgemeine Aussagen, Anwendbarkeit

Simpson – Paradoxon Th. Simpson, 1710 – 1761:

Ein Mittelwert oder eine Verhältniszahl (z.B. eine Quote, ein Anteilswert) kann für eine Gesamtheit

A größer sein als für eine Gesamtheit B, obwohl diese Größe (Mittelwert oder Verhältniszahl) in

allen Teilgesamtheiten von A kleiner ist als in denen von B.

Beispiel (aus v. d. Lippe 1993, S. 318):

Sterbeziffern (Todesraten) bei Geistlichen und Bergarbeitern

Alters- Geistliche Bergarbeiter

klasse Lebende Gestorbene Rate Lebende Gestorbene Rate

< 50 100 10 0,10 600 80 0,13

50 900 540 0,60 400 280 0,70

insgesamt 1000 550 0,55 1000 360 0,36

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Erklärung durch Struktureffekt:

Die Bergarbeiter sind jünger (60% jünger als 50 Jahre), sodass bei ihnen die Todesrate von 0,13

stärker gewichtet in den Mittelwert eingeht:

GAM Geistliche =100 ⋅ 0,1 + 900 ⋅ 0,6

1000= 0,55

GAM(Bergabeiter) =600 ⋅ 0,13 + 400 ⋅ 0,7

1000= 0,36

Page 20: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

20

Mittelwerte und Lagemaße Datenlage C Anwendungsbeispiel

Anwendungsbeispiel:

Die Einkommens- und Verbrauchsstichprobe 2008 lieferte folgende Daten zur Verteilung der Haushaltsnetto-

einkommen privater Haushalte in West- und Ostdeutschland: (Quelle: Statistisches Bundesamt, Fachserie 15, Heft 4: Wirtschaftsrechnungen , Wiesbaden 2010, Ü1.1)

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Haushaltsnettoeinkommen 2008 je Haushalt und Monat

Angaben in Euro Angaben in 1 000 Haushalten

von bis unter Früheres

Bundesgebiet Beitrittsgebiet

0 900 2 534 903

900 1 300 3 338 1 176

1 300 1 500 1 737 536

1 500 2 000 4 547 1 260

2 000 2 600 4 488 1 179

2 600 3 600 5 656 1 150

3 600 5 000 5 059 684

5 000 18 000 4 729 435

Summe 32 088 7 323

Aus diesen Daten lassen

sich die nebenstehenden

Mittelwerte berechnen:

West Ost

Modus (Klassenmitte) 1 750 1 100

Modus (quadr. interpoliert) 1 601 1 253

Median 2 520 1 915

Arithmetisches Mittel 3 715 2 578

Page 21: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

21

Mittelwerte und Lagemaße Datenlage C Anwendungsbeispiel

Berechnung der Werte für Ostdeutschland:

1. Modus

Zur Ermittlung der modalen Klasse müssen die Häufigkeitsdichten bestimmt werden, da die Klassenbreiten

nicht gleich sind.

Modus =𝑎𝑖 ⋅ 𝑔𝑖 − 𝑔𝑖−1 + 𝑎𝑖−1 ⋅ (𝑔𝑖 − 𝑔𝑖+1)

𝑔𝑖 − 𝑔𝑖−1 + (𝑔𝑖 − 𝑔𝑖+1)=

1300 ∙ 2,9400 − 1,0033 + 900 ∙ 2,9400 − 2,6800

2,9400 − 1,0033 + 2,9400 − 2,6800= 1253 €

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Haushaltsnettoeinkommen 2008 je Haushalt und Monat, Beitrittsgebiet

von bis unter absolute Häufigkeit Klassenbreite Häufigkeitsdichte

𝑎𝑖−1 𝑎𝑖 ℎ𝑖 ∆𝑖 𝑔𝑖 = ℎ𝑖 ∆𝑖

0 900 903 900 1,0033

900 1 300 1 176 400 2,9400

1 300 1 500 536 200 2,6800

1 500 2 000 1 260 500 2,5200

2 000 2 600 1 179 600 1,9650

2 600 3 600 1 150 1 000 1,1500

3 600 5 000 684 1 400 0,4886

5 000 18 000 435 13 000 0,0335

Quadratische Interpolation:

Mittelpunkt der modalen Klasse:

Modus = 1100 €

Page 22: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

22

Mittelwerte und Lagemaße Datenlage C Anwendungsbeispiel

2. Median

Berechnung der kumulierten Häufigkeiten:

Berechnung der 50%-Marke:

𝑛

2=

7323

2= 3661,5 Tsd. Haushalte

Also fällt der Median in die Klasse zwischen

1500 und 2000 Euro, weil in dieser Klasse mit

3875 Tsd. Haushalten die 50%-Marke erstmals

überschritten wird.

𝑥 = 1500 +3661,5 − 2615

3875 − 2615⋅ 2000 − 1500 = 1915 €

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Haushaltsnettoeinkommen 2008 je

Haushalt und Monat, Beitrittsgebiet

von bis unter absolute Häufigkeit

einfach kumuliert

𝑎𝑖−1 𝑎𝑖 ℎ𝑖 𝐻𝑖 Euro Tsd. Haushalte

0 900 903 903

900 1 300 1 176 2 079

1 300 1 500 536 2 615

1 500 2 000 1 260 3 875

2 000 2 600 1 179 5 054

2 600 3 600 1 150 6 204

3 600 5 000 684 6 888

5 000 18 000 435 7 323

Page 23: Statistik I - 4. Vorlesung - Ruhr University Bochum...5 Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013 Häufigkeitstabelle

23

Mittelwerte und Lagemaße Datenlage C Anwendungsbeispiel

3. Arithmetisches Mittel

Die Klassenmitten xi sind zu berechnen.

Arithmetisches Mittel = 𝑥 =18875750

7323= 2578 €

Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013

Haushaltsnettoeinkommen 2008 je Haushalt und Monat,

Beitrittsgebiet

von bis unter absolute Häufigkeit Klassenmitte

ai-1 ai hi xi hi xi

Euro Tsd. Haushalte Euro Tsd. Euro

0 900 903 450 406 350

900 1 300 1 176 1 100 1 293 600

1 300 1 500 536 1 400 750 400

1 500 2 000 1 260 1 750 2 205 000

2 000 2 600 1 179 2 300 2 711 700

2 600 3 600 1 150 3 100 3 565 000

3 600 5 000 684 4 300 2 941 200

5 000 18 000 435 11 500 5 002 500

Summe 7 323 18 875 750

Synopse …