Upload
others
View
7
Download
0
Embed Size (px)
Citation preview
WISTA WIRTSCHAFTSSTATISTIK
PROF. DR. ROLF HÜPEN
FAKULTÄT FÜR
WIRTSCHAFTSWISSENSCHAFT
Seminar für Theoretische Wirtschaftslehre
Vorlesungsprogramm 07.05.2013
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Mittelwerte und Lagemaße II
1. Anwendung und Berechnung der wichtigsten Mittelwerte
• Modus
• Median
• Arithmetisches Mittel
• Geometrisches Mittel
• Harmonisches Mittel
2. Verfahren der Gewichtung und Interpolation
3. Weitere Eigenschaften von Mittelwerten
4. Ein Anwendungsbeispiel
Literatur: Degen, Horst / Lorscheid, Peter: Statistik-Lehrbuch, 2. Aufl., München-Wien 2002, S. 37-43.
Mosler, Karl und Schmid, Friedrich: Beschreibende Statistik und Wirtschaftsstatistik, Berlin-
Heidelberg-New York 2003, S. 34-42.
von der Lippe, Peter: Deskriptive Statistik, Stuttgart 1993, Online Ausgabe S. 46-82. und S.
318.
Weitere Übungsaufgaben zu Mittelwerten: SAK WS 07/08, A2. SAK SS 08, A1. SAK SS 09, A2. SAK
SS 10, A3. SAK SS 12, A2.
2
Mittelwerte und Lagemaße Datenlage B
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Datenlage B: Häufigkeitstabellen
Liste der von einander verschiedenen Merkmalsausprägungen und deren Häufigkeit
Nr. Merkmals-
ausprägung
einfache Häufigkeit kumulierte Häufigkeit
absolut relativ absolut relativ
i xi hi fi Hi Fi
1 x1 h1 f1 H1 F1
2 x2 h2 f2 H2 F2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
m xm hm fm Hm= n Fm=1
Summe n 1
3
Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel
Stabdiagramm
0
0,05
0,1
0,15
0,2
0,25
0,3
1 2 3 4 5 6 7 8
Merkmal x
Rela
tive H
äu
fig
keit
f
Häufigkeitstabelle
xi hi fi Hi Fi
1 1 0,05 1 0,05
2 2 0,1 3 0,15
3 3 0,15 6 0,3
4 3 0,15 9 0,45
5 5 0,25 14 0,7
6 3 0,15 17 0,85
7 2 0,1 19 0,95
8 1 0,05 20 1
Summe 20 1
Fiktives Zahlenbeispiel, quantitatives Merkmal x, 20 Beobachtungswerte:
5,6,4,2,8,3,7,5,5,3,6,4,2,3,4,6,5,7,5,1
Quelle für das Zahlenbeispiel: Abels, Heiner: Wirtschafts- und Bevölkerungsstatistik, 4. Aufl., Wiesbaden 1993, S. 209
Geordnete Urliste
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
x(i) 1 2 2 3 3 3 4 4 4 5 5 5 5 5 6 6 6 7 7 8
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
4
Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel
max𝑖
ℎ𝑖 = ℎ5 = 5
max𝑖
𝑓𝑖 = 𝑓5 = 0,25
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Häufigkeitstabelle
xi hi fi Hi Fi
1 1 0,05 1 0,05
2 2 0,1 3 0,15
3 3 0,15 6 0,3
4 3 0,15 9 0,45
5 5 0,25 14 0,7
6 3 0,15 17 0,85
7 2 0,1 19 0,95
8 1 0,05 20 1
Summe 20 1
Modus = Merkmalsausprägung mit der
größten absoluten oder relativen
Häufigkeit
→ Modus = 𝒙𝟓 = 𝟓
5
Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Häufigkeitstabelle
xi hi fi Hi Fi
1 1 0,05 1 0,05
2 2 0,1 3 0,15
3 3 0,15 6 0,3
4 3 0,15 9 0,45
5 5 0,25 14 0,7
6 3 0,15 17 0,85
7 2 0,1 19 0,95
8 1 0,05 20 1
Summe 20 1
Median = Zentralwert. Merkmalsausprä-
gung, die in der Mitte der
geordneten Urliste steht. Teilt
die Liste in zwei Hälften.
Median = 𝑥𝑖 für 𝐹𝑖−1 < 0,5 < 𝐹𝑖
12∙ 𝑥𝑖 + 𝑥𝑖+1 für 0,5 = 𝐹𝑖
Median = 𝑥𝑖 für 𝐻𝑖−1 < 𝑛
2< 𝐻𝑖
12∙ 𝑥𝑖 + 𝑥𝑖+1 für 𝑛
2= 𝐹𝑖
oder alternativ:
𝐹4 = 0,45 < 0,5 < 0,7 = 𝐹5 ⟹ Median = 𝒙 = 𝒙𝟓 = 𝟓
𝐻4 = 9 < 10 < 14 = 𝐻5 ⟹ Median = 𝒙 = 𝒙𝟓 = 𝟓
6
Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Arbeitstabelle
xi hi fi 𝑥𝑖 ∙ ℎ𝑖 𝑥𝑖 ∙ 𝑓𝑖
1 1 0,05 1 0,05
2 2 0,1 4 0,2
3 3 0,15 9 0,45
4 3 0,15 12 0,6
5 5 0,25 25 1,25
6 3 0,15 18 0,9
7 2 0,1 14 0,7
8 1 0,05 8 0,4
Summe 20 1 91 4,55
Arithmetisches Mittel
Rechnerischer Durchschnitt, Summe der
Beobachtungswerte dividiert durch deren
Anzahl. Bei Datenlage B ist eine Gewichtung
der Merkmalsausprägungen mit den absoluten
oder relativen Häufigkeiten erforderlich.
→ Gewichtetes arithmetisches Mittel (GAM)
GAM = 𝑥 =1
𝑛∙ 𝑥𝑖 ∙ ℎ𝑖
𝑚
𝑖=1
oder alternativ:
𝑥 =91
20= 4,55
𝑥 = 4,55 GAM = 𝑥 = 𝑥𝑖 ∙ 𝑓𝑖
𝑚
𝑖=1
7
Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Arbeitstabelle
xi hi fi ℎ𝑖 𝑥𝑖 𝑓𝑖 𝑥𝑖
1 1 0,05 1 0,05
2 2 0,1 1 0,05
3 3 0,15 1 0,05
4 3 0,15 0,75 0,0375
5 5 0,25 1 0,05
6 3 0,15 0,5 0,025
7 2 0,1 0,2857 0,01429
8 1 0,05 0,125 0,0063
Summe 20 1 5,6607 0,2830
Harmonisches Mittel
Rechnerischer Durchschnitt, Kehrwert des
arithmetischen Mittels der Kehrwerte der
Beobachtungswerte. Bei Datenlage B ist eine
Gewichtung der Kehrwerte der Merkmals-
ausprägungen mit den absoluten oder relativen
Häufigkeiten erforderlich.
→ Gewichtetes harmonisches Mittel (GHM)
GHM = 𝑛 ℎ𝑖𝑥𝑖
𝑚
𝑖=1
oder alternativ:
GHM =20
5,6607= 3,5331
GHM = 1 𝑓𝑖𝑥𝑖
𝑚
𝑖=1
GHM =1
0,2830= 3,5331
8
Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Arbeitstabelle
xi hi fi 𝑥𝑖ℎ𝑖
1 1 0,05 1
2 2 0,1 4
3 3 0,15 27
4 3 0,15 64
5 5 0,25 3.125
6 3 0,15 216
7 2 0,1 49
8 1 0,05 8
20 1 1.828.915.200.000
Geometrisches Mittel
Rechnerischer Durchschnitt, n-te Wurzel aus
dem Produkt der Beobachtungswerte. Bei
Datenlage B sind die Merkmalsausprägungen
mit den absoluten Häufigkeiten zu potenzieren.
→ Gewichtetes geometrisches Mittel (GGM)
GGM = 𝑥𝑖ℎ𝑖
𝑚
𝑖=1
𝑛
GGM = 182891520000020
= 4,1031
9
Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Nr. Merkmals-
ausprägung
einfache Häufigkeit kumulierte Häufigkeit
absolut relativ absolut relativ
i xi hi fi Hi Fi
1 23 1 0,0256 1 0,0256
2 24 1 0,0256 2 0,0513
3 25 6 0,1538 8 0,2051
4 26 10 0,2564 18 0,4615
5 27 4 0,1026 22 0,5641
6 28 5 0,1282 27 0,6923
7 29 4 0,1026 31 0,7949
8 30 4 0,1026 35 0,8974
9 31 2 0,0513 37 0,9487
10 32 1 0,0256 38 0,9744
11 33 0 0,0000 38 0,9744
12 34 1 0,0256 39 1
Summe 39 1
Zahlenbeispiel Absolventenumfrage 2002, Merkmal „Alter“:
max ℎ𝑖 = 10 Modus = 26
0,4615 < 0,5 < 0,5641 Median = 27
10
Mittelwerte und Lagemaße Datenlage B Zahlenbeispiel
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Nr. Merkmals-
ausprägung
einfache Häufigkeit
absolut relativ
i xi hi fi 𝑥𝑖 ∙ ℎ𝑖
1 23 1 0,0256 23
2 24 1 0,0256 24
3 25 6 0,1538 150
4 26 10 0,2564 260
5 27 4 0,1026 108
6 28 5 0,1282 140
7 29 4 0,1026 116
8 30 4 0,1026 120
9 31 2 0,0513 62
10 32 1 0,0256 32
11 33 0 0,0000 0
12 34 1 0,0256 34
Summe 39 1 1069
Zahlenbeispiel Absolventenumfrage 2002, Merkmal „Alter“:
max ℎ𝑖 = 10 Modus = 26
0,4615 < 0,5 < 0,5641 Median = 27
Arithmetisches Mittel
GAM = 𝑥𝑖 ∙ ℎ𝑖
𝑚
𝑖=1
ℎ𝑖
𝑚
𝑖=1
GAM =1069
39= 27,41
11
Mittelwerte und Lagemaße Datenlage C
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Datenlage C
Gegeben sind: k Klassen 𝐺1, … , 𝐺𝑘
mit den Mittelpunkten 𝑥1, … , 𝑥𝑘
und den Grenzen 𝑎𝑖−1, 𝑎𝑖)
mit der Klassenbreite ∆𝑖= 𝑎𝑖 − 𝑎𝑖−1
und den absoluten Häufigkeiten ℎ𝑖
der Klasse 𝐺𝑖, wobei 𝑖 = 1,… , 𝑘
Häufigkeitstabelle:
Klasse Grenzen Klassen-
mitte
Klassen-
breite
einfache
Häufigkeit
kumulierte
Häufigkeit
absolut relativ absolut relativ
i 𝑎𝑖−1, 𝑎𝑖) xi Δ𝑖 ≔ 𝑎𝑖 − 𝑎𝑖−1 hi fi Hi Fi
1 𝑎0, 𝑎1) x1 ∆1 h1 f1 H1 F1
2 𝑎1, 𝑎2) x 2 ∆ 2 h2 f2 H2 F2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
k 𝑎𝑘−1, 𝑎𝑘) x k ∆ k hk fk Hk = 1 Fk = 1
Summe n 1
12
Mittelwerte und Lagemaße Datenlage C Zahlenbeispiel
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Zahlenbeispiel: Absolventenumfrage, Merkmal „Alter beim Examen“ 5 Klassen, identische Breite D = 3
i ai-1 ai xi ∆i hi fi Hi Fi
1 21 24 22,5 3 1 0,0256 1 0,0256
2 24 27 25,5 3 17 0,4359 18 0,4615
3 27 30 28,5 3 13 0,3333 31 0,7949
4 30 33 31,5 3 7 0,1795 38 0,9744
5 33 36 34,5 3 1 0,0256 39 1
Summe 39 1
Modus: Mittelpunkt der modalen Klasse. Modus = 25,5
Median: Interpoliertes 0,5-Quantil. Median = 27,3
Arithmetisches Mittel: GAM der Klassenmittelpunkte. GAM = 27,7
Annahme: Entweder Gleichverteilung oder symmetrische Verteilung innerhalb der Klassen
13
Mittelwerte und Lagemaße Datenlage C Modus
Ermittlung des Modus durch quadratische Interpolation:
Man bestimmt zunächst die Klasse 𝐺𝑖 mit der größten Häufigkeit. 𝐺𝑖 heißt modale Klasse. Sind die
Klassenbreiten unterschiedlich, so ist zur Ermittlung der modalen Klasse auf die Häufigkeitsdichte ℎ𝑖/∆𝒊
zurückzugreifen. Die modale Klasse ist in diesem Fall diejenige mit der größten Häufigkeitsdichte. Dann
betrachtet man das Histogramm für die Klasse 𝐺𝑖 und die beiden benachbarten Klassen 𝐺𝑖−1 und 𝐺𝑖+1. Modus, quadratische Interpolation
Hä
ufi
gk
eit
sd
ich
te
xi-1 xi+1xi Modus
hi
Di
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Man legt ein quadratisches Polynom 𝑦 = 𝑓 𝑥 = 𝑎 ⋅ 𝑥2 + 𝑏 ⋅ 𝑥 + 𝑐 durch die drei Mittelpunkte der oberen
Rechteckseiten mit den Koordinaten 𝑥𝑖−1,ℎ𝑖−1
Δ𝑖−1𝑥𝑖 ,
ℎ𝑖
Δ𝑖𝑥𝑖+1,
ℎ𝑖+1
Δ𝑖+1. Diese bestimmen a, b und c eindeutig.
Die Stelle, für die 𝑓(𝑥) das Maximum annimmt, wird als Modus gewählt.
Dieses Verfahren berücksichtigt die gegebene Häufigkeitsverteilung derart, dass sich der Modus innerhalb der modalen Klasse nicht im
Mittelpunkt dieser Klasse, sondern näher an der dichter besetzten Nachbarklasse befindet.
14
Mittelwerte und Lagemaße Datenlage C Modus
Näherungslösung zur quadratischen Interpolation (nur bei exakt gleichen Gruppenbreiten)
Modus, quadratische Interpolation
Näherungslösung
Hä
ufi
gk
eit
sd
ich
te
xi-1 xi+1xi Modus
hi
Di
ai-1 ai
Du
D
Achtung:
Bei unterschiedlichen Klassenbreiten sind in
der Formel die absoluten Häufigkeitsdichten
𝑔𝑖 = ℎ𝑖 ∆𝑖 anstelle von ℎ𝑖 zu verwenden.
Modus − 𝑎𝑖−1𝑎𝑖 −𝑀
=Δ𝑢
Δ𝑜=
ℎ𝑖 − ℎ𝑖−1ℎ𝑖 − ℎ𝑖+1
⇔ Modus =𝑎𝑖 ⋅ ℎ𝑖 − ℎ𝑖−1 + 𝑎𝑖−1 ⋅ (ℎ𝑖 − ℎ𝑖+1)
ℎ𝑖 − ℎ𝑖−1 + ℎ𝑖 − ℎ𝑖+1
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Es gilt (nach Strahlensätzen):
15
Mittelwerte und Lagemaße Datenlage C Modus
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Zahlenbeispiel: Absolventenumfrage, Merkmal „Alter beim Examen“
5 Klassen, identische Breite D = 3
i ai-1 ai xi ∆i hi fi Hi Fi
1 21 24 22,5 3 1 0,0256 1 0,0256
2 24 27 25,5 3 17 0,4359 18 0,4615
3 27 30 28,5 3 13 0,3333 31 0,7949
4 30 33 31,5 3 7 0,1795 38 0,9744
5 33 36 34,5 3 1 0,0256 39 1
Summe 39 1
Modale Klasse: Identische Klassenbreiten Klasse mit der größten absoluten oder relativen Häufigkeit
max ℎ𝑖 = 17 Klasse 2
Modus: Mittelpunkt der modalen Klasse Modus = 𝟐𝟓, 𝟓
Modus: Quadratische Interpolation: M =𝑎𝑖⋅ ℎ𝑖−ℎ𝑖−1 +𝑎𝑖−1⋅(ℎ𝑖−ℎ𝑖+1)
ℎ𝑖−ℎ𝑖−1 + ℎ𝑖−ℎ𝑖+1
=27⋅ 17−1 +24⋅(17−13)
17−1 + 17−13=
528
20= 26,4 Modus = 𝟐𝟔, 𝟒
Falls in der Aufgabenstellung nichts anderes gesagt wird, reicht es aus, den Modus als Mittelpunkt der
modalen Klasse zu bestimmen!
Annahme: Entweder Gleichverteilung oder symmetrische Verteilung innerhalb der Klassen
16
Mittelwerte und Lagemaße Datenlage C Zusammenfassung
Berechnung der Mittelwerte bei Datenlage C:
Modus
Schritt 1: Ermittlung der modalen Klasse i.
Bei identischen Klassenbreiten: max (ℎ𝑖)
Bei unterschiedlichen Klassenbreiten: max 𝑔𝑖 = max ℎ𝑖 ∆𝑖
Schritt 2: Einfache Variante: Modus = Mittelpunkt der modalen Klasse
Quadratische Interpolation: Modus =𝑎𝑖⋅ ℎ𝑖−ℎ𝑖−1 +𝑎𝑖−1⋅(ℎ𝑖−ℎ𝑖+1)
ℎ𝑖−ℎ𝑖−1 + ℎ𝑖−ℎ𝑖+1
bzw. Modus =𝑎𝑖⋅ 𝑔𝑖−𝑔𝑖−1 +𝑎𝑖−1⋅(𝑔𝑖−𝑔𝑖+1)
𝑔𝑖−𝑔𝑖−1 + 𝑔𝑖−𝑔𝑖+1
Median
Berechnung des 0,5-Quantils durch lineare Interpolation
𝑥 0,5 ≈ 𝑎𝑖−1 + Δ𝑖 ∙ 0,5 − 𝐹𝑖−1𝐹𝑖 − 𝐹𝑖−1
= 𝑎𝑖−1 + Δ𝑖 ∙ 0,5 ∙ 𝑛 − 𝐻𝑖−1
𝐻𝑖 −𝐻𝑖−1
Arithmetisches, harmonisches und geometrisches Mittel
werden wie bei Datenlage B als gewichtete Mittelwerte berechnet, aber unter Verwendung der
Klassenmittelpunkte als Merkmalsausprägung xi.
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
17
Mittelwerte und Lagemaße Datenlage C Zahlenbeispiel
Mit Klassenbildung Ohne Klassenbildung Abweichung
Modus, Klassenmitte 25,5 26 – 1,92%
Modus, quadratisch interpoliert 26,4 26 + 1,54%
Median 27,3461 27 + 1,28%
Arithmetisches Mittel 27,7308 27,4103 + 1,17%
Vergleich mit den Ergebnissen ohne Klassenbildung:
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Zahlenbeispiel: Absolventenumfrage, Merkmal „Alter beim Examen“
5 Klassen, identische Breite D = 3
18
Mittelwerte und Lagemaße Datenlage C Allgemeine Aussagen, Anwendbarkeit
Nominalskala Ordinalskala Intervallskala Verhältnisskala
Modus
Median
AM
GM
HM
Anwendbarkeit der Mittelwerte in Abhängigkeit vom Skalenniveau
Allgemeine Aussagen
• 𝑥𝑖 = const. ∀𝑖 = 1, … , 𝑛 ⇒ Modus = Median = AM = GM = HM
• HM < GM < AM, falls 𝑥𝑖 nicht konstant.
• Lageregel von Fechner:
Modus Median Arithmetisches Mittel linkssteile Verteilung
Arithmetisches Mittel Median Modus rechtssteile Verteilung
Modus Median Arithmetisches Mittel symmetrische Verteilung
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
19
Mittelwerte und Lagemaße Datenlage C Allgemeine Aussagen, Anwendbarkeit
Simpson – Paradoxon Th. Simpson, 1710 – 1761:
Ein Mittelwert oder eine Verhältniszahl (z.B. eine Quote, ein Anteilswert) kann für eine Gesamtheit
A größer sein als für eine Gesamtheit B, obwohl diese Größe (Mittelwert oder Verhältniszahl) in
allen Teilgesamtheiten von A kleiner ist als in denen von B.
Beispiel (aus v. d. Lippe 1993, S. 318):
Sterbeziffern (Todesraten) bei Geistlichen und Bergarbeitern
Alters- Geistliche Bergarbeiter
klasse Lebende Gestorbene Rate Lebende Gestorbene Rate
< 50 100 10 0,10 600 80 0,13
50 900 540 0,60 400 280 0,70
insgesamt 1000 550 0,55 1000 360 0,36
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Erklärung durch Struktureffekt:
Die Bergarbeiter sind jünger (60% jünger als 50 Jahre), sodass bei ihnen die Todesrate von 0,13
stärker gewichtet in den Mittelwert eingeht:
GAM Geistliche =100 ⋅ 0,1 + 900 ⋅ 0,6
1000= 0,55
GAM(Bergabeiter) =600 ⋅ 0,13 + 400 ⋅ 0,7
1000= 0,36
20
Mittelwerte und Lagemaße Datenlage C Anwendungsbeispiel
Anwendungsbeispiel:
Die Einkommens- und Verbrauchsstichprobe 2008 lieferte folgende Daten zur Verteilung der Haushaltsnetto-
einkommen privater Haushalte in West- und Ostdeutschland: (Quelle: Statistisches Bundesamt, Fachserie 15, Heft 4: Wirtschaftsrechnungen , Wiesbaden 2010, Ü1.1)
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Haushaltsnettoeinkommen 2008 je Haushalt und Monat
Angaben in Euro Angaben in 1 000 Haushalten
von bis unter Früheres
Bundesgebiet Beitrittsgebiet
0 900 2 534 903
900 1 300 3 338 1 176
1 300 1 500 1 737 536
1 500 2 000 4 547 1 260
2 000 2 600 4 488 1 179
2 600 3 600 5 656 1 150
3 600 5 000 5 059 684
5 000 18 000 4 729 435
Summe 32 088 7 323
Aus diesen Daten lassen
sich die nebenstehenden
Mittelwerte berechnen:
West Ost
Modus (Klassenmitte) 1 750 1 100
Modus (quadr. interpoliert) 1 601 1 253
Median 2 520 1 915
Arithmetisches Mittel 3 715 2 578
21
Mittelwerte und Lagemaße Datenlage C Anwendungsbeispiel
Berechnung der Werte für Ostdeutschland:
1. Modus
Zur Ermittlung der modalen Klasse müssen die Häufigkeitsdichten bestimmt werden, da die Klassenbreiten
nicht gleich sind.
Modus =𝑎𝑖 ⋅ 𝑔𝑖 − 𝑔𝑖−1 + 𝑎𝑖−1 ⋅ (𝑔𝑖 − 𝑔𝑖+1)
𝑔𝑖 − 𝑔𝑖−1 + (𝑔𝑖 − 𝑔𝑖+1)=
1300 ∙ 2,9400 − 1,0033 + 900 ∙ 2,9400 − 2,6800
2,9400 − 1,0033 + 2,9400 − 2,6800= 1253 €
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Haushaltsnettoeinkommen 2008 je Haushalt und Monat, Beitrittsgebiet
von bis unter absolute Häufigkeit Klassenbreite Häufigkeitsdichte
𝑎𝑖−1 𝑎𝑖 ℎ𝑖 ∆𝑖 𝑔𝑖 = ℎ𝑖 ∆𝑖
0 900 903 900 1,0033
900 1 300 1 176 400 2,9400
1 300 1 500 536 200 2,6800
1 500 2 000 1 260 500 2,5200
2 000 2 600 1 179 600 1,9650
2 600 3 600 1 150 1 000 1,1500
3 600 5 000 684 1 400 0,4886
5 000 18 000 435 13 000 0,0335
Quadratische Interpolation:
Mittelpunkt der modalen Klasse:
Modus = 1100 €
22
Mittelwerte und Lagemaße Datenlage C Anwendungsbeispiel
2. Median
Berechnung der kumulierten Häufigkeiten:
Berechnung der 50%-Marke:
𝑛
2=
7323
2= 3661,5 Tsd. Haushalte
Also fällt der Median in die Klasse zwischen
1500 und 2000 Euro, weil in dieser Klasse mit
3875 Tsd. Haushalten die 50%-Marke erstmals
überschritten wird.
𝑥 = 1500 +3661,5 − 2615
3875 − 2615⋅ 2000 − 1500 = 1915 €
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Haushaltsnettoeinkommen 2008 je
Haushalt und Monat, Beitrittsgebiet
von bis unter absolute Häufigkeit
einfach kumuliert
𝑎𝑖−1 𝑎𝑖 ℎ𝑖 𝐻𝑖 Euro Tsd. Haushalte
0 900 903 903
900 1 300 1 176 2 079
1 300 1 500 536 2 615
1 500 2 000 1 260 3 875
2 000 2 600 1 179 5 054
2 600 3 600 1 150 6 204
3 600 5 000 684 6 888
5 000 18 000 435 7 323
23
Mittelwerte und Lagemaße Datenlage C Anwendungsbeispiel
3. Arithmetisches Mittel
Die Klassenmitten xi sind zu berechnen.
Arithmetisches Mittel = 𝑥 =18875750
7323= 2578 €
Prof. Dr. Rolf Hüpen | Modul „Statistik I“ | Sommersemester 2013
Haushaltsnettoeinkommen 2008 je Haushalt und Monat,
Beitrittsgebiet
von bis unter absolute Häufigkeit Klassenmitte
ai-1 ai hi xi hi xi
Euro Tsd. Haushalte Euro Tsd. Euro
0 900 903 450 406 350
900 1 300 1 176 1 100 1 293 600
1 300 1 500 536 1 400 750 400
1 500 2 000 1 260 1 750 2 205 000
2 000 2 600 1 179 2 300 2 711 700
2 600 3 600 1 150 3 100 3 565 000
3 600 5 000 684 4 300 2 941 200
5 000 18 000 435 11 500 5 002 500
Summe 7 323 18 875 750
Synopse …