Upload
dara
View
35
Download
0
Embed Size (px)
DESCRIPTION
STATISIK. LV Nr.: 1375 SS 2005 1.März 2005. Literatur. Bleymüller, Gehlert, Gülicher: „Statistik für Wirtschaftswissenschaftler“, Verlag Vahlen Hartung: „Statistik. Lehr- und Handbuch der angewandten Statistik“, Oldenburg Verlag München Wien. Einführung . - PowerPoint PPT Presentation
Citation preview
1
STATISIKLV Nr 1375
SS 20051Maumlrz 2005
2
Literatur
bull Bleymuumlller Gehlert Guumllicher bdquoStatistik fuumlr Wirtschaftswissenschaftlerldquo Verlag Vahlen
bull Hartung bdquoStatistik Lehr- und Handbuch der angewandten Statistikldquo Oldenburg Verlag Muumlnchen Wien
3
Einfuumlhrung bull bdquoStatistikldquo Abgeleitet vom neulateinischen
Begriff bdquostatusldquo (Bed bdquoStaatldquo bdquoZustandldquo) bull 18 und 19 Jhdt bdquoLehre von der
Zustandsbeschreibung des Staatesldquo (Sammeln und verbales oder numerisches Beschreiben von Daten)
bull Heute im doppelten Sinne gebrauchtndash Quantitative Informationen (zB
Bevoumllkerungsstatistik)ndash Formale Wissenschaft
4
Einfuumlhrung
Statistik befasst sich mit ndash Erhebung (Sammeln von Daten Wie kommt
man zu der benoumltigten Information)ndash Aufbereitung (Praumlsentation Reduktion von
Daten wobei ein Groszligteil der Information erhalten bleiben soll wenige Kenngroumlszligen einfache Grafiken)
ndash Analyse (Welche Schluumlsse kann man ziehen Allgemeine Aussagen basierend auf Stichproben)
von (numerischen) Daten
5
Einfuumlhrung
bull Warum Statistikndash Entscheidungshilfe
zB 2 verschiedene Produkte ndash welches soll am Markt eingefuumlhrt werden
ndash Tieferes Verstaumlndnis bei Problemen zB Welche Faktoren beeinflussen die
Kaufentscheidung Richtung des Einflusses
6
Einfuumlhrungbull Wie Statistik
ndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
8
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
9
Statistische Datenbull Bestandsmassen (Streckenmassen)
ndash Objekte mit Lebensdauer ndash Werden zu einem Zeitpunkt erfasstndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand
am 31122004bull Bewegungs- oder Ereignismassen (Punktmassen)
ndash Ereignissendash Werden innerhalb einer Zeitspanne erfasstndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer
Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel Anfangsbestand + Zugang ndash Abgang = EndbestandBestandsmasse Bewegungsmasse
11
Statistische Datenbull Angehoumlrige der Massen Merkmalstraumlger
Beobachtungseinheit (Personen Objekte) bull Erhoben werden Werte von Merkmalen
Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhobenbull Stichprobenerhebung
Es werden Daten von einer Teilmenge (Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmalebull Qualitative Merkmale
ndash Messen durch Klassifikation (zB Geschlecht)bull Quantitative Merkmale
ndash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)bull Stetige Merkmale
ndash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen x=ax + b (a gt 0)
bull Verhaumlltnisskala Aumlhnlichkeitstransformationen x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
2
Literatur
bull Bleymuumlller Gehlert Guumllicher bdquoStatistik fuumlr Wirtschaftswissenschaftlerldquo Verlag Vahlen
bull Hartung bdquoStatistik Lehr- und Handbuch der angewandten Statistikldquo Oldenburg Verlag Muumlnchen Wien
3
Einfuumlhrung bull bdquoStatistikldquo Abgeleitet vom neulateinischen
Begriff bdquostatusldquo (Bed bdquoStaatldquo bdquoZustandldquo) bull 18 und 19 Jhdt bdquoLehre von der
Zustandsbeschreibung des Staatesldquo (Sammeln und verbales oder numerisches Beschreiben von Daten)
bull Heute im doppelten Sinne gebrauchtndash Quantitative Informationen (zB
Bevoumllkerungsstatistik)ndash Formale Wissenschaft
4
Einfuumlhrung
Statistik befasst sich mit ndash Erhebung (Sammeln von Daten Wie kommt
man zu der benoumltigten Information)ndash Aufbereitung (Praumlsentation Reduktion von
Daten wobei ein Groszligteil der Information erhalten bleiben soll wenige Kenngroumlszligen einfache Grafiken)
ndash Analyse (Welche Schluumlsse kann man ziehen Allgemeine Aussagen basierend auf Stichproben)
von (numerischen) Daten
5
Einfuumlhrung
bull Warum Statistikndash Entscheidungshilfe
zB 2 verschiedene Produkte ndash welches soll am Markt eingefuumlhrt werden
ndash Tieferes Verstaumlndnis bei Problemen zB Welche Faktoren beeinflussen die
Kaufentscheidung Richtung des Einflusses
6
Einfuumlhrungbull Wie Statistik
ndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
8
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
9
Statistische Datenbull Bestandsmassen (Streckenmassen)
ndash Objekte mit Lebensdauer ndash Werden zu einem Zeitpunkt erfasstndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand
am 31122004bull Bewegungs- oder Ereignismassen (Punktmassen)
ndash Ereignissendash Werden innerhalb einer Zeitspanne erfasstndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer
Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel Anfangsbestand + Zugang ndash Abgang = EndbestandBestandsmasse Bewegungsmasse
11
Statistische Datenbull Angehoumlrige der Massen Merkmalstraumlger
Beobachtungseinheit (Personen Objekte) bull Erhoben werden Werte von Merkmalen
Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhobenbull Stichprobenerhebung
Es werden Daten von einer Teilmenge (Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmalebull Qualitative Merkmale
ndash Messen durch Klassifikation (zB Geschlecht)bull Quantitative Merkmale
ndash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)bull Stetige Merkmale
ndash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen x=ax + b (a gt 0)
bull Verhaumlltnisskala Aumlhnlichkeitstransformationen x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
3
Einfuumlhrung bull bdquoStatistikldquo Abgeleitet vom neulateinischen
Begriff bdquostatusldquo (Bed bdquoStaatldquo bdquoZustandldquo) bull 18 und 19 Jhdt bdquoLehre von der
Zustandsbeschreibung des Staatesldquo (Sammeln und verbales oder numerisches Beschreiben von Daten)
bull Heute im doppelten Sinne gebrauchtndash Quantitative Informationen (zB
Bevoumllkerungsstatistik)ndash Formale Wissenschaft
4
Einfuumlhrung
Statistik befasst sich mit ndash Erhebung (Sammeln von Daten Wie kommt
man zu der benoumltigten Information)ndash Aufbereitung (Praumlsentation Reduktion von
Daten wobei ein Groszligteil der Information erhalten bleiben soll wenige Kenngroumlszligen einfache Grafiken)
ndash Analyse (Welche Schluumlsse kann man ziehen Allgemeine Aussagen basierend auf Stichproben)
von (numerischen) Daten
5
Einfuumlhrung
bull Warum Statistikndash Entscheidungshilfe
zB 2 verschiedene Produkte ndash welches soll am Markt eingefuumlhrt werden
ndash Tieferes Verstaumlndnis bei Problemen zB Welche Faktoren beeinflussen die
Kaufentscheidung Richtung des Einflusses
6
Einfuumlhrungbull Wie Statistik
ndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
8
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
9
Statistische Datenbull Bestandsmassen (Streckenmassen)
ndash Objekte mit Lebensdauer ndash Werden zu einem Zeitpunkt erfasstndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand
am 31122004bull Bewegungs- oder Ereignismassen (Punktmassen)
ndash Ereignissendash Werden innerhalb einer Zeitspanne erfasstndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer
Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel Anfangsbestand + Zugang ndash Abgang = EndbestandBestandsmasse Bewegungsmasse
11
Statistische Datenbull Angehoumlrige der Massen Merkmalstraumlger
Beobachtungseinheit (Personen Objekte) bull Erhoben werden Werte von Merkmalen
Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhobenbull Stichprobenerhebung
Es werden Daten von einer Teilmenge (Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmalebull Qualitative Merkmale
ndash Messen durch Klassifikation (zB Geschlecht)bull Quantitative Merkmale
ndash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)bull Stetige Merkmale
ndash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen x=ax + b (a gt 0)
bull Verhaumlltnisskala Aumlhnlichkeitstransformationen x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
4
Einfuumlhrung
Statistik befasst sich mit ndash Erhebung (Sammeln von Daten Wie kommt
man zu der benoumltigten Information)ndash Aufbereitung (Praumlsentation Reduktion von
Daten wobei ein Groszligteil der Information erhalten bleiben soll wenige Kenngroumlszligen einfache Grafiken)
ndash Analyse (Welche Schluumlsse kann man ziehen Allgemeine Aussagen basierend auf Stichproben)
von (numerischen) Daten
5
Einfuumlhrung
bull Warum Statistikndash Entscheidungshilfe
zB 2 verschiedene Produkte ndash welches soll am Markt eingefuumlhrt werden
ndash Tieferes Verstaumlndnis bei Problemen zB Welche Faktoren beeinflussen die
Kaufentscheidung Richtung des Einflusses
6
Einfuumlhrungbull Wie Statistik
ndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
8
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
9
Statistische Datenbull Bestandsmassen (Streckenmassen)
ndash Objekte mit Lebensdauer ndash Werden zu einem Zeitpunkt erfasstndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand
am 31122004bull Bewegungs- oder Ereignismassen (Punktmassen)
ndash Ereignissendash Werden innerhalb einer Zeitspanne erfasstndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer
Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel Anfangsbestand + Zugang ndash Abgang = EndbestandBestandsmasse Bewegungsmasse
11
Statistische Datenbull Angehoumlrige der Massen Merkmalstraumlger
Beobachtungseinheit (Personen Objekte) bull Erhoben werden Werte von Merkmalen
Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhobenbull Stichprobenerhebung
Es werden Daten von einer Teilmenge (Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmalebull Qualitative Merkmale
ndash Messen durch Klassifikation (zB Geschlecht)bull Quantitative Merkmale
ndash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)bull Stetige Merkmale
ndash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen x=ax + b (a gt 0)
bull Verhaumlltnisskala Aumlhnlichkeitstransformationen x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
5
Einfuumlhrung
bull Warum Statistikndash Entscheidungshilfe
zB 2 verschiedene Produkte ndash welches soll am Markt eingefuumlhrt werden
ndash Tieferes Verstaumlndnis bei Problemen zB Welche Faktoren beeinflussen die
Kaufentscheidung Richtung des Einflusses
6
Einfuumlhrungbull Wie Statistik
ndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
8
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
9
Statistische Datenbull Bestandsmassen (Streckenmassen)
ndash Objekte mit Lebensdauer ndash Werden zu einem Zeitpunkt erfasstndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand
am 31122004bull Bewegungs- oder Ereignismassen (Punktmassen)
ndash Ereignissendash Werden innerhalb einer Zeitspanne erfasstndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer
Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel Anfangsbestand + Zugang ndash Abgang = EndbestandBestandsmasse Bewegungsmasse
11
Statistische Datenbull Angehoumlrige der Massen Merkmalstraumlger
Beobachtungseinheit (Personen Objekte) bull Erhoben werden Werte von Merkmalen
Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhobenbull Stichprobenerhebung
Es werden Daten von einer Teilmenge (Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmalebull Qualitative Merkmale
ndash Messen durch Klassifikation (zB Geschlecht)bull Quantitative Merkmale
ndash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)bull Stetige Merkmale
ndash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen x=ax + b (a gt 0)
bull Verhaumlltnisskala Aumlhnlichkeitstransformationen x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
6
Einfuumlhrungbull Wie Statistik
ndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
8
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
9
Statistische Datenbull Bestandsmassen (Streckenmassen)
ndash Objekte mit Lebensdauer ndash Werden zu einem Zeitpunkt erfasstndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand
am 31122004bull Bewegungs- oder Ereignismassen (Punktmassen)
ndash Ereignissendash Werden innerhalb einer Zeitspanne erfasstndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer
Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel Anfangsbestand + Zugang ndash Abgang = EndbestandBestandsmasse Bewegungsmasse
11
Statistische Datenbull Angehoumlrige der Massen Merkmalstraumlger
Beobachtungseinheit (Personen Objekte) bull Erhoben werden Werte von Merkmalen
Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhobenbull Stichprobenerhebung
Es werden Daten von einer Teilmenge (Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmalebull Qualitative Merkmale
ndash Messen durch Klassifikation (zB Geschlecht)bull Quantitative Merkmale
ndash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)bull Stetige Merkmale
ndash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen x=ax + b (a gt 0)
bull Verhaumlltnisskala Aumlhnlichkeitstransformationen x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
7
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
8
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
9
Statistische Datenbull Bestandsmassen (Streckenmassen)
ndash Objekte mit Lebensdauer ndash Werden zu einem Zeitpunkt erfasstndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand
am 31122004bull Bewegungs- oder Ereignismassen (Punktmassen)
ndash Ereignissendash Werden innerhalb einer Zeitspanne erfasstndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer
Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel Anfangsbestand + Zugang ndash Abgang = EndbestandBestandsmasse Bewegungsmasse
11
Statistische Datenbull Angehoumlrige der Massen Merkmalstraumlger
Beobachtungseinheit (Personen Objekte) bull Erhoben werden Werte von Merkmalen
Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhobenbull Stichprobenerhebung
Es werden Daten von einer Teilmenge (Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmalebull Qualitative Merkmale
ndash Messen durch Klassifikation (zB Geschlecht)bull Quantitative Merkmale
ndash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)bull Stetige Merkmale
ndash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen x=ax + b (a gt 0)
bull Verhaumlltnisskala Aumlhnlichkeitstransformationen x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
8
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
9
Statistische Datenbull Bestandsmassen (Streckenmassen)
ndash Objekte mit Lebensdauer ndash Werden zu einem Zeitpunkt erfasstndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand
am 31122004bull Bewegungs- oder Ereignismassen (Punktmassen)
ndash Ereignissendash Werden innerhalb einer Zeitspanne erfasstndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer
Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel Anfangsbestand + Zugang ndash Abgang = EndbestandBestandsmasse Bewegungsmasse
11
Statistische Datenbull Angehoumlrige der Massen Merkmalstraumlger
Beobachtungseinheit (Personen Objekte) bull Erhoben werden Werte von Merkmalen
Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhobenbull Stichprobenerhebung
Es werden Daten von einer Teilmenge (Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmalebull Qualitative Merkmale
ndash Messen durch Klassifikation (zB Geschlecht)bull Quantitative Merkmale
ndash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)bull Stetige Merkmale
ndash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen x=ax + b (a gt 0)
bull Verhaumlltnisskala Aumlhnlichkeitstransformationen x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
9
Statistische Datenbull Bestandsmassen (Streckenmassen)
ndash Objekte mit Lebensdauer ndash Werden zu einem Zeitpunkt erfasstndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand
am 31122004bull Bewegungs- oder Ereignismassen (Punktmassen)
ndash Ereignissendash Werden innerhalb einer Zeitspanne erfasstndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer
Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel Anfangsbestand + Zugang ndash Abgang = EndbestandBestandsmasse Bewegungsmasse
11
Statistische Datenbull Angehoumlrige der Massen Merkmalstraumlger
Beobachtungseinheit (Personen Objekte) bull Erhoben werden Werte von Merkmalen
Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhobenbull Stichprobenerhebung
Es werden Daten von einer Teilmenge (Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmalebull Qualitative Merkmale
ndash Messen durch Klassifikation (zB Geschlecht)bull Quantitative Merkmale
ndash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)bull Stetige Merkmale
ndash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen x=ax + b (a gt 0)
bull Verhaumlltnisskala Aumlhnlichkeitstransformationen x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel Anfangsbestand + Zugang ndash Abgang = EndbestandBestandsmasse Bewegungsmasse
11
Statistische Datenbull Angehoumlrige der Massen Merkmalstraumlger
Beobachtungseinheit (Personen Objekte) bull Erhoben werden Werte von Merkmalen
Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhobenbull Stichprobenerhebung
Es werden Daten von einer Teilmenge (Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmalebull Qualitative Merkmale
ndash Messen durch Klassifikation (zB Geschlecht)bull Quantitative Merkmale
ndash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)bull Stetige Merkmale
ndash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen x=ax + b (a gt 0)
bull Verhaumlltnisskala Aumlhnlichkeitstransformationen x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
11
Statistische Datenbull Angehoumlrige der Massen Merkmalstraumlger
Beobachtungseinheit (Personen Objekte) bull Erhoben werden Werte von Merkmalen
Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhobenbull Stichprobenerhebung
Es werden Daten von einer Teilmenge (Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmalebull Qualitative Merkmale
ndash Messen durch Klassifikation (zB Geschlecht)bull Quantitative Merkmale
ndash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)bull Stetige Merkmale
ndash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen x=ax + b (a gt 0)
bull Verhaumlltnisskala Aumlhnlichkeitstransformationen x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhobenbull Stichprobenerhebung
Es werden Daten von einer Teilmenge (Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmalebull Qualitative Merkmale
ndash Messen durch Klassifikation (zB Geschlecht)bull Quantitative Merkmale
ndash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)bull Stetige Merkmale
ndash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen x=ax + b (a gt 0)
bull Verhaumlltnisskala Aumlhnlichkeitstransformationen x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmalebull Qualitative Merkmale
ndash Messen durch Klassifikation (zB Geschlecht)bull Quantitative Merkmale
ndash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)bull Stetige Merkmale
ndash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen x=ax + b (a gt 0)
bull Verhaumlltnisskala Aumlhnlichkeitstransformationen x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
14
Statistische Merkmalebull Qualitative Merkmale
ndash Messen durch Klassifikation (zB Geschlecht)bull Quantitative Merkmale
ndash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)bull Stetige Merkmale
ndash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen x=ax + b (a gt 0)
bull Verhaumlltnisskala Aumlhnlichkeitstransformationen x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen x=ax + b (a gt 0)
bull Verhaumlltnisskala Aumlhnlichkeitstransformationen x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen x=ax + b (a gt 0)
bull Verhaumlltnisskala Aumlhnlichkeitstransformationen x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
17
Empirische Verteilungen
Haumlufigkeitsverteilung bull Beobachtete Daten
n Untersuchungseinheiten Merkmal Xbull k Merkmalsauspraumlgungen (x1 xk)bull j-te Untersuchungseinheit (j=1n)
Auspraumlgung xi (i=1k)bull Liste der beobachteten Merkmalsaus-
praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
18
Empirische Verteilungenbull Absolute Haumlufigkeiten
hi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
19
Empirische Verteilungen
bull Diskrete MerkmaleEinzelwerte
bull Stetige Merkmale Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
20
Darstellungsformen
bull Tabelle Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder f i
1 1 0022 3 0073 12 0294 20 0485 6 014Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-AchseAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000005010015020025030035040045050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
23
Darstellungsformen
bull BalkendiagrammAbstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull HistogrammKein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
25
Darstellungsformen
Stetige Merkmalebull Klassen bildenbull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi Anzahl der Werte zwischen xi-1 und xi Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
26
Summenhaumlufigkeitsfunktionbull Absoluten Summenhaumlufigkeiten Hi
ndash Fortlaufende Summierung (Kumulierung) der absoluten Haumlufigkeiten
ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen hi = Hi ndash Hi-1 (i=1k)fi = Fi ndash Fi-1 (i=1k)wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an 0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
0001020304050607080910
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlenbull Lageparameter (Mittelwerte)bull Streuungsparameter (Variabilitaumltsmaszlige
Variationsmaszlige)bull Schiefebull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittelbull Medianbull Modusbull Geometrisches Mittelbull Harmonisches Mittelbull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wertbull Fuumlr metrisch skalierte Merkmalebull a1an beobachtete Merkmalswerte eines
Merkmals X
k
1iii
k
1iii fxhx
n1x
n
1iia
n1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))bull Summe der Abweichungen der Einzelwerte von
ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungeradex05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
39
Median
bull Haumlufigkeitsverteilung Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
40
Modalwertbull Modalwert (Modus haumlufigster Wert
dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliertbull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
43
Harmonisches Mittel bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a1
na
n
1i i
i
wh
aw
1a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
45
Quantilebull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil