Upload
konrad-lehner
View
103
Download
0
Embed Size (px)
Citation preview
1
STATISIK
LV Nr 1375
SS 2005
1Maumlrz 2005
2
Literatur
bull Bleymuumlller Gehlert Guumllicher bdquoStatistik fuumlr Wirtschaftswissenschaftlerldquo Verlag Vahlen
bull Hartung bdquoStatistik Lehr- und Handbuch der angewandten Statistikldquo Oldenburg Verlag Muumlnchen Wien
3
Einfuumlhrung
bull bdquoStatistikldquo Abgeleitet vom neulateinischen Begriff bdquostatusldquo (Bed bdquoStaatldquo bdquoZustandldquo)
bull 18 und 19 Jhdt bdquoLehre von der Zustandsbeschreibung des Staatesldquo (Sammeln und verbales oder numerisches Beschreiben von Daten)
bull Heute im doppelten Sinne gebrauchtndash Quantitative Informationen (zB
Bevoumllkerungsstatistik)ndash Formale Wissenschaft
4
Einfuumlhrung
Statistik befasst sich mit ndash Erhebung (Sammeln von Daten Wie kommt
man zu der benoumltigten Information)ndash Aufbereitung (Praumlsentation Reduktion von
Daten wobei ein Groszligteil der Information erhalten bleiben soll wenige Kenngroumlszligen einfache Grafiken)
ndash Analyse (Welche Schluumlsse kann man ziehen Allgemeine Aussagen basierend auf Stichproben)
von (numerischen) Daten
5
Einfuumlhrung
bull Warum Statistikndash Entscheidungshilfe
zB 2 verschiedene Produkte ndash welches soll am Markt eingefuumlhrt werden
ndash Tieferes Verstaumlndnis bei Problemen zB Welche Faktoren beeinflussen die
Kaufentscheidung Richtung des Einflusses
6
Einfuumlhrung
bull Wie Statistikndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
8
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
9
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
11
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
2
Literatur
bull Bleymuumlller Gehlert Guumllicher bdquoStatistik fuumlr Wirtschaftswissenschaftlerldquo Verlag Vahlen
bull Hartung bdquoStatistik Lehr- und Handbuch der angewandten Statistikldquo Oldenburg Verlag Muumlnchen Wien
3
Einfuumlhrung
bull bdquoStatistikldquo Abgeleitet vom neulateinischen Begriff bdquostatusldquo (Bed bdquoStaatldquo bdquoZustandldquo)
bull 18 und 19 Jhdt bdquoLehre von der Zustandsbeschreibung des Staatesldquo (Sammeln und verbales oder numerisches Beschreiben von Daten)
bull Heute im doppelten Sinne gebrauchtndash Quantitative Informationen (zB
Bevoumllkerungsstatistik)ndash Formale Wissenschaft
4
Einfuumlhrung
Statistik befasst sich mit ndash Erhebung (Sammeln von Daten Wie kommt
man zu der benoumltigten Information)ndash Aufbereitung (Praumlsentation Reduktion von
Daten wobei ein Groszligteil der Information erhalten bleiben soll wenige Kenngroumlszligen einfache Grafiken)
ndash Analyse (Welche Schluumlsse kann man ziehen Allgemeine Aussagen basierend auf Stichproben)
von (numerischen) Daten
5
Einfuumlhrung
bull Warum Statistikndash Entscheidungshilfe
zB 2 verschiedene Produkte ndash welches soll am Markt eingefuumlhrt werden
ndash Tieferes Verstaumlndnis bei Problemen zB Welche Faktoren beeinflussen die
Kaufentscheidung Richtung des Einflusses
6
Einfuumlhrung
bull Wie Statistikndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
8
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
9
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
11
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
3
Einfuumlhrung
bull bdquoStatistikldquo Abgeleitet vom neulateinischen Begriff bdquostatusldquo (Bed bdquoStaatldquo bdquoZustandldquo)
bull 18 und 19 Jhdt bdquoLehre von der Zustandsbeschreibung des Staatesldquo (Sammeln und verbales oder numerisches Beschreiben von Daten)
bull Heute im doppelten Sinne gebrauchtndash Quantitative Informationen (zB
Bevoumllkerungsstatistik)ndash Formale Wissenschaft
4
Einfuumlhrung
Statistik befasst sich mit ndash Erhebung (Sammeln von Daten Wie kommt
man zu der benoumltigten Information)ndash Aufbereitung (Praumlsentation Reduktion von
Daten wobei ein Groszligteil der Information erhalten bleiben soll wenige Kenngroumlszligen einfache Grafiken)
ndash Analyse (Welche Schluumlsse kann man ziehen Allgemeine Aussagen basierend auf Stichproben)
von (numerischen) Daten
5
Einfuumlhrung
bull Warum Statistikndash Entscheidungshilfe
zB 2 verschiedene Produkte ndash welches soll am Markt eingefuumlhrt werden
ndash Tieferes Verstaumlndnis bei Problemen zB Welche Faktoren beeinflussen die
Kaufentscheidung Richtung des Einflusses
6
Einfuumlhrung
bull Wie Statistikndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
8
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
9
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
11
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
4
Einfuumlhrung
Statistik befasst sich mit ndash Erhebung (Sammeln von Daten Wie kommt
man zu der benoumltigten Information)ndash Aufbereitung (Praumlsentation Reduktion von
Daten wobei ein Groszligteil der Information erhalten bleiben soll wenige Kenngroumlszligen einfache Grafiken)
ndash Analyse (Welche Schluumlsse kann man ziehen Allgemeine Aussagen basierend auf Stichproben)
von (numerischen) Daten
5
Einfuumlhrung
bull Warum Statistikndash Entscheidungshilfe
zB 2 verschiedene Produkte ndash welches soll am Markt eingefuumlhrt werden
ndash Tieferes Verstaumlndnis bei Problemen zB Welche Faktoren beeinflussen die
Kaufentscheidung Richtung des Einflusses
6
Einfuumlhrung
bull Wie Statistikndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
8
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
9
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
11
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
5
Einfuumlhrung
bull Warum Statistikndash Entscheidungshilfe
zB 2 verschiedene Produkte ndash welches soll am Markt eingefuumlhrt werden
ndash Tieferes Verstaumlndnis bei Problemen zB Welche Faktoren beeinflussen die
Kaufentscheidung Richtung des Einflusses
6
Einfuumlhrung
bull Wie Statistikndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
8
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
9
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
11
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
6
Einfuumlhrung
bull Wie Statistikndash Planung (Untersuchungsziel Organisation )ndash Erhebung
bull Befragung (schriftlich muumlndlich)bull Beobachtung (in Wirtschaftswissenschaften selten)bull Experiment (va Naturwissenschaften)bull Automatische Erfassung (zB Scannerkassen)
ndash Aufbereitung (Verdichtung der Daten)ndash Analyse (deskriptive u induktive Methoden)ndash Interpretation
7
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
8
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
9
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
11
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
7
Deskriptiv - Induktiv
Deskriptive Statistik beschreibende Statistik
Beschreibung und Zusammenfassung
bull Darstellung von Daten (Tabellen u Grafiken)
bull Kennzahlen (zB Mittelwerte Streuungs-maszlige)
Induktive Statistik schlieszligende Statistik
Von Stichproben auf Grundgesamtheiten
bull Schaumltzerbull Testsbull Entscheidungstheoriebull Multivariate
Methoden
8
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
9
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
11
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
8
Statistische Daten
bull Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten statistische Massen) ndash Reale und hypothetische Gesamtheiten
zB Bevoumllkerung eines Staates Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Wuumlrfels
ndash Endliche und unendliche Gesamtheiten
9
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
11
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
9
Statistische Daten
bull Bestandsmassen (Streckenmassen) ndash Objekte mit Lebensdauer
ndash Werden zu einem Zeitpunkt erfasst
ndash zB Einwohner Oumlsterreichs am 112005 Lagerbestand am 31122004
bull Bewegungs- oder Ereignismassen (Punktmassen)ndash Ereignisse
ndash Werden innerhalb einer Zeitspanne erfasst
ndash zB Geburten in Oumlsterreich im Jahr 2004 bei einer Bank eingegangene Schecks im April 2004
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
11
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
10
Statistische Daten
bull Beziehung Bestands- und Bewegungsmasse Fuumlr jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar
bull Fortschreibungsformel
Anfangsbestand + Zugang ndash Abgang = Endbestand
Bestandsmasse Bewegungsmasse
11
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
11
Statistische Daten
bull Angehoumlrige der Massen Merkmalstraumlger Beobachtungseinheit (Personen Objekte)
bull Erhoben werden Werte von Merkmalen Variablen (Merkmalsauspraumlgungen) der Merkmalstraumlger
bull (statistische) Population Gesamtheit aller Beobachtungseinheiten
Bsp Haarfarbe = Merkmal Person X = Merkmalstraumlger blond = Merkmalsauspraumlgung des Merkmals Haarfarbe des Merkmalstraumlgers X
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
12
Datenerhebung
bull VollerhebungEs werden Daten von allen Elementen der
Population erhoben
bull StichprobenerhebungEs werden Daten von einer Teilmenge
(Stichprobe) der Population erhoben
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
13
Datenerhebungbull Messen von Merkmalsauspraumlgungenbull Kriterien fuumlr Messungen
ndash Objektivitaumltdas zu ermittelnde Merkmal wird eindeutig
festgestellt Ergebnis ist unabhaumlngig von der Person die misst
ndash Validitaumlt (Guumlltigkeit)Messinstrument misst was es messen soll
ndash Reliabilitaumlt (Zuverlaumlssigkeit) Ergebnis der Messung wird exakt festgestellt bei
mehrmaligem Messen (approximativ) gleiches Ergebnis
14
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
14
Statistische Merkmale
bull Qualitative Merkmalendash Messen durch Klassifikation (zB Geschlecht)
bull Quantitative Merkmalendash Messen durch Zaumlhlen (zB Alter Koumlrpergroumlszlige)
bull Diskrete Merkmale ndash Messen mit ganzen Zahlen (zB Anzahl
Familienmitglieder)
bull Stetige Merkmalendash Messen mit reellen Zahlen (zB Koumlrpergroumlszlige)
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
15
Merkmalsskalenbull Nominalskala
ndash Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (zB Farbe Geschlecht )
bull Ordinalskalandash Werte unterliegen einer Rangfolge Abstaumlnde zw
verschiedenen Auspraumlgungen lassen sich nicht interpretieren (zB Schulnoten Guumlteklassen )
bull Intervallskalandash Rangfolge Abstaumlnde zw verschiedenen Auspraumlgungen
sind interpretierbar (zB Temperatur in Grad Celsius Kalenderzeitrechung )
bull Verhaumlltnisskalandash Rangfolge interpretierbare Abstaumlnde absoluter
Nullpunkt (zB Koumlrpergroumlszlige Alter)
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Merkmalsskalen
Zulaumlssige Transformationen (informationserhaltend)bull Nominalskala symmetrische Transformationen
nur Aumlnderung der Klassenbezeichnungenbull Ordinalskala streng monotone Transformationen
x=f(x) so dass fuumlr x1lt x2 auch x1lt x2
bull Intervallskala lineare Transformationen
x=ax + b (a gt 0)bull Verhaumlltnisskala Aumlhnlichkeitstransformationen
x=ax (a gt 0)
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
17
Empirische Verteilungen
Haumlufigkeitsverteilung
bull Beobachtete Daten n Untersuchungseinheiten Merkmal X
bull k Merkmalsauspraumlgungen (x1 xk)
bull j-te Untersuchungseinheit (j=1n) Auspraumlgung xi (i=1k)
bull Liste der beobachteten Merkmalsaus-praumlgungen Beobachtungsreihe oder Urliste
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
18
Empirische Verteilungen
bull Absolute Haumlufigkeitenhi = bdquoAnzahl der Elemente welche Merkmalsauspraumlgung xi besitzenldquo i=1khi [0n] und Σi hi = n (i=1k)
bull Relative Haumlufigkeit fi = 1nmiddothi
fi [01] und Σi fi = 1 (i=1k)bull Vorsicht Anzahl der moumlglichen Werte oft
Anzahl der tatsaumlchlichen Werte
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
19
Empirische Verteilungen
bull Diskrete Merkmale
Einzelwerte
bull Stetige Merkmale
Klasseneinteilung
bull In beiden Faumlllen werden Haumlufigkeiten gezaumlhlt
bull Sind xi Zahlen werden sie ansteigend geordnet
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
20
Darstellungsformen
bull Tabelle
Haumlufigkeitsverteilung
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
1 1 0022 3 0073 12 0294 20 0485 6 014
Σ 42 1
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
21
Darstellungsformen
bull Grafik Balkendiagrammfuumlr absolute und relative Haumlufigkeiten gleich ndash Skalierung der y-Achse
Anzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Abs
olut
e H
aumlufig
keit
hi
Anzahl Familienmitglieder
000
005
010
015
020
025
030
035
040
045
050
1 2 3 4 5
Merkmalsauspraumlgung xi
Rel
ativ
e H
aumlufig
keit
fi
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
22
Darstellungsformen
bull Grafik HistogrammAnzahl Familienmitglieder
0
5
10
15
20
25
1 2 3 4 5
Merkmalsauspraumlgung xi
Ab
solu
te H
aumlu
figke
it h
i
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
23
Darstellungsformen
bull Balkendiagramm
Abstand zwischen den Balken Die Houmlhe stellt die Haumlufigkeit dar
bull Histogramm
Kein Abstand zwischen den Balken Bei ungleich breiten Klassen ist die Flaumlche ndash nicht die Houmlhe ndash Maszlig fuumlr die Haumlufigkeit Die Balkenhoumlhe entsteht durch Division von Haumlufigkeit und Klassenbreite (Houmlhe=hibi)
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
24
Darstellungsformen
bull TortendiagrammAnzahl Familienmitglieder
12
27
329
448
514
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
25
Darstellungsformen
Stetige Merkmale
bull Klassen bilden
bull Klassengrenzen x0 x1 xk
bull Haumlufigkeiten hi
Anzahl der Werte zwischen xi-1 und xi
Liegt ein Wert genau auf der Klassengrenze wird er uumlblicherweise der unteren Klasse zugerechnet
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
26
Summenhaumlufigkeitsfunktion
bull Absoluten Summenhaumlufigkeiten Hi ndash Fortlaufende Summierung (Kumulierung) der
absoluten Haumlufigkeiten ndash Hi Anzahl der Elemente mit Merkmalswert xindash Hi = h1+h2++hi = Σj hj fuumlr j=1i und i=1k
bull Relative Summenhaumlufigkeiten Fi ndash Fortlaufende Summierung der relativen
Haumlufigkeiten ndash Fi = f1+f2++fi = Σj fj fuumlr j=1i und i=1kndash Fi = Hin fuumlr i=1k
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
27
Summenhaumlufigkeitsfunktion
bull Haumlufigkeiten aus Summenhaumlufigkeiten berechnen
hi = Hi ndash Hi-1 (i=1k)
fi = Fi ndash Fi-1 (i=1k)
wobei H0 = F0 = 0
Auspraumlgung xi
Anzahl Fammitglieder hi
Anteil Fammitglieder fi
Anzahl houmlchstens xi
Fammitglieder
Anteil houmlchstens xi
Fammitglieder
1 1 002 1 0022 3 007 4 0103 12 029 16 0384 20 048 36 0865 6 014 42 1
Σ 42 1
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
28
Summenhaumlufigkeitsfunktion
bull Summenhaumlufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhaumlufigkeiten bestimmt
F(x) gibt den Anteil der Elemente mit einem Merkmalswert x an
0 fuumlr x lt x1
F(x) = Fi fuumlr xi x lt xi+1 (i=1k-1)
1 fuumlr x xk
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
29
Summenhaumlufigkeitsfunktion
Summenhaumlufigkeitsfunktion
00
01
02
03
04
0506
07
08
09
10
0 1 2 3 4 5 6
bull Diskrete Merkmale
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
30
Summenhaumlufigkeitsfunktion
bull Stetige MerkmaleSummenhaumlufigkeitsfunktion - empirische
Verteilungsfunktion
0
01
02
03
04
05
06
07
08
09
1
145 155 165 175 185 195
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
31
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
32
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
bull Harmonisches und geometrisches Mittel sind keine Lagemaszlige im strengen Sinn
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
33
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
34
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
35
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai (i=1n))
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
36
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
n)1(iaa ii
aa
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
37
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
38
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind a1 an der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
39
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
40
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
41
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
42
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
nw1 wn
w2
w1
wg aaaa
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
43
Harmonisches Mittel
bull Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
44
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
45
Quantile
bull Geordnete Beobachtungsreihe a(1)a(n)
bull α-Quantil a(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil