28
Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle ) exp( ! ) ( k k X P k Wahrscheinlichkeitsfunkti on Poisson-Verteilung: Zählen seltener Ereignisse Beispiele: Zahl der Fischvergiftungen pro Zeiteinheit Zahl der Spontantumoren pro Zeiteinheit historisch: Zahl der Todesfälle durch Hufschlag pro Jahr und Regiment

Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Embed Size (px)

Citation preview

Page 1: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.20051

Diskrete Wahrscheinlichkeitsmodelle

)exp(!

)(

kkXP

k

Wahrscheinlichkeitsfunktion

• Poisson-Verteilung: Zählen seltener Ereignisse

Beispiele: Zahl der Fischvergiftungen pro Zeiteinheit

Zahl der Spontantumoren pro Zeiteinheit

historisch: Zahl der Todesfälle durch Hufschlag pro Jahr und Regiment

Page 2: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.20052

Beispiel für Possion-Verteilung

Wahrscheinlichkeitsfunktion

Page 3: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.20053

Lebensdauerverteilungen

Beispiel: Lebensdauern

• Exponentialverteilung

Page 4: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.20054

Zusammenfassung: Verteilungen

• Wahrscheinlichkeitsmodelle dienen dazu, bestimmte (unsichere) Phänomene zu charakterisieren.

• Das Wahrscheinlichkeitsmodell ist abhängig von der zu charakterisierenden Größe. In der Literatur gibt es eine Vielzahl solcher Verteilungen.

• Man unterscheidet diskrete und stetige Verteilungen (Wahrscheinlichkeitsmodelle).

• Wichtige Kennzahlen von Verteilungen sind Erwartungswert und Varianz.

• Verteilungen haben meist Parameter, die durch das Problem gegeben sind, oder aus Daten geschätzt werden.

Page 5: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.20055

Statistische Erhebungen

• Befragungen z.B. Befragung der Landwirte über das Verhalten der Tiere im Stall

• Experimente z.B. Versuch, welches Arzneimittel am besten zur Heilung führt

• Beobachtungen Auftreten einer Krankheit Erhebungen zu Tieren in einer Tierklinik

Bei der Erhebung von Daten unterscheidet man:

Page 6: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.20056

Unterscheidungseinheiten / statistische Einheit / Merkmalsträger

• Einzelne Tiere

• Einzelne Herden

• Einzelne Landwirte

• Haushalte

Individuen, die einer Erhebung zugrunde liegen

Beispiele:

Page 7: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.20057

Merkmale (Variablen)

Eigenschaften Untersuchungseinheiten z.B.

• Krankheitsstatus

• Blutparameter

• Geschlecht

• Anzahl der Kühe (bei Untersuchungseinheit Landwirt)

Merkmalsausprägungen

mögliche Werte des Merkmals

• Messergebnisse / positive Zahlen

• krank / gesund

Page 8: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.20058

Charakterisierung von Merkmalen

quantitative Merkmale unterscheiden sich durch ihre Größe

• Alter, Gewicht, Milchleistung, Temperatur, Anzahl Keime, Schadstoffgehalt, …

qualitative Merkmale unterscheiden sich durch ihre Art

• Geschlecht, Namen, Rassen, Haltungsform

Page 9: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.20059

Merkmalswerte

Die gemessenen, erfragten oder beobachteten Ausprägungendes Untersuchungsmerkmals sind die Merkmalswerte. Siestellen die Daten der Erhebung dar.

• Wiederkauverhalten: z.B. in Stunden pro Tag

• Arzneimittel: Dosis 1, Dosis 2, Dosis 0 (Placebo)

• Befund: gesund, fraglich, erkrankt

• Keimzahlen: Anzahl in 1000

Page 10: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200510

Skalen

Metrische Skala: Die Werte unterliegen einer Rangfolge und die

Abstände zwischen den Werten der Skala lassen sich interpretieren.

• Gewicht, Keimzahlen, Schadstoffmessung

Ordinalskala: Die Werte unterliegen einer Rangfolge, aber die Ab-

stände zwischen den Werten der Skala lassen sich nicht interpretieren.

• Bewertung (Noten), Gesundheitszustand

Nominalskala: Die Werte unterliegen keiner Rangfolge und sind nicht

Vergleichbar

• Geschlecht, Rasse, Haltungsform

Page 11: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200511

Deskriptive Statistik

Ziel: Beschreibung von Daten mit möglichst geringem

Informationsverlust

• Eigenschaften und Strukturen sichtbar machen• Graphisch und durch Kennwerte• Eindimensional und mehrdimensional• Zunächst keine Schlüsse auf die Grundgesamtheit

Page 12: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200512

Rohdaten und Datenmatrix

Die Daten liegen in der Regel als Datenmatrix vor:

• Zeilen entsprechen Untersuchungseinheiten• Spalten entsprechen Merkmalen• Elemente der Matrix sind die Merkmalsausprägungen• Fragen mit Mehrfachnennungen als Einzelne binäre Merkmale definieren

Hinweise zur Eingabe unter:www.stat.uni-muenchen.de/stablab/Excel.html

Page 13: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200513

Beispiel: Daten zu Mastenten (Ausschnitt)

- Ändern -

Page 14: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200514

Eindimensionale Statistische Kennwerte

Lagemaßzahlen

• Wo liegt die Masse der Daten?• Wo liegt die Mehrzahl der Daten?• Wo liegt die Mitte der Daten?• Welche Mehrmalsausprägung ist typisch für die

Häufigkeitsverteilung?

Page 15: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200515

Statistische KennwerteStreumaßzahlen

• Über welchen Bereich erstrecken sich die Daten?

• Wie groß ist die Schwankung der Ausprägungen?

Page 16: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200516

Eindimensionale Häufigkeitsverteilung

Hämatokrit

3 2,5 3,8 3,8

7 5,8 8,8 12,5

3 2,5 3,8 16,3

9 7,5 11,3 27,5

16 13,3 20,0 47,5

18 15,0 22,5 70,0

12 10,0 15,0 85,0

5 4,2 6,3 91,3

6 5,0 7,5 98,8

1 ,8 1,3 100,0

80 66,7 100,0

40 33,3

120 100,0

35

36

37

38

39

40

41

42

43

44

Gesamt

Gültig

SystemFehlend

Gesamt

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

Page 17: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200517

Der Modus

Eigenschaften:

• oft nicht eindeutig• nur bei gruppierten Daten oder bei Merkmalen mit wenigen

Ausprägungen sinnvoll• stabil bei allen eindeutigen Transformationen• geeignet für alle Skalenniveaus

Definition: Häufigster Wert

Page 18: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200518

Beispiel Modus

Modus = 4

Page 19: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200519

Der Median

50% der Daten sind kleiner oder gleich med

50% der Daten sind größer oder gleich med

Zahlganzen

kfallsxx

Zahlganzen

kfallsx

hk

k

2)(

2

12

1

)1()(

)(

)()1( nxx

med =

sind geordnete Werte

Definition: Wert für den gilt

Page 20: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200520

Eigenschaften des Median

• anschaulich• stabil gegenüber monotonen Transformationen• geeignet für ordinale Daten• stabil gegenüber Ausreißern

Page 21: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200521

Beispiel Median

Statistiken

Hämatokrit80

40

40,00

40

Gültig

Fehlend

N

Median

Modus

Hämatokrit

3 2,5 3,8 3,8

7 5,8 8,8 12,5

3 2,5 3,8 16,3

9 7,5 11,3 27,5

16 13,3 20,0 47,5

18 15,0 22,5 70,0

12 10,0 15,0 85,0

5 4,2 6,3 91,3

6 5,0 7,5 98,8

1 ,8 1,3 100,0

80 66,7 100,0

40 33,3

120 100,0

35

36

37

38

39

40

41

42

43

44

Gesamt

Gültig

SystemFehlend

Gesamt

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

Page 22: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200522

Das Quantil (Perzentil)

Anteil p der Daten sind kleiner oder gleich xp

Anteil 1-p der Daten sind größer oder gleich xp

Zahlganzenpkfallsxx

nphlkleinsteZakundZahlganzekeinenpfallsx

hk

k

)(2

1 )1()(

)(

Definition: Wert für den gilt

Page 23: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200523

Fünf-Punkte Zusammenfassung

Minimum, 25%-Quantil, Median,75%-Quantil,Maximum

Statistiken

Hämatokrit80

40

40,00

36,00

38,00

40,00

41,00

42,00

44,00

Gültig

Fehlend

N

Median

10

25

50

75

90

99

Perzentile

Hämatokrit

3 2,5 3,8 3,8

7 5,8 8,8 12,5

3 2,5 3,8 16,3

9 7,5 11,3 27,5

16 13,3 20,0 47,5

18 15,0 22,5 70,0

12 10,0 15,0 85,0

5 4,2 6,3 91,3

6 5,0 7,5 98,8

1 ,8 1,3 100,0

80 66,7 100,0

40 33,3

120 100,0

35

36

37

38

39

40

41

42

43

44

Gesamt

Gültig

SystemFehlend

Gesamt

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

Page 24: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200524

Der Mittelwert (arithmetisches Mittel)

n

inx

1

1

• bekanntestes Lagemaß

• instabil gegen extreme Werte • geeignet für Intervallskalierte Daten

ix

Page 25: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200525

Beispiel Mittelwert

Hämatokrit

3 2,5 3,8 3,8

7 5,8 8,8 12,5

3 2,5 3,8 16,3

9 7,5 11,3 27,5

16 13,3 20,0 47,5

18 15,0 22,5 70,0

12 10,0 15,0 85,0

5 4,2 6,3 91,3

6 5,0 7,5 98,8

1 ,8 1,3 100,0

80 66,7 100,0

40 33,3

120 100,0

35

36

37

38

39

40

41

42

43

44

Gesamt

Gültig

SystemFehlend

Gesamt

Häufigkeit ProzentGültige

ProzenteKumulierteProzente

Deskriptive Statistik

80 35 44 39,48 2,093

80

Hämatokrit

Gültige Werte(Listenweise)

N Minimum Maximum MittelwertStandardabweichung

Page 26: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200526

Die Spannweite (Range)

minmax xxq Definition:

• „Bereich in dem die Daten liegen“ • Wichtig für Datenkontrolle

Page 27: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200527

Der Quartilsabstand

25,075,0 xxq Definition:

• „Größe des Bereichs in dem die mittlere Hälfte der Daten liegt“• Geeignet für ordinal skalierte Daten• Zentraler 50%-Bereich

Page 28: Vorlesung: Biometrie für Studierende der Veterinärmedizin 17.11.2005 1 Diskrete Wahrscheinlichkeitsmodelle Wahrscheinlichkeitsfunktion Poisson-Verteilung:

Vorlesung: Biometrie für Studierende der Veterinärmedizin

17.11.200528

Standardabweichung

Definition:

2

22 )(1

1

SS

xxn

S i

• „Mittlere Abweichung vom Mittelwert“• Manchmal auch 1/n statt 1/(n-1)• Intervallskala Voraussetzung