84
Stochastik und Statistik Vorlesung 1 K.Gerald van den Boogaart http://www.stat.boogaart.de/WS0708/SI0708 Stochastik und Statistik – p.1/42

Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Stochastik und StatistikVorlesung 1

K.Gerald van den Boogaart

http://www.stat.boogaart.de/WS0708/SI0708

Stochastik und Statistik – p.1/42

Page 2: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Sümpfe des multiplen Testens

Rangviertel

Die unwegsamen Ausreißerberge

Die Datenminen

Todeswüste, der nicht erfüllten Voraussetzungen

Steig der

Nich

tparametrik

Gle

tsch

ersp

alt

e der

glei

chen

Mes

swer

te

Nacht der angenommen Hypothesen

Klippe

der

unüber

prü

fbare

n

Vor

auss

etzu

nge

n Klippe der unüberprüfbaren

Voraussetzungen

robuster Weg

Momentenmethoden u.Lineare Modelle

ML-CityBayes-Land

t-DorfModell-Platz

Statistika

Vertrauensbereich

Normalviertel

Vorhersagebereich

Steppe der unwesentlich verletzten Voraussetzungen

Schätzervorstadt

Schlaraffia oder das Land des gelungen statistischen Nachweis Land des offenen Betrugs

BonferroniPassage

BenjaminiPassage

Sequenzielle Passage

Posthoc

Mathe

Schätzung

Daten

Test

Aussichtsturm

Grafingen

Riesige Halde mit nichtrepräsentativen

Daten

Stochastik und Statistik – p.2/42

Page 3: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Inhalt der Vorlesung

Statistische Daten

Statistische Graphik und Kenngrößen

Wahrscheinlichkeitsrechnung

Stochastische Modellbildung

Parameterschätzung

Statistischer Nachweis mit Tests

Stochastik und Statistik – p.3/42

Page 4: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Literatur

Skript und Infos:http://www.stat.boogaart.de/WS0708/SI0708

Stoyan, Dietrich (1993) Stochastik für Ingenieure undNaturwissenschaftler (das beste Buch für diemathematischen Grundlagen)

Rumsey, Deborah (2004) Statistik für Dummies (undfür Schlaue ebenso, eine weises Buch für dieAnwendungen)

Krengel, Ulrich (1991) Einführung in dieWahrscheinlichkeitstheorie und Statistik (für denStudenten, der mehr wissen will)

Stochastik und Statistik – p.4/42

Page 5: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Inhalt heute (Grundlagen)

Was ist Statistik?oder was heißt alles Statistik?

Stochastik und Statistik – p.5/42

Page 6: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Inhalt heute (Grundlagen)

Was ist Statistik?

Grundmodelle der StatistikWie werden Daten erhoben und modelliert?

Stochastik und Statistik – p.5/42

Page 7: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Inhalt heute (Grundlagen)

Was ist Statistik?

Grundmodelle der Statistik

DatenmatrixWie werden Daten gespeichert?

Stochastik und Statistik – p.5/42

Page 8: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Inhalt heute (Grundlagen)

Was ist Statistik?

Grundmodelle der Statistik

Datenmatrix

SkalaWie werden Daten eingeteilt?

Stochastik und Statistik – p.5/42

Page 9: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Inhalt heute (Grundlagen)

Was ist Statistik?

Grundmodelle der Statistik

Datenmatrix

Skala

DatentafelWie kann man kategorielle Daten noch darstellen?

Stochastik und Statistik – p.5/42

Page 10: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Was ist Statistik?

Wortwurzel: Aufstellungen (lat. stare)Bedeutungen:

Datensammlung des Staats (ürsprünglicheBedeutung)

Stochastik und Statistik – p.6/42

Page 11: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Was ist Statistik?

Wortwurzel: Aufstellungen (lat. stare)Bedeutungen:

Datensammlung des Staats (ürsprünglicheBedeutung)

Wissenschaft von der Auswertung von Daten/vomSchließen aus Daten

Stochastik und Statistik – p.6/42

Page 12: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Was ist Statistik?

Wortwurzel: Aufstellungen (lat. stare)Bedeutungen:

Datensammlung des Staats (ürsprünglicheBedeutung)

Wissenschaft von der Auswertung von Daten/vomSchließen aus Daten

Aus beobachteten Zufallsvariablen berechnete weitereZufallsvariablen (z.B. der Mittelwert)

X =1

n(X1 + . . . + Xn)

Stochastik und Statistik – p.6/42

Page 13: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Die Landkarte der Vorlesung

Sümpfe des multiplen Testens

Rangviertel

Die unwegsamen Ausreißerberge

Die Datenminen

Todeswüste, der nicht erfüllten Voraussetzungen

Steig der

Nich

tparametrik

Gle

tsch

ersp

alt

e der

glei

chen

Mes

swer

te

Nacht der angenommen Hypothesen

Klippe

der

unüber

prü

fbare

n

Vor

auss

etzu

nge

n Klippe der unüberprüfbaren

Voraussetzungen

robuster Weg

Momentenmethoden u.Lineare Modelle

ML-CityBayes-Land

t-DorfModell-Platz

Statistika

Vertrauensbereich

Normalviertel

Vorhersagebereich

Steppe der unwesentlich verletzten Voraussetzungen

Schätzervorstadt

Schlaraffia oder das Land des gelungen statistischen Nachweis Land des offenen Betrugs

BonferroniPassage

BenjaminiPassage

Sequenzielle Passage

Posthoc

Mathe

Schätzung

Daten

Test

Aussichtsturm

Grafingen

Riesige Halde mit nichtrepräsentativen

Daten

Stochastik und Statistik – p.7/42

Page 14: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Repräsentative DatenNur mit repräsentativen Daten kann man statistischeSchlüsse ziehen.Repräsentativ heißt:

identisch verteilt: alle Beobachtungen spiegeln dasgleiche Zufallsgesetz wieder.

stochastisch unabhängig: jede Beobachtung ist neunach dem Zufallsgesetz zustandegekommen.

Stochastik und Statistik – p.8/42

Page 15: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Es gibt zwei grundsätzlich verschiedene Wege zurepräsentativen Daten:

Zufallige und faire Auswahl einer Stichprobe auseiner Grundgesamtheit.

Unabhangiger Wiederholung identischerZufallsexperimente.

Stochastik und Statistik – p.9/42

Page 16: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Repräsentative Datendurch

Stichprobe undGrundgesamtheit

Stochastik und Statistik – p.10/42

Page 17: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Grundbegriffe

GrundgesamtheitDie Menge der Objekte für die man sich interessiert.z.B. alle Wahlberechtigten.

Stochastik und Statistik – p.11/42

Page 18: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Grundbegriffe

Grundgesamtheit

statistisches IndividuenDie Elemente der Grundgesamtheit.z.B. ein Wahlberechtigter.

Stochastik und Statistik – p.11/42

Page 19: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Grundbegriffe

Grundgesamtheit

statistisches Individuen

StichprobeDie Menge der statistische Individuen zu den mantatsächlich Daten erhebt.z.B. die Menge der Befragten Wahlberechtigten

Stochastik und Statistik – p.11/42

Page 20: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Grundbegriffe

Grundgesamtheit

statistisches Individuen

Stichprobe

reprasentativEine Stichprobe heißt representativ, wenn jedesstatistische Individuum aus der Grundgesamtheitunabhängig von allen anderen mit der gleichenWahrscheinlichkeit in die Stichprobe gelangen kann.

Stochastik und Statistik – p.11/42

Page 21: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Grundbegriffe

Grundgesamtheit

statistisches Individuen

Stichprobe

reprasentativ

Zufallsvariabledas beim i-ten statistischen Individum beobachteteMerkmal (z.B. bevorzugte Partei) wird durch eineZufallsvariable Xi modeliert.

Stochastik und Statistik – p.11/42

Page 22: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Grundbegriffe

Grundgesamtheit

statistisches Individuen

Stichprobe

reprasentativ

Zufallsvariable

Realisierung der Zufallsvariableder tatsächlich beim i-ten Individum beobachtete Wertxi wird als Realisierung der Zufallsvariable Xi

bezeichnet.

Stochastik und Statistik – p.11/42

Page 23: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Beispiel: Bodenqualität

Grundgesamtheit: Alle Punkte des Bodens imUntersuchungsgebiet.

Stichprobe: Zufällig ausgewählteUntersuchungspunkte.

Zufallsvariablen: Nährstoffgehalt in an diesen Stellengenommenen Bodenproben.

Realisierungen: 5.34%, 7, 45%, . . .

Stochastik und Statistik – p.12/42

Page 24: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Beispiel: Werkstückprüfung

Grundgesamtheit: Alle gefertigten Zahnräder derTeilenummer 45632N.

Stichprobe: Zufällig zu Testzwecken entnommenZahnräder.

Zufallsvariablen: Betriebstunden im Testbetrieb bisDefekt.

Realisierungen: 5343h, 7342h, . . .

Stochastik und Statistik – p.13/42

Page 25: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Beispiel: Lichtgeschwindigkeitsmessungen

> lightspeeds

[1] 299850 299740 299900 300070 299930 299850 299950 299980

[9] 299980 299880 300000 299980 299930 299650 299760 299810

[17] 300000 300000 299960 299960 299960 299940 299960 299940

[25] 299880 299800 299850 299880 299900 299840 299830 299790

[33] 299810 299880 299880 299830 299800 299790 299760 299800

[41] 299880 299880 299880 299860 299720 299720 299620 299860

[49] 299970 299950 299880 299910 299850 299870 299840 299840

[57] 299850 299840 299840 299840 299890 299810 299810 299820

[65] 299800 299770 299760 299740 299750 299760 299910 299920

[73] 299890 299860 299880 299720 299840 299850 299850 299780

[81] 299890 299840 299780 299810 299760 299810 299790 299810

[89] 299820 299850 299870 299870 299810 299740 299810 299940

[97] 299950 299800 299810 299870

Stochastik und Statistik – p.14/42

Page 26: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Beispiel: Lichtgeschwindigkeitsmessungen

> dotchart(lightspeeds, main = "Michelsons Lichtgeschwindigkeitsmessungen")

299700 299800 299900 300000

Michelsons Lichtgeschwindigkeitsmessungen

Stochastik und Statistik – p.15/42

Page 27: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Vollerhebung

Die Vollerhebung ist eine spezielle Art derStichprobennahme.

Bei Vollerhebung ist die Stichprobe gleich derGrundgesamtheit.

Unabhängigkeit: alle kommen unabhängig von allenanderen sicher in die Stichprobe.

gleiche Wahrscheinlichkeit: Wahrscheinlichkeit in dieStichprobe zu kommen ist 1.

Stochastik und Statistik – p.16/42

Page 28: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Zufallsexperimente

Repräsentative Datendurch

Zufallsexperimente

Stochastik und Statistik – p.17/42

Page 29: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Grundbegriffe

Vorschrift fur ein ZufallsexprimentEin genaue Experimentiervorschrift für ein Experimentmit zufälligem Ausgang.z.B. Würfelwurfz.B. Messung mit Messfehlerz.B. Bruchversuch

Stochastik und Statistik – p.18/42

Page 30: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Grundbegriffe

Vorschrift fur ein Zufallsexpriment

ZufallsexperimentEin Experiment das nach dieserExperimentiervorschrift durchgeführt wurdez.B. 3ter Wurf des Würfelsz.B. 2te Messungz.B. 15ter Bruchversuch

Stochastik und Statistik – p.18/42

Page 31: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Grundbegriffe

Vorschrift fur ein Zufallsexpriment

Zufallsexperiment

identisch verteiltZufallsexprimente heißen identisch verteilt, wenn sienach der gleichen Vorschrift durchgeführt wurden, sodass jede Menge möglicher Ausgänge jeweils gleichwahrscheinlich sind.z.B. gleiche Bruchversuche mit gleich produziertenWerkstücken.

Stochastik und Statistik – p.18/42

Page 32: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Grundbegriffe

Vorschrift fur ein Zufallsexpriment

Zufallsexperiment

identisch verteilt

unabhangigZufallsexperimente heißen unabhängig durchgeführt,wenn sich der Zufall der Experimente gegenseitig nichtbeeinflussen kann.z.B. nicht!!!, wenn die Werkstücke aus der gleichenCharge Rohmaterial hergestellt wurde, aber dieVorschrift nicht die Rohstoffcharge spezifiziert hat.

Stochastik und Statistik – p.18/42

Page 33: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Grundbegriffe

Vorschrift fur ein Zufallsexpriment

Zufallsexperiment

identisch verteilt

unabhangig

reprasentativZufallsexperimente heißt representativ (für ihreVorschrift), wenn sie unanhängig und identisch verteiltsind.

Stochastik und Statistik – p.18/42

Page 34: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Grundbegriffe

Vorschrift fur ein Zufallsexpriment

Zufallsexperiment

identisch verteilt

unabhangig

reprasentativ

Zufallsvariabledie beim i-ten Zufallsexpriment zu machendeBeobachtung Xi.z.B. die Bruchspannung.

Stochastik und Statistik – p.18/42

Page 35: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Grundbegriffe

Vorschrift fur ein Zufallsexpriment

Zufallsexperiment

identisch verteilt

unabhangig

reprasentativ

Zufallsvariable

Realisierung der Zufallsvariableder tatsächlich beim i-ten Individum beobachtete Wertxi wird als Realisierung der Zufallsvariable Xi

bezeichnet.

Stochastik und Statistik – p.18/42

Page 36: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Fadenbrüche

Anzahl Fadenbrüche bei verschiedenenRahmenbedingungen:

> warpbreaks

breaks wool tension

1 26 A L

2 30 A L

3 54 A L

4 25 A L

5 70 A L

6 52 A L

7 51 A L

8 26 A L

9 67 A L

10 18 A M

11 21 A M

12 29 A MStochastik und Statistik – p.19/42

Page 37: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Mehrstichprobenmodell

Oft finden wir in einem Datensatz zwei oder mehrerGruppen von Daten, die von unterschiedlichen

Grundgesamtheit oder

Zufallsexperimenten (Experimentiervorschriften)

herrühren.Ein Datensatz kann also mehrer Stichproben enthalten.

Man spricht dann von einer Zweistichproben- oder Mehr-

stichprobensituation.

Stochastik und Statistik – p.20/42

Page 38: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Zufälligkeit der Daten

Ein repräsentativer Datensatz ist grundsätzlich zufällig, da

die Auswahl der Beobachtungen zufälligzustandegekommen ist, oder

die Experimente zufällige Ergebnisse haben.

Wir interessieren uns aber nicht für die konkreten Da-

ten, sondern für die dahinterstehenden Gesetzte: z.B. für

die Zahlräder, die tatsächlich ausgeliefert werden, was al-

le Deutschen wählen, oder welche Maschieneneinstellung

in Zukunft die besten Ergebnisse liefert.

Stochastik und Statistik – p.21/42

Page 39: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Zufälligkeit der Kenngrößen

Das erste Ergebnis einer statistischen Analyse sind oftKenngrößen, wie z.B. der Mittelwert.

Der Mittelwert als Zufallsvariable und Statistik

X :=1

n

n∑

i=1

Xn =1

n(X1 + X2 + . . . + Xn)

Der Mittelwert ist selbst zufallig!!!.

Der Mittelwert als abstrakte Realisierung

x :=1

n

n∑

i=1

xn =1

n(x1 + x2 + . . . + xn)

Der realisierte Mittelwert

[1] 299852.4 Stochastik und Statistik – p.22/42

Page 40: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Repräsentation statistischerDaten

DatenmatrixVariablenSkala (bestimmt die Auswertung!!!)

Datentafel

Stochastik und Statistik – p.23/42

Page 41: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Beispiel einer Datenmatrix

Ausschnitt eines Datensatzes:

> X

Sepal.Length Sepal.Width Species1 5.1 3.5 setosa2 4.9 3.0 setosa3 4.7 3.2 setosa53 6.9 3.1 versicolor54 5.5 2.3 versicolor56 5.7 2.8 versicolor58 4.9 2.4 versicolor

Stochastik und Statistik – p.24/42

Page 42: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Die Datenmatrix

Xij , i = 1, . . . , n, j = 1, . . . ,m sind die Einträge einerDatenmatrix.

Stochastik und Statistik – p.25/42

Page 43: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Die Datenmatrix

Xij , i = 1, . . . , n, j = 1, . . . ,m sind die Einträge einerDatenmatrix.

Jede Zeile Xi· gehört zu einem statistischenIndividuum

Stochastik und Statistik – p.25/42

Page 44: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Die Datenmatrix

Xij , i = 1, . . . , n, j = 1, . . . ,m sind die Einträge einerDatenmatrix.

Jede Zeile Xi· gehört zu einem statistischenIndividuum

Jede Spalte X·j gehört zu einem Merkmal

Stochastik und Statistik – p.25/42

Page 45: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Die Datenmatrix

Xij , i = 1, . . . , n, j = 1, . . . ,m sind die Einträge einerDatenmatrix.

Jede Zeile Xi· gehört zu einem statistischenIndividuum

Jede Spalte X·j gehört zu einem Merkmal

Der Eintrag Xij entspricht der Ausprägung des j-tenMerkmals am i-ten Individuum.

Stochastik und Statistik – p.25/42

Page 46: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Die Datenmatrix

Xij , i = 1, . . . , n, j = 1, . . . ,m sind die Einträge einerDatenmatrix.

Jede Zeile Xi· gehört zu einem statistischenIndividuum

Jede Spalte X·j gehört zu einem Merkmal

Der Eintrag Xij entspricht der Ausprägung des j-tenMerkmals am i-ten Individuum.

Die Einträge einer Datenmatrix sind Zufallsvariablenbzw. ihre Realisierungen.

Stochastik und Statistik – p.25/42

Page 47: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Die Datenmatrix

Xij , i = 1, . . . , n, j = 1, . . . ,m sind die Einträge einerDatenmatrix.

Jede Zeile Xi· gehört zu einem statistischenIndividuum

Jede Spalte X·j gehört zu einem Merkmal

Der Eintrag Xij entspricht der Ausprägung des j-tenMerkmals am i-ten Individuum.

Die Einträge einer Datenmatrix sind Zufallsvariablenbzw. ihre Realisierungen.

Die Einträge einer Datenmatrix sind nicht unbedingtreelle Zahlen!

Stochastik und Statistik – p.25/42

Page 48: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Variablen

Die Spalten der Datenmatrix heißen Variablen.

> X

Sepal.Length Sepal.Width Species1 5.1 3.5 setosa2 4.9 3.0 setosa3 4.7 3.2 setosa53 6.9 3.1 versicolor54 5.5 2.3 versicolor56 5.7 2.8 versicolor58 4.9 2.4 versicolor

Stochastik und Statistik – p.26/42

Page 49: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Der Begriff der Skala

Zu jeder Variable gehört eine Skala, also ein Wertebereichmit gewissen sinnvollen mathematischen Operationen.Kriterien zur bestimmung der Skala sind:

Ω Die Menge der möglichen Werte (endlich, unendlich,Zahlen)

< Sind die Werte geordnet? (Fachabi<Abi?)

− Gibt es einen sinnvollen Unterschiedsbegriff?

+ Ist addieren sinnvoll?

/ Ist das Verhältnis ein sinnvoller Unterschiedsbegriff?

∗ Ist Multiplikation mit einer reellen Zahl sinnvoll?

Stochastik und Statistik – p.27/42

Page 50: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Skalen

diskrete Skalenhaben voneinander getrennte Wertenominal (), dichotom (= NOT), kategoriell(=),ordinal(=<), Intervallskala(=< −), Anzahlen(=< −∗)

stetige SkalenAnteil< /, positiv< ∗/, reell< ∗−

spezielle Skalenz.B. Richtungen, Zusammensetzungen,Orientierungen, Winkel, Zuordnungen, . . .

Stochastik und Statistik – p.28/42

Page 51: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Diskrete Skalen

nominal(lat. nomen = der Name) Namen, bezeichnetverschiedene Individuen, die prinzipell gleichartig, aberindividuell verschieden sind.

Stochastik und Statistik – p.29/42

Page 52: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Diskrete Skalen

nominal

kategoriell(gr. katagorein = unterordnen, einordnen)Kategorien, jedes statistische Individuum wird in einevon ein paar vor dem Expriment feststehendeKategorien eingeordent.

Stochastik und Statistik – p.29/42

Page 53: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Diskrete Skalen

nominal

kategoriell

ordinal(angeordnet)wie kategoriell, nur dass die Kategorien in einenatürliche Reihenfolge gebracht werden können.z.B. tot, krank, gesund

Stochastik und Statistik – p.29/42

Page 54: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Diskrete Skalen

nominal

kategoriell

ordinal

dichotom(gr. dichys=zwei, tomein=schneiden)wie kategoriell, nur dass nur zwei Kategorien gibt.z.B. männlich - weiblich, ja - nein, . . .

Stochastik und Statistik – p.29/42

Page 55: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Diskrete Skalen

nominal

kategoriell

ordinal

dichotom

intervallskaliert(gr. intervall = Abstand)wie ordinal, nur dass der Abstand der benachbartenKategorien vergleichbar ist.z.B. Schulnoten

Stochastik und Statistik – p.29/42

Page 56: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Diskrete Skalen

nominal

kategoriell

ordinal

dichotom

intervallskaliert

Anzahl(von zählen)Es wurde etwas gezählt. Wie Intervallskaliert nur, dassdie Kategorien alle möglichen natürlichen Zahlen oder0 sind.

Stochastik und Statistik – p.29/42

Page 57: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Die diskreten Skalen

Name Geschlecht Fach Stufe Note Kinder

1 Maier m Chemie Abi 4 0

2 Huber w Biologie Vordiplom 1 1

3 Mueller m Geographie Hauptdiplom 2 4

Stochastik und Statistik – p.30/42

Page 58: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Stetige Skalen

reell(reelle Zahlen)Jede beliebige reelle Zahl kann vorkommen. +,−, ∗sind sinnvolle Operationen. Der Abstand von 10 zu 5ist genauso groß wie der Abstand von 5 zu 0.z.B. Temperaturänderung

Stochastik und Statistik – p.31/42

Page 59: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Stetige Skalen

reell

ratio / positiv reell /Verhaltnisskala(ratio =Verhältnis)Nur positive Zahlen können beobachtet werden. ∗, /sind sinnvolle Operationen. Der Abstand von 10 zu 1ist genauso groß, wie der Abstand von 1zu0.1.z.B. Gewicht, Länge

Stochastik und Statistik – p.31/42

Page 60: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Stetige Skalen

reell

ratio / positiv reell /Verhaltnisskala

Anteilskala / Wahrscheinlichkeitskala(Anteil vom Ganzen)Nur Werte zwischen 0 und 1 können beobachtetwerden. Die Werte sind als Anteile interpretierbar.

Stochastik und Statistik – p.31/42

Page 61: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Stetige Skalen

reell

ratio / positiv reell /Verhaltnisskala

Anteilskala / Wahrscheinlichkeitskala

Stochastik und Statistik – p.31/42

Page 62: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Die stetigen Skalen

AlkoholAnteil Menge Temperatur

1 0.1 0.125 16

2 0.3 0.500 5

3 0.7 1.000 -20

Stochastik und Statistik – p.32/42

Page 63: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Grobeinteilung der Skalen

Die Skala bestimmt welche statistischen Verfahrenangewendet werden können. Oft genügt im ersten Schrittschon eine Grobeinteilung:

diskretVariablen mit diskreten Skalen heißen oft auch Faktor.Die Möglichen Werte heißen dann Stufen des Faktors.

stetigVariablen mit stetigen Skalen können ein unendlichviele verschiedene Zahlenwerte annehmen. Tretendabei der gleiche Wert mehrfach auf, so spricht manvon Bindungen.

spezielleVariablen, die nicht ins Schema passen haben einespezielle Skala.

Stochastik und Statistik – p.33/42

Page 64: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Versuchen wir es selbst

Ausschnitt des Iris Blueten Datensatzes:

> X

Sepal.Length Sepal.Width Petal.Length Petal.Width Species

1 5.1 3.5 1.4 0.2 setosa

2 4.9 3.0 1.4 0.2 setosa

3 4.7 3.2 1.3 0.2 setosa

53 6.9 3.1 4.9 1.5 versicolor

54 5.5 2.3 4.0 1.3 versicolor

56 5.7 2.8 4.5 1.3 versicolor

58 4.9 2.4 3.3 1.0 versicolor

Welche Spalte hat welche Skala?

Stochastik und Statistik – p.34/42

Page 65: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Wozu Skala?

Die Skala bestimmt welche weiteren Verfahrenangewendet werden sollten.

Die Skala gibt Hinweise was in der weiteren Analysebeachtet werden sollte.

Die Skala bestimmt, wie die Daten zusammengefaßtund beschrieben werden können.

Die Bestimmung der Skala der Variablen ist daher dererste Schritt jeder Datenanalyse.

Stochastik und Statistik – p.35/42

Page 66: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

DatentafelDie Datentafel ist eine alternative Darstellung zurDatenmatrix, wenn nur diskrete Skalen auftreten.

Stochastik und Statistik – p.36/42

Page 67: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Datentafel (Beispiel)

> data(Titanic)

> ftable(Titanic, col.vars = c("Class", "Survived"))

Class 1st 2nd 3rd Crew

Survived No Yes No Yes No Yes No Yes

Sex Age

Male Child 0 5 0 11 35 13 0 0

Adult 118 57 154 14 387 75 670 192

Female Child 0 1 0 13 17 14 0 0

Adult 4 140 13 80 89 76 3 20

Stochastik und Statistik – p.37/42

Page 68: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Erklaerung Datentafel

Stochastik und Statistik – p.38/42

Page 69: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Erklaerung Datentafel

Stochastik und Statistik – p.38/42

Page 70: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Erklaerung Datentafel

Stochastik und Statistik – p.38/42

Page 71: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Die Datentafel

Jede Zelle der Datenmatrix enthält die Anzahlstatistischer Individuen in der Stichprobe mit dergegeben Faktorkombination.

Stochastik und Statistik – p.39/42

Page 72: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Erste Analyseschritte

Eine Datenauswertung beginnt grundsätzlich mit denfolgenden Analyseschritten:

Wie liegen die Daten vor?Datenmatrix, Datentafel, Unvorbereitet

Stochastik und Statistik – p.40/42

Page 73: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Erste Analyseschritte

Eine Datenauswertung beginnt grundsätzlich mit denfolgenden Analyseschritten:

Wie liegen die Daten vor?

Welche Variablen gibt es und was bedeuten Sie?Wir lesen die Beschreibung!!!

Stochastik und Statistik – p.40/42

Page 74: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Erste Analyseschritte

Eine Datenauswertung beginnt grundsätzlich mit denfolgenden Analyseschritten:

Wie liegen die Daten vor?

Welche Variablen gibt es und was bedeuten Sie?

Welche Skala haben die einzelnen Variablen?diskret: nominal, kategoriell, ordinal, Intervall, Anzahlstetig: (Anzahl), reell, ratio, Anteil speziell: Irgendwieanders

Stochastik und Statistik – p.40/42

Page 75: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Erste Analyseschritte

Eine Datenauswertung beginnt grundsätzlich mit denfolgenden Analyseschritten:

Wie liegen die Daten vor?

Welche Variablen gibt es und was bedeuten Sie?

Welche Skala haben die einzelnen Variablen?

Ein-, Zwei- oder Mehrstichprobensituation?Eine Grundgesamtheit, zwei oder mehrere? bzw.Eine Typ Zufallsexperiment, zwei oder mehrere?

Stochastik und Statistik – p.40/42

Page 76: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Erste Analyseschritte

Eine Datenauswertung beginnt grundsätzlich mit denfolgenden Analyseschritten:

Wie liegen die Daten vor?

Welche Variablen gibt es und was bedeuten Sie?

Welche Skala haben die einzelnen Variablen?

Ein-, Zwei- oder Mehrstichprobensituation?

Was sind die Grundgesamtheiten?Welche wünschen wir uns? Für welche ist es wohlrepräsentativ?

Stochastik und Statistik – p.40/42

Page 77: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Erste Analyseschritte

Eine Datenauswertung beginnt grundsätzlich mit denfolgenden Analyseschritten:

Wie liegen die Daten vor?

Welche Variablen gibt es und was bedeuten Sie?

Welche Skala haben die einzelnen Variablen?

Ein-, Zwei- oder Mehrstichprobensituation?

Was sind die Grundgesamtheiten?

Sind die Daten fur die Grundgesamtheitreprasentativ?Wie sind die Daten zustandegekommen?,unabhängig?, identische Zufallsgesetze?

Stochastik und Statistik – p.40/42

Page 78: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Wozu die ersten Analyseschritte?

Eine Datenauswertung beginnt grundsätzlich mit denfolgenden Analyseschritten:

Wie liegen die Daten vor?Wir müssen die Daten gegebenfalls in eineDatenmatrix übersetzten, um sie in Statistiksoftwareeinlesen zu können.

Stochastik und Statistik – p.41/42

Page 79: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Wozu die ersten Analyseschritte?

Eine Datenauswertung beginnt grundsätzlich mit denfolgenden Analyseschritten:

Wie liegen die Daten vor?

Welche Variablen gibt es und was bedeuten Sie?Wir müssen den Datensatz verstehen, um Ihnauswerten zu können.

Stochastik und Statistik – p.41/42

Page 80: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Wozu die ersten Analyseschritte?

Eine Datenauswertung beginnt grundsätzlich mit denfolgenden Analyseschritten:

Wie liegen die Daten vor?

Welche Variablen gibt es und was bedeuten Sie?

Welche Skala haben die einzelnen Variablen?Die Skala bestimmt die Auswahl der Analyseverfahren.

Stochastik und Statistik – p.41/42

Page 81: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Wozu die ersten Analyseschritte?

Eine Datenauswertung beginnt grundsätzlich mit denfolgenden Analyseschritten:

Wie liegen die Daten vor?

Welche Variablen gibt es und was bedeuten Sie?

Welche Skala haben die einzelnen Variablen?

Ein-, Zwei- oder Mehrstichprobensituation?Stichproben müssen einzeln oder mitMehrstichprobenverfahren ausgewertet werden.

Stochastik und Statistik – p.41/42

Page 82: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Wozu die ersten Analyseschritte?

Eine Datenauswertung beginnt grundsätzlich mit denfolgenden Analyseschritten:

Wie liegen die Daten vor?

Welche Variablen gibt es und was bedeuten Sie?

Welche Skala haben die einzelnen Variablen?

Ein-, Zwei- oder Mehrstichprobensituation?

Was sind die Grundgesamtheiten?Alle Analyseergebnisse beziehen sich nur auf dieseGrundgesamtheit.

Stochastik und Statistik – p.41/42

Page 83: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Wozu die ersten Analyseschritte?

Eine Datenauswertung beginnt grundsätzlich mit denfolgenden Analyseschritten:

Wie liegen die Daten vor?

Welche Variablen gibt es und was bedeuten Sie?

Welche Skala haben die einzelnen Variablen?

Ein-, Zwei- oder Mehrstichprobensituation?

Was sind die Grundgesamtheiten?

Sind die Daten fur die Grundgesamtheitreprasentativ?Nur repräsentative Daten für zu richtigen Auswertung!!!

Stochastik und Statistik – p.41/42

Page 84: Stochastik und Statistik - BoogaartRumsey, Deborah (2004) Statistik für Dummies (und für Schlaue ebenso, eine weises Buch für die Anwendungen) Krengel, Ulrich (1991) Einführung

Über diese Vorlesung

Stochastik und Statistik – p.42/42