Download pdf - Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Einfuhrung in Quantitative Methoden

Mag. Dipl.Ing. Dr. Pantelis Christodoulides&

Mag. Dr. Karin Waldherr

SS 2011

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 1/49



I Bedeutung der Psychologischen Methodenlehre und Statistikfur Psychologie

I GrundbegriffeI Beschreibende Statistik (Deskriptivstatistik):

I Aufbereitung von Daten mittels Tabellen, Grafiken,statistischen Kennzahlen.

I Zusammenhangsmaße.

I Versuchsplanung

I Grundlagen der Wahrscheinlichkeitstheorie und spezielleWahrscheinlichkeitsverteilungen

I Statistische Schlusse, Parameterschatzung und Logik desHypothesentestens (ausgewahlte statistische Testverfahren)

I Berechnungen handisch und mit Statistik-Programm ”SPSS”




Vorlesungsunterlagen und KontaktPrufungErganzende Literaturbegleitende Ubung & Tutorien

I SPSS: erhaltlich im Rechenzentrum der Universitat Wien,www.univie.ac.at/zid/software-shop

I Vorlesungsunterlagen: Folien werden spatestens Mittwochmittag zum Download zur Verfugung gestellt. Die Folienersetzen nicht den Vorlesungsbesuch! Sie sind nur alsErleichterung gedacht; prufungsrelevant sind die Inhalte, die inder Vorlesung gebracht werden.

I Homepage:psychologie.univie.ac.at/grundlagenforschung/studium/methodenlehre

I Die Folien unterliegen einem Copyright.





I schriftliche Prufung

I 4 Prufungstermine (Ende Juni, Oktober,November/Dezember, Janner), s. Homepage fur genaueTermine

I Theorieteil: Multiple Choice-Fragen.Praktischer Teil: Rechenbeispiele oder Interpretation einesSPSS-Ausdruckes.Sowohl im MC-Teil als auch im Praktischen Teil istMindestpunkteanzahl notwendig fur positive Note!

I Sprechstunde: nach Vereinbarung(e-mail: [email protected])





I Zusatzliche Literatur:Bortz, J. & Doring, N. (2006). Forschungsmethoden undEvaluation fur Human- und Sozialwissenschaftler. (4.Auflage). Berlin: Springer.Buhner, M. & Ziegler, M. (2009). Statistik fur Psychologenund Sozialwissenschaftler. Munchen: Pearson Studium.Eid, M., Gollwitzer, M, & Schmitt, M. (2010). Statistik undForschungsmethoden. Mit Online-Materialien. Weinheim:BeltzSedlmeier, P. & Renkewitz, F. (2008). Forschungsmethodenund Statistik in der Psychologie. Pearson Studium.

I Zusatzliche MaterialienI www.neuestatistik.deI www.mathe-online.at





I Ubungen zur Statistik: mehrere Parallelveranstaltungen,Anwesenheitspflicht, Beispiele sind vorzubereiten, Anmeldungin Univis.

I Ubungsbeispiele werden auf der Homepage jeweils amMittwoch nachmittag zum Download bereitgestellt.

I Tutorien zur Vorlesung und zu den Ubungen: s. Homepage




Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

I Psychologie = empirische Wissenschaft(auf Erfahrung beruhend):

I Bortz & Doring: Empirische Forschung sucht nachErkenntnissen durch systematische Auswertung vonErfahrungen.

I Psychologische Methodenlehre beschaftigt sich mit Fragen derPlanung und Auswertung empirischer Untersuchungen

I Gute Untersuchungsplanung entscheidend furAussagekraft der Ergebnisse einer empirischenUntersuchung!





I Warum benotigt eine Klinische Psychologin undGesundheitspsychologin in freier Praxis, die nicht selbstempirische Untersuchungen durchfuhren mochte, Kenntnisseder Psychologischen Methodenlehre und Statistik?

I Psychologisches Gutachten:Zur Auswahl geeigneter psychologischer Testverfahren und derInterpretation der Ergebnisse (Umgang mit Normtabellen)Kenntnisse der Statistik notwendig.





I Behandlung:Ethischer Grundsatz: Anwendung evidenzbasierterBehandlungsmethoden. Behandlungsmethoden, derenEffektivitat in Studien mit entsprechendem Studiendesigngezeigt werden konnte. ⇒ Notwendigkeit, die Qualitat einerStudie, Untersuchungsdesign, statistische Auswertung undInterpretation, nachzuvollziehen und kritisch zu bewerten.





”Goldstandard” in der medizinischen und psychologischenForschung sind randomisiert kontrollierte Studien (”randomizedcontrolled trials”, RCT’s).Kontrolliert, weil die Ergebnisse in der Studiengruppe mit deneneiner Kontrollgruppe ohne Intervention oder einerKontrollintervention verglichen werden. Kontrollintervention:bisher wirksamste Maßnahme oder eine Scheinintervention (beiMedikamenten Placebo).Die Studiengruppe wird auch als Pruf-, Interventions-,Behandlungs- oder Verumgruppe (lateinisch Verum, ”das Wahre”;im Gegensatz zum Placebo die echte Behandlungsform, z. B. daswirkstoffhaltige Medikament) bezeichnet.Die Kontrollgruppe wird auch als Vergleichs- oder Placebogruppe(sofern Placebos eingesetzt werden) bezeichnet.





Randomisierung bedeutet, dass die Zuordnung zurBehandlungsgruppe (etwa Verhaltenstherapie oderGestalttheoretische Psychotherapie) oder Vergleichsgruppe nachdem Zufallsprinzip erfolgt.Zweck der Randomisierung: 1. Ausschluss der Einflussnahme desUntersuchers (Befangenheit) auf die Zuordnung einer Behandlungund dadurch auf die Studienergebnisse. 2. Gleichmaßige Verteilungvon bekannten und nicht bekannten Einflussfaktoren auf alleGruppen.Form und Durchfuhrung der Randomisierung mussen in der Studieangefuhrt werden.





Quelle: Bortz,J. & Doring,N. Forschungsmethoden und Evaluation.





Gutekriterien einer quantitativen empirischen Untersuchung

I Objektivitat: Ergebnisse sollen unabhangig vom jeweiligenUntersucher sein.

I Validitat = Gultigkeit, Aussagekraft:

1. Interne Validitat = Interpretationseindeutigkeit (keinealternativen Erklarungen moglich)

2. Externe (okologische) Validitat = Verallgemeinerbarkeit derErgebnisse auf andere Personen, Situationen und/oderZeitpunkte.

I Reliabilitat = Zuverlassigkeit, Genauigkeit.





Deskriptivstatistik und Inferenzstatistik

I Deskriptivstatistik oder Beschreibende Statistik:zusammenfassende Beschreibung der Daten, explorativeDatenanalyse (Suchen von Strukturen und Zusammenhangen)

I Inferenzstatistik oder Schließende Statistik:Vollstandige Befragung der interessierenden Grundgesamtheitmeist nicht moglich ⇒ mit Hilfe der Inferenzstatistik werdenaufgrund von Beobachtungen in einer Teilmenge von PersonenRuckschlusse auf Gegebenheiten in der interessierendenGrundgesamtheit gezogen.Ruckschlusse sind mit gewisser Fehlerwahrscheinlichkeitbehaftet = Wahrscheinlichkeitsaussagen.





Population und Stichprobe (1)Aus Grundgesamtheit aller interessierenden Personen = Populationwird eine Teilmenge von Personen ausgewahlt = Stichprobe undaufgrund der Beobachtungen in dieser Stichprobe auf dieGrundgesamtheit geschlossen.

Quelle: www.neuestatistik.de





Population und Stichprobe (2)

I Beispiel aus dem Alltag: Wenn Sie Spaghetti kochen, werdenSie vielleicht zunachst einige davon aus dem Wasser nehmenum zu uberprufen, ob sie bereits ”al dente” sind. Trifft diesfur diese Stichprobe zu, werden Sie daraus schließen, dass dasmit hoher Wahrscheinlichkeit auch fur die Grundgesamtheitaller von Ihnen ins Wasser gelegten Spaghetti zutrifft.






I Beispiel: Epidemiologische Studie zur Pravalenzrate vonEssstorungen bei 10-15 Jahrigen in Wien: Liste aller WienerSchulen, Zufallsauswahl von Schulen, Testung von zufalliggewahlten Schulerinnen und Schulern in diesen Schulen.Schluss auf Pravalenzrate in der Grundgesamtheit.






I Verallgemeinerung auf Population ist nur mitinferenzstatistischen Verfahren zulassig, Deskriptivstatistikmacht nur Aussagen uber die erhobene Stichprobe.

I Inferenzschluss nur bei Zufallsauswahl gultig.

I Population muss eindeutig definiert sein.





Merkmale und Variablen (1)

I Die Psychologie interessiert sich fur Variation vonEigenschaften in der Population bzw. fur gemeinsameVariation mehrerer Merkmale (die Veranderung einesMerkmales in Abhangigkeit von einem anderen).

I In Experimenten wird Veranderung eines Merkmales durchaktive Manipulation eines anderen Merkmales untersucht

I Beispiel: In einem verkehrspsychologischen Experiment wirduntersucht wie sich die Konzentrationsfahigkeit und dieReaktionsgeschwindigkeit von Personen unter verschiedenstarkem Alkoholeinfluss verandern.





Merkmale und Variablen (2)

I Interessierende Merkmale (Eigenschaften) der Personen,welche verschiedene Auspragungen annehmen konnen, werdenals Variablen bezeichnet.

I Eine Variable ist ein Symbol fur eine Menge vonMerkmalsauspragungen. (Bortz & Doring)

I Variablen werden ublicherweise mit lateinischenGroßbuchstaben gekennzeichnet, die konkreten Auspragungen(Realisierungen) mit Kleinbuchstaben.

I Beispiel: Variable X , Geschlecht, steht fur die moglichenMerkmalsauspragungen x ′

1, weiblich, oder x ′2, mannlich





Funktionale Bedeutung von Variablen (1)

I Unabhangige Variablen (UV): Variablen, deren Einfluss aufeine oder mehrere andere Variablen untersucht wird (auchFaktoren genannt).

I Abhangige Variablen (AV): Variablen, auf die ein Einfluss derVeranderung der unabhangigen Variablen vermutet wird.

I Beispiel: Im verkehrspsychologischen Experiment wareAlkoholeinfluss die unabhangige Variable,Konzentrationsfahigkeit und Reaktionsgeschwindigkeit dieabhangigen Variablen.






I Moderierende Variablen oder Moderatorvariablen sindVariablen, die das Ergebnis beeinflussen, indem sie dieWirkung einer unabhangigen Variablen auf die abhangigeVariable verandern (sie beeinflussen Richtung und Starke desZusammenhanges zwischen UV und AV).

I Beispiel: Im verkehrspsychologischen Experiment konnte diegleichzeitige Einnahme von Medikamenten die Alkoholwirkungbeeinflussen.






I Mediierende Variablen oder Mediatorvariablen sind Variablen,die den Zusammenhang zwischen zwei Variablen vermitteln(erklaren).

I Beispiel: Altere AutofahrerInnen sind ”bessere”AutofahrerInnen. Dieser Zusammenhang wird durch dieVariable ”Fahrpraxis” vermittelt.






Quelle: Faller, H. & Lang, H. (2006). Medizinische Psychologie und

Soziologie (2. Auflage, S.51). Heidelberg: Springer Medizin Verlag.






I Storvariablen sind Variablen, die das Untersuchungsergebnisbeeinflussen konnen, aber nicht berucksichtigt wurden.Moglichkeiten zur Ausschaltung von Storvariablen (vgl. Bortz& Doring):

I Randomisierung.I Paarbildung (matched samples): Bei zwei

Untersuchungsgruppen werden aufgrund der Auspragung(en)der moglichen Storvariable(n) ”Paare” vonUntersuchungsteilnehmerInnen gebildet; je eine Person derKontrollgruppe wird einer Person der Studiengruppezugeordnet.






I Mogliche Storvariable als zusatzliche Variable erheben und beider statistischen Auswertung als Kontrollvariableberucksichtigen.

I Nur Personen mit einer bestimmten Auspragung dieser Variableuntersuchen (z.B. nur Personen, die keine Medikamenteeingenommen haben); d.h. die Variable konstant halten.

I Außerdem sollte man dafur sorgen, dass die Untersuchung inallen Vergleichsgruppen storungsfrei verlauft (= Ausschaltenvon Storfaktoren).





Empirische Zuganglichkeit von Variablen

I Manifeste Variablen sind direkt beobachtbar. Z.B.Alkoholmenge, Gewicht, Geschlecht, usw.

I Latente Variablen sind nicht beobachtbar (sichtbar). Z.B.Konzentrationsfahigkeit, Intelligenz, etc. Hierbei handelt essich um sog. hypothetische Konstrukte, welche nur indirektgemessen werden konnen. Aufgrund der Auspragungen vonmanifesten Variablen wird auf die latente Eigenschaftgeschlossen.





Arten von MerkmalsauspragungenI Numerische oder Quantitative Variablen: Auspragungen sind

Zahlenwerte. Z.B. Gewicht, Alter, etc.

I Kategoriale oder Qualitative Variablen: Auspragungen sindZustande oder Kategorien. Z.B. Geschlecht, Familienstand,Staatsburgerschaft.

I Auspragungen quantitativer Variablen lassen sich durchMessen, Zahlen, Wiegen erfassen und unterscheiden sichdurch ihre Große.Auspragungen qualitativer Variablen unterscheiden sich durchihre Art und lassen sich nicht durch Messen, Zahlen, Wiegenerfassen.





Arten qualitativer und quantitativer Variablen

Weiters unterscheidet man:

I Bei quantitativen Variablen zwischen diskreten Variablen,welche nur ganzzahlige Auspragungen haben (1,2,3,. . . ) undstetigen oder kontinuierlichen Variablen, die beliebig feinabstufbar sind.

I Bei qualitativen Variablen zwischen dichotomen Variablen =Variablen mit nur zwei Auspragungen (z.B. Geschlecht) undpolytomen Variablen = Variablen mit mehr als zweiAuspragungen.





Skalenniveau (1)

I Um ein Merkmal zu messen werden den einzelnenAuspragungen Messwerte (Zahlen) auf einer Skala zugeordnet.

I Eine Skala ist eine Vorschrift, die jeder Person der Stichprobeeinen Beobachtungswert zuordnet, der die Auspragung desinteressierenden Merkmales angibt.





Skalenniveau (2)

In diesem Sinne lassen sich auch qualitative Merkmale ”messen”;man nennt diese Zuordnung von Zahlen zu denMerkmalsauspragungen auch Kodierung.Bei der Zuordnung der Zahlen ist zu beachten, dassunterschiedlichen Merkmalsauspragungen unterschiedliche Zahlenzugeordnet werden und jeder moglichen Merkmalsauspragungeindeutig eine Zahl zuordenbar ist.





Skalenniveau (3)

I Nominalskala: Die Skala mit dem niedrigsten Niveau.Rangordnung der Auspragungen nicht moglich oder sinnvoll,auch wenn ihnen Zahlen zugeordnet werden. Beurteilt nurGleichheit und Verschiedenheit von Merkmalsauspragungen.Beispiele: Geschlecht, Familienstand, Staatsburgerschaft.Nominalskalierte Variablen heissen nominale Merkmale.





Skalenniveau (4)

I Ordinalskala oder Rangskala: Auspragungen weisen naturlicheRangordnung auf. Macht Großer-Kleiner-Aussagen. DieAbstande zwischen den verschiedenen Werten einerordinalskalierten Variablen lassen sich jedoch nichtinterpretieren; die Ordinalskala macht keine Aussage uber dieGroße der Unterschiede zwischen den Auspragungen. Solangedie Großer-Kleiner-Relationen erhalten bleiben sind die Zahlenbeliebig wahlbar.

I Typisches Beispiel einer Ordinalskala: Platzierungen beisportlichen Wettkampfen. Platzierung gibt nur Auskunftdaruber wer z.B. am schnellsten war, nicht uber Zeitabstandezwischen den einzelnen Rangplatzen.





Skalenniveau (5)

I Metrische Variablen: Auspragungen unterliegen nicht nurRangordnung, sondern Differenzen sind sinnvollinterpretierbar. Gleich große Zahlendifferenzen entsprechenauch gleich großen Unterschieden zwischen denAuspragungen. Beispiele sind: Gewicht, Große, Alter.





Skalenniveau (7)

I Metrische Skalen konnen weiters noch unterteilt werden inI Intervallskala: kein naturlicher Nullpunkt (z.B. Kalender,

Temperatur in Grad Celsius); Verhaltnisse konnen nichtinterpretiert werden. In der Psychologie wird furPsychologische Tests angenommen, dass die Messwerteintervallskaliert sind.

I Rationalskala: absoluter (naturlicher) Nullpunkt, Verhaltnissekonnen interpretiert werden (Gewicht, Alter, Große, Anzahl derKinder, Temperatur in Kelvin, usw.)





Univariat, Bivariat, Multivariat

I Univariat: nur eine Variable wird betrachtet.

I Bivariat: zwei Variablen werden gemeinsam betrachtet.

I Multivariat: mehr als zwei Variablen werden gemeinsambetrachtet.





Hypothesengenerierende und HypothesenprufendeUntersuchungen

I Hypothesenprufende Untersuchungen: aufgrund vonVorinformationen aus bisherigen Untersuchungen konnenwissenschaftliche Hypothesen formuliert und statistischgepruft werden.

I Hypothesengenerierende Untersuchungen: bei neuenForschungsgebieten, fur welche zu wenige Informationenvorliegen um Hypothesen zu formulieren, werden zunachsthypothesenerkundende Untersuchungen durchgefuhrt. Ziel istdie Formulierung wissenschaftlicher Hypothesen, die in eineranschließenden hypothesenprufenden Untersuchung statistischgepruft werden.





Wissenschaftliche Hypothesen (1)

I Eine wissenschaftliche Hypothese behauptet eine mehr oderweniger prazise Beziehung zwischen zwei oder mehr Variablen,die fur eine bestimmte Population vergleichbarer Objekte oderEreignisse gelten soll. (Bortz & Doring)

I Die Hypothesen mussen im Rahmen derUntersuchungsplanung vor der Datenerhebung formuliertwerden!





Wissenschaftliche Hypothesen (2)

I Wissenschaftliche Hypothesen (im Gegensatz zuAlltagsvermutungen)

I beziehen sich auf reale Sachverhalte, die empirisch uberprufbarsind,

I sind allgemeingultige, uber den Einzelfall hinausgehendeBehauptungen,

I mussen durch Erfahrung widerlegbar (falsifizierbar) sein,I mussen widerspruchsfrei sein,I sollen moglichst prazise formuliert sein,I mussen theoriegeleitet sein.

(vgl. Bortz & Doring)




NotationSummenzeichen

I Die Anzahl der Personen in der Stichprobe =Stichprobenumfang wird mit N bzw. n bezeichnet.

I Die Merkmalsauspragungen der einzelnen Personen in derStichprobe bei Variable X werden mit x1, . . . , xi , . . . , xn (oderin anderer Schreibweise xi , i = 1, . . . , n) bezeichnet.

I Die moglichen Auspragungen (Realisierungen) einesMerkmales X werden mit x ′

1, . . . , x′j , . . . , x

′k (oder in anderer

Schreibweise: x ′j , j = 1, . . . , k) bezeichnet.





I Hat man nur ein Merkmal erhoben und notiert dieBefragungsergebnisse in der Reihenfolge der Befragung oderzufallig, bezeichnet man die entstehende Liste als Urliste oderBeobachtungsreihe.

I Beispiel: Erhobene Variable X : Anzahl der Kinder,Stichprobenumfang n = 15.

I Urliste:x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15

0 1 2 3 2 1 2 2 4 3 1 2 3 1 0

x2 = 1 bedeutet, dass die in die Urliste an zweiter Stelleeingetragene Person ein Kind hat.





Hat man mehrere Merkmale (Variablen) erhoben, fasst man diesein Form einer Datenmatrix zusammen. Die Matrix besteht aus nZeilen fur die Personen und p Spalten fur die erhobenen Variablen(n × p−Matrix).Zeile i enthalt die beobachteten Merkmalsauspragungen der i−tenPerson,Spalte k enthalt die bei den n Personen beobachtetenAuspragungen des Merkmales K .Die Eintragungen x11, . . . , xnp bezeichnen die Auspragungen dereinzelnen Merkmale bei den einzelnen Personen: x11 steht fur dieMerkmalsauspragung der ersten Person beim ersten Merkmal.





Beispiel einer Datenmatrix in allgemeiner Notation:

Variable1 2 . . . k . . . p

Person 1 x11 x12 . . . x1k . . . x1p

2 x21 x22 . . . x2k . . . x2p...

.... . .

...i xi1 xi2 . . . xik . . . xip...

.... . .

...n xn1 xn2 . . . xnk . . . xnp





Beispiel einer Datenmatrix fur n = 50 Personen und erhobeneVariablen Geschlecht (1=weiblich, 2=mannlich), Kinderanzahl,Alter

VariableGeschlecht Kinder Alter

Person 1 1 2 402 2 0 25...

......

......

......

...50 2 1 45





In der Statistik benotigt man sehr oft die Summe von Messwerten,z.B. in der Gesamtstichprobe oder einer Teilstichprobe.Hat eine Summe sehr viele Summanden, ist es zweckmaßig dasSummenzeichen

∑(griech. Sigma) zu verwenden.

Zum Beispiel: Summe aller xi fur i = 1 bis n:

x1 + x2 + x3 + . . . + xn =





Zusatzmaterial:

http://www.mathe-online.at/materialien/klaus.berger/files/Summen/summenzeichen.pdf





I Beispiel 1: Summe der Kinder aller Personen aus unsererUrliste

n∑i=1

xi = 0+1+2+3+2+1+2+2+4+3+1+2+3+1+0 = 27

I Beispiel 2: Summe der Kinder der ersten 5 Personen aus derUrliste

5∑i=1

xi = 0 + 1 + 2 + 3 + 2 = 8

I Beispiel 3: Summe der Kinder der letzten 5 Personen aus derUrliste (also Personen 11 bis 15)

15∑i=11

= 1 + 2 + 3 + 1 + 0 = 7





I Laufindex ist beliebig wahlbar

n∑i=1

xi =n∑

j=1

xj =n∑

l=1

xl

I Aber!n∑

i=1

xi 6=n∑

j=1

xi

I

n∑i=1

(xi+yi ) = (x1+y1)+(x2+y2)+. . .+(xn+yn) =n∑

i=1

xi+n∑

i=1

yi

6=n∑

i=1

xi + yi = (x1 + x2 + . . . + xn) + yi





In∑

i=1

a = a + a + a + ... = na

(a ist eine Konstante)

I

n∑i=1

axi = (ax1+ax2+. . .+axn) = a(x1+x2+. . .+xn) = an∑

i=1

xi

I Es gelten die allgemeinen Rechenregeln fur AdditionenZusatzmaterial:http://www.mathe-online.at/materialien/klaus.berger/files/Summen/regenregelnsummen.pdf


GrundbegriffeUnivariate Deskriptive Statistik




SS 2011

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 1/62


Summenzeichen

In der Statistik benotigt man sehr oft die Summe von Messwerten,z.B. in der Gesamtstichprobe oder einer Teilstichprobe.Hat eine Summe sehr viele Summanden, ist es zweckmaßig dasSummenzeichen

∑(griech. Sigma) zu verwenden.

Zum Beispiel: Summe aller xi fur i = 1 bis n:

x1 + x2 + x3 + . . .+ xn =



Summenzeichen

Zusatzmaterial:

http://www.mathe-online.at/materialien/klaus.berger/files/Summen/summenzeichen.pdf



Summenzeichen

Urliste: Anzahl der Kinder von n = 15 Personenx1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15

0 1 2 3 2 1 2 2 4 3 1 2 3 1 0

I Beispiel 1: Summe der Kinder aller Personen aus der Urlisten∑

i=1

xi = 0 + 1 + 2 + 3 + 2 + 1 + 2 + 2 + 4 + 3 + 1 + 2 + 3 + 1 + 0 = 27

I Beispiel 2: Summe der Kinder der ersten 5 Personen aus der Urliste

5∑i=1

xi = 0 + 1 + 2 + 3 + 2 = 8

I Beispiel 3: Summe der Kinder der letzten 5 Personen aus der Urliste(also Personen 11 bis 15)

15∑i=11

xi = 1 + 2 + 3 + 1 + 0 = 7



Summenzeichen

I Laufindex ist beliebig wahlbarn∑

i=1

xi =n∑

j=1

xj =n∑

l=1

xl

I Aber!n∑

i=1

xi 6=n∑

j=1

xi

I

n∑i=1

(xi+yi ) = (x1+y1)+(x2+y2)+. . .+(xn+yn) =n∑

i=1

xi+n∑

i=1

yi

6=n∑

i=1

xi + yi = (x1 + x2 + . . .+ xn) + yi



Summenzeichen

In∑

i=1

a = a + a + a + ... = na

(a ist eine Konstante)

I

n∑i=1

axi = (ax1+ax2+. . .+axn) = a(x1+x2+. . .+xn) = an∑

i=1

xi

I Es gelten die allgemeinen Rechenregeln fur AdditionenZusatzmaterial:http://www.mathe-online.at/materialien/klaus.berger/files/Summen/regenregelnsummen.pdf



Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

I Die Deskriptivstatistik dient der Beschreibung der erhobenenDaten in der Stichprobe durch

1. Tabellen,2. Statistische Kennwerte, und/oder3. Grafiken.

I Diese Strukturierung, Zusammenfassung und anschaulicheDarstellung der Daten dient aber auch dazu, sich zunachsteinen Uberblick zu verschaffen und ev. Widerspruchlichkeitenzu entdecken (verursacht z.B. durch Dateneingabefehler,falsche Angaben eines Untersuchungsteilnehmers, etc.).




Die Datenmatrix liefert Informationen uber die Charakteristikajeder einzelnen Person. Im allgemeinen ist man allerdings daraninteressiert, wie haufig die einzelnen Merkmalsauspragungen in derStichprobe vorkommen. Dazu kann man sich die Haufigkeitstabellebzw. Haufigkeitsverteilung ansehen.




Nominalskalierte Merkmale

Absolute Haufigkeit, fj , ist die Anzahl von Personen mit der j-tenAuspragung des Merkmals X .

Es gilt stets: Die Summe der absoluten Haufigkeiten fur dieverschiedenen Auspragungen betragt n:

k∑j=1

fj = n




I Die absoluten Haufigkeiten sind vom Stichprobenumfangabhangig; eignen sich nicht um die Ergebnisse verschiedenerErhebungen mit unterschiedlichem Stichprobenumfang zuvergleichen. Großen, die unabhangig vom Stichprobenumfangsind, sind die relative Haufigkeit und Prozentwerte.




I Relative Haufigkeit, rj , ist der Quotient

absolute Haufigkeit

Anzahl der Personen=

fjn

Es gilt stets: Es konnen nur Werte zwischen 0 und 1vorkommen; die Summe der relativen Haufigkeiten fur die

verschiedenen Auspragungen betragt 1.

k∑j=1

rj = 1

I Prozentwerte, pzj :

Prozentuelle Haufigkeit = rj × 100




Datenbeispiel 1:

Allgemeine Bevolkerungsumfrage der Sozialwissenschaften(ALLBUS 2006):1 Variable ”Erhebungsgebiet: Alte Bundeslander(= Westdeutschland) oder Neue Bundeslander (=Ostdeutschland)”; Zufallsstichprobe von n = 50 Personen.Kodierung: 1 = Westdeutschland, 2 = Ostdeutschland.

Urliste: 2, 2, 2, 1, 1, 1, 1, 1, 2, 2, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1,1, 2, 2, 2, 2, 1, 2, 2, 1, 1, 1, 2, 1, 1, 2, 1, 2, 2, 1, 2, 1, 2, 2, 1, 1,2, 1, 2

1Das ALLBUS-Programm ist 1980-1986 und 1991 von der DFG (Deutsche Forschungsgemeinschaft) gefordert

worden. Die weiteren Erhebungen wurden von Bund und Landern uber die GESIS (Gesellschaftsozialwissenschaftlicher Infrastruktureinrichtungen) finanziert. ALLBUS wird innerhalb der GESIS an denStandorten Mannheim und Koln in Zusammenarbeit mit dem ALLBUS-Ausschuß realisiert. Die vorgenanntenInstitutionen und Personen tragen keine Verantwortung fur die Verwendung der Daten in dieser Vorlesung.




Haufigkeitstabelle fur Datenbeispiel 1Erhebungsgebiet Strichliste abs. H. rel. H. Prozent

x ′j fj rj pzjWestdeutschland ||||— ||||— ||||— ||||— ||||— |||| 29 0.58 58Ostdeutschland ||||— ||||— ||||— ||||— | 21 0.42 42

Summe 50 1 100




Ordinalskalierte Merkmale

Zusatzlich kumulative Haufigkeitsfunktionen interessant undsinnvoll.Voraussetzung ist, dass die Merkmalsauspragungen der Große nachgeordnet sind.

I Kumulierte absolute Haufigkeit oder EmpirischeVerteilungsfunktion f + = die Summe der absolutenHaufigkeiten der betreffenden Merkmalsauspragung und allerkleineren. Gibt an, wieviele Personen einen Wert haben, derkleiner oder gleich der betreffenden Kategorie l ist.

f +l =

l∑j=1

fj




I Kumulierte relative Haufigkeit r+ = die Summe der relativenHaufigkeiten der betreffenden Merkmalsauspragung und allerkleineren. Anteil der Personen, die einen Wert haben, derkleiner oder gleich der betreffenden Kategorie l ist.

r+l =

1

n

l∑j=1

fj

I Kumulierte prozentuelle Haufigkeit pz+ = die Summe derprozentuellen Haufigkeiten der betreffendenMerkmalsauspragung und aller kleineren. Prozentwert derPersonen, die einen Wert haben, der kleiner oder gleich derbetreffenden Kategorie l ist.

pz+l = r+

l × 100




Es gilt stets:

f +k =

k∑j=1

fj = n

r+k =

1

n

k∑j=1

fj = 1

pz+k = 100

bei j = 1, . . . , k Merkmalsauspragungen.




Datenbeispiel 2:Variable ”Gesundheitszustand” aus ALLBUS (2006): Kodierung: 1= sehr gut, 2 = gut, 3 = zufriedenstellend, 4 = weniger gut, 5 =schlecht; Zufallsstichprobe von n = 50 Personen.

Urliste: 1, 2, 3, 2, 3, 2, 3, 4, 3, 2, 2, 5, 2, 3, 3, 2, 2, 3, 2, 2, 2, 2,2, 1, 1, 1, 2, 4, 3, 3, 2, 4, 3, 5, 1, 3, 5, 2, 1, 2, 2, 2, 2, 4, 2, 3, 1,2, 4, 4




Haufigkeitstabelle fur Datenbeispiel 2

Gesundheitszustand fj rj pzj f +j r+

j pz+j

sehr gut 7 0.14 14 7 0.14 14gut 22 0.44 44 29(7 + 22) 0.58 58zufriedenstellend 12 0.24 24 41(29 + 12) 0.82 82weniger gut 6 0.12 12 47 0.94 94schlecht 3 0.06 6 50 1.00 100

Summe 50 1.00 100 - - -




Metrische Merkmale

Haufigkeitstabelle unubersichtlich, insbesondere bei stetigenVariablen → Intervalle (= Klassenzusammenfassung odergruppierte Daten). 5-15 Intervalle (max. 20). Je weniger Intervalleumso großer Informationsverlust, je mehr Intervalle umsounubersichtlicher.Variable ”Alter” aus ALLBUS (2006), Zufallsstichprobe vonn = 50 Personen.




Haufigkeitstabelle fur Datenbeispiel 3 mit Originaldaten

Alter fj rj pzj f +j r+

j pz+j

19 1 0.02 2 1 0.02 220 1 0.02 2 2 0.04 424 2 0.04 4 4 0.08 831 1 0.02 2 5 0.10 1033 1 0.02 2 6 0.12 1235 1 0.02 2 7 0.14 1436 2 0.04 4 9 0.18 1838 2 0.04 4 11 0.22 2240 4 0.08 8 15 0.30 3041 2 0.04 4 17 0.34 3442 2 0.04 4 19 0.38 3843 1 0.02 2 20 0.40 40




Fortsetzung Haufigkeitstabelle fur Datenbeispiel 3 mitOriginaldaten

45 1 0.02 2 21 0.42 4246 2 0.04 4 23 0.46 4647 2 0.04 4 25 0.50 5048 2 0.04 4 27 0.54 5449 1 0.02 2 28 0.56 5651 1 0.02 2 29 0.58 5852 1 0.02 2 30 0.60 6053 2 0.04 4 32 0.64 6454 1 0.02 2 33 0.66 6655 2 0.04 4 35 0.70 7056 1 0.02 2 36 0.72 7257 1 0.02 2 37 0.74 7458 1 0.02 2 38 0.76 76




Fortsetzung Haufigkeitstabelle fur Datenbeispiel 3 mitOriginaldaten

60 1 0.02 2 39 0.78 7862 1 0.02 2 40 0.80 8064 2 0.04 4 42 0.84 8466 1 0.02 2 43 0.86 8667 1 0.02 2 44 0.88 8869 1 0.02 2 45 0.90 9071 2 0.04 4 47 0.94 9475 1 0.02 2 48 0.96 9682 1 0.02 2 49 0.98 9885 1 0.02 2 50 1.00 100




Haufigkeitstabelle fur Datenbeispiel 3 mit gruppierten Daten

Alter fj rj pzj f +j r+

j pz+j

≤ 29 Jahre 4 0.08 8 4 0.08 830-39 Jahre 7 0.14 14 11 0.22 2240-49 Jahre 17 0.34 34 28 0.56 5650-59 Jahre 10 0.20 20 38 0.76 7660-69 Jahre 7 0.14 14 45 0.90 90≥ 70 Jahre 5 0.10 10 50 1.00 100

Summe 50 1 100




Haufigkeitstabelle mit SPSS

I Menu Analysieren...

I → Deskriptive Statistik

I → Haufigkeiten...




Histogramm

I Histogramm oder Blockdiagramm - Grafische Darstellung derHaufigkeitstabelle

I Beobachtete Auspragungen x ′j geordnet auf der X -Achse

I Relative (rj) oder absolute Haufigkeiten (fj) auf der Y -Achse

I Rechtecksflachen sind gleich den rj oder fj

I Gesamtflache des Histogramms ist gleich 1 bzw. n

I Maßstab auf der X -Achse beliebig und wird so gewahlt, dassdie Verteilung moglichst anschaulich wird

I Balkendiagramm fur nominalskalierte Variablen







Treppenfunktion

I Grafische Darstellung der kumulativen Haufigkeitstabelleanalog zu Histogramm

I Letzte und großte Teilflache ist gleich 1 bzw. n




Treppenfunktion




Lagemaße - Zweck

I Wir wollen die zentrale Tendenz einer Stichprobe moglichstgut schatzen

I Eine Maßzahl, die in geeigneter Weise ein ’Zentrum’ derStichprobe angibt

I Mittelwert, Geometrisches Mittel, Modalwert und Median




Arithmetisches Mittel (Mittelwert)

I Der Mittelwert oder Durchschnittswert ist die Summe allerWerte dividiert durch den Stichprobenumfang n:

Ix =

n∑i=1

xi

n=

1

n

n∑i=1

xi

I Das arithmetische Mittel ist nur fur metrische Variablensinnvoll!




Arithmetisches Mittel (Mittelwert)

Beispiel: Anzahl der Kinder:

Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0

x =0 + 1 + 2 + 3 + 2 + 1 + 2 + 2 + 4 + 3 + 1 + 2 + 3 + 1 + 0

15=

=27

15= 1.8

Die durchschnittliche Kinderzahl in der Stichprobe betragt 1.8Kinder.




Arithmetisches Mittel (Mittelwert)Auf Grundlage der Haufigkeitstabelle lasst sich der Mittelwertberechnen, indem man jede Merkmalsauspragung mit ihrerabsoluten Haufigkeit multipliziert und die Summe uber alleMerkmalsauspragungen bildet.

x =1

n

k∑j=1

x ′j · fj

Beispiel: Berechnung des Mittelwertes fur Datenbeispiel 3 aus derHaufigkeitstabelle

x =1

50(19 · 1 + 20 · 1 + 24 · 2 + 31 · 1 + . . .) =

2459

50= 49.18




Eigenschaften des Mittelwertes (1)

Die Summe der Differenzen aller Werte vom Mittelwert ist Null,

n∑i=1

(xi − x) = 0

d.h. positive und negative Abweichungen vom Mittelwert hebensich auf.




Eigenschaften des Mittelwertes (2)

Die Summe der quadrierten Differenzen aller Werte zum Mittelwertist ein Minimum (d.h. ist kleiner als die Summe der quadriertenDifferenzen aller Werte zu irgendeinem anderen Wert)

n∑i=1

(xi − x)2 = Min




Gemeinsamer Mittelwert fur zwei oder mehr Datensatze

Den gemeinsamen Mittelwert aus zwei Stichproben mitMittelwerten x1 und x2 und Stichprobenumfangen n1 und n2

berechnet man, indem man die Mittelwerte mit denStichprobenumfangen gewichtet:

x =n1x1 + n2x2

n1 + n2

Analog fur mehr als zwei Datensatze.




Median und das α-QuantilI Der Median ist dadurch charakterisiert, dass jeweils

mindestens 50% der Beobachtungen einen Wert großer odergleich bzw. kleiner oder gleich dem Median annehmen

I Sind x(1) ≤ · · · ≤ x(n) die der Große nach geordnetenBeobachtungswerte, so ist der Median definiert als

x =

x( n+12

) falls n ungerade

x( n2

) + x( n+22

)

2 falls n gerade

I Bei einer ungeraden Anzahl von Merkmalsauspragungen istder Median der Wert in der Mitte der geordneten Reihe

I Bei einer geraden Anzahl ist der Median das arithmetischeMittel zwischen den beiden mittleren Werten der geordnetenReihe




Median und das α-Quantil

I Beispiel 1: Anzahl der Kinder (n = 15):Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0

Geordn. Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4

x = x(8) = 2

I Beispiel 2: Anzahl der Kinder (n = 16):

Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0 5Geordn. Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4 5

x =x(8) + x(9)

2=

2 + 2

2= 2




Median und das α-QuantilI Sind x(1) ≤ · · · ≤ x(n) die der Große nach geordneten

Beobachtungswerte, so ist das α-Quantil (0 < α < 1) definiertals

xα =

x(l) falls n · α keine ganze Zahl ist;

l = die auf n · α folgende ganze Zahlx(l)+x(l+1)

2 falls n · α eine ganze Zahl ist;l = n · α

I Der Median ist das Quantil mit α = 0.50 (0.50-Quantil)

I Die Quantile mit α = 0.25 und α = 0.75 heißen unteres bzw.oberes Quartil





Beispiel Anzahl der Kinder (n = 15):

Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0Geordnete Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4

x = x(8) = 2 x0.25 = x(4) = 1 x0.75 = x(12) = 3





I Der Median hat gegenuber dem arithmetischen Mittel denVorteil, dass er auch bei rangskalierten Merkmalen verwendetwerden kann

I Der Median ist weniger empfindlich gegenuber Ausreissern inder Stichprobe

I Werte, die weit von allen ubrigen entfernt liegen, beeinflussenden Median kaum




Ausreisser - Graphische Uberprufung




ModalwertI Bei nominalskalierten Merkmalen wie Geschlecht oder Beruf

kann man weder das arithmetische Mittel noch den Medianals Lagemaß verwenden

I Der Modalwert (Mod) (haufigster Wert) ist ein dafurgeeignetes Lagemaß

I Der Modalwert gibt die Auspragung an, welche die großteHaufigkeit in der Stichprobe besitzt

I Falls mehrere Auspragungen diese Bedingung erfullen, derModalwert also nicht eindeutig ist, ist es nicht sinnvoll ihn alsLagemaß zu verwenden




Modalwert


Urliste: 0 1 1 3 2 2 2 3 4 3 1 2 3 1 0

Mod = 1, 2, 3

I Modalwert nicht eindeutig




Bemerkungen zu den Lagemaßen

I Bei mehrgipfeligen und U-formigen Haufigkeitsverteilungensind Lagemaße nicht charakteristisch fur die Verteilung

I Vor der Verwendung eines Lagemaßes immer seineSinnhaftigkeit uberprufen

I Charakterisierung von Haufigkeitsverteilungen




Charakterisierung von Haufigkeitsverteilungen

I Bei einer symmetrischen Verteilung gilt x = x = Mod




Charakterisierung von Haufigkeitsverteilungen

I Lagemaße charakterisieren den Datensatz nicht richtig




I Bei einer linksschiefen Verteilung gilt x < x < Mod

I Bei einer rechtsschiefen Verteilung gilt x > x > Mod




Wegweiser Lagemaße




Streuungsmaße - ZweckI Streuungsmaße beschreiben die Abweichung von einem

Zentrum einer Haufigkeitsverteilung

I Prazisierung einer Haufigkeitsverteilung durch Lagemaß undStreuungsmaß

I Spannweite, Standardabweichung, Varianz,Variationskoeffizient und Quartilabstand




SpannweiteI Streubereich einer Haufigkeitsverteilung ist derjenige Bereich,

in dem alle Werte der Stichprobe liegen

I Sind x(1) ≤ · · · ≤ x(n) die der Große nach geordnetenBeobachtungswerte, so ist das Intervall

[x(1), x(n)

]der

Streubereich der Stichprobe

I Spannweite R = x(n) − x(1), d.h. die Breite des Streubereichs

I Ausreisser beeinflussen die Spannweite sehr stark

I Berechnung der Spannweite ist nur fur metrische Variablensinnvoll




VarianzI Die Varianz s2 ist ein Maß, das die Streuung der Werte um

den Mittelwert ausdruckt

I

s2 =1

n − 1

n∑i=1

(xi − x)2 =1

n − 1

[n∑

i=1

x2i −

(∑n

i=1 xi )2

n

]︸︷︷︸praktische Berechnungsformel

I Varianz ist ein quadratisches Streuungsmaß und nimmt somitstets positive Werte an

I Ausreisser beeinflussen die Varianz sehr stark, da dieBezugsgroße der Mittelwert ist

I Berechnung der Varianz ist nur fur metrische Variablensinnvoll




VarianzBeispiel Anzahl der Kinder (n = 15):

Urliste: 0 1 1 3 2 2 2 3 4 3 1 2 3 1 0

15∑i=1

xi = 2815∑i=1

x2i = 72 s2 =

1

14

[72− 784

15

]= 1.38

I Die Varianz laßt sich auch durch die Haufigkeitstabelleberechnen, analog zu Mittelwert

s2 =1

n − 1

k∑j=1

fjx′2j −

(∑k

j=1 fjx′j )

2

n




Varianz

Beispiel Datenbeispiel 3:Haufigkeitstabelle siehe 1. Vorlesungseinheit

50∑i=1

xi = 245950∑i=1

x2i = 132027

s2 =1

49

[132027− 24592

50

]= 226.396




StandardabweichungI Die Standardabweichung s ist die positive Wurzel aus der

Varianz einer Stichprobe

I

s =+√s2 = +

√√√√ 1

n − 1

n∑i=1

(xi − x)2

I Die Standardabweichung besitzt die gleiche Dimension wie dieBeobachtungswerte (Vorteil gegenuber der Varianz)

I Ausreisser beeinflussen die Standardabweichung sehr stark, dadie Bezugsgroße der Mittelwert ist

I Berechnung der Standardabweichung ist sinnvoll nur furmetrische Variablen




VariationskoeffizientI Der Variationskoeffizient v ist ein vom Mittelwert bereinigtes

Streuungsmaß

I

v =s

x

I Der Variationskoeffizient misst das Verhaltnis vonStandardabweichung und Mittelwert

I Berechnung von v nur fur metrische Variablen mit positivenWerten sinnvoll

I Der Variationskoeffizient eignet sich zum Vergleich derStreuungen verschiedener Messreihen




Quartilabstand

I

qA = x0.75 − x0.25

I Quartilabstand ist robust gegenuber Ausreissern

I Zwischen dem unteren und oberen Quartil liegen 50% allerWerte

I Berechnung des Quartilabstandes ist sinnvoll fur mindestensrangskalierte Variablen




Quartilabstand


Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0Geordnete Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4

x = x(8) = 2 x0.25 = x(4) = 1 x0.75 = x(12) = 3

qA = x0.75 − x0.25 = 2




Ausreisser - Grafische Uberprufung




Wegweiser Streuungsmaße




Schiefe

I Die Schiefe g1 ist eine Maßzahl, die uns angibt, in welcheRichtung eine Haufigkeitsverteilung schief ist

g1 =1n

∑ni=1(xi − x)3√

( 1n

∑ni=1(xi − x)2)3

I Ist g1 = 0, so ist die Verteilung symmetrisch

I Je starker negativ/positiv g1 ist, destolinksschiefer/rechtsschiefer ist die Verteilung

I Die Schiefe ist sinnvoll fur eingipfelige Verteilungen




I Messwerte von Personen verschiedener Populationen sind oftnicht direkt vergleichbar, z.B. die Leistung eines Madchens inKugelstoßen mit jener eines Knaben

I Dennoch mochte man ausdrucken konnen, wie gut jeder derbeiden Leistungen innerhalb der Bezugsgruppe ist

I Der Standardmesswert t∗i bezieht den beobachteten Messwertxi der i-ten Person auf den Mittelwert x der Gruppe unddruckt die Abweichung in Standardeinheiten s aus

I

t∗i =xi − x

s

I Es gilt t = 0 und s2t = 1




Beispiel

I Ein Knabe erzielt 5.20m bei Gruppenkennwerten xM = 5.03,bzw. sM = 0.92

I Ein Madchen erreicht 4.50m bei GruppenkennwertenxW = 4.21, bzw. sW = 0.85

I Daher ist t∗M = 0.18 und t∗W = 0.42

I Der Knabe liegt 0.18, das Madchen 0.42 Standardeinheitenuber dem Mittelwert (0!); die Leistung des Madchens istrelativ besser


Univariate Deskriptive StatistikBivariate Deskriptive Statistik

3. Vorlesung


Karin Waldherr & Pantelis Christodoulides

23. Marz 2011



Boxplot

Boxplot



Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Ziele

I Gemeinsame Betrachtung zweier Variablen

I Aufschluss uber Art und Starke des Zusammenhangeszwischen den beiden Variablen

I Bei metrischen Merkmalen: Beschreibung einer funktionalenBeziehung und darauf beruhende Prognosen fehlender Werte




Methoden

I Zweidimensionale numerische und grafische DarstellungI Bivariate Haufigkeitstabelle (Kontingenztafel, Kreuztabelle)I Grafiken zur Beschreibung der Art des ZusammenhangesI Maßzahlenermittlung zur Beschreibung der Starke des

Zusammenhanges zwischen den beiden VariablenI Bei metrischen Variablen Darstellung des Merkmales X als

Funktion des Merkmales Y : X = f (Y )




Bivariate Haufigkeitstabelle

I Zwei Merkmale X und Y mit Auspragungen x ′j , j = 1, . . . , k,y ′l , l = 1, . . . ,m

I X = Zeilen, Y = Spalten; Auspragungen jeweils geordnetnach Große

I fjl , abs. H., oder rjl , rel.H. der Merkmalskombinationen inZellen

I Beispiel 1: X = vom Arzt gewogenes Gewicht; Y = selbstangegebenes Gewicht




Beispiel 1: Variable X : vom Arzt gewogenes Gewicht; Variable Y :selbst angegebenes Gewicht; n = 20 16-jahrige Madchen

Beispiel: f46,46 = 1




Beispiel 2

Variablen Erhebungsgebiet und Religionszugehorigkeit ausALLBUS (2006)X = Erhebungsgebiet (x ′1 = Westdeutschl., x ′2 = Ostdeutschland);Y = Religionszugehorigkeit (y ′1 = Evang., y ′2 = Rom.-Kath., y ′3 =andere, y ′4 = keine)

X = Y = ReligionszugehorigkeitErhebungs- Rom.-gebiet Evang. Kath. andere keine GesamtWestd. 905 838 165 377 2285Ostd. 284 45 25 765 1119

Gesamt 1189 883 190 1142 3404




Kontingenztafel allgemein

y ′1 y ′2 . . . y ′m∑m

l=1

x ′1 f11 f12 . . . f1m f1.x ′2 f21 f22 . . . f2m f2....

......

......

...

x ′k fk1 fk2... fkm fk.∑k

j=1 f.1 f.2 . . . f.m f.. = n

fj . =∑m

l=1 fjl und f.l =∑k

j=1 fjl sind die univariatenRandhaufigkeiten.Die eindimensionalen Haufigkeitsverteilungen heißenRandverteilungen.




Bedingte relative Haufigkeiten (1)

Relative Haufigkeit einer bestimmten Auspragung des MerkmalesX unter der Bedingung des Auftretens einer bestimmtenAuspragung von Y , Y = y ′l

rX=x ′j |Y=y ′

l=

fjlf.l

(f.l > 0)

und vice versa

rY=y ′l |X=x ′

j=

fjlfj .

(fj . > 0)




Bedingte relative Haufigkeiten (2)

Beispiel 3: Relative Haufigkeit der Personen mit evangelischerReligionszugehorigkeit unter der Bedingung, dass sie a) inWestdeutschland und b) in Ostdeutschland wohnen

a) rY=Evang.|X=Westd. =905

2285≈ 0.40 b) rY=Evang.|X=Ostd. =

284

1119≈ 0.25

X = Y = ReligionszugehorigkeitErhebungs- Rom.-gebiet Evang. Kath. andere keine GesamtWestd. 905 838 165 377 2285Ostd. 284 45 25 765 1119

Gesamt 1189 883 190 1142 3404




Empirische Unabhangigkeit (1)I X und Y sind unabhangig, wenn bedingte

Haufigkeitsverteilungen = unbedingte Haufigkeitsverteilung,d.h. wenn die Verteilungen in allen Spalten gleich sind jenerder Randverteilung (analog fur die Zeilen)

fjlf.l

=fj .n

bzw.fjlfj .

=f.ln

I Beispiel 4:Y

X ja nein Gesamtja 10 25 35 10

39 ≈25101 ≈

35140 ≈ 0.25

nein 29 76 105Gesamt 39 101 140




Empirische Unabhangigkeit (2)

I außerdem:

fjl =fj .f.ln

fur alle j = 1, . . . , k, l = 1, . . . ,m.

y ′1 y ′2 . . . y ′m∑m

l=1

x ′1 f11 f12 . . . f1m f1....

......

......

...x ′k fk1 fk2

... fkm fk.∑kj=1 f.1 f.2 . . . f.m f.. = n




Empirische Unabhangigkeit (3)

I Beispiel 4:Y

X ja nein Gesamtja 10 25 35nein 29 76 105Gesamt 39 101 140

39 · 35

140= 9.75 ≈ 10




Zwei nominalskalierte Variablen: Balkendiagramm




Dreidimensionales Balkendiagramm




Zwei metrische Variablen: StreudiagrammBeispiel: Linearer Zusammenhang

VariablePerson X Y1 2 32 5 63 1 24 3 45 6 7




Starker positiver Zusammenhang

große X -Werte, große Y -Werte




Starker negativer Zusammenhang

große X -Werte, kleine Y -Werte




Mittelmaßiger Zusammenhang




Geringer Zusammenhang




Nicht-linearer (U-formiger) Zusammenhang




Kovarianz

Gemeinsame Variation der Variablen X und Y - mittleresAbweichungsprodukt

I Hoher Wert → positive Abweichung vom Mittelwert(xi − x > 0),niedriger Wert → negative Abweichung vom Mittelwert(xi − x < 0)

I Starker positiver Zusammenhang: hohe X -Werte → hoheY -Werte und niedrige X -Werte → niedrige Y -Werte




xi − x > 0 ∧ yi − y > 0 → (xi − x)(yi − y) > 0xi − x < 0 ∧ yi − y < 0 → (xi − x)(yi − y) > 0

cXY = 1n−1

∑ni=1(xi − x)(yi − y) großer positiver Wert




xi − x < 0 ∧ yi − y > 0 → (xi − x)(yi − y) < 0xi − x > 0 ∧ yi − y < 0 → (xi − x)(yi − y) < 0

⇒ cXY = 1n−1

∑ni=1(xi − x)(yi − y) großer negativer Wert




cXY =1

n − 1

n∑i=1

(xi − x)(yi − y) Betrag der Kovarianz klein




Eigenschaften der Kovarianz

I Formel zur Berechnung der Kovarianz:

cXY =1

n − 1

n∑i=1

xiyi −nx y

n − 1=

1

n − 1

(n∑

i=1

xiyi − nx y

)

I Betrag der maximalen Kovarianz zweier Variablen ist Produktihrer Standardabweichungen

I Kovarianz einer Variablen mit sich selbst ist die Varianz derVariablen

I Kovarianz nicht direkt interpretierbar (kein standardisiertesMaß)




Bravais-Pearson-Korrelationskoeffizient(Produkt-Moment-Korrelation)

rXY =cXY

sX sY− 1 ≤ rXY ≤ 1

rXY = 0 X und Y kein linearer ZusammenhangrXY > 0 positiver ZusammenhangrXY < 0 negativer ZusammenhangrXY ± 1 perfekter Zusammenhang

Bestimmtheitsmaß: B = r2 gibt Anteil der Varianz von X wieder,der durch Darstellung von X als lineare Funktion von Y erklartwerden kann und vice versa (s. 4. VO)







Voraussetzungen fur Produkt-Moment-Korrelation

I Linearer Zusammenhang

I Metrische Variablen

I keine Ausreißer im Streudiagramm




Ausreißer 1. Art




Ausreißer 2. Art




Datenbeispiel

Variable X : vom Arzt gewogenes Gewicht; Variable Y : selbstangegebenes Gewicht; n = 20 16-jahrige Madchen

vgl. Folie 5: Bivariate Haufigkeitstabelle




Datenbeispiel

∑ni=1 xi = 1 · 46 + 1 · 48 + 1 · 51 + 4 · 52 + . . . =

∑ni=1 yi =

= 1062 = 1061

x = 53.1 y = 53.05∑ni=1 x2

i = 1× 462 + 1× 482 + . . . = 56558∑n

i=1 y2i = 56461

s2X = 8.73 s2

Y = 9.21

sX = 2.95 sY = 3.03∑ni=1 xiyi = 56494

cXY =1

1956494− 20

192816.96 = 8.15

rXY = 0.91⇒ B = 0.83 = 83% erklarter Varianzanteil




Berechnung in SPSS - StreudiagrammBeispiel: Zusammenhang zwischen Selbstwert undKorperzufriedenheit




Berechnung in SPSS - Korrelationskoeffizient




Interpretation von Korrelationen

I rXY = 0 bedeutet nur: kein linearer Zusammenhang

I Keine Kausalinterpretation aufgrund großem rXY moglich

I rXY gibt keine Auskunft uber Ursache-Wirkungs-Beziehungen

I Scheinkorrelation: der Zusammenhang zwischen X und Y istdurch eine dritte Variable Z induziert (Frage nachsachlogischem Zusammenhang)

I Beispiel: Anzahl der Notarzte, die zu einem Einsatzort gerufenwurden, und Anzahl der spateren Todesopfer. PlausibelsteErklarung: beide Variablen werden von Schwere desKatastrophenfalles beeinflusst.




Beispiel: Zusammenhang zwischen Schuhgroße undEinkommen




Partielle Korrelation

I Ziel: Korrelation zwischen Variablen X und Y ohne denEinfluss von Z → partielle Korrelation von X und Y unterKonstanthalten von Z (‘Z wird aus der Korrelation herauspartialisiert’)

I Partielle Korrelation:

rXY |Z =rXY − rXZ rYZ√

(1− r2XZ )(1− r2

YZ )




Beispiel: Zusammenhang zwischen Gewissenhaftigkeit, X , undVertraglichkeit, Y , Kontrollvariable Extraversion, Z

rXY = 0.98; rXZ = 0.90; rYZ = 0.80

rXY |Z =0.98− (0.90)(0.80)√(1− .902)(1− .802)

= 0.99




Berechnung in SPSSBeispiel: Zusammenhang zwischen Korperzufriedenheit undSelbstwertgefuhl (r = 0.775), Kontrollvariable Body Mass Index(BMI)




Rangkorrelation nach Spearman

I Variablen ordinalskaliert oder andere Voraussetzungen furProdukt-Moment-Korrelation nicht gegeben

I Produkt-Moment-Korrelation der Rangplatze R(xi ) und R(yi )I Berechnung:

I Zuordnung von Rangzahlen zu den der Große nach geordnetenMesswerten x(1) ≤ . . . ≤ x(n) und y(1) ≤ . . . ≤ y(n) getrennt furX und Y

I Tritt eine Auspragung x ′j mehrmals auf (Bindung) erhalten alle

Personen mit diesem x ′j als Rangplatz das arithmetische Mittel

der zu vergebenden RangplatzeBeispiel:geordnete Urliste: 10, 12, 12, 13, 15Rangplatze: 1, 2.5, 2.5, 4, 5




I Praktische Berechnungsformel:

rsp = 1−6∑n

i=1 d2i

n(n2 − 1)

mit di = R(xi )− R(yi )

I Kontrolle der Rangplatzvergabe:

n∑i=1

R(xi ) =n(n + 1)

2bzw.

n∑i=1

R(yi ) =n(n + 1)

2

n∑i=1

di = 0

I −1 ≤ rsp ≤ 1




Beispiel fur Rangkorrelation nach Spearman

Bewertung des Preis-Leistungs-Verhaltnis von 15 Produkten durch

I NutzerInnen (5-Punkte Skala; hoher Wert = gutesPreis-Leistungs-Verhaltnis) und

I Expertin (Rangreihung; 1=schlechtestesPreis-Leistungs-Verhaltnis)




Beispiel fur Rangkorrelation nach SpearmanX = durchschnittliche Bewertung von NutzerInnen, Y = Expertin




Punkt-biseriale Korrelation fur Zusammenhang einerdichotomen mit einer metrischen Variable

I Abgeleitet aus Produkt-Moment-Korrelation

rpb =x1 − x0

sx

√n1n0

n(n − 1)

I Voraussetzung: metrische Variable, keine Ausreißer

I Berechnung in SPSS mittels Produkt-Moment-Korrelation




BeispielALLBUS (2006): Zufallsstichprobe n = 22, Zusammenhangzwischen Geschlecht und Alter der Befragten; 1 = Mann, 0 = Frau

Person Geschlecht Alter Person Geschlecht Alter1 1 58 12 0 682 0 45 13 0 643 0 54 14 1 454 1 79 15 0 635 1 46 16 0 206 0 34 17 1 377 1 76 18 0 208 0 63 19 1 529 1 49 20 0 5010 0 55 21 1 4411 1 32 22 0 57




n1∑i=1

xi = 518, n1 = 10, x1 = 51.80

n0∑i=1

xi = 593, n0 = 12, x0 = 49.42

N∑i=1

xi = 1111,

N∑i=1

x2i = 61285, sX = 15.70

rpb =51.8− 49.42

15.7

√0.26 = 0.077

⇒ kein Zusammenhang zwischen Geschlecht und Alter




Vierfelderkorrelation

X0 1

Y 0 f00 f01 f0.1 f10 f11 f1.

f.0 f.1 f..

Bei zwei dichotomen Variablen ergibt sich als Spezialfall derProdukt-Moment-Korrelation der Phi-Koeffizient:

rφ =f00f11 − f01f10√

f0.f1.f.0f.1

Vorzeichen von rφ ist abhangig von Vorzeichen der Determinantef00f11 − f01f10 (Uberwiegen der Kombinationen 00 und 11 oder 01und 10)




Beispiel

ALLBUS (2006): Zusammenhang zwischen Geschlecht undHandy-Besitz in Ostdeutschland

Handy-Besitzja nein

Geschlecht Mann 446 96 542Frau 414 165 579

860 261 1121

rφ =(446)(165)− (414)(96)√

(542)(579)(860)(261)=

33846

265404.57= 0.13

→ nur sehr geringer Zusammenhang zwischen Geschlecht undHandy-Besitz


Einfache Regressionsanalyse




SS 2011



EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

HistorischesI Regression geht auf Galton (1889) und seine Studien zur

Vererbung zuruck; Galton formulierte das Gesetz deruniversalen Regression

I Jede vom ’normalen’ abweichende Eigenschaft eines Menschenwird in der nachfolgenden Generation zwar ubernommen, aberim Durchschnitt in einem geringeren Ausmaß. Es tritt alsobzgl. dieser Eigenschaft ein Rucktritt (Regression) ein




HistorischesI Karl Pearson hat bei 1078 Familien die Große von Vater und

Sohn untersucht

I Obwohl große Vater dazu neigen große Sohne zu haben, sinddie Sohne von großen Vatern im Durchschnitt kleiner als ihreVater

I Ebenso wird die Besonderheit der Kleinheit von Vatern nichtin vollem Maße an die Sohne vererbt, denn diese sinddurchschnittlich großer als ihre Vater

I Es ist eine Regression oder ein Rucktritt in Bezug auf dieGroße bei Sohnen sichtbar




Ziele

I Empirische Reprasentation großer Datenmengen

I Erkennen eines funktionalen Zusammenhanges

I Nachweis einer bereits bekannten Beziehung zwischen denVariablen

I Spezifizierung eines funktionalen Zusammenhanges zwischenzwei Variablen

I Schatzen der Parameter einer funktionalen Beziehung

I Interpolation fehlender bzw. Prognose zukunftiger Werte




Ausgangslage

I Zusammenhang zwischen 2 metrischen Variablen X und Ymit Auspragungen xi und yi

I Spezifizierung einer funktionalen Beziehung Y = f (X ): Ywird mithilfe von X und f geschatzt

I Stichprobe mit n Objektpaaren - (x1, y1) · · · (xn, yn)

I Objektpaare (x1, y1) · · · (xn, yn) darstellbar als Punkte inkartesischem Koordinatensystem mit Koordinaten (xi , yi ) =Streudiagramm




Ausgangslage

I Y ist der Regressand (abhangige Variable); X ist derRegressor (unabhangige Variable); Regression von Y auf X

I Annahmen - die abhangige Variable ist mit Zufallsfehlernuberlagert; die unabhangige Variable gilt als fehlerfrei

I Einfache Regression weil ein Regressor, im Vergleich zumultipler Regression mit mehr als einem Regressor




Funktion f (X )I Linear: Y = a + bX , a und b reelle Zahlen, hochster

Polynomgrad ist 1

I Quadratisch: Y = c + wX + dX 2, c , w , und d reelle Zahlen,hochster Polynomgrad ist 2

I Exponentiell: Y = q(egX), q und g reelle Zahlen

I Logarithmisch: Y = h ln(Xp

), h und p reelle Zahlen, p

zusatzlich positiv




Beispiel 1: Lineare Funktion f (X )I Treibstoffverbrauch (Y ) und Leistungsabgabe eines Motors

(X ) bei konstanter Drehzahl: Y ≈ 0.854 + 0.302X




Beispiel 2: Quadratische Funktion f (X )I Kornerertrag (Y ) und Dungung (X ):

Y ≈ 5.78 + 2.29X − 0.09X 2

I Bis zu einer bestimmten Dungungsgrenze steigt derKornerertrag an, um wieder abzufallen




Beispiel 3: Logarithmische Funktion f (X )I Weber-Fechner’sches Gesetz: Bei einem linearen Anstieg der

Reizstarke (X ), wachst die Empfindung im Sinnesorgan (Y )logarithmisch an

I

Y = c ln

(X

b

)b = Schwellenreiz c = Konstante abhangig von der Reizart

I Weber-Fechner’sches Gesetz allgemein bekannt durch dieDezibel-Skala, die das logarithmische Verhaltnis zwischen Reizund Larmempfindung ubertragt




Beispiel 3: Logarithmische Funktion f (X )




I Vermutet wird ein zumindest naherungsweise linearerZusammenhang zwischen zwei Variablen Y und X

I Die Variable Y soll naherungsweise durch eine lineareFunktion von X beschrieben werden

I

Y ≈ Y = bX + a mit a, b reelle Zahlen

I a (Schnitt mit Y -Achse) und b (Anstieg) sind unbekannt

I a und b so wahlen, dass Zusammenhang (Streudiagramm)zwischen Y und X ’am besten’ beschrieben wird

I Die Methode der kleinsten Quadrate ermittelt besteSchatzungen a und b fur a und b




Kleinste Quadrate Schatzung (KQS)

I Residuum ei = yi − yi ; n Residuen (Abweichungen von derRegressionsgerade in Richtung abhangiger Variable)

I Zentrale Idee bei KQS ist, a und b derart zu wahlen, dass dieSumme der quadrierten Differenzen (Quadratsumme allerResiduen) minimal wird










Kleinste Quadrate Schatzung (KQS)I Bestimme a und b derart, dass die Quadratsumme aller

Residuen minimal wird, d.h.

S2 =n∑

i=1

(yi − yi )2 =

n∑i=1

(yi − a− bxi )2 → Min

I Partielles Differenzieren von S2 nach den Unbekannten a undb und anschließendes Nullsetzen der Ableitungen liefert

b =cXYs2X

, a = y − bx

I b = Verhaltnis zwischen Kovarianz und Varianz des RegressorsI a ist abhangig von den Mittelwerten, x , y , und b




BeispielI Bei einer Stichprobe von n = 40 Personen wurden

Korpergroße (X ) und Gewicht (Y ) gemessen

40∑i=1

xi = 6814,40∑i=1

x2i = 1163780, s2

X = 77.31

40∑i=1

yi = 2722,40∑i=1

y2i = 190422, s2

Y = 133.07,40∑i=1

xiyi = 466599

I

cXY =1

39(

40∑i=1

xiyi − 40x y) =1

39(466599− 40

6814

40

2722

40)




BeispielcXY = 74.52, s2

X = 77.31 ⇒ b =cXYs2X

= 0.9639

a = y − bx = 68.05− 0.9639 · 170.35 = −96.15




Beispiel




I Produktmomentkorrelation rXY steht im engenZusammenhang zum Schatzer b

I Es gilt

rXY =cXYsX sY

, b =cXYsX sX

=cXY sYsY sX sX

=rXY sYsX

I Aus der Korrelation kann der Steigungsparameter geschatztwerden und umgekehrt




I Maß fur Gute der Anpassung einer Regression ist dasBestimmtheitsmaß B

I B misst das Verhaltnis der Varianz der geschatzten Werte yizur Varianz der beobachteten Werte yi

I B misst den Anteil der Varianz der abhangigen Variable Y ,der durch die unabhangige Variable X (bzw. die Regression)erklart werden kann

I Achtung ’verursacht’ nur bei Kausalitat




B =s2Y

s2Y

mit 0 ≤ B ≤ 1

I Je naher die Punkte zur Regressionsgerade liegen, destogroßer ist B

I Liegen alle Punkte auf der Regressionsgerade, dann ist B = 1und Y wird durch die Regression vollig erklart

I Das Bestimmtheitsmaß ist gleich dem Quadrat der Korrelation

I Es gilt also B = r2




B und Streudiagramm




BeispielI Gewicht und Korpergroße

b = 0.9639; r = 0.9639

√77.31√

133.07= 0.735

I

B = r2 = 0.7352 = 0.54

I 54% der Varianz vom Gewicht wird durch die lineareRegression mit Korpergroße erklart

I deswegen Korrelation von ’mittelmaßiger Hohe’




Regression von X auf YI Vertauschen von abhangiger und unabhangiger Variable;

Vertauschen des Koordinatensystems X -Y

I X approximativ als lineare Funktion von Y darstellen

X ≈ b′Y + a′

I Wie andern sich unsere Parameter? Vertauschen von X undYin den Formeln, d.h.

b′ =cXYs2Y

a′ = x − b′y

I 2 Regressionsgeraden, je nach Fragestellung; beide gehendurch den Schwerpunkt des Punktschwarms (x , y)




Regression von X auf Y bzw. Y auf X

I Verschiedenheit beider Regressionsgeraden hat ihre Ursache inder Annahme, dass die unabhangige Variable als fehlerfreiangesehen wird, wahrend die abhangige Variable durch einenZufallsfehler uberlagert wird

I Darstellung beider Geraden im X -Y Koordinatensystem

Y = bX + a (1)

X = b′Y + a′ ⇒ Y =1

b′X − a′

b′(2)




BeispielY = 0.624X + 35.13 (1) X = 0.789Y + 27.01

Y =1

0.789X − 27.01

0.789⇒ Y = 1.27X − 34.23 (2)




Bemerkungen

I Korrelation und Bestimmtheitsmaß andern sich nicht, da siesymmetrisch bzgl. X und Y sind

I Vorzeichen der Steigungsparameter bleibt auch unverandert

I Steigungsparameter andert sich um die jeweilige Varianz desRegressors X bzw.Y

I Regressionsgeraden fallen zusammen bei perfektem linearenZusammenhang zwischen X und Y , d.h. bei rXY = ±1




I Prognose von Y ⇒ Y als abhangige Variable; fur gegebenes xin die Modellgleichung y = bx + a einsetzen und y ausrechnen

I Prognose von X ⇒ X als abhangige Variable; fur gegebenes yin die Modellgleichung x = b′y + a′ einsetzen und xausrechnen

I Die zu prognostizierende Variable ist die im jeweiligen Modellabhangige Variable




Beispiel

I Prognose von y bei x = 125 ⇒ y = (0.624)(125) + 35.13,d.h. y = 113.13

I Prognose von x bei y = 125 ⇒ x = (0.789)(125) + 27.01,d.h. x = 125.635

I Uberprufung der Gute der Prognose mithilfe der Abweichungdes beobachteten Wertes yi vom geschatzten yi (bzw. analogfur X )

I Betragsmaßig ’kleine’ Abweichungen sprechen fur eine ’gutePrognose’




Allgemeine Richtlinien

I Grafische Uberprufung der Daten und der Regressionsgeradeim Streudiagramm; Daten sollten annahernd auf einenlinearen Zusammenhang hinweisen

I Große und Struktur der Residuen: Betragsmaßig kleineResiduen, die in einem Streudiagramm mit den geschatztenWerten yi keine erkennbare Struktur zeigen, weisen auf eingutes Modell hin

I Hohes Bestimmtheitsmaß: Dieses Kriterium sollte imZusammenhang mit einer Residualanalyse und grafischenUberprufung der Daten verwendet werden




Residualanalyse

I ’Betragsmaßig kleine’ Residuen ei = yi − yi weisen auf eingutes Regressionsmodell hin

I Residuen sind aber abhangig von den Maßeinheiten in Y und X

I∑n

i=1 ei = 0 und auch e = 0, d.h. der Mittelwert der Residuenist 0

I Standardisieren der Residuen mit

s2e =

1

n − 2

n∑i=1

e2i , also ei =

ei√s2e

ei sind die normierten Residuen, welche bei einem ’gutenModell’ im Intervall [−2.5, 2.5] liegen sollten




BeispielI Datei ’bspreg.sav’, n = 61, Y sei die abhangige VariableI Streudiagramm spricht eher fur einen positiven linearen

Zusammenhang




Beispiel

I y = 0.92x + 3.63, B = 0.86, rXY = 0.93




Beispiel

I Berechnung der Residuen und normierten Residuen mit√s2e = 1.45

i yi xi yi ei ei1 33 32 33.20 -0.20 -0.142 33 33 34.13 -1.13 -0.783 35 35 35.98 -0.98 -0.67...

......

......

...61 47 48 47.99 -0.99 -0.68




BeispielI Graph der normierten Residuen mit Konfidenzbereich

[−2.5, 2.5]I i auf der X Achse, ei auf der Y Achse




BeispielI Graph der normierten Residuen gegen die geschatzten Werte

yiI yi auf der X Achse, ei auf der Y Achse




Problematische DarstellungenI Graph der normierten Residuen gegen die geschatzten Werte

yiI linearer Trend, Hinweis auf Messfehler oder inadaquates

Modell





yiI Ansteigende Varianzen mit ansteigendem yi





yiI Nicht-linearer Verlauf der Residuen, inadaquates Modell




Regression mit Standardmesswerten

I Wir betrachten die Regression von Y auf X mitstandardisierten Variablen t∗Y und t∗X

I Kovarianz, Korrelation und Regressionskoeffizient b sindgleich dem mittleren Messwertprodukt, und dieRegressionskonstante a = 0.

I

ct∗Y t∗X= rt∗Y t∗X

= bt∗Y t∗X=

1

n − 1

n∑i=1

t∗yi t∗xi

I Regressionseffekt (bei |rXY | < 1: |yi − y | < |xi − x |) leichtererkennbar, da x , y und y standardisiert sind




Partielle Korrelation rXY |Z

I Berechnung der partiellen Korrelation mithilfe der Residuen

I Regression von X auf Z durchfuhren und die Residuenei = (xi − xi ) berechnen; diese Residuen drucken jeneVariation von X aus, die durch Z nicht erklart wird

I Regression von Y auf Z durchfuhren und die Residuenei = (yi − yi ) berechnen; diese Residuen drucken jeneVariation von Y aus, die durch Z nicht erklart wird

I rXY |Z ist identisch mit rE ,E

I Einfachere Berechnung mit Formel von letzter Einheit




Einfluss von Ausreissern

I Einzelne Ausreisser konnen die Regressionsgerade beeinflussen

I b und a werden sehr stark durch Ausreisser verfalscht

I Schlimmster Fall, wenn Ausreisser nicht in Richtung desPunktschwarms liegen

I Leichtes Erkennen von Ausreissern im Streudiagramm derDaten

I Nur in manchen Fallen sind Ausreisser auch durch großenormierte Residuen erkennbar (Residuengraphs)
















Nichtlineares f (X )

I Quadratisch: Y = c + dX 2 ⇒ KQS

I Exponentiell: Y = qegX ⇒ Logarithmieren ergibtln(Y ) = ln(q) + gX also ln(Y ) = q′ + gX ⇒ KQS fur q′ undg

I Logarithmisch: Y = ln (hX p) ⇒ Y = p ln(X ) + ln(h); KQS

fur p und ln(h)

I Achtung auf richtige Interpretation der Parameter!


InferenzstatistikKombinatorik

5. Vorlesung



6. April 2011



Inferenzstatistik

I Schluss von Zufallsstichprobe auf Population

I Grundlage Wahrscheinlichkeitsrechnung

I Zentral: Zufallsprozesse (Ausgang unsicher, nicht mitSicherheit vorhersagbar)

”Zufall ist das unberechenbare Geschehen, das sich unsererVernunft und unserer Absicht entzieht.”(Gebruder Grimm, Deutsches Worterbuch. Band 32, Sp. 345. Leipzig: S. Hirzel 1854-1960.)



Kann man Zufall berechnen?

I Rudolf Taschner: ”Mathematik ist der Versuch, alles zubandigen, auch den Zufall.”

I ”Wenn man weiß, wie ein Wurfel wahrscheinlich fallt, kannman sogar damit reich werden.” (Rudolf Taschner,kurier.at/nachrichten/2076992.php)

I Beispiel: WurfelspielI Ich lasse Sie werfen. Sie zahlen mir 100 Euro dafur, dass Sie

werfen durfen. Wenn Sie eine 6 werfen, gebe ich Ihnen 500Euro.

I Wollen Sie 6000 Mal werfen, erhalte ich 600.000 Euro.I Bei etwa 1/6 der Falle (ca. 1000 Mal) wird eine 6 kommen.I Ich muss also 500.000 zahlen, 100.000 bleiben mir.



Stochastik

I die Kunst des Vermutens (altgriechisch: στoχαστικη τεχvη,stochastike techne)

I Mathematik setzt Vorstellung von Zufall voraus (= Modellevon Situationen, deren Ausgang unsicher ist) undquantifizierbar ist

I Keine Einzelereignisse vorhersagbar, aber:

I Erkennen von Regelmaßigkeiten bei Vorgangen, derenErgebnisse vom Zufall abhangen.

I Hinderer (1980): ’Statistischer Wahrscheinlichkeitsbegriffdient der Beschreibung von beobachteten Haufigkeiten beibeliebig oft wiederholbaren Vorgangen, deren Ausgang nichtvorhersehbar ist.’



Geschichte der Wahrscheinlichkeitsrechnung II Interesse am Zufall bis in fruheste Menschheitsgeschichte

zuruckzuverfolgenI Lat. ’Astragali’ genannte Knochen wurden im romischen

Reich als Spielwurfel verwendet - zum Glucksspiel um Geld,oder zu rituellen Zwecken um Auskunft uber die Meinung derGotter zu erhalten.



Geschichte der Wahrscheinlichkeitsrechnung II

I Solche und ahnliche Orakel auf der Grundlage vonZufallsereignissen weltweit zu beobachten.

I Bereits fruh auch Wurfel in der heute ublichen Kubusformoder als Tetraeder → faire und damit besonders interessanteSpiele

I Einer der fruhesten Funde im heutigen Iran datiert etwa auf3000 v. Chr.



Geschichte der Wahrscheinlichkeitsrechnung III

I Statistischer Wahrscheinlichkeitsbegriff geht zuruck auf 17.Jahrhundert (Frankreich)

I Im Jahr 1654 wandte sich der Glucksspieler Chevalier de Meremit mehreren Fragen an den franzosischen MathematikerBlaise Pascal

I Teilungsproblem: Fiktives Spiel: jener Spieler gewinnt einenGeldpreis, der zuerst eine festgesetzte Anzahl von fairenRunden gewinnt (bei denen jeder Spieler je eine Siegchancevon 50 % besitzt, unabhangig vom Ausgang dervorangegangenen Runden). Das Spiel wird aber durch hohereGewalt vor der Entscheidung abgebrochen. Betrag sollabhangig vom Spielstand zum Abbruch gerecht geteilt werden.



Geschichte der Wahrscheinlichkeitsrechnung IV

I Briefwechsel zwischen Blaise Pascal und Pierre de Fermat(Mathematiker)

I Schluss: Einsatz musse entsprechendGewinnwahrscheinlichkeiten der ausstehenden Rundenaufgeteilt werden

I Pascal zeigte auf, wie diese mit Hilfe der Kombinatorik undspeziell dem von ihm entwickelten Pascalschen Dreieckberechnet werden konne

Blaise Pascal (1623-1662)



Kombinatorik

I Rechenregeln zur Berechnung von:

I In wie vielen unterschiedlichen Reihenfolgen konnen nElemente angeordnet werden? = Permutationen

I Wieviele Moglichkeiten gibt es, aus n Elementen eineTeilmenge von k Elementen auszuwahlen? = Kombinationen

1. mit oder ohne Wiederholung (= mit oder ohne Zurucklegen)2. mit oder ohne Berucksichtigung der Reihenfolge

I Grundlage fur Wahrscheinlichkeitsrechnung



Permutationen ohne WiederholungPermutation = jede Anordnung einer endlichen Anzahl vonElementen, bei der alle Elemente verwendet werdenBeispiel: 3 Kugeln sollen auf 3 Platten angeordnet werden

¶ · ¸

→ ¬ l l

{→ ¬ l {→ ¬ ®

→ ¬ l {→ ¬ ®

→ l ¬ l

{→ ¬ l {→ ¬ ®

→ l ¬ {→ ® ¬

→ l l ¬

{→ l ¬ {→ ® ¬

→ l ¬ {→ ® ¬

1. Kugel: 3 Moglichkeiten (allgemein:n) → 2. Kugel: 2Moglichkeiten (allgemein: n − 1) → 3. Kugel: 1 Moglichkeit⇒ allgemein: n(n − 1)(n − 2) . . . 1 = n! MoglichkeitenAnmerkung: n! = n Fakultat = 1 · 2 · . . . · n (z.B.4! = 1 · 2 · 3 · 4 = 24); 0! = 1



Permutationen mit Wiederholung

Wie viele Moglichkeiten gibt es, n Elemente, die sich in mverschiedene Typen (Klassen) mit je k Elementen unterscheidenlassen, anzuordnen? Z.B. n = 4 Kugeln, m = 2 Klassen (m1=blau,m2 = schwarz), k1 = 2, k2 = 2

l l l l

l l l ll l l ll l l ll l l ll l l ll l l l

n Elemente → n! verschiedene Anordnungsmoglichkeitenm verschiedene Klassen mit k1, k2 . . . , km nicht unterscheidbarenElementen → k1!k2! . . . km! Anordnungsmoglichkeiten nichtunterscheidbar, daher⇒ n!

k1!k2! . . . km!verschiedene Anordnungsmoglichkeiten



Spezialfall m = 2 Klassen

Hier gilt:n!

k!(n − k)!=:

(n

k

)(nk

)= Binomialkoeffizient, n ≥ k

Beispiel: 2 blaue, 2 schwarze Kugeln(4

2

)=

4!

2!2!=

4 · 3 · 2 · 1(2 · 1)(2 · 1)

= 6



Rechenregeln fur BinomialkoeffizientenEs gilt:

I (n

n − k

)=

n!

(n − k)!k!=

(n

k

)I (

n

0

)=

(n

n

)=

n!

0!n!= 1

I (n

1

)=

(n

n − 1

)=

n!

1!(n − 1)!=

n(n − 1)(n − 2) . . . 1

(n − 1)(n − 2) . . . 1= n

I (n

2

)=

(n

n − 2

)=

n(n − 1)(n − 2) . . . 1

2(n − 2) . . . 1=

n(n − 1)

2



Kombinationen mit Zurucklegen mit Berucksichtigung derReihenfolge

k Elemente sollen aus n Elementen ausgewahlt werden (k Versucheoder Ziehungen), wobei sich jedes der n Elemente beliebig oftwiederholen kann (d.h. zuruckgelegt wird).Beispiel: Ziehen von k = 2 aus n = 3 Kugeln

l l l

→ l

→ l l→ l l→ l l

→ l


→ l


→ nk verschiedene Reihenfolgen



Beispiel

Ein Zahlencode besteht aus 4 voneinander unabhangigen,nacheinander einzugebenden Ziffern von 0 bis 9. Wie vieleMoglichkeiten gibt es?

n = 10, k = 4nk = 104 = 10000



Kombinationen ohne Zurucklegen mit Berucksichtigungder Reihenfolge

Ziehen von k Elementen aus insgesamt n Elementen, wobei jedesder n Elemente nur einmal gewahlt werden kann (d.h. nichtzuruckgelegt wird)Beispiel: Ziehen von k = 2 aus n = 3 Kugeln

l l l

→ l

{→ l l

→ l l

→ l

{→ l l

→ l l

→ l

{→ l l

→ l l

n!

(n − k)!=

3!

(3− 2)!= 6



Beispiel

Bei einem Pferderennen sind 8 Pferde am Start. Wie vieleMoglichkeiten gibt es fur die Belegung der ersten drei Platze?

n = 8, k = 3

n!

(n − k)!=

8!

(8− 3)!= 336 Moglichkeiten



Kombinationen ohne Zurucklegen ohne Berucksichtigungder Reihenfolge

Wie viele Moglichkeiten gibt es, k Elemente aus n Elementen inbeliebiger Reihenfolge auszuwahlen, wobei jedes der n Elementenur ein Mal gewahlt werden kann?Beispiel: Ziehen von k = 2 aus n = 3 Kugeln, Reihenfolge egal

l l l

l l

l l

l l

(n

k

)=

n!

k!(n − k)!



BeispielLotto 6 aus 45

n = 45, k = 6(n

k

)=

(45

6

)=

45!

6!39!=

45 · 44 · 43 · 42 · 41 · 40

6 · 5 · 4 · 3 · 2 · 1= 8145060



Kombinationen mit Zurucklegen ohne Berucksichtigungder Reihenfolge

Aus n Elementen sollen k Elemente in beliebiger Reihenfolgeausgewahlt werden, wobei sich jedes der n Elemente beliebig oftwiederholen kann.Beispiel: Ziehen von k = 2 aus n = 3 Kugeln, Reihenfolge egal

l l l

l l

l l

l l

l l

l l

l l

(n + k − 1

k

)=

(n + k − 1)!

k!(n − 1)!=

4!

2!2!= 6



Beispiel

Gummibarchenorakel: Man wahlt k = 5 Gummibarchen aus n = 5Elementen (= Farben). Wieviele verschiedene Farbkombinationensind moglich?

(n + k − 1

k

)=

(5 + 5− 1

5

)=

(9

5

)=

9!

5!4!= 126



Kombinationen - Zusammenfassende Ubersicht

Wiederholung (= Zurucklegen)nein ja

Berucksichtigung jan!

(n − k)!nk Variationen

d. Reihenfolge nein

(n

k

) (n + k − 1

k

)



Beispiele

I Ein Intelligenztest besteht aus 15 Aufgaben. DerTestentwickler mochte uberprufen, ob die Testergebnisseunabhangig von der Reihenfolge der Vorgabe der Aufgabensind. Wie viele verschiedene Testversionen (Reihenfolgen)kann er erstellen?

Losung in der Vorlesung

I Eine Klinische Psychologin hat sich auf drei Storungsbilderspezialisiert. Im Laufe eines Monats meldeten sich 9 neuePatientInnen mit einem dieser Storungsbilder. Wie vieleMoglichkeiten der PatientInnenzusammensetzung gibt es?




Beispiele

I Die zwei Studierenden mit den besten Seminararbeiten sollenStipendien in unterschiedlicher Hohe erhalten. Insgesamtnehmen 20 Studierende teil. Wie viele verschiedeneMoglichkeiten gibt es fur die Belegung der Platze 1 und 2?


I Wieviele Moglichkeiten ergeben sich, wenn die beiden bestenStudierenden Stipendien derselben Hohe erhalten sollen, d.h.es ist gleichgultig wer den 1. und wer den 2. Platz erhalt.



Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen


Pantelis Christodoulides & Karin Waldherr

4. Mai 2011



Dichtefunktion

I Eine stetige ZV X kann jeden Wert in einem Intervall [a, b]annehmen

I Die Wahrscheinlichkeiten der einzelnen Auspragungen (Werte)einer stetigen ZV konnen (im Gegensatz zum diskreten Fall)nicht angegeben werden

I Es konnen nur Wahrscheinlichkeiten f (x)dx angegebenwerden, mit welchen die Werte innerhalb von Intervallen dxum die Werte x auftreten

I Beispielsweise fragt man nicht, wie viele Personen exakt 1.75Meter groß sind, sondern z.B., wie viele Personen zwischen1.75 und 1.76 Meter groß sind

I Die Funktion f (x) heißt Dichtefunktion



I Die Wahrscheinlichkeit, dass die ZV Werte zwischen a und bannimmt, wird dann allgemein definiert als das Integral uberdie Dichtefunktion mit Integrationsgrenzen a und b.

I Analog zum diskreten Fall erhalt man durch Integration dieVerteilungsfunktion

F (x) = P(X ≤ x) =

∫t≤x

f (t)dt

I Die Wahrscheinlichkeit ist definiert als Flache unter derDichtefunktion



I Es gilt fur alle a < b

P(a ≤ X ≤ b) = P(a < X < b) =

∫ b

af (x)dx



Eigenschaften der Dichtefunktion

I Es gilt weiters fur alle x

f (x) ≥ 0 und

∫xf (x)dx = 1

I P(a ≤ X ≤ b) = F (b)− F (a)

I f (x) = dF (x)dx = F ′(x)

I f (x) gibt an mit welcher Wahrscheinlichkeit Beobachtungenin der ’Nahe’ von x auftreten



Eigenschaften der Verteilungsfunktion

I MonotonieF (x1) ≤ F (x2) fur x1 ≤ x2

I Normierung im Intervall [0, 1]

F (x)→ 0 fur ’sehr kleines’ x

F (x)→ 1 fur ’sehr großes’ x

I P(c ≤ X ≤ b) = F (b)− F (c) fur c < b



I Es seien X und Y ZV; die gemeinsame Verteilungsfunktionvon X und Y ist definiert als

F (x , y) = P(X ≤ x ∧ Y ≤ y)

I X und Y heißen stochastisch unabhangig wenn gilt:

F (x , y) = P(X ≤ x ∧ Y ≤ y) = P(X ≤ x) P(Y ≤ y)

I Bei diskreten ZV folgt Unabhangigkeit aus

P(X = x ∧ Y = y) = P(X = x) P(Y = y)

I Bei stetigen ZV folgt Unabhangigkeit aus

f (x , y) = f (x) f (y)

I Obige Regeln sind verallgemeinbar auf beliebig viele ZV



Beispiel

I Beim zweimaligen Wurfeln bezeichne X die Augenzahl beimersten und Y die Augenzahl beim zweiten Wurf

I Das Ereignis Y = 2 ist unabhangig vom Ereignis X < 2

I Auch das Ereignis Y = {2, 4, 6} ist unabhangig vom EreignisX = {1, 3, 5}

I X und Y sind stochastisch unabhangig, weil fur jede Auswahlvon Ereignissen in beiden ZV Unabhangigkeit vorliegt

I Die Bedingung Y = y beeinflusst nicht die Verteilung von Xund umgekehrt



ErwartungswertI Beispiel: X ist die erhaltene Augenzahl bei einmaligem

Wurfeln; die Wahrscheinlichkeitsverteilung von X ist

xi 1 2 3 4 5 6

f (xi )16

16

16

16

16

16

I Welchen Wert ’erwarten’ wir, wenn wir diesesZufallsexperiment sehr lange durchfuhren?

I Intuitiv erwarten wir X = 1 bei 16 der Wurfe, X = 2 bei 1

6 beider Wurfe, usw.

I Der Durchschnitt von X auf lange Sicht ist derErwartungswert von X

11

6+ 2

1

6+ · · ·+ 6

1

6= 3.5,



Erwartungswert

I Der Erwartungswert einer ZV ist ein Maß fur das Zentrum derVerteilung

I Bei einer diskreten ZV X ist der Erwartungswert definiertE [X ] als der gewichtete Durchschnitt uber alle moglichenAuspragungen von X ; die Gewichte sind die jeweiligenWahrscheinlichkeiten.

E [X ] =∑x

xf (x)

I Bei einer stetigen ZV Y analog

E [X ] =

∫xxf (x)dx



Erwartungswert

I Folgende Eigenschaft folgt direkt aus der Definition desErwartungswerts; fur beliebige Konstanten a und b gilt

E [aX + b] = aE [X ] + b

I Weiters gilt

E [X1 + X2 + · · ·+ Xn] = E [X1] + · · ·+ E [Xn]

I Fur unabhangige ZV X1 · · ·Xn gilt

E [X1 · X2 · . . . · Xn] = E [X1] · . . . · E [Xn]



Varianz, Kovarianz, Korrelation

I Die Varianz σ2 ist ein Streuungsmaß der Verteilung

σ2X = E[(X − E [X ])2

]= E

[X 2]− (E [X ])2

I Analog zur Stichprobenkovarianz ist die Kovarianz zwischen 2ZV definiert als

σXY = E [XY ]− E [X ]E [Y ]

I Die Varianz einer ZV ist die Kovarianz dieser ZV mit sichselbst!




I Die Korrelation ρXY ist das Verhaltnis zwischen der Kovarianzund dem Produkt der Standardabweichungen

ρXY =σXYσXσY

I Gleiche Interpretation wie in Stichprobe

I Sind zwei ZV Variablen unabhangig, dann ist ihre Korrelation0; Achtung die umgekehrte Folgerung ist nicht immer richtig!

I Aus Korrelation gleich 0 folgt nicht unbedingt stochastischeUnabhangigkeit




I Es gilt fur beliebige ZV bzw. fur Konstanten a und b

σ2(aX+b) = a2σ2X

I Weiters

σ2(X+Y ) = σ2X +σ2Y +2σXY bzw. σ2(X−Y ) = σ2X +σ2Y −2σXY

I

σ(aX+b)(cY+d) = acσXY

I Und schließlich

ρ(aX+b)(cY+d) = sgn(ac)ρXY



Varianz

I Beispiel: X ist die beobachtete Augenzahl bei einmaligemWurfeln; die Wahrscheinlichkeitsverteilung von X ist

xi 1 2 3 4 5 6

f (xi )16

16

16

16

16

16

I

σ2 = E[X 2]− (E [X ])2︸︷︷︸

3.52

und E[X 2]

=6∑

i=1

x2i p(x2i )

E[X 2]

= 121

6+ · · ·+ 62

1

6= 15.17, σ2 = 2.92, σ = 1.71



Erwartungswert und Varianz



α-Quantil

I Als α-Quantil qα wird ein Wert bezeichnet, unterhalb dessenein vorgegebener Anteil α aller Falle der Verteilung liegen

I Jeder Wert unterhalb von qα unterschreitet den Anteil α, mitα als reelle Zahl zwischen 0 (gar kein Fall der Verteilung) und1 (alle Falle oder 100% der Verteilung)

I Fur stetige ZV gilt

F (qα) = P(X ≤ qα) =

∫t≤qα

f (t)dt = α

I α-Quantile sind fur die wichtigsten stetigen Verteilungen inTabellen ausgegeben



Stetige ZV



α-Quantil

I Fur diskrete ZV gilt

F (qα) = P(X ≤ qα) =∑t≤qα

P(X = t) ≥ α

F (x) < α fur jedes x kleiner als qα

I Aufrunden auf die nachste großere ganzzahlige Auspragung,analog zur Stichprobe



Diskrete ZV



Diskrete Gleichverteilung

I Diese Verteilung beschreibt eine ZV, welche die Zahlen1, 2, · · · ,m annehmen kann, und

I es gilt

P(X = x) =1

mfur alle x = 1, 2, · · · ,m

E [X ] =(m + 1)

2

σ2 =(m2 − 1)

12

I Anwendung bei Zufallsexperimenten, deren Ergebnisse gleichhaufig sind, also wenn angenommen wird, dass die mElementarereignisse gleichwahrscheinlich sind







I Erwartungswert und Varianz

E [X ] =m∑i=1

i1

m=

1

m

m∑i=1

i︸︷︷︸m(m + 1)

2

=m + 1

2

E[X 2]

=1

m

m∑i=1

i2 =1

m

m(m + 1)(2m + 1)

6

σ2 =(m + 1)(2m + 1)

6−(m + 1

2

)2

= · · · =(m + 1)(m − 1)

12




I Beispiel: X = die erhaltene Augenzahl bei einmaligem Wurfeln

E [X ] =(6 + 1)

2= 3.5

σ2 =(62 − 1)

12= 2.92



Binomialverteilung

I Wir betrachten ein Zufallsexperiment mit 2 Ausgangen,’Erfolg (1)’ und ’Misserfolg (0)’

I Die Wahrscheinlichkeit fur Erfolg sei p, mit p zwischen 0 und1

I Wir fuhren dieses Experiment n-mal durch, wobei zwischenden einzelnen Durchfuhrungen Unabhangigkeit angenommenwird (’Ziehen mit Zurucklegen’)

I Die ZV X beschreibt die Anzahl der Erfolge und istbinomialverteilt mit Parametern n und p, X v B(n, p)

P(X = k) =

(n

k

)pk(1− p)n−k fur k = 0, 1, · · · , n



Binomialverteilung

I Beispiel: Ein Glucksrad besteht aus 20 Feldern, wobei 5 davonGewinnfelder sind. Wie groß ist die Wahrscheinlichkeit, dassSie zwei Mal gewinnen, wenn Sie das Glucksrad drei Maldrehen?

I Experiment mit 2 Ausgangen, Erfolg (5 Gewinnfelder) undMisserfolg

I n = 3, weil wir das Glucksrad drei Mal drehen

I p = 520 = 0.25 ist die Wahrscheinlichkeit zum Erfolg

P(X = 2) =

(3

2

)0.252(1− 0.25)1 =

3!

2!1!0.0625 · 0.75 = 0.14



Binomialverteilung

I Binomialverteilte ZV nimmt Werte zwischen 0 und n an

I Binomialverteilung ist symmetrisch fur p = 0.5

I Je kleiner/großer p desto rechts/links-schiefer die Verteilung


E [X ] = np σ2 = np(1− p)

I Fur n = 1: B(1, p) ist eine Bernoulli-ZV mit Erwartungswertp und Varianz p(1− p)



Binomialverteilung



Poisson-Verteilung

I Diese Verteilung beschreibt ZV, die alle naturliche Zahlen und0 annehmen konnen

I Die Wahrscheinlichkeitsfunktion

P(X = k) =λke−λ

k!fur k = 0, 1, · · · ,∞

I λ ist der Parameter der Poisson-Verteilung und kann jedereelle positive Zahl sein


E [X ] = λ σ2 = λ



Poisson-Verteilung

I Poisson-Verteilung ist Grenzverteilung der Binomialverteilungbei n→∞ und p → 0 unter der Nebenbedingung, dassnp = λ beschrankt bleibt

I Poisson-Verteilung kann als gute Approximation fur dieBinomialverteilung bei großem n und kleinem p verwendetwerden

I Poisson-Verteilung beschreibt seltene Ereignisse

I Anwendung bei binomialverteilter ZV mit unbekanntem odergroßem n (leichtere Berechnung) und kleinem p



Poisson-Verteilung



Poisson-Verteilung

I Beispiel: Die Wahrscheinlichkeit, dass ein Patient die Injektioneines Serums nicht vertragt sei 0.001. Wie groß ist dieWahrscheinlichkeit, dass von 200 Patienten mehr als 1 dieInjektion nicht vertragen?

I Wahrscheinlichkeiten (Poisson-Verteilung)

I E [X ] = λ = (200)(0.001) = 0.2

P(X = 0) =0.20e−0.2

0!= 0.818731, P(X = 1) = 0.163746

P(X > 1) = 1− P(X = 0)− P(X = 1) = 0.017523



Poisson-Verteilung

I Wahrscheinlichkeiten (Binomialverteilung B(200, 0.001))

P(X = 0) =

(200

0

)(0.001)0(1− 0.001)(200−0) = 0.818649

P(X = 1) = 0.163894

P(X > 1) = 1− P(X = 0)− P(X = 1) = 0.017458



Poisson-Verteilung

I Beispiel: In einer Telefonzentrale kommen in einer Minutedurchschnittlich 3 Gesprache an. Mit welcherWahrscheinlichkeit kommen in einer Minute mehr als 3Gesprache an?

I Denkt man sich eine Minute in n gleiche Zeitabschnittezerlegt, die so klein sind, dass in jedem Abschnitt hochstensein Gesprach ankommen kann, so liegt eine BinomialverteilungB(n, 3n ) vor

I n ist unbekannt ⇒ Poissonverteilung mit λ = 3

P(X > 3) = 1−P(X = 0)−P(X = 1)−P(X = 2)−P(X = 3)



Poisson-Verteilung

I

P(X = 0) =30e−3

0!= 0.0498

I

P(X = 1) =31e−3

1!= 0.1494

I

P(X = 2) =32e−3

2!= 0.2240

I

P(X = 3) =33e−3

3!= 0.2240

I

P(X > 3) = 1− 0.0498− 0.1494− 0.2240− 0.2240 = 0.3528



Geometrische Verteilung

I Wir fuhren eine Serie von Versuchen mit zwei moglichenAusgangen, ’Erfolg (1)’ und ’Misserfolg (0)’, so lange durchbis wir den ersten Erfolg haben

I Die Wahrscheinlichkeit fur Erfolg sei p

I Unsere ZV X erfasst die Anzahl der Durchfuhrungen bis zumersten Erfolg

P(X = k) = p(1− p)k−1 fur k = 1, 2, · · · ,∞

E [X ] =1− p

pσ2 =

1− p

p2




I Anwendung bei der Analyse von Wartezeiten bis zumEintreffen eines bestimmten Ereignisses

I Lebensdauerbestimmung von Geraten und Bauteilen, d.h.dem Warten bis zum ersten Ausfall

I Ruckfalle bei Suchterkrankungen

I Bestimmung der Anzahl haufiger Ereignisse zwischenunmittelbar aufeinanderfolgenden seltenen Ereignissen wiez.B. Fehlern

I Bestimmung der Zuverlassigkeit von Geraten



Hypergeometrische Verteilung

I Aus einer Gesamtheit von N Elementen, wobei A (A ≤ N)markiert sind, wird zufallig eine Stichprobe von n (n ≤ N)Elementen ohne Zurucklegen entnommen

I Mit welcher Wahrscheinlichkeit kommt in der Stichprobe einebestimmte Anzahl a von markierten Elementen vor?

P(X = a) =

(Aa

)(N−An−a)(N

n

)E [X ] = n

A

Nσ2 = n

A

N

(1− A

N

)(N − n

N − 1

)




I Beispiel: Lotto 6 aus 45N = 45 Kugeln (=Zahlen) insgesamt, A = 6 Kugeln sind’markiert’ (d.h. am Lottoschein angekreuzt), n = 6 Kugelnwerden gezogen (ohne Zurucklegen). Die einzelnenGewinnwahrscheinlichkeiten ergeben sich durch dieHypergeometrische Verteilung

P(X = 3) =

(63

)(393

)(456

) =20 · 9139

8145060= 0.022

P(X = 6) =

(66

)(390

)(456

) =1

8145060= 0.000000123



Wahrscheinlichkeitsfunktion Beispiel Lotto



Hypergeometrische und Binomialverteilung

I Hypergeometrische Verteilung kann durch B(n, AN ) angenahertwerden, wenn n

N ≤ 0.05

I Beispiel: In der Population der Personen mit Adipositas, diesich einer Magenbypass-Operation unterzogen haben, haben10% einige Jahre nach der Operation (noch) eineBinge-Eating Storung (BED). In einer spezialisierten Klinikwurden in den letzten Jahren 1500 Personen operiert. Wiegroß ist die Wahrscheinlichkeit in einer Stichprobe von n = 50Personen maximal eine Person mit BED zu finden?




I Binomialverteilung B(50, 0.10)

P(X = 0) =

(50

0

)0.100(1− 0.10)50 = 0.005154

P(X = 1) = 0.028632, ⇒ P(X = 0) +P(X = 1) = 0.033786

I Hypergeometrische Verteilung, N = 1500, A = 150, n = 50

P(X = 0) =

(1500

)(135050

)(150050

) = 0.004697

P(X = 1) = 0.027075 ⇒ P(X = 0) + P(X = 1) = 0.031771



Normalverteilung (NV)

I Die NV ist eine stetige Verteilung, die durch 2 Parameter µund σ charakterisiert ist

I Es sei X eine ZV die N(µ, σ2) verteilt ist; X kann Wertezwischen −∞ und +∞ annehmen

I Die Dichtefunktion φ(x)

φ(x) =1

σ√

2πe−1

2

(x − µσ

)2

I Geht x → ±∞ strebt φ(x) gegen 0

I φ(x) ist symmetrisch um µ, d.h. µ+ a = µ− a (a =Konstante)




I σ gibt den Abstand zwischen µ und den Wendepunkten derDichtefunktion an

I Wendepunkte an den Stellen µ± σI Wenn σ groß ist, ist die Verteilung breit und niedrig, wenn σ

klein ist, ist die Verteilung schmal und hoch

I Flache unter φ(x) zwischen −∞ und +∞ ist gleich 1

I Die Flache µ± σ umfasst ca. 68% aller Falle

I Die Flache µ± 2σ umfasst ca. 95% aller Falle

I Es existieren unendlich viele NV durch beliebige Auswahl vonµ und σ






Standardnormalverteilung N(0, 1)

I Spezielle NV fur µ = 0 und σ = 1 (Gauß’sche Glockenkurve)

I Verteilung der N(0,1) ist tabelliert; Flache zwischen µ = 0und einem beliebigen Wert z ist ablesbar (Tabelle 1c)

I Quantile der NV; 1-Flache rechts von einem Wert z , und linksvon −z (Tabelle 1b)

I Beispiele

P(0 ≤ Z ≤ 1) = 0.3413 (Tabelle 1c)

P(−1 ≤ Z ≤ 1) = 0.6826 (Tabelle 1b)










I Ist X N(µ, σ2) verteilt dann fuhrt die Transformation X−µσ auf

eine N(0, 1) Verteilung

I Vorteil, da Quantile ablesbar (Tabelle 1b)

I Beispiel: X ∼ N(11, 5.53). Wie hoch ist P(X ≥ 14.5)?

z =14.5− 11

2.35= 1.49

P(Z ≥ 1.49) = 0.0681 (Tabelle 1b)


Tabelle 1b: Verteilungsfunktion der Standard-Normalverteilung(einseitige Fragestellung)

z0 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 .5000 .4960 .4920 .4880 .4840 .4801 .4761 .4721 .4681 .46410.1 .4602 .4562 .4522 .4483 .4443 .4404 .4364 .4325 .4286 .42470.2 .4207 .4168 .4129 .4090 .4052 .4013 .3974 .3936 .3897 .38590.3 .3821 .3783 .3745 .3707 .3669 .3632 .3594 .3557 .3520 .34830.4 .3446 .3409 .3372 .3336 .3300 .3264 .3228 .3192 .3156 .3121

0.5 .3085 .3050 .3015 .2981 .2946 .2912 .2877 .2843 .2810 .27760.6 .2743 .2709 .2676 .2643 .2611 .2578 .2546 .2514 .2483 .24510.7 .2420 .2389 .2358 .2327 .2296 .2266 .2236 .2206 .2177 .21480.8 .2119 .2090 .2061 .2033 .2005 .1977 .1949 .1922 .1894 .18670.9 .1841 .1814 .1788 .1762 .1736 .1711 .1685 .1660 .1635 .1611

1.0 .1587 .1562 .1539 .1515 .1492 .1469 .1446 .1423 .1401 .13791.1 .1357 .1335 .1314 .1292 .1271 .1251 .1230 .1210 .1190 .11701.2 .1151 .1131 .1112 .1093 .1075 .1056 .1038 .1020 .1003 .09851.3 .0968 .0951 .0934 .0918 .0901 .0885 .0869 .0853 .0838 .08231.4 .0808 .0793 .0778 .0764 .0749 .0735 .0721 .0708 .0694 .0681

1.5 .0668 .0655 .0643 .0630 .0618 .0606 .0594 .0582 .0571 .05591.6 .0548 .0537 .0526 .0516 .0505 .0495 .0485 .0475 .0465 .04551.7 .0446 .0436 .0427 .0418 .0409 .0402 .0392 .0384 .0375 .03671.8 .0359 .0351 .0344 .0336 .0329 .0322 .0314 .0307 .0301 .02941.9 .0287 .0281 .0274 .0268 .0262 .0256 .0250 .0244 .0239 .0233

2.0 .0228 .0222 .0217 .0212 .0207 .0202 .0197 .0192 .0188 .01832.1 .0179 .0174 .0170 .0166 .0162 .0158 .0154 .0150 .0146 .01432.2 .0139 .0136 .0132 .0129 .0126 .0122 .0119 .0116 .0113 .01102.3 .0107 .0104 .0102 .0099 .0096 .0094 .0091 .0089 .0087 .00842.4 .0082 .0080 .0078 .0076 .0073 .0071 .0070 .0068 .0066 .0064

2.5 .0062 .0060 .0059 .0057 .0055 .0054 .0052 .0051 .0049 .00482.6 .0047 .0045 .0044 .0043 .0042 .0040 .0039 .0038 .0037 .00362.7 .0035 .0034 .0033 .0032 .0031 .0030 .0029 .0028 .0027 .00262.8 .0026 .0025 .0024 .0023 .0023 .0022 .0021 .0021 .0020 .00192.9 .0019 .0018 .0018 .0017 .0016 .0016 .0015 .0015 .0014 .0014

3.0 .00135 Die Tabelle gibt die Wahrscheinlich-3.1 .00097 keiten P (Z ≥ z0) fur beliebige3.2 .00069 Werte z0 einer standardnormal-3.3 .00048 verteilten Variablen Z an. (Ist z03.4 .00034 negativ, so ist |z0| zu verwenden!)

3.5 .00023 Ist die Irrtumswahrscheinlich-3.6 .00016 keit α gegeben, so ist jenes z03.7 .00011 (kritischer Wert) gesucht,3.8 .00007 fur welches gilt:3.9 .00005 P (Z ≥ z0) = α.

4.0 .00003 Fur α = 0.01 und α = 0.05 sind diese5.0 .0000003 kritischen Werte: 2.33 und 1.645.

waldherr

Stempel

waldherr

Stempel

Tabelle 1c: Verteilungsfunktion der Standard-Normalverteilung

z0 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .03590.1 .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .07530.2 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .1064 .1103 .11410.3 .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .15170.4 .1554 .1591 .1628 .1664 .1700 .1736 .1772 .1808 .1844 .1879

0.5 .1915 .1950 .1985 .2019 .2054 .2088 .2123 .2157 .2190 .22240.6 .2257 .2291 .2324 .2357 .2389 .2422 .2454 .2486 .2517 .25490.7 .2580 .2611 .2642 .2673 .2703 .2734 .2764 .2794 .2823 .28520.8 .2881 .2910 .2939 .2967 .2995 .3023 .3051 .3078 .3106 .31330.9 .3159 .3186 .3212 .3238 .3264 .3289 .3315 .3340 .3365 .3389

1.0 .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .36211.1 .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3790 .3810 .38301.2 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .40151.3 .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .41771.4 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319

1.5 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .44411.6 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .45451.7 .4554 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .46331.8 .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4699 .47061.9 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767

2.0 .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .48172.1 .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .48572.2 .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 .48902.3 .4893 .4896 .4898 .4901 .4904 .4906 .4909 .4911 .4913 .49162.4 .4918 .4920 .4922 .4925 .4927 .4929 .4931 .4832 .4934 .4936

2.5 .4938 .4940 .4941 .4943 .4945 .4946 .4948 .4949 .4951 .49522.6 .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .49642.7 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .49742.8 .4974 .4975 .4976 .4977 .4977 .4978 .4979 .4979 .4980 .49812.9 .4981 .4982 .4982 .4983 .4984 .4984 .4985 .4985 .4986 .4986

3.0 .49865 Die Tabelle gibt die Wahrscheinlich-3.1 .49903 keiten P (0 ≤ Z ≤ z0) fur beliebige3.2 .49931 Werte z0 einer standardnormal-3.3 .49952 verteilten Variablen Z an. (Ist z03.4 .49966 negativ, so ist |z0| zu verwenden!)

3.5 .499773.6 .499843.7 .499893.8 .499933.9 .49995

4.0 .499975.0 .4999997

waldherr

Stempel

Wahrscheinlichkeitsverteilungen II



11. Mai 2011


Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Poisson-Verteilung

I Diese Verteilung beschreibt ZV, die alle naturliche Zahlen und0 annehmen konnen

I Die Wahrscheinlichkeitsfunktion

P(X = k) =λke−λ

k!fur k = 0, 1, · · · ,∞

I λ ist der Parameter der Poisson-Verteilung und kann jedereelle positive Zahl sein


E [X ] = λ σ2 = λ



Poisson-Verteilung

I Poisson-Verteilung ist Grenzverteilung der Binomialverteilungbei n→∞ und p → 0 unter der Nebenbedingung, dassnp = λ beschrankt bleibt

I Poisson-Verteilung kann als gute Approximation fur dieBinomialverteilung bei großem n und kleinem p verwendetwerden

I Poisson-Verteilung beschreibt seltene Ereignisse

I Anwendung bei binomialverteilter ZV mit unbekanntem odergroßem n (leichtere Berechnung) und kleinem p



Poisson-Verteilung



Poisson-Verteilung

I Beispiel: Die Wahrscheinlichkeit, dass ein Patient die Injektioneines Serums nicht vertragt sei 0.001. Wie groß ist dieWahrscheinlichkeit, dass von 200 Patienten mehr als 1 dieInjektion nicht vertragen?

I Wahrscheinlichkeiten (Poisson-Verteilung)

I E [X ] = λ = (200)(0.001) = 0.2

P(X = 0) =0.20e−0.2

0!= 0.818731, P(X = 1) = 0.163746

P(X > 1) = 1− P(X = 0)− P(X = 1) = 0.017523



Poisson-Verteilung

I Wahrscheinlichkeiten (Binomialverteilung B(200, 0.001))

P(X = 0) =

(200

0

)(0.001)0(1− 0.001)(200−0) = 0.818649

P(X = 1) = 0.163894

P(X > 1) = 1− P(X = 0)− P(X = 1) = 0.017458



Poisson-Verteilung

I Beispiel: In einer Telefonzentrale kommen in einer Minutedurchschnittlich 3 Gesprache an. Mit welcherWahrscheinlichkeit kommen in einer Minute mehr als 3Gesprache an?

I Denkt man sich eine Minute in n gleiche Zeitabschnittezerlegt, die so klein sind, dass in jedem Abschnitt hochstensein Gesprach ankommen kann, so liegt eine BinomialverteilungB(n, 3

n ) vor

I n ist unbekannt ⇒ Poissonverteilung mit λ = 3

P(X > 3) = 1−P(X = 0)−P(X = 1)−P(X = 2)−P(X = 3)



Poisson-Verteilung

I

P(X = 0) =30e−3

0!= 0.0498

I

P(X = 1) =31e−3

1!= 0.1494

I

P(X = 2) =32e−3

2!= 0.2240

I

P(X = 3) =33e−3

3!= 0.2240

I

P(X > 3) = 1− 0.0498− 0.1494− 0.2240− 0.2240 = 0.3528




I Wir fuhren eine Serie von Versuchen mit zwei moglichenAusgangen, ’Erfolg (1)’ und ’Misserfolg (0)’, so lange durchbis wir den ersten Erfolg haben

I Die Wahrscheinlichkeit fur Erfolg sei p

I Variante 1: Unsere ZV X erfasst die Anzahl derDurchfuhrungen bis zum ersten Erfolg (Anzahl der Versuche,die notwendig sind, bis zum Erfolg)

P(X = k) = p(1− p)k−1 fur k = 1, 2, · · · ,∞

E [X ] =1

p; σ2 =

1− p

p2




I Beispiel: Wurfeln einer 6, p = 1/6

I P(6 beim 1. Wurf): P(X = 1) = p = 1/6I P(6 beim 2. Wurf): P(X = 2) =?

I 1. Wurf keine 6: P(keine 6 beim 1.Wurf) = (1− p) = 5/6I P(6 beim 2.Wurf) = p = 1/6I P(X = 2) = p(1− p) = 1/6× 5/6 = 5/36 = 0.14

I allgemein: P(X = k) = p(1− p)k−1

I E (X ) = 1/16 = 6




I Variante 2: Unsere ZV Y erfasst die Anzahl der Misserfolgebis zum ersten Erfolg (Anzahl der Fehlversuche vor demErfolg)

P(Y = k) = p(1− p)k fur k = 0, 1, 2, · · · ,∞

E [Y ] = E (X )− 1 =1− p

p; σ2 =

1− p

p2




I Anwendung bei der Analyse von Wartezeiten bis zumEintreffen eines bestimmten Ereignisses

I Lebensdauerbestimmung von Geraten und Bauteilen, d.h.dem Warten bis zum ersten Ausfall

I Ruckfalle bei Suchterkrankungen

I Bestimmung der Anzahl haufiger Ereignisse zwischenunmittelbar aufeinanderfolgenden seltenen Ereignissen wiez.B. Fehlern

I Bestimmung der Zuverlassigkeit von Geraten




I Aus einer Gesamtheit von N Elementen, wobei A (A ≤ N)markiert sind, wird zufallig eine Stichprobe von n (n ≤ N)Elementen ohne Zurucklegen entnommen

I Mit welcher Wahrscheinlichkeit kommt in der Stichprobe einebestimmte Anzahl a von markierten Elementen vor?

P(X = a) =

(Aa

)(N−An−a

)(Nn

)E [X ] = n

A

Nσ2 = n

A

N

(1− A

N

)(N − n

N − 1

)




I Beispiel: Lotto 6 aus 45N = 45 Kugeln (=Zahlen) insgesamt, A = 6 Kugeln sind’markiert’ (d.h. am Lottoschein angekreuzt), n = 6 Kugelnwerden gezogen (ohne Zurucklegen). Die einzelnenGewinnwahrscheinlichkeiten ergeben sich durch dieHypergeometrische Verteilung

P(X = 3) =

(63

)(393

)(456

) =20 · 9139

8145060= 0.022

P(X = 6) =

(66

)(390

)(456

) =1

8145060= 0.000000123



Wahrscheinlichkeitsfunktion Beispiel Lotto




I Hypergeometrische Verteilung kann durch B(n, AN ) angenahert

werden, wenn nN ≤ 0.05

I Beispiel: In der Population der Personen mit Adipositas, diesich einer Magenbypass-Operation unterzogen haben, haben10% einige Jahre nach der Operation (noch) eineBinge-Eating Storung (BED). In einer spezialisierten Klinikwurden in den letzten Jahren 1500 Personen operiert. Wiegroß ist die Wahrscheinlichkeit in einer Stichprobe von n = 50Personen maximal eine Person mit BED zu finden?




I Binomialverteilung B(50, 0.10)

P(X = 0) =

(50

0

)0.100(1− 0.10)50 = 0.005154

P(X = 1) = 0.028632, ⇒ P(X = 0) + P(X = 1) = 0.033786

I Hypergeometrische Verteilung, N = 1500, A = 150, n = 50

P(X = 0) =

(1500

)(135050

)(150050

) = 0.004697

P(X = 1) = 0.027075 ⇒ P(X = 0) + P(X = 1) = 0.031771




I Die NV ist eine stetige Verteilung, die durch 2 Parameter µund σ charakterisiert ist

I Es sei X eine ZV die N(µ, σ2) verteilt ist; X kann Wertezwischen −∞ und +∞ annehmen

I Die Dichtefunktion φ(x)

φ(x) =1

σ√

2πe−1

2

(x − µσ

)2

I Geht x → ±∞ strebt φ(x) gegen 0

I φ(x) ist symmetrisch um µ, d.h. µ+ a = µ− a (a =Konstante)




I σ gibt den Abstand zwischen µ und den Wendepunkten derDichtefunktion an

I Wendepunkte an den Stellen µ± σI Wenn σ groß ist, ist die Verteilung breit und niedrig, wenn σ

klein ist, ist die Verteilung schmal und hoch

I Flache unter φ(x) zwischen −∞ und +∞ ist gleich 1

I Die Flache µ± σ umfasst ca. 68% aller Falle

I Die Flache µ± 2σ umfasst ca. 95% aller Falle

I Es existieren unendlich viele NV durch beliebige Auswahl vonµ und σ







I Spezielle NV fur µ = 0 und σ = 1 (Gauß’sche Glockenkurve)

I Verteilung der N(0,1) ist tabelliert; Flache zwischen µ = 0und einem beliebigen Wert z ist ablesbar (Tabelle 1c)

I Quantile der NV (Tabelle 1b)I 1 - Flache rechts von einem Wert z ,I Flache links von −z






Standardnormalverteilung - Beispiel 1

P(0 ≤ Z ≤ 1) = 0.3413 (Tabelle 1c)



Standardnormalverteilung - Beispiel 2

P(−1 ≤ Z ≤ 1)





I Tabelle 1c: P(−1 ≤ Z ≤ 1) = 2× 0.3413 = 0.6826

I Tabelle 1b:

P(−1 ≤ Z ≤ 1) = 1− 2× 0.1587 = 0.6826




I Ist X N(µ, σ2) verteilt dann fuhrt die Transformation X−µσ auf

eine N(0, 1) Verteilung

I Vorteil, da Quantile ablesbar (Tabelle 1b)

I Beispiel: X ∼ N(11, 5.53). Wie hoch ist P(X ≥ 14.5)?

z =14.5− 11

2.35= 1.49

P(Z ≥ 1.49) = 0.0681 (Tabelle 1b)





Zentraler Grenzwertsatz

I Große Zahl voneinander unabhangiger ZV Xi mit beliebiger,identischer Verteilung mit gleichem E (Xi ) = µ und VarianzVar(Xi ) = σ2

I Zentraler Grenzwertsatz von Lindeberg & Levy (1922):Die Summe Y = X1 + X2 + . . .Xn ist asymptotischnormalverteilt mit E (Y ) = E (X1) + E (X2) + . . .E (Xn) = nµund Varianz σ2(Y ) = nσ2.

I Fur B(n, p) Satz von de Moivre und Laplace:Summe vieler Xi mit Bernoulli-Verteilung B(1, p) istasymptotisch normalverteilt mit µ = np und σ2 = np(1− p).Voraussetzung: np ≥ 5 und n(1− p) ≥ 5.



BinomialverteilungExperiment mit zwei Ausgangen, z.B. Erfolg und Misserfolg. DieZV K , Anzahl der Erfolge bei n Versuchen, ist binomialverteilt mitParametern n und p, K v B(n, p)

P(K = k) =

(n

k

)pk(1− p)n−k fur k = 0, 1, · · · , n



NV-Approximation der BinomialverteilungBeispiel: n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58



NV-Approximation der Binomialverteilung

I Vorteil: Verwendung der Standardnormalverteilung N(0,1), databelliert

I Berechnen von E (K ) = np und σ =√

np(1− p), unduberprufen ob np ≥ 5 und n(1− p) ≥ 5

I Standardisieren der Variable (d.h. Berechnung desStandardmesswertes), auch z-Transformation genannt

Z =k − µσ

I Bestimmen der Wahrscheinlichkeiten aus der Tabelle derN(0,1)



NV-Approximation der Binomialverteilung - Beispiel 1I n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58I Beispiel P(k ≥ 7)I k = 7: Dem diskreten Wert 7 entspricht bei der stetigen NV

das Intervall [6.5,7.5].I Stetigkeitskorrektur (Kontinuitatskorrektur)



z =6.5− 5

1.58= 0.95

Tab. 1b: P(Z ≥ 0.95) = 0.1711



Beispiel 2

n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58Beispiel P(K ≤ 7):

1− P(k ≥ 7) = 1− 0.1711 = 0.829



Beispiel 3n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58Beispiel P(K ≤ 3): Dem diskreten Wert 3 entspricht bei derstetigen NV das Intervall [2.5,3.5].

z =3.5− 5

1.58= −0.95

Tab. 1b: P(Z ≤ −0.95) = P(Z ≥ 0.95) = 0.1711



Beispiel 4n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58P(4 ≤ K ≤ 6):



Beispiel 4 - Tabelle 1b

z1:

z1 =3.5− 5

1.58= −0.95

z2:

z2 =6.5− 5

1.58= 0.95

Tab. 1b:P(−0.95 ≤ Z ≤ 0.95)] = 1− P(Z ≤ −0.95)− P(Z ≥ 0.95) =

1− 2× 0.1711 = 0.6578



Beispiel 4 - Tabelle 1c



P(−0.95 ≤ Z ≤ 0.95) = 0.3289 + 0.3289 = 0.6578




Korrektur der Folie 35 vom 11. Mai 2011

Karin Waldherr & Pantelis Christodoulides Einfuhrung in Quantitative Methoden

Beispiel 2

n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58Beispiel P(K ≤ 6):

1− P(k ≥ 7) = 1− 0.1711 = 0.829

Karin Waldherr & Pantelis Christodoulides Einfuhrung in Quantitative Methoden

Wahrscheinlichkeitsverteilungen IIIParameterschatzung



18. Mai 2011

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 1/37


Fortsetzung Spezielle stetige Verteilungen

Prufverteilungen - Motivation

I Inferenzstatistik verwendet Stichprobenkennwerte(Stichprobenmittelwert, Stichprobenvarianz oder auch denQuotient zweier Stichprobenvarianzen) als Schatzfunktionenfur die entsprechenden Populationsparameter.

I Zieht man immer wieder voneinander unabhangigeZufallsstichproben und berechnet die Kennwerte, werden dieeinzelnen Kennwerte aufgrund der zufalligenZusammensetzung der Stichproben nicht ident sein sondernstreuen zufallig um den Erwartungswert. Die Kennwerteeinzelner Zufallsstichproben sind Realisierungen vonZufallsvariablen (z.B. X , S2).

I Kenntnis der Verteilung dieser ZV (= Stichprobenverteilung)ist Grundlage fur Inferenzstatistik, z.B. von Hypothesentests,Vertrauensbereichen fur Schatzwerte.




Empirische und Theoretische Verteilungen

Empirisch (beobachtet) Theoretisch (erwartet)

Stichprobe Population(Umfang n) n→∞

Haufigkeitsverteilung Wahrscheinlichkeitsfunktionbzw. Dichte

Kumulative relative VerteilungsfunktionHaufigkeitsverteilung

Kennwerte der Verteilungx E (X ) = µs2 σ2

rXY ρXYEmpirische Quantile Theoretische Quantile




χ2-VerteilungI Gegeben: standardnormalverteilte ZV (µ = 0, σ = 1)I Man entnimmt wiederholt (theoretisch unendlich oft) zufallig

einzelne z-Werte und quadriert diese. Diese Zufallsvariablewird als Z 2 = χ2

(1)-verteilte ZV bezeichnet.I Welche Verteilungsform ergibt sich?

I da die z-Werte quadriert werden, konnen nur Werte ≥ 0vorkommen

I da bei einer N(0,1)-verteilten ZV die Werte zwischen 0 und ±1 am haufigsten sind, werden daher auch χ2-Werte zwischen 0und 1 am haufigsten sein




χ2-Verteilung

I Entnimmt man wiederholt 2, 3, 4 . . . , oder m unabhangigezi -Werte, quadriert diese und bildet die Summe der z2

i ,ergeben sich χ2

(2), χ2(3), χ2

(4), ... bzw. χ2(m)- verteilte ZV

I Es entstehen χ2-Verteilungen mit 2, 3, 4, . . . , bzw. mFreiheitsgraden (df )

I Freiheitsgrade = Anzahl der Summanden, die frei variierendurfen (d.h. fur die es gleichgultig ist, welchen Wert sieannehmen)

I E (χ2) = df , σ2 = 2df




Dichten verschiedener χ2-Verteilungen




χ2-Verteilung

I Die Summe einer χ2-verteilten Variablen mit df = n und einerunabhangigen χ2-verteilten Variablen mit df = m ist ebenfallsχ2-verteilt mit df = m + n. (= Reproduktionseigenschaft derχ2-Verteilung)

I Mit wachsender Anzahl von Summanden wird dieχ2-Verteilung immer symmetrischer und nahert sich einer NVmit µ = df und σ2 = 2df (vgl. Zentraler Grenzwertsatz)




χ2-Tabelle

Tabelle 2 gibt ausgewahlte α-Quantile der χ2-Verteilung furverschiedene Freiheitsgrade an (jene Werte χ2

0, fur die giltP(χ2 ≤ χ2

0) = α).

α

0.005 0.01 0.025 0.05 0.90 0.95 0.975 0.99 0.995

df1 0.00 0.00 0.00 0.00 2.71 3.84 5.02 6.64 7.882 0.01 0.02 0.05 0.10 4.61 5.99 7.38 9.21 10.603 0.07 0.11 0.22 0.35 6.25 7.82 9.35 11.34 12.844 0.21 0.30 0.48 0.71 7.78 9.49 11.14 13.28 14.865 0.41 0.55 0.83 1.15 9.24 11.07 12.83 15.09 16.75...

......

......

......

......

...




Beispiel: df = 15, α = 0.95α

0.005 0.01 0.025 0.05 0.90 0.95 0.975 0.99 0.995

df1 0.00 0.00 0.00 0.00 2.71 3.84 5.02 6.64 7.88...

......

......

......

......

...15 4.60 5.23 6.26 7.26 22.31 25.00 27.49 30.58 32.80




Asymptotische Entwicklung von χ2

I Wenn df > 100 asymptotische Entwicklung von χ2

I Beispiel df = 200: annahernd normalverteilt mitN(200,

√400)

I

Z =χ2 − E (χ2)

σ(χ2)=χ2 − 200√

400I

χ20.99 − 200

20∼ z0.99 = 2.33(Tab. 1b)

I

χ20.99 ∼ 200 + 20 · 2.33 = 246.6

I

χ20.01 ∼ 200− 20 · 2.33 = 153.4




t-Verteilung

I Durch Standardisieren einer normalverteilten Variablen erhaltman eine standardnormalverteilte Variable

Z =X − µXσX

=X − µX√

σ2Xn

I Ist Populationsvarianz jedoch nicht bekannt und mussgeschatzt werden, dann ist der Quotient nichtstandardnormalverteilt sondern t-verteilt

T =X − µXσX

=X − µX√

σ2Xn

mit n Freiheitsgraden.




Dichten verschiedener t-VerteilungenDie t-Verteilung ist wie die NV eingipfelig und symmetrisch, mitE (T ) = 0 (fur df ≥ 2), und Varianz n/(n − 2) (fur df ≥ 3).Mit wachsender Zahl der Freiheitsgrade nahert sich diet-Verteilung der N(0,1).




t-Tabelle

Tabelle 3 gibt ausgewahlte α-Quantile der t-Verteilung furverschiedene Freiheitsgrade an (jene Werte t0, fur welche giltP(t ≤ t0) = α)

α0.90 0.95 0.975 0.99 0.995 0.999 0.9995

df1 3.09 6.31 12.71 31.82 63.66 318.31 636.622 1.89 2.92 4.30 6.97 9.93 22.33 31.60...

......

......

......

...




Beispielα

0.90 0.95 0.975 0.99 0.995 0.999 0.9995

df10 1.37 1.81 2.23 2.76 3.17 4.14 4.59

......

......

......

......

120 1.29 1.66 1.98 2.36 2.62 3.16 3.37∞ 1.28 1.65 1.96 2.33 2.58 3.09 3.29




F -Verteilung

I Gegeben seien zwei stochastisch unabhangige χ2-verteilteVariablen, χ2

(n) und χ2(m).

I Der Quotientχ2

(n)

nχ2

(m)

m

ist F -verteilt mit df1 = n (Zahlerfreiheitsgrade) und df2 = m(Nennerfreiheitsgrade)

I F -Verteilungen sind stetig und asymmetrisch

I Da F das Verhaltnis zweier quadrierter Werte ist, konnen nurpositive Werte vorkommen

I Form ist abhangig von der Anzahl der Zahler- undNennerfreiheitsgrade




Dichten verschiedener F -Verteilungen




F -TabelleI Tabelle 4a gibt jene Werte F0 einer F -verteilten Variablen mit

bestimmter Anzahl von Freiheitsgraden an, fur welche giltP(F ≤ F0) = α.

I Quotient wird so gebildet, dass der großere Wert im Zahlersteht.

I Fur die Werte in der jeweils oberen Zeile ist α = 0.95, fur jeneder unteren Zeile ist α = 0.99.

I df1 . . . Anzahl der ZahlerfreiheitsgradeI df2 . . . Anzahl der Nennerfreiheitsgrade

df1 1 2 3 4 5 . . . 10

df21 161 200 216 225 230 . . . 242

4052 4999 5403 5625 5764 . . . 6056

2 18.51 19.00 19.16 19.25 19.30 . . . 19.4098.50 99.00 99.17 99.25 99.30 . . . 99.40




Beispieldf1 1 2 3 4 5 . . . 10

df21 161 200 216 225 230 . . . 242

4052 4999 5403 5625 5764 . . . 6056

2 18.51 19.00 19.16 19.25 19.30 . . . 19.4098.50 99.00 99.17 99.25 99.30 . . . 99.40



PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

Parameterschatzung

I Schatzung von Populationsparameter aufgrund einerStichprobe

1. Punktschatzer2. Vertrauensbereiche (Konfidenzintervalle)

I Punktschatzer: Wir benotigen eine Schatzfunktion (kurz:Schatzer).

I Bei der Konstruktion von Schatzern werden bestimmteEigenschaften berucksichtigt.

I ”Gute” (Qualitat) eines Schatzers spielt zentrale Rolle.




Gutekriterien von Schatzfunktionen nach R.A. Fisher

Populationsparameter sollen aus Stichprobenkennwerten moglichst’gut’ geschatzt werden. Nach welchen Kriterien konnen wirentscheiden, ob ein Stichprobenkennwert ein brauchbarer Schatzerist?

I Erwartungstreue

I Konsistenz

I Effizienz

I Suffizienz (erschopfend)




Erwartungstreue

I Eine Schatzfunktion (kurz: Schatzer) Θ ist erwartungstreu,wenn sein Erwartungswert dem Populationsparameterentspricht.

E (Θ) = θ

D.h., zieht man aus der Population immer wieder Stichprobenvom Umfang n und berechnet z.B. jedes Mal x , entspricht(auf lange Sicht) das arithmetische Mittel dieser xi demPopulationsparameter µ. Der Erwartungswert der ZV X ist µ.

I Unter- oder uberschatzt ein Schatzer den Parametersystematisch, weist er einen Bias auf. Der Bias ist dieDifferenz E (Θ)− θ.




Beispiel GewehrErwartungstreues Gewehr und Gewehr mit Bias




I X ist ein erwartungstreuer Schatzer fur denPopulationsparameter µ: E (X ) = µ.

I

S2 =1

n − 1

n∑i=1

(Xi − X )2

ist ein erwartungstreuer Schatzer fur denPopulationsparameter σ2.

I

S2 =1

n

n∑i=1

(Xi − X )2

ist kein erwartungstreuer Schatzer fur σ2. Wurde man dieVarianzen aller moglichen Zufallsstichproben aus derPopulation mit dieser Formel berechnen, und daraus denDurchschnittswert, wurde die Populationsvarianz um denFaktor (n − 1)/n unterschatzt.




I Analog fur die Kovarianz:

CXY =1

n − 1

n∑i=1

(Xi − X )(Yi − Y )

ist ein erwartungstreuer Schatzer.

I Weitere erwartungstreue Schatzer: Die relative Haufigkeit Rfur die Wahrscheinlichkeit eines Ereignisses, und dieStichprobenkorrelation fur ρXY




EffizienzI Ein Schatzer soll auch schon fur kleine Stichprobenumfange

eine moglichst geringe Varianz aufweisen.I Effizienz meint also die Prazision eines Schatzers.I Je kleiner die Varianz der Verteilung eines

Stichprobenkennwertes, umso großer ist seine Effizienz alsSchatzer.




Streuung von Stichprobenmittelwerten

I Wie effizient ist X als Schatzer fur µ?

I Standardabweichung von Stichprobenkennwerten heißtStandardfehler

I Der Standardfehler des Mittelwertes σX ist abhangig von derVarianz der Variable X in der Population. σX andert sichproportional zur Populationsstreuung.

I Weiters beeinflusst der Stichprobenumfang denStandardfehler. Mit zunehmendem Stichprobenumfang wirdσX kleiner.

I Der Standardfehler des Mittelwertes betragt

σX =

√σ2X

n




Standardfehler des Medians

I Der Standardfehler des Medians betragt

σMd = 1.25

√σ2X

n

I Somit ist die Varianz der Medianwerteverteilung immer großerals jene der Mittelwerteverteilung.

I Der Mittelwert schatzt µ effizienter als der Median.




Konsistenz

I Ein Schatzer soll fur große Stichprobenumfange (n→∞)einen moglichst kleinen zufalligen Fehler aufweisen, d.h. mitgroßer werdendem Stichprobenumfang soll Θn gegen denwahren Parameter θ streben, also immer genauer werden.

I Mathematisch

P(|Θn − θ| > ε)−→n→∞

0 fur jedes ε > 0.

Ein Schatzer ist konsistent, wenn die Wahrscheinlichkeit, dassder Absolutbetrag der Differenz zum wahren Parameter großerals jede beliebig kleine reelle Zahl ist, mit wachsendem ngegen 0 strebt.

I Konsistente Schatzer sind: Relative Haufigkeit, X , S2, und dieKorrelation.




Suffizienz

I Ein Schatzer ist dann suffizient (oder erschopfend), wenn eralle in den Daten einer Stichprobe enthaltenen Informationenberucksichtigt, so dass die Berechnung eines weiterenstatistischen Kennwertes keine zusatzliche Information uberden zu schatzenden Parameter liefert.

I X und S2 sind suffiziente Schatzer

I Beispiel: Unter ganz bestimmten Bedingungen ist derRohscore (= Anzahl richtig geloster Aufgaben), den einePerson in einem Test erreicht, eine erschopfendeSchatzfunktion fur die Fahigkeit der Person. Die Kenntnis,welche Aufgaben die Person gelost hat und welche nicht,liefert keine zusatzliche Information uber die Fahigkeit derPerson.




Methode der kleinsten Quadrate

I auch Ordinary Least Squares-Methode genannt.

I Schatzwert θ fur θ, sodass Stichprobe moglichst gutreprasentiert wird in der Form,

I dass die Summe der quadrierten Abweichungen zwischen θund Messwerten minimiert wird.

I Es wird die Summe der Abweichungsquadrate gebildet,

S(θ) =n∑

i=1

(xi − θ)2 → min,

und anschließend die partielle Ableitung nach dem ParameterNull gesetzt.

I Beispiel: Regression




Beispiel Mittelwert

S(µ) =n∑

i=1

(xi − µ)2 =n∑

i=1

(x2i − 2µxi + µ2) =

=n∑

i=1

x2i − 2µ

n∑i=1

xi + nµ2

∂S

∂µ= 2

n∑i=1

xi + 2nµ = 0

⇒ µ =

∑ni=1 xin

= x




Maximum-Likelihood SchatzungI Likelihood-Funktion: Wahrscheinlichkeit konkret beobachteter

Daten unter einem bestimmten Wahrscheinlichkeitsmodell.I Fur eine diskrete Verteilung, die durch den Parameter θ

charakterisiert ist, ist die Likelihood-Funktion definiert durch:

L(θ) =n∏

i=1

P(Xi = xi |θ)

I Gesucht: Maximum der Likelihood-Funktion fur diebeobachteten Daten, d.h. jenes θ, bei dem die Likelihood dengroßten Wert hat.

I Man bestimmt die Wahrscheinlichkeit fur das Auftreten derbeobachteten Daten unter der Annahme aller in Fragekommenden Stichprobenverteilungen.

I Der ML-Schatzer ist der Parameter jener Verteilung, bei demdas beobachtete Resultat am wahrscheinlichsten ist.




Beispiel: Schatzen des Parameters p einerBinomialverteilung aufgrund beobachteter Daten

I Pilotstudie mit neuem Antidepressivum; bei 5 der 15teilnehmenden PatientInnen erfolgreich. Wie kann manaufgrund dieser Beobachtungen den Parameter p fur Erfolg inder Population schatzen?

I Numerische Losung: Einsetzen verschiedener p inL(p) =

(155

)p5(1− p)10

I

L(p = 0.1) = 0.01 L(p = 0.2) = 0.103

L(p = 0.3) = 0.206 L(p = 0.4) = 0.186

L(p = 0.5) = 0.092

I Die Likelihoodfunktion hat den großten Wert bei p = 0.3.Vielleicht ist ein Wert rund um 0.3 noch besser?




I Analytische Losung: Finden des Maximums der Funktion

L(p) =

(n

k

)pk(1− p)n−k

durch partielles Differenzieren und Nullsetzen




Da mathematisch einfacher: Logarithmieren der Likelihoodfunktionln L

ln L(p) = ln

(n

k

)+ k ln p + (n − k) ln(1− p)→ Max

∂ ln L

∂p= k

∂ ln p

∂p+ (n − k)

∂ ln(1− p)

∂p= 0

k

p+ (n − k)

−1

1− p= 0

k(1− p) = (n − k)p

p =k

n= r

2. Ableitung ist < 0 ⇒ r ist der ML-Schatzer fur den Parameter pder Binomialverteilung. L(p = 0.33) = 0.214




ML-Schatzer fur Poisson-Verteilung

P(K = k |λ) =λke−λ

k!

ln L = k lnλ− ln k!− λ→ Max

∂ ln L

∂λ=

k

λ− 1 = 0

λ = k




Eigenschaften von ML-Schatzern

Sie sind stets

I konsistent,

I suffizient,

I nicht unbedingt erwartungstreu (z.B. Varianz berechnet mit1/n)

I ML-Schatzer sind z.B.: R, X

I Nachteile: Oft existiert keine analytische Losung. NumerischeLosungsverfahren oft mathematisch nicht trivial


Tabelle 2: Ausgewahlte α-Quantile der χ2-Verteilung

Die Tabelle gibt jene Werte χ20 einer χ2-verteilten Variablen mit bestimmter

Anzahl von Freiheitsgraden an, sodass P (χ2 ≤ χ20) = α.

α

0.005 0.01 0.025 0.05 0.90 0.95 0.975 0.99 0.995df1 0.00 0.00 0.00 0.00 2.71 3.84 5.02 6.64 7.882 0.01 0.02 0.05 0.10 4.61 5.99 7.38 9.21 10.603 0.07 0.11 0.22 0.35 6.25 7.82 9.35 11.34 12.844 0.21 0.30 0.48 0.71 7.78 9.49 11.14 13.28 14.865 0.41 0.55 0.83 1.15 9.24 11.07 12.83 15.09 16.756 0.68 0.87 1.24 1.64 10.64 12.59 14.45 16.81 18.557 0.99 1.24 1.69 2.17 12.02 14.07 16.01 18.48 20.288 1.34 1.65 2.18 2.73 13.36 15.51 17.53 20.09 21.969 1.74 2.09 2.70 3.33 14.68 16.92 19.02 21.67 23.59

10 2.16 2.56 3.25 3.94 15.99 18.31 20.48 23.21 25.1911 2.60 3.05 3.82 4.58 17.28 19.68 21.92 24.74 26.7612 3.07 3.57 4.40 5.23 18.55 21.03 23.34 26.22 28.3013 3.57 4.11 5.01 5.89 19.81 22.36 24.74 27.69 29.8214 4.08 4.66 5.63 6.57 21.06 23.68 26.12 29.14 31.3215 4.60 5.23 6.26 7.26 22.31 25.00 27.49 30.58 32.8016 5.14 5.81 6.91 7.96 23.54 26.30 28.85 32.00 34.2717 5.70 6.41 7.56 8.67 24.77 27.59 30.19 33.41 35.7218 6.27 7.02 8.23 9.39 25.99 28.87 31.53 34.81 37.1619 6.84 7.63 8.91 10.12 27.20 30.14 32.85 36.19 38.5820 7.43 8.26 9.59 10.85 28.41 31.41 34.17 37.57 40.0021 8.03 8.90 10.28 11.59 29.62 32.67 35.48 38.93 41.4022 8.64 9.54 10.98 12.34 30.81 33.92 36.78 40.29 42.8023 9.26 10.20 11.69 13.09 32.01 35.17 38.08 41.64 44.1824 9.89 10.86 12.40 13.85 33.20 36.42 39.36 42.98 45.5625 10.52 11.52 13.12 14.61 34.38 37.65 40.65 44.31 46.9326 11.16 12.20 13.84 15.38 35.56 38.89 41.92 45.64 48.2927 11.81 12.88 14.57 16.15 36.74 40.11 43.19 46.96 49.6428 12.46 13.56 15.31 16.93 37.92 41.34 44.46 48.28 50.9929 13.12 14.26 16.05 17.71 39.09 42.56 45.72 49.59 52.3430 13.79 14.95 16.79 18.49 40.26 43.77 46.98 50.89 53.6740 20.71 22.16 24.43 26.51 51.80 55.76 59.34 63.69 66.7750 27.99 29.71 32.36 34.76 63.17 67.50 71.42 76.15 79.4960 35.53 37.48 40.48 43.19 74.40 79.08 83.30 88.38 91.9570 43.28 45.44 48.76 51.74 85.53 90.53 95.02 100.42 104.2280 51.17 53.54 57.15 60.39 96.58 101.88 106.63 112.33 116.3290 59.20 61.75 65.65 69.13 107.56 113.14 118.14 124.12 128.30

100 67.33 70.06 74.22 77.93 118.50 124.34 129.56 135.81 140.17200 151.36 156.43 162.73 168.28 226.02 233.99 241.06 249.06 254.27

Tabelle 4a: Ausgewahlte 0.95- und 0.99-Quantile der F -Verteilung

Die Tabelle gibt jene Werte F0 einer F -verteilten Variablen mit bestimmterAnzahl von Freiheitsgraden an, fur welche gilt: P (F ≤ F0) = α.F ist stets der Quotient aus dem großeren durch den kleineren Wert.Fur die Werte in der jeweils oberen Zeile ist α = 0.95, fur jene der unteren Zeileist α = 0.99.df1 . . . Anzahl der Zahlerfreiheitsgrade,df2 . . . Anzahl der Nennerfreiheitsgrade.

df1 1 2 3 4 5 6 7 8 9 10

df21 161 200 216 225 230 234 237 239 241 242

4052 4999 5403 5625 5764 5859 5928 5981 6022 60562 18.51 19.00 19.16 19.25 19.30 19.33 19.36 19.37 19.38 19.40

98.50 99.00 99.17 99.25 99.30 99.33 99.34 99.36 99.38 99.403 10.13 9.55 9.28 9.12 9.01 8.94 8.88 8.84 8.81 8.78

34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.234 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96

21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.545 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.78 4.74

16.26 13.27 12.06 11.39 10.97 10.67 10.45 10.27 10.15 10.056 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06

13.74 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.877 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.63

12.25 9.55 8.45 7.85 7.46 7.19 7.00 6.84 6.71 6.628 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.34

11.26 8.65 7.59 7.01 6.63 6.37 6.19 6.03 5.91 5.829 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.13

10.56 8.02 6.99 6.42 6.06 5.80 5.62 5.47 5.35 5.2610 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.97

10.04 7.56 6.55 5.99 5.64 5.39 5.21 5.06 4.95 4.8511 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.86

9.65 7.20 6.22 5.67 5.32 5.07 4.88 4.74 4.63 4.5412 4.75 3.88 3.49 3.26 3.11 3.00 2.92 2.85 2.80 2.76

9.33 6.93 5.95 5.41 5.06 4.82 4.65 4.50 4.39 4.3013 4.67 3.80 3.41 3.18 3.02 2.92 2.84 2.77 2.72 2.67

9.07 6.70 5.74 5.20 4.86 4.62 4.44 4.30 4.19 4.1014 4.60 3.74 3.34 3.11 2.96 2.85 2.77 2.70 2.65 2.60

8.86 6.51 5.56 5.03 4.69 4.46 4.28 4.14 4.03 3.9415 4.54 3.68 3.29 3.06 2.90 2.79 2.70 2.64 2.59 2.55

8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80

Fortsetzung Tabelle 4a: 0.95- und 0.99-Quantile der F -Verteilung

df1 1 2 3 4 5 6 7 8 9 10

df216 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49

8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.6917 4.45 3.59 3.20 2.96 2.81 2.70 2.62 2.55 2.50 2.45

8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.5918 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41

8.28 6.01 5.09 4.58 4.25 4.01 3.85 3.71 3.60 3.5119 4.38 3.52 3.13 2.90 2.74 2.63 2.55 2.48 2.43 2.38

8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.4320 4.35 3.49 3.10 2.87 2.71 2.60 2.52 2.45 2.40 2.35

8.10 5.85 4.94 4.43 4.10 3.87 3.71 3.56 3.45 3.3722 4.30 3.44 3.05 2.82 2.66 2.55 2.47 2.40 2.35 2.30

7.94 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.2624 4.26 3.40 3.01 2.78 2.62 2.51 2.43 2.36 2.30 2.26

7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.25 3.1726 4.22 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22

7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.17 3.0928 4.20 3.34 2.95 2.71 2.56 2.44 2.36 2.29 2.24 2.19

7.64 5.45 4.57 4.07 3.76 3.53 3.36 3.23 3.11 3.0330 4.17 3.32 2.92 2.69 2.53 2.42 2.34 2.27 2.21 2.16

7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.06 2.9832 4.15 3.30 2.90 2.67 2.51 2.40 2.32 2.25 2.19 2.14

7.50 5.34 4.46 3.97 3.66 3.42 3.25 3.12 3.01 2.9434 4.13 3.28 2.88 2.65 2.49 2.38 2.30 2.23 2.17 2.12

7.44 5.29 4.42 3.93 3.61 3.38 3.21 3.08 2.97 2.8936 4.11 3.26 2.86 2.63 2.48 2.36 2.28 2.21 2.15 2.10

7.39 5.25 4.38 3.89 3.58 3.35 3.18 3.04 2.94 2.8640 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.07

7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.88 2.8050 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.02

7.17 5.06 4.20 3.72 3.41 3.18 3.02 2.83 2.78 2.7060 4.00 3.15 2.76 2.52 2.37 2.25 2.17 2.10 2.04 1.99

7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.6370 3.98 3.13 2.74 2.50 2.35 2.23 2.14 2.07 2.01 1.97

7.01 4.92 4.08 3.60 3.29 3.07 2.91 2.77 2.67 2.59100 3.94 3.09 2.70 2.46 2.30 2.19 2.10 2.03 1.97 1.92

6.90 4.82 3.98 3.51 3.20 2.99 2.82 2.69 2.59 2.51200 3.89 3.04 2.65 2.41 2.26 2.14 2.05 1.98 1.92 1.87

6.76 4.71 3.88 3.41 3.11 2.90 2.73 2.60 2.50 2.41∞ 3.84 2.99 2.60 2.37 2.21 2.09 2.01 1.94 1.88 1.83

6.64 4.60 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32


11 12 14 16 20 24 30 50 100 ∞ df1

df2

243 244 245 246 248 249 250 252 253 254 16082 6106 6142 6169 6208 6234 6258 6302 6334 636619.40 19.41 19.42 19.43 19.44 19.45 19.46 19.47 19.49 19.50 299.41 99.42 99.43 99.44 99.45 99.46 99.47 99.48 99.49 99.508.76 8.74 8.71 8.69 8.66 8.64 8.62 8.58 8.56 8.53 3

27.13 27.05 26.92 26.83 26.69 26.60 26.50 26.35 26.23 26.125.93 5.91 5.87 5.84 5.80 5.77 5.74 5.70 5.66 5.63 4

14.45 14.37 14.24 14.15 14.02 13.93 13.83 13.69 13.57 13.464.70 4.68 4.64 4.60 4.56 4.53 4.50 4.44 4.40 4.36 59.96 9.89 9.77 9.68 9.55 9.47 9.38 9.24 9.13 9.024.03 4.00 3.96 3.92 3.87 3.84 3.81 3.75 3.71 3.67 67.79 7.72 7.60 7.52 7.39 7.31 7.23 7.09 6.99 6.883.60 3.57 3.52 3.49 3.44 3.41 3.38 3.32 3.28 3.23 76.54 6.47 6.35 6.27 6.15 6.07 5.98 5.85 5.75 5.653.31 3.28 3.23 3.20 3.15 3.12 3.08 3.03 2.98 2.93 85.74 5.67 5.56 5.48 5.36 5.28 5.20 5.06 4.96 4.863.10 3.07 3.02 2.98 2.93 2.90 2.86 2.80 2.76 2.71 95.18 5.11 5.00 4.92 4.80 4.73 4.64 4.51 4.41 4.312.94 2.91 2.86 2.82 2.77 2.74 2.70 2.64 2.59 2.54 104.78 4.71 4.60 4.52 4.41 4.33 4.25 4.12 4.01 3.912.82 2.79 2.74 2.70 2.65 2.61 2.57 2.50 2.45 2.40 114.46 4.40 4.29 4.21 4.10 4.02 3.94 3.80 3.70 3.602.72 2.69 2.64 2.60 2.54 2.50 2.46 2.40 2.35 2.30 124.22 4.16 4.05 3.98 3.86 3.78 3.70 3.56 3.46 3.362.63 2.60 2.55 2.51 2.46 2.42 2.38 2.32 2.26 2.21 134.02 3.96 3.85 3.78 3.67 3.59 3.51 3.37 3.27 3.162.56 2.53 2.48 2.44 2.39 2.35 2.31 2.24 2.19 2.13 143.86 3.80 3.70 3.62 3.51 3.43 3.34 3.21 3.11 3.002.51 2.48 2.43 2.39 2.33 2.29 2.25 2.18 2.12 2.07 153.73 3.67 3.56 3.48 3.36 3.29 3.20 3.07 2.97 2.87


11 12 14 16 20 24 30 50 100 ∞ df1

df2

2.45 2.42 2.37 2.33 2.28 2.24 2.20 2.13 2.07 2.01 163.61 3.55 3.45 3.37 3.25 3.18 3.10 2.96 2.86 2.752.41 2.38 2.33 2.29 2.23 2.19 2.15 2.08 2.02 1.96 173.52 3.45 3.35 3.27 3.16 3.08 3.00 2.86 2.76 2.652.37 2.34 2.29 2.25 2.19 2.15 2.11 2.04 1.98 1.92 183.44 3.37 3.27 3.19 3.07 3.00 2.91 2.78 2.68 2.572.34 2.31 2.26 2.21 2.15 2.11 2.07 2.00 1.94 1.88 193.36 3.30 3.19 3.12 3.00 2.92 2.84 2.70 2.60 2.492.31 2.28 2.23 2.18 2.12 2.08 2.04 1.96 1.90 1.84 203.30 3.23 3.13 3.05 2.94 2.86 2.77 2.63 2.53 2.422.26 2.23 2.18 2.13 2.07 2.03 1.98 1.91 1.84 1.78 223.18 3.12 3.02 2.94 2.83 2.75 2.67 2.53 2.42 2.312.22 2.18 2.13 2.09 2.02 1.98 1.94 1.86 1.80 1.73 243.09 3.03 2.93 2.85 2.74 2.66 2.58 2.44 2.33 2.212.18 2.15 2.10 2.05 1.99 1.95 1.90 1.82 1.76 1.69 263.02 2.96 2.86 2.77 2.66 2.58 2.50 2.36 2.25 2.132.15 2.12 2.06 2.02 1.96 1.91 1.87 1.78 1.72 1.65 282.95 2.90 2.80 2.71 2.60 2.52 2.44 2.30 2.18 2.062.12 2.09 2.04 1.99 1.93 1.89 1.84 1.76 1.69 1.62 302.90 2.84 2.74 2.66 2.55 2.47 2.38 2.24 2.13 2.012.10 2.07 2.02 1.97 1.91 1.86 1.82 1.74 1.67 1.59 322.86 2.80 2.70 2.62 2.51 2.42 2.34 2.20 2.08 1.962.08 2.05 2.00 1.95 1.89 1.84 1.80 1.71 1.64 1.57 342.82 2.76 2.66 2.58 2.47 2.38 2.30 2.15 2.04 1.912.06 2.03 1.98 1.93 1.87 1.82 1.78 1.69 1.62 1.55 362.78 2.72 2.62 2.54 2.43 2.35 2.26 2.12 2.00 1.872.04 2.00 1.95 1.90 1.84 1.79 1.74 1.66 1.59 1.51 402.73 2.66 2.56 2.49 2.37 2.29 2.20 2.05 1.94 1.811.98 1.95 1.90 1.85 1.78 1.74 1.69 1.60 1.52 1.44 502.62 2.56 2.46 2.39 2.26 2.18 2.10 1.94 1.82 1.681.95 1.92 1.86 1.81 1.75 1.70 1.65 1.56 1.48 1.39 602.56 2.50 2.40 2.32 2.20 2.12 2.03 1.87 1.74 1.601.93 1.89 1.84 1.79 1.72 1.67 1.62 1.53 1.45 1.35 702.51 2.45 2.35 2.28 2.15 2.07 1.98 1.82 1.69 1.531.88 1.85 1.79 1.75 1.68 1.63 1.57 1.48 1.39 1.28 1002.43 2.36 2.26 2.19 2.06 1.98 1.89 1.73 1.59 1.431.83 1.80 1.74 1.69 1.62 1.57 1.52 1.42 1.32 1.19 2002.34 2.28 2.17 2.09 1.97 1.88 1.79 1.62 1.48 1.281.79 1.75 1.69 1.64 1.57 1.52 1.46 1.35 1.24 1.00 ∞2.24 2.18 2.07 1.99 1.87 1.79 1.69 1.52 1.36 1.00

Fortsetzung Tabelle 4b: 0.975- und 0.995-Quantile der F -Verteilung

11 12 14 16 20 30 50 100 ∞ df1

df2

973 977 983 987 993 1001 1008 1013 1018 124334 24426 24572 24681 24836 25044 25211 25337 25500

39.4 39.4 39.4 39.4 39.4 39.5 39.5 39.5 39.5 2199 199 199 199 199 199 199 199 20014.4 14.3 14.3 14.2 14.2 14.1 14.0 14.0 13.9 343.5 43.4 43.2 43.0 42.8 42.5 42.2 42.0 41.88.79 8.75 8.69 8.64 8.56 8.46 8.38 8.32 8.26 420.8 20.7 20.5 20.4 20.2 19.9 19.7 19.5 19.36.57 6.52 6.46 6.41 6.33 6.23 6.14 6.08 6.02 513.5 13.4 13.2 13.1 12.9 12.7 12.5 12.3 12.15.41 5.37 5.30 5.25 5.17 5.07 4.98 4.92 4.85 610.1 10.0 9.88 9.76 9.59 9.36 9.17 9.03 8.884.71 4.67 4.60 4.54 4.47 4.36 4.28 4.21 4.14 78.27 8.18 8.03 7.93 7.75 7.53 7.35 7.22 7.084.24 4.20 4.13 4.08 4.00 3.89 3.81 3.74 3.67 87.10 7.01 6.87 6.76 6.61 6.40 6.22 6.09 5.953.91 3.87 3.80 3.74 3.67 3.56 3.47 3.40 3.33 96.31 6.23 6.09 5.98 5.83 5.62 5.45 5.32 5.193.66 3.62 3.55 3.50 3.42 3.31 3.22 3.15 3.08 105.75 5.66 5.53 5.42 5.27 5.07 4.90 4.77 4.643.47 3.43 3.36 3.30 3.23 3.12 3.03 2.96 2.88 115.32 5.24 5.10 5.00 4.86 4.65 4.49 4.36 4.233.32 3.28 3.21 3.15 3.07 2.96 2.87 2.80 2.72 124.99 4.91 4.77 4.67 4.53 4.33 4.17 4.04 3.903.20 3.15 3.08 3.03 2.95 2.84 2.74 2.67 2.60 134.72 4.64 4.51 4.41 4.27 4.07 3.91 3.78 3.653.09 3.05 2.98 2.92 2.84 2.73 2.64 2.56 2.49 144.51 4.43 4.30 4.20 4.06 3.86 3.70 3.57 3.443.01 2.96 2.89 2.84 2.76 2.64 2.55 2.47 2.40 154.33 4.25 4.12 4.02 3.88 3.69 3.52 3.39 3.26


11 12 14 16 20 30 50 100 ∞ df1

df2

2.93 2.89 2.82 2.76 2.68 2.57 2.47 2.40 2.32 164.18 4.10 3.97 3.87 3.73 3.54 3.37 3.25 3.112.87 2.82 2.75 2.70 2.62 2.50 2.41 2.33 2.25 174.05 3.97 3.84 3.75 3.61 3.41 3.25 3.12 2.982.81 2.77 2.70 2.64 2.56 2.44 2.35 2.27 2.19 183.94 3.86 3.73 3.64 3.50 3.30 3.14 3.01 2.872.76 2.72 2.65 2.59 2.51 2.39 2.30 2.22 2.13 193.84 3.76 3.64 3.54 3.40 3.21 3.04 2.91 2.782.72 2.68 2.60 2.55 2.46 2.35 2.25 2.17 2.09 203.76 3.68 3.55 3.46 3.32 3.12 2.96 2.83 2.692.65 2.60 2.53 2.47 2.39 2.27 2.17 2.09 2.00 223.61 3.54 3.41 3.31 3.18 2.98 2.82 2.69 2.552.59 2.54 2.47 2.41 2.33 2.21 2.11 2.02 1.94 243.50 3.42 3.30 3.20 3.06 2.87 2.70 2.57 2.432.54 2.49 2.42 2.36 2.28 2.16 2.05 1.97 1.88 263.40 3.33 3.20 3.11 2.97 2.77 2.61 2.47 2.332.49 2.45 2.37 2.32 2.23 2.11 2.01 1.92 1.83 283.32 3.25 3.12 3.03 2.89 2.69 2.53 2.39 2.252.46 2.41 2.34 2.28 2.20 2.07 1.97 1.88 1.79 303.25 3.18 3.06 2.96 2.82 2.63 2.46 2.32 2.182.43 2.38 2.31 2.25 2.16 2.04 1.93 1.85 1.75 323.20 3.12 3.00 2.90 2.77 2.57 2.40 2.26 2.112.40 2.35 2.28 2.22 2.13 2.01 1.90 1.82 1.72 343.15 3.07 2.95 2.85 2.72 2.52 2.35 2.21 2.062.37 2.33 2.25 2.20 2.11 1.99 1.88 1.79 1.69 363.10 3.03 2.90 2.81 2.67 2.48 2.30 2.17 2.012.33 2.29 2.21 2.15 2.07 1.94 1.83 1.74 1.64 403.03 2.95 2.83 2.74 2.60 2.40 2.23 2.09 1.932.26 2.22 2.14 2.08 1.99 1.87 1.75 1.66 1.55 502.90 2.82 2.70 2.61 2.47 2.27 2.10 1.95 1.792.22 2.17 2.09 2.03 1.94 1.82 1.70 1.60 1.48 602.82 2.74 2.62 2.53 2.39 2.19 2.01 1.86 1.692.18 2.14 2.06 2.00 1.91 1.78 1.66 1.56 1.44 702.76 2.68 2.56 2.47 2.33 2.13 1.95 1.80 1.622.12 2.08 2.00 1.94 1.85 1.71 1.59 1.48 1.35 1002.66 2.58 2.46 2.37 2.23 2.02 1.84 1.68 1.492.06 2.01 1.93 1.87 1.78 1.64 1.51 1.39 1.23 2002.54 2.47 2.35 2.25 2.11 1.91 1.71 1.54 1.311.99 1.94 1.87 1.80 1.71 1.57 1.43 1.30 1.00 ∞2.43 2.36 2.24 2.14 2.00 1.79 1.59 1.40 1.00

Tabelle 4b: Ausgewahlte 0.975- und 0.995-Quantile der F -Verteilung

Die Tabelle gibt jene Werte F0 einer F -verteilten Variablen mit bestimmterAnzahl von Freiheitsgraden an, fur welche gilt: P (F ≤ F0) = α.F ist stets der Quotient aus dem großeren durch den kleineren Wert.Fur die Werte in der jeweils oberen Zeile ist α = 0.975, fur jene der unterenZeile ist α = 0.995.df1 . . . Anzahl der Zahlerfreiheitsgrade,df2 . . . Anzahl der Nennerfreiheitsgrade.

df1 1 2 3 4 5 6 7 8 9 10

df21 648 800 864 900 922 937 948 957 963 969

16211 20000 21615 22500 23056 23437 23715 23925 24091 242242 38.5 39.0 39.2 39.2 39.3 39.3 39.4 39.4 39.4 39.4

198 199 199 199 199 199 199 199 199 1993 17.4 16.0 15.4 15.1 14.9 14.7 14.6 14.5 14.4 14.4

55.6 49.8 47.5 46.2 45.4 44.8 44.4 44.1 43.9 43.74 12.2 10.6 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84

31.3 26.3 24.3 23.2 22.5 22.0 21.6 21.4 21.1 21.05 10.0 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62

22.8 18.3 16.5 15.6 14.9 14.5 14.2 14.0 13.8 13.66 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46

18.6 14.5 12.9 12.0 11.5 11.1 10.8 10.6 10.4 10.27 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76

16.2 12.4 10.9 10.0 9.52 9.16 8.89 8.68 8.51 8.388 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30

14.7 11.0 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.219 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96

13.6 10.1 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.4210 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72

12.8 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.8511 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53

12.2 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 5.4212 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37

11.8 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.0913 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25

11.4 8.19 6.93 6.23 5.79 5.48 5.25 5.08 4.94 4.8214 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15

11.1 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.6015 6.20 4.76 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06

10.8 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42


df1 1 2 3 4 5 6 7 8 9 10

df216 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99

10.6 7.51 6.30 5.64 5.21 4.91 4.69 4.52 4.38 4.2717 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92

10.4 7.35 6.16 5.50 5.07 4.78 4.56 4.39 4.25 4.1418 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87

10.2 7.21 6.03 5.37 4.96 4.66 4.44 4.28 4.14 4.0319 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82

10.1 7.09 5.92 5.27 4.85 4.56 4.34 4.18 4.04 3.9320 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77

9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.8522 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76 2.70

9.73 6.81 5.65 5.02 4.61 4.32 4.11 3.94 3.81 3.7024 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64

9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.5926 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65 2.59

9.41 6.54 5.41 4.79 4.38 4.10 3.89 3.73 3.60 3.4928 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61 2.55

9.28 6.44 5.32 4.70 4.30 4.02 3.81 3.65 3.52 3.4230 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51

9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.3432 5.53 4.15 3.56 3.22 3.00 2.84 2.72 2.62 2.54 2.48

9.09 6.28 5.17 4.56 4.17 3.89 3.68 3.52 3.39 3.2934 5.50 4.12 3.53 3.19 2.97 2.81 2.69 2.59 2.52 2.45

9.01 6.22 5.11 4.50 4.11 3.84 3.63 3.47 3.34 3.2436 5.47 4.09 3.51 3.17 2.94 2.79 2.66 2.57 2.49 2.43

8.94 6.16 5.06 4.46 4.06 3.79 3.58 3.42 3.30 3.1940 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39

8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.1250 5.34 3.98 3.39 3.06 2.83 2.67 2.55 2.46 2.38 2.32

8.63 5.90 4.83 4.23 3.85 3.58 3.38 3.22 3.09 2.9960 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27

8.49 5.80 4.73 4.14 3.76 3.49 3.29 3.13 3.01 2.9070 5.25 3.89 3.31 2.98 2.75 2.60 2.48 2.38 2.30 2.24

8.40 5.72 4.65 4.08 3.70 3.43 3.23 3.08 2.95 2.85100 5.18 3.83 3.25 2.92 2.70 2.54 2.42 2.32 2.24 2.18

8.24 5.59 4.54 3.96 3.59 3.33 3.13 2.97 2.85 2.74200 5.10 3.76 3.18 2.85 2.63 2.47 2.35 2.26 2.18 2.11

8.06 5.44 4.41 3.84 3.47 3.21 3.01 2.85 2.73 2.63∞ 5.02 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11 2.05

7.88 5.30 4.28 3.72 3.35 3.09 2.90 2.74 2.62 2.52

Tabelle 4b: Ausgewahlte 0.975- und 0.995-Quantile der F -Verteilung

Die Tabelle gibt jene Werte F0 einer F -verteilten Variablen mit bestimmterAnzahl von Freiheitsgraden an, fur welche gilt: P (F ≤ F0) = α.F ist stets der Quotient aus dem großeren durch den kleineren Wert.Fur die Werte in der jeweils oberen Zeile ist α = 0.975, fur jene der unterenZeile ist α = 0.995.df1 . . . Anzahl der Zahlerfreiheitsgrade,df2 . . . Anzahl der Nennerfreiheitsgrade.

df1 1 2 3 4 5 6 7 8 9 10

df21 648 800 864 900 922 937 948 957 963 969

16211 20000 21615 22500 23056 23437 23715 23925 24091 242242 38.5 39.0 39.2 39.2 39.3 39.3 39.4 39.4 39.4 39.4

198 199 199 199 199 199 199 199 199 1993 17.4 16.0 15.4 15.1 14.9 14.7 14.6 14.5 14.4 14.4

55.6 49.8 47.5 46.2 45.4 44.8 44.4 44.1 43.9 43.74 12.2 10.6 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84

31.3 26.3 24.3 23.2 22.5 22.0 21.6 21.4 21.1 21.05 10.0 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62

22.8 18.3 16.5 15.6 14.9 14.5 14.2 14.0 13.8 13.66 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46

18.6 14.5 12.9 12.0 11.5 11.1 10.8 10.6 10.4 10.27 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76

16.2 12.4 10.9 10.0 9.52 9.16 8.89 8.68 8.51 8.388 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30

14.7 11.0 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.219 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96

13.6 10.1 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.4210 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72

12.8 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.8511 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53

12.2 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 5.4212 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37

11.8 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.0913 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25

11.4 8.19 6.93 6.23 5.79 5.48 5.25 5.08 4.94 4.8214 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15

11.1 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.6015 6.20 4.76 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06

10.8 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42


df1 1 2 3 4 5 6 7 8 9 10

df216 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99

10.6 7.51 6.30 5.64 5.21 4.91 4.69 4.52 4.38 4.2717 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92

10.4 7.35 6.16 5.50 5.07 4.78 4.56 4.39 4.25 4.1418 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87

10.2 7.21 6.03 5.37 4.96 4.66 4.44 4.28 4.14 4.0319 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82

10.1 7.09 5.92 5.27 4.85 4.56 4.34 4.18 4.04 3.9320 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77

9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.8522 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76 2.70

9.73 6.81 5.65 5.02 4.61 4.32 4.11 3.94 3.81 3.7024 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64

9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.5926 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65 2.59

9.41 6.54 5.41 4.79 4.38 4.10 3.89 3.73 3.60 3.4928 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61 2.55

9.28 6.44 5.32 4.70 4.30 4.02 3.81 3.65 3.52 3.4230 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51

9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.3432 5.53 4.15 3.56 3.22 3.00 2.84 2.72 2.62 2.54 2.48

9.09 6.28 5.17 4.56 4.17 3.89 3.68 3.52 3.39 3.2934 5.50 4.12 3.53 3.19 2.97 2.81 2.69 2.59 2.52 2.45

9.01 6.22 5.11 4.50 4.11 3.84 3.63 3.47 3.34 3.2436 5.47 4.09 3.51 3.17 2.94 2.79 2.66 2.57 2.49 2.43

8.94 6.16 5.06 4.46 4.06 3.79 3.58 3.42 3.30 3.1940 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39

8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.1250 5.34 3.98 3.39 3.06 2.83 2.67 2.55 2.46 2.38 2.32

8.63 5.90 4.83 4.23 3.85 3.58 3.38 3.22 3.09 2.9960 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27

8.49 5.80 4.73 4.14 3.76 3.49 3.29 3.13 3.01 2.9070 5.25 3.89 3.31 2.98 2.75 2.60 2.48 2.38 2.30 2.24

8.40 5.72 4.65 4.08 3.70 3.43 3.23 3.08 2.95 2.85100 5.18 3.83 3.25 2.92 2.70 2.54 2.42 2.32 2.24 2.18

8.24 5.59 4.54 3.96 3.59 3.33 3.13 2.97 2.85 2.74200 5.10 3.76 3.18 2.85 2.63 2.47 2.35 2.26 2.18 2.11

8.06 5.44 4.41 3.84 3.47 3.21 3.01 2.85 2.73 2.63∞ 5.02 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11 2.05

7.88 5.30 4.28 3.72 3.35 3.09 2.90 2.74 2.62 2.52

Tabelle 3: Ausgewahlte Quantile der t-Verteilung

Die Tabelle gibt ausgewahlte α-Quantile der t-Verteilung fur verschiedeneFreiheitsgrade an (jene Werte t0, fur welche gilt P (t ≤ t0) = α)

α0.90 0.95 0.975 0.99 0.995 0.999 0.9995

df1 3.08 6.31 12.71 31.82 63.66 318.31 636.622 1.89 2.92 4.30 6.97 9.93 22.33 31.603 1.64 2.35 3.18 4.54 5.84 10.21 12.924 1.53 2.13 2.78 3.75 4.60 7.17 8.61

5 1.48 2.02 2.57 3.37 4.03 5.89 6.876 1.44 1.94 2.45 3.14 3.71 5.21 5.967 1.42 1.90 2.37 3.00 3.50 4.79 5.418 1.40 1.86 2.31 2.90 3.36 4.50 5.049 1.38 1.83 2.26 2.82 3.25 4.30 4.78

10 1.37 1.81 2.23 2.76 3.17 4.14 4.5911 1.36 1.80 2.20 2.72 3.11 4.03 4.4412 1.36 1.78 2.18 2.68 3.06 3.93 4.3213 1.35 1.77 2.16 2.65 3.01 3.85 4.2214 1.35 1.76 2.15 2.62 2.98 3.79 4.14

15 1.34 1.75 2.13 2.60 2.95 3.73 4.0716 1.34 1.75 2.12 2.58 2.92 3.69 4.0217 1.33 1.74 2.11 2.57 2.90 3.65 3.9718 1.33 1.73 2.10 2.55 2.88 3.61 3.9219 1.33 1.73 2.09 2.54 2.86 3.58 3.88

20 1.33 1.73 2.09 2.53 2.85 3.55 3.8521 1.32 1.72 2.08 2.52 2.83 3.53 3.8222 1.32 1.72 2.07 2.51 2.82 3.51 3.7923 1.32 1.71 2.07 2.50 2.81 3.49 3.7724 1.32 1.71 2.06 2.49 2.80 3.47 3.75

25 1.32 1.71 2.06 2.49 2.79 3.45 3.7326 1.32 1.71 2.06 2.48 2.78 3.44 3.7127 1.31 1.70 2.05 2.47 2.77 3.42 3.6928 1.31 1.70 2.05 2.47 2.76 3.41 3.6729 1.31 1.70 2.05 2.46 2.76 3.40 3.66

30 1.31 1.70 2.04 2.46 2.75 3.39 3.6540 1.30 1.68 2.02 2.42 2.70 3.31 3.5660 1.30 1.67 2.00 2.39 2.66 3.23 3.46

120 1.29 1.66 1.98 2.36 2.62 3.16 3.37∞ 1.28 1.65 1.96 2.33 2.58 3.09 3.29

Konfidenzintervalle und Statistische Tests



25. Mai 2011

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 1/39

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Allgemeines

I Wir interessieren uns fur einen unbekannten wahren Parameterθ, der die Verteilung einer Zufallsvariable charakterisiert

I θ wird durch eine Schatzfunktion Θ aus einer(reprasentativen) Stichprobe mit Umfang n geschatzt

I Es wird davon ausgegangen, dass die Stichprobe in etwa dieGrundgesamtheit widerspiegelt, und dass deshalb dieSchatzung in der Nahe des wahren Parameters liegen musste

I Die Schatzfunktion ist selbst eine Zufallsvariable mit einerVerteilung, die den Parameter θ enthalt

I Bei der Schatzung von Parametern geht es nicht nur darum,Schatzfunktionen zu finden und deren Eigenschaften(Erwartungstreue, Konsistenz, etc.) abzuklaren



AllgemeinesI Man mochte auch Intervalle angeben, in welchen θ mit einer

gewissen Sicherheit liegtI Es sei α eine vorgegebene Irrtumswahrscheinlichkeit, und a

bzw. b reelle Zahlen, mit a ≤ b. Die Schatzung des Bereichesa ≤ θ ≤ b mit der Vertrauenswahrscheinlichkeit (1− α)nennen wir Konfidenzintervall des Parameters θ mitIrrtumswahrscheinlichkeit α

I Θ Punktschatzung von θ, im Vergleich zur IntervallschatzungI Wir konstruieren ein symmetrisches Konfidenzintervall auf

Grundlage einer Schatzfunktion ΘI Von besonderem Interesse ist die Breite des

Konfidenzintervalls. Diese bestimmt sich durch dieStandardabweichung von Θ

I Erwunscht ist in der Regel ein moglichst schmalesKonfidenzintervall, denn dies weist auf eine genaue Schatzunghin



Uberblick

I Konfidenzintervall fur den Parameter p einer B(n, p) Variable

I Konfidenzintervall fur den Erwartungswert µ einer N(µ, σ2)Variable bei bekannter Varianz σ2

I Konfidenzintervall fur den Erwartungswert µ einer N(µ, σ2)Variable bei unbekannter Varianz σ2

I Naherungsweises Konfidenzintervall fur den Erwartungswert µeiner Variable mit unbekannter Verteilung

I Konfidenzintervall fur die Varianz σ2 einer N(µ, σ2) Variable



KI fur p einer B(n, p)

I Befragung einer Zufallsstichprobe von n Personen aus einerunendlichen Population zu einem Thema mitAntwortkategorien ja/nein

I k ist die Anzahl der ’ja’ Antworten in der Stichprobe

I r = kn die entsprechende relative Haufigkeit

I p = P (’ja’) ist der wahre (unbekannte) Anteil derJa-Stimmen in der Population

I r ist ein erwartungstreuer Schatzer fur p

I K ist jene Zufallsvariable, die durch wiederholte Ziehungunabhangiger Stichproben vom Umfang n aus der unendlichenPopulation entsteht, R ist die entsprechende Zufallsvariableder relativen Haufigkeiten




I K ∼ B(n, p)

I Wenn np ≥ 5 und n(1− p) ≥ 5 darf die Binomialverteilungnaherungsweise durch die N(np, np(1− p)) ersetzt werden

I K ∼a N(np, np(1− p)) und auch

I R ∼a N(npn ,

np(1−p)n2 ) = N(p, p(1−p)

n )

I Um die Tabelle der N(0, 1) fur die Bestimmung derEndpunkte des Konfidenzintervalls anwenden zu konnen,standardisieren wir R

I

Z =R − E (R)

σR=

R − p√p(1−p)

n

∼ N(0, 1)

I Sei α = 0.05




Tabelle 1b: P(−1.96 ≤ Z ≤ 1.96) = 0.95




I Fur 95% aller Stichproben mit Umfang n gilt

|Z | =|R − p|√

p(1−p)n

≤ 1.96

I Wir ersetzen σR durch einen Schatzer σR

σR =

√p(1− p)

n, σR =

√r(1− r)

n − 1

I Also gilt fur 95% aller Stichproben mit Umfang n

|R − p| ≤ 1.96

√r(1− r)

n − 1

I Grundlage fur ein KI mit einer Irrtumswahrscheinlichkeitα = 0.05




I Die Grenzen des KI mit Irrtumswahrscheinlichkeit α = 0.05werden wie folgt bestimmt

p1,2 = r ± 1.96

√r(1− r)

n − 1

I Allgemeiner fur beliebige Irrtumswahrscheinlichkeit α

p1,2 = r ± z1−α2

√r(1− r)

n − 1

I KI ist symmetrisch um den Punkt r , symmetrisches KI




I Bei gegebenem p hangt die Breite des KI von zwei Faktorenab: der gewunschten Sicherheit und dem Stichprobenumfang

I Je hoher die Sicherheit, desto kleiner dieIrrtumswahrscheinlichkeit α, desto großer wird z1−α

2, und

desto breiter das Intervall

I Je großer die Stichprobe, desto kleiner wird σR und dessenSchatzung σR , und desto schmaler das Intervall

I Interpretation des KI: Werden immer wieder unabhangigeStichproben vom Umfang n gezogen, und wird fur jede dieserStichproben p = r gerechnet, so liegt p in (1− α) Prozentdieser Stichproben innerhalb des Intervalles [p1, p2]. DerParameter p wird mit einer Vertrauenswahrscheinlichkeit von(1− α) vom Intervall [p1, p2] uberdeckt




I Beispiel: Es wurden n = 200 Personen befragt, von denenk = 78 mit ’ja’ geantwortet haben. α = 0.05, bzw. α = 0.01

I r = p = 78200 = 0.39

I

p1,2 = 0.39± 1.96

√(0.39)(0.61)

199= 0.39± 0.068

p1,2 = 0.39± 2.58

√(0.39)(0.61)

199= 0.39± 0.089

I

p1,2 = [0.322, 0.458] p1,2 = [0.301, 0.479]



KI in SPSSFile: SPSS-Konfidenzintervalle.sav;Konfidenzintervall fur Anteil der Haustierbesitzer (n = 166,α = 0.05)Deskriptive Statistiken → Explorative Datenanalyse





KI fur µ einer N(µ, σ2) bei bekanntem σ2

I Die Normalverteilung ist eine reproduzierende Verteilung

I Seien X1,X2, . . . ,Xn voneinander unabhangig normalverteilteZufallsvariablen mit Erwartungswerten µ1, µ2, . . . , µn undVarianzen σ2

1, σ22, . . . , σ

2n. Dann ist die Zufallsvariable

Y = X1 + X2 + . . .+ Xn ebenfalls normalverteilt mitE [Y ] = µ1 + µ2 + . . .+ µn und σ2

Y = σ21 + σ2

2 + . . .+ σ2n

I Wie ist die Verteilung von Mittelwerten x einernormalverteilten Variable?

I X sei N(µ, σ2)




I Wir ziehen unabhangige Zufallsstichproben vom Umfang n.Die Mittelwerte x aller Zufallsstichproben erzeugen eineVariable X = 1

n (X1 + X2 + . . .+ Xn)

I X ist abgesehen von der multiplikativen Konstante 1n eine

Summe normalverteilter Variablen, und es gilt

X ∼ N(µ,σ2

n)

I Wenn X normalverteilt ist, hat X wiederum Normalverteilungmit dem selben Erwartungswert, aber wesentlich kleinererVarianz σ2

n

I Die Mittelwerte aus Stichproben vom Umfang n gruppierensich also enger zusammen als die Messwerte




I Wir verwenden die Verteilung von X um ein KI fur µaufzustellen

I Standardisieren der normalverteilten Variable X

Z =X − µ

σ√n

I Es gilt fur (1− α)% aller Stichproben mit Umfang n

|x − µ| ≤ z1−α2

σ√n

I

µ1,2 = x ± z1−α2

σ√n




I Die Breite des KI hangt von 3 Faktoren ab: von der Streuungder Variable X bzw. σ, von n, und von derIrrtumswahrscheinlichkeit α

I Je kleiner σ, desto enger das KI

I Je großer die Stichprobe, desto enger das KI

I Je kleiner α, desto breiter das KI

I Beispiel: Eine Stichprobe von n = 234 14-jahrigenSchulerInnen wurde mit einem Intelligenztest, der fur 14-18jahrige Jugendliche normiert wurde, getestet. Der Mittelwertder 14-Jahrigen ist x = 98.10. In der Gesamtpopulation allerJugendlichen wurde der Test so geeicht, dass die Messwertenormalverteilt mit µ = 100 und σ = 15 sind.

I In welchem Bereich liegt der Erwartungswert der 14-Jahrigen,µ14 (α = 0.05)?




I

µ1,2 = 98.10± 1.9615√234

= 98.10± 1.92

I µ14 wird mit einer Vertrauenswahrscheinlichkeit von 0.95 vomKI [96.18, 100.02] uberdeckt

I Berechnung des KI beruht auf der Voraussetzung, dass σ2

bekannt und gultig auch fur die Teilpopulation der14-Jahrigen ist

I Es kommt selten vor, dass σ2 bekannt ist

I Typischer ist der Fall unbekannter Varianz



KI fur µ einer N(µ, σ2) bei unbekanntem σ2

I Unbekannte Varianz σ2 wird aus den vorliegenden Datengeschatzt

σ2 =1

n − 1

n∑i=1

(xi − x)2

I Anstelle der Verteilung

Z =X − µ

σ√n

∼ N(0, 1)

I wird folgender Ausdruck als Grundlage fur das KI verwendet

T =X − µ

σ√n

∼ t(n−1)




I Das KI fur µ ergibt sich aus∣∣X − µ∣∣σ√n

≤ t1−α2, df = n − 1

I Mit Irrtumswahrscheinlichkeit α gilt

|x − µ| ≤ t1−α2

σ√n, df = n − 1

I Und schließlich das KI

µ1,2 = x ± t1−α2

σ√n, df = n − 1




I Beispiel: Der Subtest ’Rechenaufgaben’ eines Intelligenztestswird einer Zufallsstichprobe von n = 87 15-jahrigen WienerHauptschulabsolventInnen vorgegeben, wobei x = 25.48 unds = 6.12. Gesucht ist das Konfidenzintervall fur denErwartungswert µ der Population der WienerHauptschulabsolventInnen (α = 0.05 bzw. 0.01)

I

µ1,2 = 25.48± t1−α2

6.12√87, df = 86




I Tabelle enthalt keine Eintragung fur df = 86, abernachstgelegene Wert ist df = 60; t0.975 = 2.00 bzw.t0.995 = 2.66

µ1,2 = 25.48± (2.00)6.12√

87, µ1,2 = 25.48± (2.66)

6.12√87

I µ liegt mit einer Irrtumswahrscheinlichkeit α = 0.05 bzw. 0.01im Intervall [24.17, 26.79] bzw. [23.74, 27.23]



Naherungsweises KI fur µ einer Variable mit unbekannterVerteilung

I Normalverteilung der betrachteten Variable X war Grundlagefur alle dargestellten KI

I Was tun, wenn die Normalverteilungsannahme nichtgerechtfertigt erscheint?

I KI bleiben naherungsweise gultig wegen ZentralemGrenzwertsatz

I Gute der Naherung hangt von der Verteilung von X und demStichprobenumfang n ab

I Bei kleinem n sollte sich die Verteilung von X nicht allzusehrvon einer Normalverteilung entfernen

I Großes n kann praktisch jede Abweichung von derNormalverteilung kompensieren



KI fur σ2 einer N(µ, σ2)

I Ebenso wichtig wie die Verteilung von X ist auch jene von S2,wobei S2 jene Variable bezeichnet, die durch wiederholtesZiehen von Zufallsstichproben vom Umfang n und Berechnungvon s2 in dieser Stichprobe entsteht

I Um σ2 zu schatzen, verwenden wir

S2 =1

n − 1

n∑i=1

(xi − x)2 = σ2 1

n − 1

n∑i=1

(xi − x

σ

)2

︸︷︷︸∼χ2

(n−1)

I

S2 =σ2

n − 1χ2

(n−1) oderχ2

(n−1)

n − 1=

S2

σ2




I Grundlage fur Aufstellung eines KI fur σ2

I

(n − 1)S2

χ2(n−1)

= σ2

I KI mit Irrtumswahrscheinlichkeit α und Freiheitsgradendf = n − 1

(n − 1)s2

χ2α2

≥ σ2 ≥ (n − 1)s2

χ21−α

2

I Beispiel: Angenommen, s = 14.7 fur eine normalverteilteVariable in einer Stichprobe von (n = 234) Personen: inwelchem Bereich vermuten wir σ2 fur die entsprechendePopulation (α = 0.05)?

I Tabelle enthalt fur df = 233 keine Eintragungen ⇒asymptotische Entwicklung




I Bei df →∞ strebt χ2 gegen die Normalverteilung N(df , 2df )

I

z0.975 = 1.96 =χ2

0.975 − 233√466

χ20.975 = 233 + 1.96

√466 = 275.3

z0.025 = −1.96 =χ2

0.025 − 233√466

χ20.025 = 233− 1.96

√466 = 190.7

I KI fur die Varianz

23314.72

275.3≤ σ2 ≤ 233

14.72

190.7⇒ 182.89 ≤ σ2 ≤ 264.02




I Beispiel: Wie vorhin, aber mit einer Stichprobe vom Umfangn = 24

I Aus Tabelle fur df = 23

χ20.975 = 38.08 χ2

0.025 = 11.69

I KI fur σ2

2314.72

38.08≤ σ2 ≤ 23

14.72

11.69⇒ 130.52 ≤ σ2 ≤ 425.16

I Wir sehen, dass die kleine Stichprobe zu einerunzuverlassigeren Schatzung (breiteres KI) der Varianz fuhrt



AllgemeinesI Ein statistischer Test ist ein Entscheidungsverfahren, das nach

Sammlung von empirischer Information (Daten) eineEntscheidung uber a priori formulierte Vermutungen(Hypothesen) trifft

I Der statistische Test basiert auf der Formulierung zweierkomplementarer Hypothesen (Null- und Alternativ) bezuglicheines unbekannten Parameters bzw. der Verteilungsform derGrundgesamtheit, auf welche man durch eine Stichprobeschließen mochte

I Ziel: Fur eine der zwei Hypothesen entscheiden mit moglichstkleinem Risiko

I Da die vorhandenen Daten Realisationen von Zufallsvariablensind, lasst sich niemals mit Sicherheit sagen, ob eineHypothese stimmt oder nicht. Man versucht daher, dieWahrscheinlichkeiten fur Fehlentscheidungen zu kontrollieren



Grundlagen

I Hypothese: eine anhand empirischer Daten zu prufendeAnnahme. Wir unterscheiden als Gegensatzpaar zwischen derNullhypothese, H0, und der Alternativhypothese, H1

I Die H0 formuliert eine a priori Vermutung uber die Verteilungeiner Zufallsvariable oder den Wert θ0 eines Parameters θ. H0:θ = θ0. Die H0 beinhaltet diejenige Aussage, welche falsifiziertwerden soll

I Die H0 ist fur die Entscheidung von zentraler Bedeutung: sielegt die Annahmen fur die Formulierung einesWahrscheinlichkeitsmodells fest; bei Gultigkeit der H0 ist dieVerteilung der Prufgroße bekannt

I Zu jeder H0 wird eine H1 formuliert, z.B. H1: θ > θ0, oderH1: θ < θ0, oder H1: θ 6= θ0. Die H1 enthalt die Aussage, dieman aufzeigen mochte



Grundlagen

I Ein statistisches Testverfahren lasst sich im Prinzip mit einemGerichtsverfahren vergleichen. Es wird immer von derUnschuld eines Verdachtigen ausgegangen. Nur, wenn dieIndizien fur die Schuld eines Angeklagten deutlich uberwiegen,kommt es zu einer Verurteilung

I Es gibt zu Beginn des Verfahrens die beiden Hypothesen H0:’der Verdachtige ist unschuldig’, und H1: ’der Verdachtige istschuldig’

I Um einen Unschuldigen nicht zu schnell zu verurteilen, wirddie Hypothese der Unschuld erst dann verworfen, wenn einIrrtum sehr unwahrscheinlich ist



Grundlagen

I Wir definieren zwei Wahrscheinlichkeiten: DieWahrscheinlichkeit fur einen Fehler erster Art (das Verurteilendes Unschuldigen) und die Wahrscheinlichkeit fur einen Fehlerzweiter Art (das Freisprechen des Schuldigen)

I

P(Fehler erster Art) = α = P(H0 verwerfen|H0 wahr)

P(Fehler zweiter Art) = β = P(H0 beibehalten|H0 falsch)

I Wir berechnen die Wahrscheinlichkeit fur die empirischerhobenen Daten unter der Annahme, dass H0 gilt

I Ist das empirische Ergebnis bei Gultigkeit der H0 sehrunwahrscheinlich, nehmen wir an, dass H0 nicht wahr ist undverwerfen die H0



Beispiel: Binomialtest

I Ein statistischer Test zur Uberprufung von hellseherischenFahigkeiten.

I Wir zeigen einer Person 25 Mal die Ruckseite einer reinzufallig gewahlten Spielkarte und fragen sie jeweils danach, zuwelcher der vier Farben (Kreuz, Pik, Herz, Karo) die Kartegehort. Unsere ZV X erfasst die Anzahl der Treffer

I H0 besagt, die Person sei nicht hellseherisch begabt; die H1

besagt, die Person hat hellseherische Fahigkeiten;

I Formal:

H0 : p =1

4, und H1 : p >

1

4



PrinzipI Unter Annahme der Gultigkeit der H0 ist X ∼ B(25, 1

4)I Wenn die Person alle 25 Karten richtig benennt, werden wir

sie als Hellseher betrachten, und die H0 verwerfen, mit 24oder 23 Treffern vermutlich auch

I Wo liegt aber die kritische Anzahl an Treffern k, von der anwir nicht mehr glauben konnen, es seien reine Zufallstreffer?

I In der Praxis kommt es darauf an, wie oft man eineFehlentscheidung erster Art zulassen will

I Mit k = 24 ist die Wahrscheinlichkeit einer solchenFehlentscheidung P(H0 verwerfen | H0 wahr)

P(X ≥ 24) = P(X = 24) + P(X = 25) = (0.675)(10−13)

I Mit k = 10 erhalten wir eine etwas großere Wahrscheinlichkeit

P(X ≥ 10) = 0.07



Prinzip

I Wir brauchen eine Entscheidungsregel

I In der Praxis wird die obere Grenze fur die Wahrscheinlichkeiteiner Fehlentscheidung erster Art a priori festgesetzt(Signifikanzniveau). Typische Werte sind 0.01 und 0.05

I Beispiel Binomialtest: Kann man von hellseherischenFahigkeiten einer Person ausgehen (α = 0.01)?

I Angenommen, die Person erzielt 18 Treffer.

I H0: p = 14 , H1: p > 1

4 . Unsere Zufallsvariable X hat unterAnnahme, die H0 sei wahr, eine B(25, 1

4)

I Dieses Hypothesenpaar teilt unter Annahme der Gultigkeit vonH0 und dem Signifikanzniveau α alle Realisationen(Stichproben) von X in zwei Bereiche: den Annahmebereichund den Verwerfungsbereich der H0 in Relation zur H1



Prinzip



Prinzip

I Wie wahrscheinlich ist es, tatsachlich dieses (oder ein nochextremeres Ergebnis) unter der Annahme, die H0 sei wahr, zubeobachten?

I Die Teststatistik errechnet sich aus der vorhandenenStichprobe und H0. Mithilfe der Teststatistik wird eineEntscheidungsregel fur oder gegen die H0 erstellt

P(X ≥ 18) =25∑

x=18

(25

x

)(1

4

)x (3

4

)(25−x)

P(X ≥ 18) = 0.000001 ≤ α = 0.01

I Unter H0 ist die Wahrscheinlichkeit, dieses Ergebnis (oder einnoch extremeres) zu bekommen, kleiner als das von unsangenommene Risiko fur einen Fehler erster Art, d.h. bei derVerwerfung der H0 eine falsche Entscheidung zu treffen



Prinzip



Prinzip

I Entscheidungsregel: Liegt die Teststatistik imVerwerfungsbereich, wird die H0 verworfen. Liegt dieTeststatistik im Annahmebereich, wird die H0 beibehalten(’Freispruch aus Mangel an Beweisen’).

I Aufgrund der Entscheidungsregel wird die H0: p = 14

zugunsten der H1: p > 14 mit einem Irrtumsrisiko von

0.000001 verworfen. Das Ergebnis ist signifikant

I Auch wenn es wunschenswert ist, dass der Test aufgrund dervorliegenden Daten ’richtig’ entscheidet, besteht dieMoglichkeit von Fehlentscheidungen. Bei richtiger H0 undEntscheidung fur H1 (Fehler erster Art oder α-Fehler), bzw.bei falscher H0 und Entscheidung fur die H0 (Fehler zweiterArt oder β-Fehler)

I ’Entscheiden’ ist immer an ein Risiko fur Fehler gebunden



Vorgangsweise

I Formulierung eines Hypothesenpaares, H0 bzw. H1, undAuswahl eines Signifikanzniveaus α vor Realisation derStichprobe

I Bestimmung der Verteilung der Teststatistik unter Gultigkeitder H0

I Verwerfungsbereich beinhaltet die α% extremsten Falle dieserVerteilung zugunsten der H1

I Berechnung der Teststatistik bei der vorhandenen Stichprobe.Liegt das Ergebnis im Verwerfungsbereich, so wird die H0

verworfen, andernfalls wird die H0 beibehalten


Konfidenzintervalle und Statistische Tests



25. Mai 2011



Allgemeines

I Wir interessieren uns fur einen unbekannten wahren Parameterθ, der die Verteilung einer Zufallsvariable charakterisiert

I θ wird durch eine Schatzfunktion Θ aus einer(reprasentativen) Stichprobe mit Umfang n geschatzt

I Es wird davon ausgegangen, dass die Stichprobe in etwa dieGrundgesamtheit widerspiegelt, und dass deshalb dieSchatzung in der Nahe des wahren Parameters liegen musste

I Die Schatzfunktion ist selbst eine Zufallsvariable mit einerVerteilung, die den Parameter θ enthalt

I Bei der Schatzung von Parametern geht es nicht nur darum,Schatzfunktionen zu finden und deren Eigenschaften(Erwartungstreue, Konsistenz, etc.) abzuklaren



AllgemeinesI Man mochte auch Intervalle angeben, in welchen θ mit einer

gewissen Sicherheit liegtI Es sei α eine vorgegebene Irrtumswahrscheinlichkeit, und a

bzw. b reelle Zahlen, mit a ≤ b. Die Schatzung des Bereichesa ≤ θ ≤ b mit der Vertrauenswahrscheinlichkeit (1− α)nennen wir Konfidenzintervall des Parameters θ mitIrrtumswahrscheinlichkeit α

I Θ Punktschatzung von θ, im Vergleich zur IntervallschatzungI Wir konstruieren ein symmetrisches Konfidenzintervall auf

Grundlage einer Schatzfunktion ΘI Von besonderem Interesse ist die Breite des

Konfidenzintervalls. Diese bestimmt sich durch dieStandardabweichung von Θ

I Erwunscht ist in der Regel ein moglichst schmalesKonfidenzintervall, denn dies weist auf eine genaue Schatzunghin



Uberblick

I Konfidenzintervall fur den Parameter p einer B(n, p) Variable

I Konfidenzintervall fur den Erwartungswert µ einer N(µ, σ2)Variable bei bekannter Varianz σ2

I Konfidenzintervall fur den Erwartungswert µ einer N(µ, σ2)Variable bei unbekannter Varianz σ2

I Naherungsweises Konfidenzintervall fur den Erwartungswert µeiner Variable mit unbekannter Verteilung

I Konfidenzintervall fur die Varianz σ2 einer N(µ, σ2) Variable




I Befragung einer Zufallsstichprobe von n Personen aus einerunendlichen Population zu einem Thema mitAntwortkategorien ja/nein

I k ist die Anzahl der ’ja’ Antworten in der Stichprobe

I r = kn die entsprechende relative Haufigkeit

I p = P (’ja’) ist der wahre (unbekannte) Anteil derJa-Stimmen in der Population

I r ist ein erwartungstreuer Schatzer fur p

I K ist jene Zufallsvariable, die durch wiederholte Ziehungunabhangiger Stichproben vom Umfang n aus der unendlichenPopulation entsteht, R ist die entsprechende Zufallsvariableder relativen Haufigkeiten




I K ∼ B(n, p)

I Wenn np ≥ 5 und n(1− p) ≥ 5 darf die Binomialverteilungnaherungsweise durch die N(np, np(1− p)) ersetzt werden

I K ∼a N(np, np(1− p)) und auch

I R ∼a N(npn ,

np(1−p)n2 ) = N(p, p(1−p)

n )

I Um die Tabelle der N(0, 1) fur die Bestimmung derEndpunkte des Konfidenzintervalls anwenden zu konnen,standardisieren wir R

I

Z =R − E (R)

σR=

R − p√p(1−p)

n

∼ N(0, 1)

I Sei α = 0.05




Tabelle 1b: P(−1.96 ≤ Z ≤ 1.96) = 0.95




I Fur 95% aller Stichproben mit Umfang n gilt

|Z | =|R − p|√

p(1−p)n

≤ 1.96

I Wir ersetzen σR durch einen Schatzer σR

σR =

√p(1− p)

n, σR =

√r(1− r)

n − 1

I Also gilt fur 95% aller Stichproben mit Umfang n

|R − p| ≤ 1.96

√r(1− r)

n − 1

I Grundlage fur ein KI mit einer Irrtumswahrscheinlichkeitα = 0.05




I Die Grenzen des KI mit Irrtumswahrscheinlichkeit α = 0.05werden wie folgt bestimmt

p1,2 = r ± 1.96

√r(1− r)

n − 1

I Allgemeiner fur beliebige Irrtumswahrscheinlichkeit α

p1,2 = r ± z1−α2

√r(1− r)

n − 1

I KI ist symmetrisch um den Punkt r , symmetrisches KI




I Bei gegebenem p hangt die Breite des KI von zwei Faktorenab: der gewunschten Sicherheit und dem Stichprobenumfang

I Je hoher die Sicherheit, desto kleiner dieIrrtumswahrscheinlichkeit α, desto großer wird z1−α

2, und

desto breiter das Intervall

I Je großer die Stichprobe, desto kleiner wird σR und dessenSchatzung σR , und desto schmaler das Intervall

I Interpretation des KI: Werden immer wieder unabhangigeStichproben vom Umfang n gezogen, und wird fur jede dieserStichproben p = r gerechnet, so liegt p in (1− α) Prozentdieser Stichproben innerhalb des Intervalles [p1, p2]. DerParameter p wird mit einer Vertrauenswahrscheinlichkeit von(1− α) vom Intervall [p1, p2] uberdeckt




I Beispiel: Es wurden n = 200 Personen befragt, von denenk = 78 mit ’ja’ geantwortet haben. α = 0.05, bzw. α = 0.01

I r = p = 78200 = 0.39

I

p1,2 = 0.39± 1.96

√(0.39)(0.61)

199= 0.39± 0.068

p1,2 = 0.39± 2.58

√(0.39)(0.61)

199= 0.39± 0.089

I

p1,2 = [0.322, 0.458] p1,2 = [0.301, 0.479]



KI in SPSSFile: SPSS-Konfidenzintervalle.sav;Konfidenzintervall fur Anteil der Haustierbesitzer (n = 166,α = 0.05)Deskriptive Statistiken → Explorative Datenanalyse






I Die Normalverteilung ist eine reproduzierende Verteilung

I Seien X1,X2, . . . ,Xn voneinander unabhangig normalverteilteZufallsvariablen mit Erwartungswerten µ1, µ2, . . . , µn undVarianzen σ2

1, σ22, . . . , σ

2n. Dann ist die Zufallsvariable

Y = X1 + X2 + . . .+ Xn ebenfalls normalverteilt mitE [Y ] = µ1 + µ2 + . . .+ µn und σ2

Y = σ21 + σ2

2 + . . .+ σ2n

I Wie ist die Verteilung von Mittelwerten x einernormalverteilten Variable?

I X sei N(µ, σ2)




I Wir ziehen unabhangige Zufallsstichproben vom Umfang n.Die Mittelwerte x aller Zufallsstichproben erzeugen eineVariable X = 1

n (X1 + X2 + . . .+ Xn)

I X ist abgesehen von der multiplikativen Konstante 1n eine

Summe normalverteilter Variablen, und es gilt

X ∼ N(µ,σ2

n)

I Wenn X normalverteilt ist, hat X wiederum Normalverteilungmit dem selben Erwartungswert, aber wesentlich kleinererVarianz σ2

n

I Die Mittelwerte aus Stichproben vom Umfang n gruppierensich also enger zusammen als die Messwerte




I Wir verwenden die Verteilung von X um ein KI fur µaufzustellen

I Standardisieren der normalverteilten Variable X

Z =X − µ

σ√n

I Es gilt fur (1− α)% aller Stichproben mit Umfang n

|x − µ| ≤ z1−α2

σ√n

I

µ1,2 = x ± z1−α2

σ√n




I Die Breite des KI hangt von 3 Faktoren ab: von der Streuungder Variable X bzw. σ, von n, und von derIrrtumswahrscheinlichkeit α

I Je kleiner σ, desto enger das KI

I Je großer die Stichprobe, desto enger das KI

I Je kleiner α, desto breiter das KI

I Beispiel: Eine Stichprobe von n = 234 14-jahrigenSchulerInnen wurde mit einem Intelligenztest, der fur 14-18jahrige Jugendliche normiert wurde, getestet. Der Mittelwertder 14-Jahrigen ist x = 98.10. In der Gesamtpopulation allerJugendlichen wurde der Test so geeicht, dass die Messwertenormalverteilt mit µ = 100 und σ = 15 sind.

I In welchem Bereich liegt der Erwartungswert der 14-Jahrigen,µ14 (α = 0.05)?




I

µ1,2 = 98.10± 1.9615√234

= 98.10± 1.92

I µ14 wird mit einer Vertrauenswahrscheinlichkeit von 0.95 vomKI [96.18, 100.02] uberdeckt

I Berechnung des KI beruht auf der Voraussetzung, dass σ2

bekannt und gultig auch fur die Teilpopulation der14-Jahrigen ist

I Es kommt selten vor, dass σ2 bekannt ist

I Typischer ist der Fall unbekannter Varianz




I Unbekannte Varianz σ2 wird aus den vorliegenden Datengeschatzt

σ2 =1

n − 1

n∑i=1

(xi − x)2

I Anstelle der Verteilung

Z =X − µ

σ√n

∼ N(0, 1)

I wird folgender Ausdruck als Grundlage fur das KI verwendet

T =X − µ

σ√n

∼ t(n−1)




I Das KI fur µ ergibt sich aus∣∣X − µ∣∣σ√n

≤ t1−α2, df = n − 1

I Mit Irrtumswahrscheinlichkeit α gilt

|x − µ| ≤ t1−α2

σ√n, df = n − 1

I Und schließlich das KI

µ1,2 = x ± t1−α2

σ√n, df = n − 1




I Beispiel: Der Subtest ’Rechenaufgaben’ eines Intelligenztestswird einer Zufallsstichprobe von n = 87 15-jahrigen WienerHauptschulabsolventInnen vorgegeben, wobei x = 25.48 unds = 6.12. Gesucht ist das Konfidenzintervall fur denErwartungswert µ der Population der WienerHauptschulabsolventInnen (α = 0.05 bzw. 0.01)

I

µ1,2 = 25.48± t1−α2

6.12√87, df = 86




I Tabelle enthalt keine Eintragung fur df = 86, abernachstgelegene Wert ist df = 60; t0.975 = 2.00 bzw.t0.995 = 2.66

µ1,2 = 25.48± (2.00)6.12√

87, µ1,2 = 25.48± (2.66)

6.12√87

I µ liegt mit einer Irrtumswahrscheinlichkeit α = 0.05 bzw. 0.01im Intervall [24.17, 26.79] bzw. [23.74, 27.23]



Naherungsweises KI fur µ einer Variable mit unbekannterVerteilung

I Normalverteilung der betrachteten Variable X war Grundlagefur alle dargestellten KI

I Was tun, wenn die Normalverteilungsannahme nichtgerechtfertigt erscheint?

I KI bleiben naherungsweise gultig wegen ZentralemGrenzwertsatz

I Gute der Naherung hangt von der Verteilung von X und demStichprobenumfang n ab

I Bei kleinem n sollte sich die Verteilung von X nicht allzusehrvon einer Normalverteilung entfernen

I Großes n kann praktisch jede Abweichung von derNormalverteilung kompensieren




I Ebenso wichtig wie die Verteilung von X ist auch jene von S2,wobei S2 jene Variable bezeichnet, die durch wiederholtesZiehen von Zufallsstichproben vom Umfang n und Berechnungvon s2 in dieser Stichprobe entsteht

I Um σ2 zu schatzen, verwenden wir

S2 =1

n − 1

n∑i=1

(xi − x)2 = σ2 1

n − 1

n∑i=1

(xi − x

σ

)2

︸︷︷︸∼χ2

(n−1)

I

S2 =σ2

n − 1χ2

(n−1) oderχ2

(n−1)

n − 1=

S2

σ2




I Grundlage fur Aufstellung eines KI fur σ2

I

(n − 1)S2

χ2(n−1)

= σ2

I KI mit Irrtumswahrscheinlichkeit α und Freiheitsgradendf = n − 1

(n − 1)s2

χ2α2

≥ σ2 ≥ (n − 1)s2

χ21−α

2

I Beispiel: Angenommen, s = 14.7 fur eine normalverteilteVariable in einer Stichprobe von (n = 234) Personen: inwelchem Bereich vermuten wir σ2 fur die entsprechendePopulation (α = 0.05)?

I Tabelle enthalt fur df = 233 keine Eintragungen ⇒asymptotische Entwicklung




I Bei df →∞ strebt χ2 gegen die Normalverteilung N(df , 2df )

I

z0.975 = 1.96 =χ2

0.975 − 233√466

χ20.975 = 233 + 1.96

√466 = 275.3

z0.025 = −1.96 =χ2

0.025 − 233√466

χ20.025 = 233− 1.96

√466 = 190.7

I KI fur die Varianz

23314.72

275.3≤ σ2 ≤ 233

14.72

190.7⇒ 182.89 ≤ σ2 ≤ 264.02




I Beispiel: Wie vorhin, aber mit einer Stichprobe vom Umfangn = 24

I Aus Tabelle fur df = 23

χ20.975 = 38.08 χ2

0.025 = 11.69

I KI fur σ2

2314.72

38.08≤ σ2 ≤ 23

14.72

11.69⇒ 130.52 ≤ σ2 ≤ 425.16

I Wir sehen, dass die kleine Stichprobe zu einerunzuverlassigeren Schatzung (breiteres KI) der Varianz fuhrt



AllgemeinesI Ein statistischer Test ist ein Entscheidungsverfahren, das nach

Sammlung von empirischer Information (Daten) eineEntscheidung uber a priori formulierte Vermutungen(Hypothesen) trifft

I Der statistische Test basiert auf der Formulierung zweierkomplementarer Hypothesen (Null- und Alternativ) bezuglicheines unbekannten Parameters bzw. der Verteilungsform derGrundgesamtheit, auf welche man durch eine Stichprobeschließen mochte

I Ziel: Fur eine der zwei Hypothesen entscheiden mit moglichstkleinem Risiko

I Da die vorhandenen Daten Realisationen von Zufallsvariablensind, lasst sich niemals mit Sicherheit sagen, ob eineHypothese stimmt oder nicht. Man versucht daher, dieWahrscheinlichkeiten fur Fehlentscheidungen zu kontrollieren



Grundlagen

I Hypothese: eine anhand empirischer Daten zu prufendeAnnahme. Wir unterscheiden als Gegensatzpaar zwischen derNullhypothese, H0, und der Alternativhypothese, H1

I Die H0 formuliert eine a priori Vermutung uber die Verteilungeiner Zufallsvariable oder den Wert θ0 eines Parameters θ. H0:θ = θ0. Die H0 beinhaltet diejenige Aussage, welche falsifiziertwerden soll

I Die H0 ist fur die Entscheidung von zentraler Bedeutung: sielegt die Annahmen fur die Formulierung einesWahrscheinlichkeitsmodells fest; bei Gultigkeit der H0 ist dieVerteilung der Prufgroße bekannt

I Zu jeder H0 wird eine H1 formuliert, z.B. H1: θ > θ0, oderH1: θ < θ0, oder H1: θ 6= θ0. Die H1 enthalt die Aussage, dieman aufzeigen mochte



Grundlagen

I Ein statistisches Testverfahren lasst sich im Prinzip mit einemGerichtsverfahren vergleichen. Es wird immer von derUnschuld eines Verdachtigen ausgegangen. Nur, wenn dieIndizien fur die Schuld eines Angeklagten deutlich uberwiegen,kommt es zu einer Verurteilung

I Es gibt zu Beginn des Verfahrens die beiden Hypothesen H0:’der Verdachtige ist unschuldig’, und H1: ’der Verdachtige istschuldig’

I Um einen Unschuldigen nicht zu schnell zu verurteilen, wirddie Hypothese der Unschuld erst dann verworfen, wenn einIrrtum sehr unwahrscheinlich ist



Grundlagen

I Wir definieren zwei Wahrscheinlichkeiten: DieWahrscheinlichkeit fur einen Fehler erster Art (das Verurteilendes Unschuldigen) und die Wahrscheinlichkeit fur einen Fehlerzweiter Art (das Freisprechen des Schuldigen)

I

P(Fehler erster Art) = α = P(H0 verwerfen|H0 wahr)

P(Fehler zweiter Art) = β = P(H0 beibehalten|H0 falsch)

I Wir berechnen die Wahrscheinlichkeit fur die empirischerhobenen Daten unter der Annahme, dass H0 gilt

I Ist das empirische Ergebnis bei Gultigkeit der H0 sehrunwahrscheinlich, nehmen wir an, dass H0 nicht wahr ist undverwerfen die H0



Beispiel: Binomialtest

I Ein statistischer Test zur Uberprufung von hellseherischenFahigkeiten.

I Wir zeigen einer Person 25 Mal die Ruckseite einer reinzufallig gewahlten Spielkarte und fragen sie jeweils danach, zuwelcher der vier Farben (Kreuz, Pik, Herz, Karo) die Kartegehort. Unsere ZV X erfasst die Anzahl der Treffer

I H0 besagt, die Person sei nicht hellseherisch begabt; die H1

besagt, die Person hat hellseherische Fahigkeiten;

I Formal:

H0 : p =1

4, und H1 : p >

1

4



PrinzipI Unter Annahme der Gultigkeit der H0 ist X ∼ B(25, 1

4)I Wenn die Person alle 25 Karten richtig benennt, werden wir

sie als Hellseher betrachten, und die H0 verwerfen, mit 24oder 23 Treffern vermutlich auch

I Wo liegt aber die kritische Anzahl an Treffern k, von der anwir nicht mehr glauben konnen, es seien reine Zufallstreffer?

I In der Praxis kommt es darauf an, wie oft man eineFehlentscheidung erster Art zulassen will

I Mit k = 24 ist die Wahrscheinlichkeit einer solchenFehlentscheidung P(H0 verwerfen | H0 wahr)

P(X ≥ 24) = P(X = 24) + P(X = 25) = (0.675)(10−13)

I Mit k = 10 erhalten wir eine etwas großere Wahrscheinlichkeit

P(X ≥ 10) = 0.07



Prinzip

I Wir brauchen eine Entscheidungsregel

I In der Praxis wird die obere Grenze fur die Wahrscheinlichkeiteiner Fehlentscheidung erster Art a priori festgesetzt(Signifikanzniveau). Typische Werte sind 0.01 und 0.05

I Beispiel Binomialtest: Kann man von hellseherischenFahigkeiten einer Person ausgehen (α = 0.01)?

I Angenommen, die Person erzielt 18 Treffer.

I H0: p = 14 , H1: p > 1

4 . Unsere Zufallsvariable X hat unterAnnahme, die H0 sei wahr, eine B(25, 1

4)

I Dieses Hypothesenpaar teilt unter Annahme der Gultigkeit vonH0 und dem Signifikanzniveau α alle Realisationen(Stichproben) von X in zwei Bereiche: den Annahmebereichund den Verwerfungsbereich der H0 in Relation zur H1



Prinzip



Prinzip

I Wie wahrscheinlich ist es, tatsachlich dieses (oder ein nochextremeres Ergebnis) unter der Annahme, die H0 sei wahr, zubeobachten?

I Die Teststatistik errechnet sich aus der vorhandenenStichprobe und H0. Mithilfe der Teststatistik wird eineEntscheidungsregel fur oder gegen die H0 erstellt

P(X ≥ 18) =25∑

x=18

(25

x

)(1

4

)x (3

4

)(25−x)

P(X ≥ 18) = 0.000001 ≤ α = 0.01

I Unter H0 ist die Wahrscheinlichkeit, dieses Ergebnis (oder einnoch extremeres) zu bekommen, kleiner als das von unsangenommene Risiko fur einen Fehler erster Art, d.h. bei derVerwerfung der H0 eine falsche Entscheidung zu treffen



Prinzip



Prinzip

I Entscheidungsregel: Liegt die Teststatistik imVerwerfungsbereich, wird die H0 verworfen. Liegt dieTeststatistik im Annahmebereich, wird die H0 beibehalten(’Freispruch aus Mangel an Beweisen’).

I Aufgrund der Entscheidungsregel wird die H0: p = 14

zugunsten der H1: p > 14 mit einem Irrtumsrisiko von

0.000001 verworfen. Das Ergebnis ist signifikant

I Auch wenn es wunschenswert ist, dass der Test aufgrund dervorliegenden Daten ’richtig’ entscheidet, besteht dieMoglichkeit von Fehlentscheidungen. Bei richtiger H0 undEntscheidung fur H1 (Fehler erster Art oder α-Fehler), bzw.bei falscher H0 und Entscheidung fur die H0 (Fehler zweiterArt oder β-Fehler)

I ’Entscheiden’ ist immer an ein Risiko fur Fehler gebunden



Vorgangsweise

I Formulierung eines Hypothesenpaares, H0 bzw. H1, undAuswahl eines Signifikanzniveaus α vor Realisation derStichprobe

I Bestimmung der Verteilung der Teststatistik unter Gultigkeitder H0

I Verwerfungsbereich beinhaltet die α% extremsten Falle dieserVerteilung zugunsten der H1

I Berechnung der Teststatistik bei der vorhandenen Stichprobe.Liegt das Ergebnis im Verwerfungsbereich, so wird die H0

verworfen, andernfalls wird die H0 beibehalten


Statistische Tests II



1. Juni 2011

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 1/35


Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Ein- und Zweiseitige Hypothesen

I H0: p = 14 gegenuber

I Einseitige (= gerichtete) HypotheseH1 : p > 1

4 oder H ′1 : p < 1

4

I versus

I Zweiseitige Hypothese H ′′1 : p 6= 1

4

I Beim einseitigen Testen ist die Kontrolle des α-Fehlers nur ineine Richtung notwendig, beim zweiseitigen Testen ist dieseKontrolle in beide Richtungen erforderlich




Zweiseitiges Testen α = 0.05




Einseitiges vs. zweiseitiges Testen

I Die Wahl der Alternativhypothese muss a priori, d.h. ohneBerucksichtigung der aktuellen Daten aufgrund inhaltlicherKriterien erfolgen

I Insbesondere die Wahl einer der einseitigen Alternativen mussauf einer von den aktuellen Daten unabhangigenVorinformation beruhen




Beispiel: Binomialtest mit NV-Approximation

I Wenn Voraussetzungen fur NV-Approximation der BVgegeben; µ = np, σ2 = np(1− p)

I Standardnormalverteilte Teststatistik:

Z =K − µσ

=K − np0√np0(1− np0)

∼ N(0, 1)




NV-Approximation der Binomialverteilung:Kontinuitatskorrektur




Beispiel Einseitiges Testen

I Eine Psychologin vermutet, dass weniger als 50% der Frauen,die eine Diat machen, ubergewichtig sind.

I H0: p = 0.50; H1: p < 0.50; α = 0.05

I Verwerfungsbereich:




I In einer von ihr erhobenen Stichprobe von n = 200 Frauen, diederzeit Diat aus Figurgrunden halten, sind 87 ubergewichtig.

I µ = np = 100, k = 87

I

z =87.5− 100√

200 · 0.50 · 0.50= −1.77

Tab. 1b: P(Z ≤ −1.77) = 0.0384 < α = 0.05 ⇒ H0

verwerfen




Einseitiges Testen

I Verwerfung der H0 zugunsten der H1 mit einem Risiko fureinen Fehler erster Art von 0.0384




Einseitiges Testen

Angenommen, die Psychologin hatte die folgenden Hypothesenformuliert:H0: p = 0.5; H1: p > 0.5Verwerfungsbereich:




z = −1.77 liegt nicht im Verwerfungsbereich




Beispiel Zweiseitiges Testen

I Angenommen, die Psychologin hatte keine Vermutung in einebestimmte Richtung gehabt und die H1 ungerichtet formuliert:

I H0: p = 0.50; H1: p 6= 0.50; α = 0.05

I Kontrolle des α-Fehlers in beide Richtungen notwendig

I P(Z ≤ −1.77) + P(Z ≥ 1.77) = 0.0384 + 0.0384 = 0.0768 >α = 0.05; Ergebnis liegt noch im Annahmebereich der H0

I Oder aquivalent: nur eine Seite betrachten: α2 = 0.025

I 0.0384 > 0.025;




Fortsetzung

Es konnen bei denselben Daten unterschiedliche Entscheidungenresultieren. Beim einseitigen Testen kommt man eher zu einerVerwerfung der H0




Einseitiges vs. Zweiseitiges Testen




p-WertI In Statistik-Softwareprodukten wird zusammen mit der

Teststatistik eines statistischen Tests ein sogenannter p-Wertausgegeben

I Der p-Wert gibt die Wahrscheinlichkeit fur den Fehler ersterArt an, also die Wahrscheinlichkeit, eine gultige H0 zuverwerfen aufgrund der beobachteten Daten

I Vorteil des p-Wertes liegt darin, dass bei der Entscheidungkeine Tabelle der Verteilung der Teststatistik benotigt wird

I Wird der zweiseitige p-Wert angegeben und die H1 istgerichtet, muss man den p-Wert durch 2 dividieren und mit αvergleichen.

I Bei einseitigen Hypothesen ist die zusatzliche Uberprufungnotwendig, ob die Teststatistik tatsachlich imVerwerfungsbereich der H0 liegt




p-WertI SPSS-Beispiel in Datei ’binom.sav’, α = 0.05, B(11, 0.5),

x = 9I H0: p = 0.5, H1: p 6= 0.5, ’Signifikanz’ (zweiseitig!) =

0.065 > α = 0.05 ⇒ H0 wird beibehalten




p-WertI H0: p = 0.5, H ′

1: p > 0.5, Signifikanz (zweiseitig!) = 0.065⇒, ’Signifikanz’ (einseitig!) = 0.065

2 = 0.0325 < α = 0.05 undTeststatistik liegt im Verwerfungsbereich ⇒ H0 wird verworfen




p-WertI H0: p = 0.5, H ′′

1 : p < 0.5, Signifikanz (zweiseitig!) = 0.065⇒ ’Signifikanz’ (einseitig!) = 0.065

2 = 0.0325 < α = 0.05,aber Teststatistik liegt nicht im Verwerfungsbereich !!! ⇒ H0

wird beibehalten




Unspezifische H0 bei einseitigem Testen

I Bisher spezifische H0: θ = θ0

I Bei H1: θ < θ0 korrekterweise H0: θ ≥ θ0 (unspezifische H0)

I Kann die H0: θ = θ0 mit einer Irrtumswahrscheinlichkeit αverworfen werden, so kann jede weitere H0: θ > θ0 mit einernoch kleineren Irrtumswahrscheinlichkeit verworfen werden

I Es genugt also, die H1: θ < θ0 an der spezifischen H0: θ = θ0zu testen




Fehler bei statistischen Tests

I α = 0.05 bedeutet: fuhrt man dasselbe Experiment haufigdurch, verwirft man in ca. 5% der Falle die H0 irrtumlich,obwohl sie tatsachlich gilt (Fehler 1. Art oder α-Fehler)

I Man versucht, Wahrscheinlichkeiten fur Fehlentscheidungenzu minimieren, kann sie aber niemals vollig ausschalten

I Statistische Fehler beziehen sich nicht auf unkorrekteVorgangsweise beim Hypothesentesten, sondern aufEntscheidungsfehler. Richtige Prozeduren fuhren zuFehlentscheidungen.





I β-Fehler (Fehler 2. Art) = Wahrscheinlichkeit H0

beizubehalten, obwohl sie falsch ist.

I Vergleiche Gerichtsverfahren: Freispruch aus Mangel anBeweisen (Beibehalten der H0: der Verdachtige istunschuldig) bedeutet nicht, dass er mit Sicherheit unschuldigist (β-Fehler). Die Beweise fur seine Schuld waren nichtausreichend




Fehler bei Statistischen Tests




Statistische Fehler

I Je kleiner α, umso kleiner der Fehler 1. Art (H0 irrtumlich zuverwerfen)

I → α moglichst klein wahlen, z.B. α = 0.001?

I Entscheiden fur Signifikanzniveau ist vergleichbar mit demAbschluss einer Versicherung. Umso besser derVersicherungsschutz gegen einen α-Fehler, umso hoher dieKosten.

I Was sind die Kosten eines kleinen Signifikanzniveaus?

I Großerer Fehler 2. Art (β-Fehler = H0 irrtumlichbeizubehalten) und geringere Teststarke 1− β (Macht oderPower = Wahrscheinlichkeit, H0 zugunsten einer H1 zuverwerfen, wenn tatsachlich H1 gilt)




Beziehungen zwischen Statistischen Fehlern - 1








Richtige und falsche Entscheidungen

Reale SituationH0 H1

Ergebnis d. verworfen Fehler 1. Art Richtige E.Hypothesen- H0 α Macht, 1− β

tests beibehalten Richtige E. Fehler 2. Art1− α β




Dilemma

I Versicherung gegen α-Fehler hat die Kosten eines hoherenβ-Fehlers und geringerer Macht des Tests

I Versicherung gegen β-Fehler hat die Kosten eines hoherenα-Fehlers

I Kompromiss in der Praxis: α = 0.05 oder α = 0.01 jenachdem, welchen Fehler man eher riskieren mochte




Macht eines Tests (Teststarke)

I 1− β ist die Wahrscheinlichkeit dafur, dass ein statistischerTest zugunsten einer H1 entscheidet, wenn diese gilt (d.h. dieH0 richtigerweise zu verwerfen)

I Die Teststarke hangt von verschiedenen Faktoren ab:I Signifikanzniveau αI Ein- oder zweiseitige Alternativhypothese (bei einseitiger H1

hoher)I Große des UnterschiedesI Streuung der Variable X in der PopulationI Stichprobenumfang nI Verwendeter statistischer Test: je hoher der verwendete

Informationsgehalt der Daten, umso hoher seine Macht




Teststarke und Große der Unterschiede




Teststarke und Populationsstreuung




Teststarke und Stichprobenumfang

I Beispiel: Binomialtest mit NV-Approximation, Anteil derubergewichtigen Frauen

I Stichprobengroße n = 2000 Frauen (statt n = 200), gleicherAnteil wie vorher: 43.5% ubergewichtig = 870.

I µ = np = 1000, k = 870

I

z =870.5− 1000√

2000 · 0.50 · 0.50= −5.79

zum Vergleich z = −1.77 bei n = 200




Statistische Signifikanz und praktische Relevanz

I Mit genugend großem Stichprobenumfang kann man praktischjede H0 verwerfen

I Festlegung einer Effektgroße ε (z.B. praktisch relevanterUnterschied) und einer spezifischen H1

I Muss aufgrund inhaltlicher Uberlegungen vor Datenerhebungfestgelegt werden

I Vorteil: notwendiger Stichprobenumfang, der bei gegebenemα, gewunschtem 1− β und bestimmter Effektgroße eineeindeutige Entscheidung ermoglicht, bestimmbar

I Tabellen bzw. Computerprogramme im Internet (z.B. GPowervon Erdfelder, Faul & Buchner, 1996).




Kumulierung des α-Fehlers

I Fuhrt man mehrere statistische Tests durch, hat man beijedem dieser Tests das Risiko eines α-Fehlers

I Angenommen, jemand fuhrt drei statistische Tests durch umeine Hypothese zu prufen

I Selbst bei Annahme der Unabhangigkeit der einzelnen Testsware Wahrscheinlichkeit, dass mindestens 1 Test signifikantwird = 1 − (Wahrscheinlichkeit kein Test signifikant) =1− (1− 0.05)3 = 0.14





I Fuhrt man k unabhangige statistische Tests zur Uberprufungeiner H0 durch, kommt es zu einer Kumulierung des α-FehlerRisikos α′ = 1− (1− α)k

I Lasst es sich nicht vermeiden, mehrere statistische Tests zurPrufung einer Hypothese durchzufuhren, muss eine α-FehlerKorrektur vorgenommen werden

I α-Fehler Adjustierung: αadj = 1− (1− α)1/k

I 3 Tests: αadj = 1− (1− 0.05)1/3 = 0.017




Darstellung des Ergebnisses

I Voraussetzung: Formulierung der H0 und H1, Angabe von α,Stichprobenbeschreibung

I Angabe des p-Wertes

I Angabe der Teststatistik (+ df wo notig)

I ev. Teststarke und Effektgroße

I Korrekte Formulierung bei nicht-signifikantem Ergebnis: ’H0

wird beibehalten’; Formulierung, ’H0 wurde bewiesen’, istfalsch

I Falsche Interpretationen:I ’Je kleiner der p-Wert, umso großer der Effekt.’ Der p-Wert ist

keine Effektgroße.I ’Der p-Wert gibt die Wahrscheinlichkeit fur das Zutreffen der

H0 an.’ Der p-Wert ist die P(beobachtetesErgebnis|H0).





1. Juni 2011




Ein- und Zweiseitige Hypothesen

I H0: p = 14 gegenuber

I Einseitige (= gerichtete) HypotheseH1 : p > 1

4 oder H ′1 : p < 1

4

I versus

I Zweiseitige Hypothese H ′′1 : p 6= 1

4

I Beim einseitigen Testen ist die Kontrolle des α-Fehlers nur ineine Richtung notwendig, beim zweiseitigen Testen ist dieseKontrolle in beide Richtungen erforderlich




Zweiseitiges Testen α = 0.05




Einseitiges vs. zweiseitiges Testen

I Die Wahl der Alternativhypothese muss a priori, d.h. ohneBerucksichtigung der aktuellen Daten aufgrund inhaltlicherKriterien erfolgen

I Insbesondere die Wahl einer der einseitigen Alternativen mussauf einer von den aktuellen Daten unabhangigenVorinformation beruhen




Beispiel: Binomialtest mit NV-Approximation

I Wenn Voraussetzungen fur NV-Approximation der BVgegeben; µ = np, σ2 = np(1− p)

I Standardnormalverteilte Teststatistik:

Z =K − µσ

=K − np0√np0(1− np0)

∼ N(0, 1)




NV-Approximation der Binomialverteilung:Kontinuitatskorrektur




Beispiel Einseitiges Testen

I Eine Psychologin vermutet, dass weniger als 50% der Frauen,die eine Diat machen, ubergewichtig sind.

I H0: p = 0.50; H1: p < 0.50; α = 0.05

I Verwerfungsbereich:




I In einer von ihr erhobenen Stichprobe von n = 200 Frauen, diederzeit Diat aus Figurgrunden halten, sind 87 ubergewichtig.

I µ = np = 100, k = 87

I

z =87.5− 100√

200 · 0.50 · 0.50= −1.77

Tab. 1b: P(Z ≤ −1.77) = 0.0384 < α = 0.05 ⇒ H0

verwerfen




Einseitiges Testen

I Verwerfung der H0 zugunsten der H1 mit einem Risiko fureinen Fehler erster Art von 0.0384




Einseitiges Testen

Angenommen, die Psychologin hatte die folgenden Hypothesenformuliert:H0: p = 0.5; H1: p > 0.5Verwerfungsbereich:




z = −1.77 liegt nicht im Verwerfungsbereich




Beispiel Zweiseitiges Testen

I Angenommen, die Psychologin hatte keine Vermutung in einebestimmte Richtung gehabt und die H1 ungerichtet formuliert:

I H0: p = 0.50; H1: p 6= 0.50; α = 0.05

I Kontrolle des α-Fehlers in beide Richtungen notwendig

I P(Z ≤ −1.77) + P(Z ≥ 1.77) = 0.0384 + 0.0384 = 0.0768 >α = 0.05; Ergebnis liegt noch im Annahmebereich der H0

I Oder aquivalent: nur eine Seite betrachten: α2 = 0.025

I 0.0384 > 0.025;




Fortsetzung

Es konnen bei denselben Daten unterschiedliche Entscheidungenresultieren. Beim einseitigen Testen kommt man eher zu einerVerwerfung der H0




Einseitiges vs. Zweiseitiges Testen




p-WertI In Statistik-Softwareprodukten wird zusammen mit der

Teststatistik eines statistischen Tests ein sogenannter p-Wertausgegeben

I Der p-Wert gibt die Wahrscheinlichkeit fur den Fehler ersterArt an, also die Wahrscheinlichkeit, eine gultige H0 zuverwerfen aufgrund der beobachteten Daten

I Vorteil des p-Wertes liegt darin, dass bei der Entscheidungkeine Tabelle der Verteilung der Teststatistik benotigt wird

I Wird der zweiseitige p-Wert angegeben und die H1 istgerichtet, muss man den p-Wert durch 2 dividieren und mit αvergleichen.

I Bei einseitigen Hypothesen ist die zusatzliche Uberprufungnotwendig, ob die Teststatistik tatsachlich imVerwerfungsbereich der H0 liegt




p-WertI SPSS-Beispiel in Datei ’binom.sav’, α = 0.05, B(11, 0.5),

x = 9I H0: p = 0.5, H1: p 6= 0.5, ’Signifikanz’ (zweiseitig!) =

0.065 > α = 0.05 ⇒ H0 wird beibehalten




p-WertI H0: p = 0.5, H ′

1: p > 0.5, Signifikanz (zweiseitig!) = 0.065⇒, ’Signifikanz’ (einseitig!) = 0.065

2 = 0.0325 < α = 0.05 undTeststatistik liegt im Verwerfungsbereich ⇒ H0 wird verworfen




p-WertI H0: p = 0.5, H ′′

1 : p < 0.5, Signifikanz (zweiseitig!) = 0.065⇒ ’Signifikanz’ (einseitig!) = 0.065

2 = 0.0325 < α = 0.05,aber Teststatistik liegt nicht im Verwerfungsbereich !!! ⇒ H0

wird beibehalten




Unspezifische H0 bei einseitigem Testen

I Bisher spezifische H0: θ = θ0

I Bei H1: θ < θ0 korrekterweise H0: θ ≥ θ0 (unspezifische H0)

I Kann die H0: θ = θ0 mit einer Irrtumswahrscheinlichkeit αverworfen werden, so kann jede weitere H0: θ > θ0 mit einernoch kleineren Irrtumswahrscheinlichkeit verworfen werden

I Es genugt also, die H1: θ < θ0 an der spezifischen H0: θ = θ0zu testen





I α = 0.05 bedeutet: fuhrt man dasselbe Experiment haufigdurch, verwirft man in ca. 5% der Falle die H0 irrtumlich,obwohl sie tatsachlich gilt (Fehler 1. Art oder α-Fehler)

I Man versucht, Wahrscheinlichkeiten fur Fehlentscheidungenzu minimieren, kann sie aber niemals vollig ausschalten

I Statistische Fehler beziehen sich nicht auf unkorrekteVorgangsweise beim Hypothesentesten, sondern aufEntscheidungsfehler. Richtige Prozeduren fuhren zuFehlentscheidungen.





I β-Fehler (Fehler 2. Art) = Wahrscheinlichkeit H0

beizubehalten, obwohl sie falsch ist.

I Vergleiche Gerichtsverfahren: Freispruch aus Mangel anBeweisen (Beibehalten der H0: der Verdachtige istunschuldig) bedeutet nicht, dass er mit Sicherheit unschuldigist (β-Fehler). Die Beweise fur seine Schuld waren nichtausreichend




Fehler bei Statistischen Tests




Statistische Fehler

I Je kleiner α, umso kleiner der Fehler 1. Art (H0 irrtumlich zuverwerfen)

I → α moglichst klein wahlen, z.B. α = 0.001?

I Entscheiden fur Signifikanzniveau ist vergleichbar mit demAbschluss einer Versicherung. Umso besser derVersicherungsschutz gegen einen α-Fehler, umso hoher dieKosten.

I Was sind die Kosten eines kleinen Signifikanzniveaus?

I Großerer Fehler 2. Art (β-Fehler = H0 irrtumlichbeizubehalten) und geringere Teststarke 1− β (Macht oderPower = Wahrscheinlichkeit, H0 zugunsten einer H1 zuverwerfen, wenn tatsachlich H1 gilt)












Richtige und falsche Entscheidungen

Reale SituationH0 H1

Ergebnis d. verworfen Fehler 1. Art Richtige E.Hypothesen- H0 α Macht, 1− β

tests beibehalten Richtige E. Fehler 2. Art1− α β




Dilemma

I Versicherung gegen α-Fehler hat die Kosten eines hoherenβ-Fehlers und geringerer Macht des Tests

I Versicherung gegen β-Fehler hat die Kosten eines hoherenα-Fehlers

I Kompromiss in der Praxis: α = 0.05 oder α = 0.01 jenachdem, welchen Fehler man eher riskieren mochte




Macht eines Tests (Teststarke)

I 1− β ist die Wahrscheinlichkeit dafur, dass ein statistischerTest zugunsten einer H1 entscheidet, wenn diese gilt (d.h. dieH0 richtigerweise zu verwerfen)

I Die Teststarke hangt von verschiedenen Faktoren ab:I Signifikanzniveau αI Ein- oder zweiseitige Alternativhypothese (bei einseitiger H1

hoher)I Große des UnterschiedesI Streuung der Variable X in der PopulationI Stichprobenumfang nI Verwendeter statistischer Test: je hoher der verwendete

Informationsgehalt der Daten, umso hoher seine Macht




Teststarke und Große der Unterschiede




Teststarke und Populationsstreuung




Teststarke und Stichprobenumfang

I Beispiel: Binomialtest mit NV-Approximation, Anteil derubergewichtigen Frauen

I Stichprobengroße n = 2000 Frauen (statt n = 200), gleicherAnteil wie vorher: 43.5% ubergewichtig = 870.

I µ = np = 1000, k = 870

I

z =870.5− 1000√

2000 · 0.50 · 0.50= −5.79

zum Vergleich z = −1.77 bei n = 200




Statistische Signifikanz und praktische Relevanz

I Mit genugend großem Stichprobenumfang kann man praktischjede H0 verwerfen

I Festlegung einer Effektgroße ε (z.B. praktisch relevanterUnterschied) und einer spezifischen H1

I Muss aufgrund inhaltlicher Uberlegungen vor Datenerhebungfestgelegt werden

I Vorteil: notwendiger Stichprobenumfang, der bei gegebenemα, gewunschtem 1− β und bestimmter Effektgroße eineeindeutige Entscheidung ermoglicht, bestimmbar

I Tabellen bzw. Computerprogramme im Internet (z.B. GPowervon Erdfelder, Faul & Buchner, 1996).





I Fuhrt man mehrere statistische Tests durch, hat man beijedem dieser Tests das Risiko eines α-Fehlers

I Angenommen, jemand fuhrt drei statistische Tests durch umeine Hypothese zu prufen

I Selbst bei Annahme der Unabhangigkeit der einzelnen Testsware Wahrscheinlichkeit, dass mindestens 1 Test signifikantwird = 1 − (Wahrscheinlichkeit kein Test signifikant) =1− (1− 0.05)3 = 0.14





I Fuhrt man k unabhangige statistische Tests zur Uberprufungeiner H0 durch, kommt es zu einer Kumulierung des α-FehlerRisikos α′ = 1− (1− α)k

I Lasst es sich nicht vermeiden, mehrere statistische Tests zurPrufung einer Hypothese durchzufuhren, muss eine α-FehlerKorrektur vorgenommen werden

I α-Fehler Adjustierung: αadj = 1− (1− α)1/k

I 3 Tests: αadj = 1− (1− 0.05)1/3 = 0.017




Darstellung des Ergebnisses

I Voraussetzung: Formulierung der H0 und H1, Angabe von α,Stichprobenbeschreibung

I Angabe des p-Wertes

I Angabe der Teststatistik (+ df wo notig)

I ev. Teststarke und Effektgroße

I Korrekte Formulierung bei nicht-signifikantem Ergebnis: ’H0

wird beibehalten’; Formulierung, ’H0 wurde bewiesen’, istfalsch

I Falsche Interpretationen:I ’Je kleiner der p-Wert, umso großer der Effekt.’ Der p-Wert ist

keine Effektgroße.I ’Der p-Wert gibt die Wahrscheinlichkeit fur das Zutreffen der

H0 an.’ Der p-Wert ist die P(beobachtetesErgebnis|H0).


Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben



8. Juni 2011

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 1/42


Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Anpassungstests allgemein

I Gegeben: Haufigkeitsverteilung der Variable X in einerStichprobe aus bestimmter Population (empirische Verteilung)

I Unbekannt: Verteilungsfunktion der Variable X , F (x), in derPopulation

I Nullhypothese spezifiziert theoretische (erwartete) VerteilungF0(x) (z.B. Gleichverteilung, Normalverteilung)

I H0: F (x) = F0(x) gegen H1: F (x) 6= F0(x)

I Anpassungstest pruft, ob Stichprobe aus Population stammt,in welcher X die Verteilung F0(x) aufweist

I Abweichung empirische - theoretische Verteilung, d.h.Vergleich der empirisch beobachteten Haufigkeiten derAuspragungen von X mit theoretisch erwarteten Haufigkeiten,wenn H0 gilt




χ2-Anpassungstest

I Variable X mit j = 1, . . . , k Auspragungen

I fj = beobachtete Haufigkeiten in der Stichprobe, ej =erwartete Haufigkeiten unter H0

k∑j=1

(fj − ej)2

ejasympt. χ2 − verteilt mit df = k − 1

I Empirische und theoretische Verteilung ident ⇒ χ2 → 0

I Abweichungen groß ⇒ χ2 →∞I H0 verworfen, wenn χ2 im Verwerfungsbereich: χ2 > χ2

(df ;1−α)




Erklarung Freiheitsgrade: Summe der Haufigkeiten muss mitStichprobenumfang identisch sein. Bei k Auspragungen durfen nurbei k − 1 Auspragungen die Haufigkeiten frei variieren.




Beispiel 1: Gleichverteilung

I Ist erstmaliges Auftreten von Depressionen gleich verteilt aufdie vier Jahreszeiten?

I H0: Gleichverteilung; H1: keine Gleichverteilung; α = 0.05

I n = 100 Personen mit Depression

I Erwartete Haufigkeiten:

ej =n

k=

100

4= 25




Beispiel 1: Gleichverteilung

I

Fruhling Sommer Herbst Winter∑

fj 21 19 27 33 100ej 25 25 25 25 100

I

χ2 =k∑

j=1

(fj − ej)2

ej=

(21− 25)2

25+

(19− 25)2

25+

+(27− 25)2

25+

(33− 25)2

25=

= 0.64 + 1.44 + 0.16 + 2.56 = 4.8

I df = 3, χ2(3;0.95) = 7.82 (Tab. 3)

I 4.8 < 7.82 ⇒ χ2 = 4.8 gehort nicht zu den 5% derextremsten Falle unter H0 ⇒ H0 beibehalten.




χ2-Anpassungstest mit SPSSI Menu AnalysierenI Nichtparametrische TestsI Chi-Quadrat . . .




SPSS-Output χ2-Test




Voraussetzungen fur χ2-Test

I Jede Person muss eindeutig einer Merkmalsauspragungzuordenbar sein

I Beobachtungen mussen voneinander unabhangig sein

I Eintragungen mussen absolute Haufigkeiten sein

I Approximation der Prufgroße an χ2-Verteilung ausreichend,wenn mind. 80% der ej ≥ 5 und kein ej kleiner 1.

I Fur alle Verteilungen geeignet

I Bei stetigen Verteilungen mussen Merkmalsauspragungen zuKlassen zusammengefasst werden




Beispiel 2: beliebige Verteilung

I Laut Statistik der Wiener Gebietskrankenkasse aus dem Jahr2009 verteilten sich vier bestimmte psychiatrische DiagnosenA,B,C,D im Verhaltnis A:B:C:D=4:3:2:1.

I Eine Diplomandin erhebt eine Stichprobe von 320 Personen,die wegen einer dieser vier psychiatrischen Erkrankungen inBehandlung sind.

I Die vier Diagnosen verteilen sich in ihrer Stichprobeprozentmaßig folgendermaßen:

I Diagnose A: 45%I Diagnose B: 25%I Diagnose C: 15%I Diagnose D: 15%

I Entspricht die Verteilung der vier Diagnosen in ihrerStichprobe jener in der Population?




Beispiel 2 Fortsetzung

I H0: F (x) = F0(x) = 4 : 3 : 2 : 1; H1: F (x) 6= F0(x)I Erwartete Haufigkeiten:

I Diagnose A: 320 : 10 × 4 = 128I Diagnose B: 320 : 10 × 3 = 96I Diagnose C: 320 : 10 × 2 = 64I Diagnose D: 320 : 10 × 1 = 32

I Beobachtete Haufigkeiten:I Diagnose A: 45% von 320 = 144I Diagnose B: 25% von 320 = 80I Diagnose C: 15% von 320 = 48I Diagnose D: 15% von 320 = 48




Beispiel 2 Fortsetzung

I Erwartete und beobachtete HaufigkeitenDiagnose A Diagnose B Diagnose C Diagnose D

∑ej 128 96 64 32 320

fj 144 80 48 48 320I

χ2 =(144− 128)2

128+

(80− 96)2

96+

(48− 64)2

64+

(48− 32)2

32=

= 16.67

I df = 3, χ23;0.95 = 7.82 ⇒ Nullhypothese verwerfen




Kolmogorov-Smirnov-Test (K-S-Test)

I Theoretische Verteilung stetig; bei diskreten Verteilungenanwendbar, jedoch weniger Macht

I ”Standardverfahren” zur Prufung auf NV

I Fur kleine Stichproben besser geeignet als χ2-Test, da dieserapproximativ und K-S exakt

I Basiert auf maximalem Abstand zwischen empirischerVerteilungsfunktion (kumulierte Haufigkeitsverteilung) underwarteter Verteilungsfunktion F0(x) (z.B. Normalverteilung)




Signifikanzkorrektur nach Lilliefors

I Zwei Falle:

1. spezifische NV: H0: Variable X ist in der Population NV mitParametern µ0 und σ0 (z.B. BMI bei Wiener FrauenN(20.64,2.31)-verteilt)

2. unspezifische NV: H0: Verteilung der Variable X in derPopulation ist eine NV (irgendeine NV, mit nicht festgelegtenParametern)

I Bei Fall 2 werden x bzw. s2 aus der Stichprobe als Schatzungfur µ bzw. σ2 verwendet.

I Sind µ und σ2 der theoretischen Verteilung nicht bekannt undmussen aus Stichprobe geschatzt werden, ist K-S-Test sehrkonservativ (d.h. H0 wird zu lange beibehalten) → Korrekturdes kritischen Wertes (Lilliefors, 1967).




K-S-Test mit Korrektur nach Lilliefors in SPSSI Menu AnalysierenI Deskriptive Statistiken . . .I Explorative Datenanalyse . . .I Schaltflache Diagramme




SPSS-Output K-S-Test mit korrigierten kritischen Wertennach Lilliefors

”originaler” K-S-Test ohne Korrektur nach Lilliefors fur nichtbekanntes µ und σ) ⇒ konservativer, H0 wird langer beibehalten




Ein-Stichproben-t-Test

I Hypothesen uber µ einer normalverteilten Variable, wobei σ2

unbekanntI Mogliche Hypothesen:

I H0: µ = µ0; H1: µ 6= µ0

I H0: µ ≤ µ0; H1: µ > µ0

I H0: µ ≥ µ0; H1: µ < µ0

I Pruft anhand des Mittelwerts einer Stichprobe ob derErwartungswert in der entsprechenden Grundgesamtheit gleicheinem vorgegebenen Wert ist (dem unter H0 erwarteten µ0).

I Vergleich eines Stichprobenmittelwertes mit einemhypothetischen Populationsparameter µ0.




Ein-Stichproben-t-Test: Beispiel 1

I Weicht der Mittelwert einer Zufallsstichprobe aus dem Iran,xI , in einem in Osterreich entwickelten sprachfreienIntelligenztest signifikant vom Populationsparameter inOsterreich, µA = 100, ab?

I n = 108, Testpunkte normalverteilt, xI = 99.32, sI = 4.03,

I H0: µI = 100; H1: µI 6= 100; α = 0.05

I Teststatistik:

T =X − µ

σ√n

∼ t(n−1)

t =99.32− 100

4.03√108

= −1.75

df = 107, t120;0.975 = 1.98 1.75 < 1.98 ⇒ H0 beibehalten




Ein-Stichproben-t-Test mit SPSS

I Menu Analysieren

I Mittelwerte vergleichen

I T-Test bei einer Stichprobe . . .




SPSS-Output Ein-Stichproben-t-Test




Ein-Stichproben-t-Test: Beispiel 2I Stichprobe von n = 36 Schulern mit Unterricht in

Darstellender Geometrie (DG)I Raumvorstellungstest normiert in Population auf µ = 100I Es soll die Hypothese gepruft werden, dass Erwartungswert bei

Schulern mit DG-Unterricht hoher.I H0: µDG ≤ µ; H1: µDG > µ; α = 0.05I xDG = 101.32, sDG = 4.15I NV gegeben ⇒ Ein-Stichproben-t−Test

t =101.32− 100

4.15√36

= 1.91

df = 35, t30;0.95 = 1.70, t40;0.95 = 1.68I Richtung stimmt: unter H1 positiver t-Wert erwartet;

1.91 > 1.69 ⇒ H0 verworfen: Schuler mit DG-Unterrichthaben uberdurchschnittliche Testleistungen.




SPSS-Output




Hypothesen uber p einer B(n, p)

I Binomialtest exakt oder mit NV-Approximation (vgl. letzteVO)

I H0: p = p0; H1: p 6= p0 bzw.

I H0: p ≤ p0; H1: p > p0 oder H0: p ≥ p0, H1: p < p0

I Voraussetzungen fur NV-Approximation der BV gegeben:µ = np, σ2 = np(1− p) → Teststatistik:

Z =K − µσ

=K − np0√

np0(1− np0)∼ N(0, 1)

I Voraussetzung fur NV-Approximation der BV nicht gegeben:

P(k|n, p) =

(n

k

)pk(1− p)n−k




Ein-Stichproben-Verfahren im Uberblick

Test Prufbare Hypothesen / Voraussetzungen

χ2-Anpassungstest Testen von Verteilungsannahmenalle Verteilungen prufbarabsolute Haufigkeiten

Kolmogorov-Smirnov-Test Testen von Verteilungsannahmeninsbesondere stetige Verteilungen (NV)

Ein-Stichproben-t-Test Vergleich eines x mit µ einer NV (µ, σ2)σ2 unbekannt, NV

Binomialtest exakt Hypothesen uber p einer B(n, p)NV-Approximation nicht moglich

Binomialtest NV-App. Hypothesen uber p einer B(n, p)NV-App. moglich (np und n(1− p) ≥ 5)



Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

Unabhangige vs. abhangige Stichproben

I Abhangige Stichproben: die Elemente der zwei Stichprobenkonnen einander paarweise zugeordnet werden, weilbeispielsweise die gleichen Personen zwei Mal befragt wurden(Messwiederholungen), es sich um Paare handelt(Geschwisterpaare, Ehepaare,..), oder die Personen aufgrundeines oder mehrerer Variablen parallelisiert wurden (z.B.aufgrund eines Vortests werden je zwei Personen mit gleicherPunktezahl zu Paaren zusammengefasst).

I Unabhangige Stichproben: es besteht kein Zusammenhang(keine Beziehung) zwischen den Elementen der Stichproben.Werte in der einen Stichprobe erlauben keine Vorhersage uberWerte in der anderen Stichprobe (unkorreliert). Z.B.: zufalligeZuteilung von Personen in VG und KG; Zufallsstichproben auszwei unterschiedlichen Populationen, z.B. Frauen und Manner(wobei es sich nicht um Paare handeln darf).




Vergleich zweier Varianzen: F -Test

I Unterscheiden sich die Varianzen zweier unabhangigerStichproben aus normalverteilten Grundgesamtheiten?

I H0,1: σ21 = σ2

2; H1,1: σ21 6= σ2

2

I H0,2: σ21 ≤ σ2

2; H1,1: σ21 > σ2

2

I H0,3: σ21 ≥ σ2

2; H1,3: σ21 < σ2

2

I Prufgroße:

F =σ2

1

σ22

df1 = n1 − 1, df2 = n2 − 1

I Voraussetzungen: NV in jeder Population

I Achtung! Großere Varianz muss im Zahler stehen!

I H0,1: σ21 = σ2

2 wird verworfen, wenn F > F(df1,df2,1−α/2)

I H0,2 und H0,3 werden verworfen, wenn F > F(df1,df2,1−α)




F -Test - Beispiel 1

I Im Rahmen eines Experimentes hort die Versuchsgruppewahrend der Bearbeitung eines GedachtnistestsHintergrundmusik, die Kontrollgruppe bearbeitet den Testohne Hintergrundmusik. Streuen die Testleistungen der beidenBedingungen unterschiedlich stark?

I H0: σ2VG = σ2

KG ; H1: σ2VG 6= σ2

KG ; α = 0.05

I s2VG = 8.5, s2

KG = 4.7, nVG = nKG = 50, NV der Daten injeder Gruppe

F =8.5

4.7= 1.81 df1 = 49, df2 = 49

I Tabelle 4b: F50;50;0.975 = 1.75 < 1.81 ⇒ H0 wird verworfen

I Die Varianzen sind unterschiedlich.




F -Test - Beispiel 2

I Im Rahmen eines Experimentes erhalt die VG einKonzentrationstraining, die KG erhalt kein Training.Anschließend bearbeiten beide Gruppen einenKonzentrationstest. Der Versuchsleiter vermutet, dass dieLeistungen in der VG homogener sind.

I H0: σ2VG ≥ σ2

KG ; H1: σ2VG < σ2

KG ; α = 0.05

I s2KG = 10.2, s2

VG = 5.9, nVG = 40, nKG = 60, NV der Datenin jeder Gruppe

F =10.2

5.9= 1.73 df1 = 59, df2 = 39

I Tabelle 4a: F50;40;0.95 = 1.66 < 1.73 ⇒ H0 wird verworfen

I Die Leistungen der Versuchsgruppe streuen weniger.




t-Test fur unabhangige Stichproben mit gleichen Varianzen

I Unterscheiden sich die Mittelwerte zweier unabhangigerStichproben aus normalverteilten Grundgesamtheitensignifikant voneinander?

I Stammen die beiden Stichproben aus zwei Populationen, indenen das Merkmal X identisch normalverteilt ist?

I Ungerichtete Hypothese:I H0: µ1 = µ2 bzw. µ1 − µ2 = 0 und σ1 = σ2 = σI H1: µ1 6= µ2 bzw. µ1 − µ2 6= 0 und σ1 = σ2 = σ

I Gerichtete Hypothese z.B.:I H0: µ1 ≤ µ2 bzw. µ1 − µ2 ≤ 0 und σ1 = σ2 = σI H1: µ1 > µ2 bzw. µ1 − µ2 > 0 und σ1 = σ2 = σ




t-Test fur unabhangige Stichproben

I Zieht man aus 2 normalverteilten Populationen, N(µ1, σ21)

und N(µ2, σ22), immer wieder zwei voneinander unabhangige

Stichproben ⇒ Verteilung der Differenzen derStichprobenmittelwerte = Normalverteilung

N(µ(X1−X2), σ2(X1−X2)

) = N(µ1 − µ2,σ2

1n1

+σ2

2n2

)

I Wegen Reproduktionseigenschaft der NV

I X1 − X2 = X1 + (−X2)

I µ(X1−X2) = µ1 + (−µ2) = µ1 − µ2 (Erwartungswert einerDifferenz = Differenz der Erwartungswerte)

I Ist µ1 = µ2, sind die Differenzen normalverteilt mitµ(X1−X2) = 0

I σ2(X1 − X2) = σ2(X1) + σ2(−X2) = σ2(X1) + σ2(X2)




Streuung der Mittelwertsdifferenz σ(x1−x2)

I Standardfehler des Mittelwertes (vgl. VO vom 9.1.08, Folie32)

σx =

√σ2

n

I Standardfehler der Mittelwertsdifferenz

σ(x1−x2) =

√σ2

1

n1+σ2

2

n2

I Bei σ21 = σ2

2 = σ2

σ(x1−x2) =

√σ2

(1

n1+

1

n2

)




t-Test fur unabhangige Stichproben

I Abweichung (x1 − x2)− (µ1 − µ2) in Relation zur Streuungder Mittelwertsdifferenz (= Standardfehler derMittelwertsdifferenz)

(x1 − x2)− (µ1 − µ2)

σ(x1−x2)∼ N(0, 1)

I Unter H0: µ1 − µ2 = 0 ⇒

x1 − x2

σ(x1−x2)∼ N(0, 1)




Varianzschatzung innerhalb

I Populationsvarianz nicht bekannt ⇒ Schatzung ausStichproben

I Beste Schatzung: gewichtete mittlere Varianzschatzung

I Varianzschatzung innerhalb (der Stichproben)

σ2 =(n1 − 1)σ2

1 + (n2 − 1)σ22

(n1 − 1) + (n2 − 1)




Warum Varianzschatzung innerhalb?I Unter H1 beide Stichproben normalverteilt mit gleichem σ,

aber unterschiedlichen MittelwertenI Wurde man die Stichproben zu einer einzigen zusammenfassen

und die Varianz berechnen, entstunde eine zweigipfeligeVerteilung und man erhielte eine großere Varianz




Standardfehler der Mittelwertsdifferenz

I Standardfehler der Mittelwertsdifferenz bei σ21 = σ2

2 = σ2

σ(x1−x2) =

√σ2

(1

n1+

1

n2

)I Schatzung des Standardfehlers der Mittelwertsdifferenz

σ(x1−x2) =

√(n1 − 1)σ2

1 + (n2 − 1)σ22

(n1 − 1) + (n2 − 1)

(1

n1+

1

n2

)




Prufgroße t

I

t =x1 − x2√

(n1−1)σ21+(n2−1)σ2

2(n1−1)+(n2−1)

(1n1

+ 1n2

) df = n1 + n2 − 2

I Zweiseitige H0 wird verworfen, wenn |t| > t(df ;1−α/2)

I Einseitige H0 wird verworfen, wenn Abweichung in dieerwartete Richtung und |t| > t(df ;1−α)




t-Test - Voraussetzungen

I Unabhangige Stichproben

I Metrische Variable

I Normalverteilung in beiden Populationen

I Homogene Varianzen → F -Test

I Sind Voraussetzungen fur t-Test erfullt, ist er der machtigsteTest zum Vergleich zweier unabhangiger Stichproben

I Ist eine (oder mehrere) der Voraussetzungen nicht erfullt, liegtkeine t-Verteilung vor, das reale α entspricht nicht demvorgegebenen α und es kommt zu Fehlentscheidungen




t-Test - Beispiel

I Es soll uberpruft werden, ob zusatzliches autogenes Trainingeinen positiven Effekt bei der Behandlung von Depressionenhat. Klassischer Zwei-Gruppen-Versuchsplan: eine Gruppe vonPatientinnen erhalt nur die konventionelle Therapie (KG), einezweite Gruppe erhalt zusatzlich autogenes Training (VG).Operationalisierung des Effekts der Therapien: Scoredifferenz(vorher minus nachher) in einem Depressionsfragebogen.

I H0: µVG ≤ µKG , σ2VG = σ2

KG

I H1: µVG > µKG , σ2VG = σ2

KG

I VG: xVG = 7.22, s2VG = 6.12, n = 53

I KG: xKG = 4.91, s2KG = 6.54, n = 51

I NV gegeben, α = 0.05




t-Test - Beispiel

I Homogenitat der Varianzen: H0: σ21 = σ2

2, H1: σ21 6= σ2

2

F =6.54

6.12= 1.07 df1 = 50, df2 = 52

Tabelle 4b: F50;50;0.975 = 1.75 > 1.07 ⇒ H0 wird beibehalten,Varianzen sind homogen

I

t =7.22− 4.91√

52·6.12+50·6.5452+50

(1

52 + 150

) = 4.64, df = 102

Tabelle 3: t102;0.95 = 1.66 < 4.64 ⇒ H0 verworfen, Ergebnisspricht dafur, dass autogenes Training zusatzlichen Effekt hat




t-Test fur unabhangige Stichproben mit SPSSI Es soll uberpruft werden, ob sich die beiden Gruppen (mit vs.

ohne autogenes Training) bezuglich Alter unterscheiden.I H0: µ1 = µ2, σ1 = σ2; H1: µ1 6= µ2, σ1 = σ2; α = 0.05




t-Test fur unabhangige Stichproben mit SPSS

I Menu Analysieren

I Mittelwerte vergleichen

I T-Test bei unabhangigen Stichproben . . .




t-Test fur unabhangige Stichproben mit SPSS


E�ektgröÿen (E�ektstärken)

Einführung in Quantitative Methoden


15. Juni 2011

Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 1/10


Allgemeines

I Wie groÿ ist der E�ekt (d.h. Ausmaÿ der Wirkung) eines

experimentellen Faktors?

I Ist er bedeutsam oder trivial?

I Ein E�ekt kann statistisch signi�kant sein, obwohl praktisch

nicht relevant.

I Ist der E�ekt in einer Studie gröÿer als in einer anderen?

I Vergleich der Ergebnisse verschiedener Studien im Rahmen

einer sog. Metaanalyse.

I Publication Manual of the American Psychological

Association, 2002: "For the reader to fully understand the

importance of your �ndings, it is almost always necessary to

include some index of e�ect size ... "



Allgemeines

I Hängen mit statistischer Signi�kanz insofern zusammen, als

geringe E�ektstärken gröÿere Stichproben erfordern, damit

Ergebnisse signi�kant werden

I Können als Ergänzung zu vielen Verfahren berechnet werden

I E�ektgröÿen zur Planung der Untersuchung (Berechnung der

notwendigen Stichprobe). Entsprechende Vorinformation

notwendig

I Grundsätzlich Einteilung in zwei Arten: Abstandsmaÿe und

Korrelationsmaÿe

I Beide Arten drücken dieselbe Information aus

I Ineinander überführbar

I Besonders bekannt gemacht durch Cohen (1962)



Abstandsmaÿe

I Naheliegende E�ektgröÿe für Unterschiede zwischen zwei

Gruppen ist der Abstand zwischen den Mittelwerten

(=Rohscore-E�ektgröÿe)

I Probleme:

1. Verwendung unterschiedlicher Skalen, z.B. Konzentrationstest

mit Scores 1-10 vs. Konzentrationstest mit Scores 50-150

2. Unterschied bezieht sich darauf, wie sehr sich die Verteilungen

der beiden Gruppen nicht überschneiden → abhängig von

Streuung der Messwerte



Ein�uss der Streuung



Abstandsmaÿe: Cohen's d

I Lösung: Standardisiertes Maÿ, das die relative Gröÿe der

Mittelwertsdi�erenz zwischen zwei Populationen angibt

I

d =µ1 − µ2

σ

I Schätzer:

d =x1 − x2√

σ2

1+σ2

2

2

I Modi�kation für ungleiche Gruppengröÿen: Hedge's g

g =x1 − x2√

σ2

1(n1−1)+σ2

2(n2−1)

n1+n2−2



E�ektgröÿe aus t-Wert berechnen

I

g =x1 − x2√

(n1−1)σ2

1+(n2−1)σ2

2

(n1−1)+(n2−1)

t =x1 − x2√

(n1−1)σ2

1+(n2−1)σ2

2

(n1−1)+(n2−1)

(1

n1+ 1

n2

)⇒

g = t

√1

n1+

1

n2



Einteilung der E�ektgröÿen nach Cohen

I Schwacher E�ekt: ab d = 0.2 oder r = 0.1

I Mittlerer E�ekt: ab d = 0.5 oder r = 0.3

I Starker E�ekt: ab d = 0.8 oder r = 0.5

I Einteilung beruht auf sozialwissenschaftlichem Usus und auf

durchschnittlich in Studien gefundenen Werten.

Bedeutsamkeit der E�ektgröÿe ist stark vom jeweiligen

Problembereich abhängig.



Schwacher E�ekt: d = 0.2



Starker E�ekt: d = 0.8