InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Einfuhrung in Quantitative Methoden
Mag. Dipl.Ing. Dr. Pantelis Christodoulides&
Mag. Dr. Karin Waldherr
SS 2011
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 1/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
I Bedeutung der Psychologischen Methodenlehre und Statistikfur Psychologie
I GrundbegriffeI Beschreibende Statistik (Deskriptivstatistik):
I Aufbereitung von Daten mittels Tabellen, Grafiken,statistischen Kennzahlen.
I Zusammenhangsmaße.
I Versuchsplanung
I Grundlagen der Wahrscheinlichkeitstheorie und spezielleWahrscheinlichkeitsverteilungen
I Statistische Schlusse, Parameterschatzung und Logik desHypothesentestens (ausgewahlte statistische Testverfahren)
I Berechnungen handisch und mit Statistik-Programm ”SPSS”
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 2/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Vorlesungsunterlagen und KontaktPrufungErganzende Literaturbegleitende Ubung & Tutorien
I SPSS: erhaltlich im Rechenzentrum der Universitat Wien,www.univie.ac.at/zid/software-shop
I Vorlesungsunterlagen: Folien werden spatestens Mittwochmittag zum Download zur Verfugung gestellt. Die Folienersetzen nicht den Vorlesungsbesuch! Sie sind nur alsErleichterung gedacht; prufungsrelevant sind die Inhalte, die inder Vorlesung gebracht werden.
I Homepage:psychologie.univie.ac.at/grundlagenforschung/studium/methodenlehre
I Die Folien unterliegen einem Copyright.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 3/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Vorlesungsunterlagen und KontaktPrufungErganzende Literaturbegleitende Ubung & Tutorien
I schriftliche Prufung
I 4 Prufungstermine (Ende Juni, Oktober,November/Dezember, Janner), s. Homepage fur genaueTermine
I Theorieteil: Multiple Choice-Fragen.Praktischer Teil: Rechenbeispiele oder Interpretation einesSPSS-Ausdruckes.Sowohl im MC-Teil als auch im Praktischen Teil istMindestpunkteanzahl notwendig fur positive Note!
I Sprechstunde: nach Vereinbarung(e-mail: [email protected])
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 4/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Vorlesungsunterlagen und KontaktPrufungErganzende Literaturbegleitende Ubung & Tutorien
I Zusatzliche Literatur:Bortz, J. & Doring, N. (2006). Forschungsmethoden undEvaluation fur Human- und Sozialwissenschaftler. (4.Auflage). Berlin: Springer.Buhner, M. & Ziegler, M. (2009). Statistik fur Psychologenund Sozialwissenschaftler. Munchen: Pearson Studium.Eid, M., Gollwitzer, M, & Schmitt, M. (2010). Statistik undForschungsmethoden. Mit Online-Materialien. Weinheim:BeltzSedlmeier, P. & Renkewitz, F. (2008). Forschungsmethodenund Statistik in der Psychologie. Pearson Studium.
I Zusatzliche MaterialienI www.neuestatistik.deI www.mathe-online.at
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 5/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Vorlesungsunterlagen und KontaktPrufungErganzende Literaturbegleitende Ubung & Tutorien
I Ubungen zur Statistik: mehrere Parallelveranstaltungen,Anwesenheitspflicht, Beispiele sind vorzubereiten, Anmeldungin Univis.
I Ubungsbeispiele werden auf der Homepage jeweils amMittwoch nachmittag zum Download bereitgestellt.
I Tutorien zur Vorlesung und zu den Ubungen: s. Homepage
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 6/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
I Psychologie = empirische Wissenschaft(auf Erfahrung beruhend):
I Bortz & Doring: Empirische Forschung sucht nachErkenntnissen durch systematische Auswertung vonErfahrungen.
I Psychologische Methodenlehre beschaftigt sich mit Fragen derPlanung und Auswertung empirischer Untersuchungen
I Gute Untersuchungsplanung entscheidend furAussagekraft der Ergebnisse einer empirischenUntersuchung!
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 7/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
I Warum benotigt eine Klinische Psychologin undGesundheitspsychologin in freier Praxis, die nicht selbstempirische Untersuchungen durchfuhren mochte, Kenntnisseder Psychologischen Methodenlehre und Statistik?
I Psychologisches Gutachten:Zur Auswahl geeigneter psychologischer Testverfahren und derInterpretation der Ergebnisse (Umgang mit Normtabellen)Kenntnisse der Statistik notwendig.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 8/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
I Behandlung:Ethischer Grundsatz: Anwendung evidenzbasierterBehandlungsmethoden. Behandlungsmethoden, derenEffektivitat in Studien mit entsprechendem Studiendesigngezeigt werden konnte. ⇒ Notwendigkeit, die Qualitat einerStudie, Untersuchungsdesign, statistische Auswertung undInterpretation, nachzuvollziehen und kritisch zu bewerten.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 9/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
”Goldstandard” in der medizinischen und psychologischenForschung sind randomisiert kontrollierte Studien (”randomizedcontrolled trials”, RCT’s).Kontrolliert, weil die Ergebnisse in der Studiengruppe mit deneneiner Kontrollgruppe ohne Intervention oder einerKontrollintervention verglichen werden. Kontrollintervention:bisher wirksamste Maßnahme oder eine Scheinintervention (beiMedikamenten Placebo).Die Studiengruppe wird auch als Pruf-, Interventions-,Behandlungs- oder Verumgruppe (lateinisch Verum, ”das Wahre”;im Gegensatz zum Placebo die echte Behandlungsform, z. B. daswirkstoffhaltige Medikament) bezeichnet.Die Kontrollgruppe wird auch als Vergleichs- oder Placebogruppe(sofern Placebos eingesetzt werden) bezeichnet.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 10/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Randomisierung bedeutet, dass die Zuordnung zurBehandlungsgruppe (etwa Verhaltenstherapie oderGestalttheoretische Psychotherapie) oder Vergleichsgruppe nachdem Zufallsprinzip erfolgt.Zweck der Randomisierung: 1. Ausschluss der Einflussnahme desUntersuchers (Befangenheit) auf die Zuordnung einer Behandlungund dadurch auf die Studienergebnisse. 2. Gleichmaßige Verteilungvon bekannten und nicht bekannten Einflussfaktoren auf alleGruppen.Form und Durchfuhrung der Randomisierung mussen in der Studieangefuhrt werden.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 11/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Quelle: Bortz,J. & Doring,N. Forschungsmethoden und Evaluation.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 12/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Gutekriterien einer quantitativen empirischen Untersuchung
I Objektivitat: Ergebnisse sollen unabhangig vom jeweiligenUntersucher sein.
I Validitat = Gultigkeit, Aussagekraft:
1. Interne Validitat = Interpretationseindeutigkeit (keinealternativen Erklarungen moglich)
2. Externe (okologische) Validitat = Verallgemeinerbarkeit derErgebnisse auf andere Personen, Situationen und/oderZeitpunkte.
I Reliabilitat = Zuverlassigkeit, Genauigkeit.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 13/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Deskriptivstatistik und Inferenzstatistik
I Deskriptivstatistik oder Beschreibende Statistik:zusammenfassende Beschreibung der Daten, explorativeDatenanalyse (Suchen von Strukturen und Zusammenhangen)
I Inferenzstatistik oder Schließende Statistik:Vollstandige Befragung der interessierenden Grundgesamtheitmeist nicht moglich ⇒ mit Hilfe der Inferenzstatistik werdenaufgrund von Beobachtungen in einer Teilmenge von PersonenRuckschlusse auf Gegebenheiten in der interessierendenGrundgesamtheit gezogen.Ruckschlusse sind mit gewisser Fehlerwahrscheinlichkeitbehaftet = Wahrscheinlichkeitsaussagen.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 14/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Population und Stichprobe (1)Aus Grundgesamtheit aller interessierenden Personen = Populationwird eine Teilmenge von Personen ausgewahlt = Stichprobe undaufgrund der Beobachtungen in dieser Stichprobe auf dieGrundgesamtheit geschlossen.
Quelle: www.neuestatistik.de
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 15/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Population und Stichprobe (2)
I Beispiel aus dem Alltag: Wenn Sie Spaghetti kochen, werdenSie vielleicht zunachst einige davon aus dem Wasser nehmenum zu uberprufen, ob sie bereits ”al dente” sind. Trifft diesfur diese Stichprobe zu, werden Sie daraus schließen, dass dasmit hoher Wahrscheinlichkeit auch fur die Grundgesamtheitaller von Ihnen ins Wasser gelegten Spaghetti zutrifft.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 16/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Population und Stichprobe (3)
I Beispiel: Epidemiologische Studie zur Pravalenzrate vonEssstorungen bei 10-15 Jahrigen in Wien: Liste aller WienerSchulen, Zufallsauswahl von Schulen, Testung von zufalliggewahlten Schulerinnen und Schulern in diesen Schulen.Schluss auf Pravalenzrate in der Grundgesamtheit.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 17/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Population und Stichprobe (4)
I Verallgemeinerung auf Population ist nur mitinferenzstatistischen Verfahren zulassig, Deskriptivstatistikmacht nur Aussagen uber die erhobene Stichprobe.
I Inferenzschluss nur bei Zufallsauswahl gultig.
I Population muss eindeutig definiert sein.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 18/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Merkmale und Variablen (1)
I Die Psychologie interessiert sich fur Variation vonEigenschaften in der Population bzw. fur gemeinsameVariation mehrerer Merkmale (die Veranderung einesMerkmales in Abhangigkeit von einem anderen).
I In Experimenten wird Veranderung eines Merkmales durchaktive Manipulation eines anderen Merkmales untersucht
I Beispiel: In einem verkehrspsychologischen Experiment wirduntersucht wie sich die Konzentrationsfahigkeit und dieReaktionsgeschwindigkeit von Personen unter verschiedenstarkem Alkoholeinfluss verandern.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 19/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Merkmale und Variablen (2)
I Interessierende Merkmale (Eigenschaften) der Personen,welche verschiedene Auspragungen annehmen konnen, werdenals Variablen bezeichnet.
I Eine Variable ist ein Symbol fur eine Menge vonMerkmalsauspragungen. (Bortz & Doring)
I Variablen werden ublicherweise mit lateinischenGroßbuchstaben gekennzeichnet, die konkreten Auspragungen(Realisierungen) mit Kleinbuchstaben.
I Beispiel: Variable X , Geschlecht, steht fur die moglichenMerkmalsauspragungen x ′
1, weiblich, oder x ′2, mannlich
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 20/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Funktionale Bedeutung von Variablen (1)
I Unabhangige Variablen (UV): Variablen, deren Einfluss aufeine oder mehrere andere Variablen untersucht wird (auchFaktoren genannt).
I Abhangige Variablen (AV): Variablen, auf die ein Einfluss derVeranderung der unabhangigen Variablen vermutet wird.
I Beispiel: Im verkehrspsychologischen Experiment wareAlkoholeinfluss die unabhangige Variable,Konzentrationsfahigkeit und Reaktionsgeschwindigkeit dieabhangigen Variablen.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 21/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Funktionale Bedeutung von Variablen (2)
I Moderierende Variablen oder Moderatorvariablen sindVariablen, die das Ergebnis beeinflussen, indem sie dieWirkung einer unabhangigen Variablen auf die abhangigeVariable verandern (sie beeinflussen Richtung und Starke desZusammenhanges zwischen UV und AV).
I Beispiel: Im verkehrspsychologischen Experiment konnte diegleichzeitige Einnahme von Medikamenten die Alkoholwirkungbeeinflussen.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 22/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Funktionale Bedeutung von Variablen (3)
I Mediierende Variablen oder Mediatorvariablen sind Variablen,die den Zusammenhang zwischen zwei Variablen vermitteln(erklaren).
I Beispiel: Altere AutofahrerInnen sind ”bessere”AutofahrerInnen. Dieser Zusammenhang wird durch dieVariable ”Fahrpraxis” vermittelt.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 23/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Funktionale Bedeutung von Variablen (4)
Quelle: Faller, H. & Lang, H. (2006). Medizinische Psychologie und
Soziologie (2. Auflage, S.51). Heidelberg: Springer Medizin Verlag.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 24/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Funktionale Bedeutung von Variablen (5)
I Storvariablen sind Variablen, die das Untersuchungsergebnisbeeinflussen konnen, aber nicht berucksichtigt wurden.Moglichkeiten zur Ausschaltung von Storvariablen (vgl. Bortz& Doring):
I Randomisierung.I Paarbildung (matched samples): Bei zwei
Untersuchungsgruppen werden aufgrund der Auspragung(en)der moglichen Storvariable(n) ”Paare” vonUntersuchungsteilnehmerInnen gebildet; je eine Person derKontrollgruppe wird einer Person der Studiengruppezugeordnet.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 25/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Funktionale Bedeutung von Variablen (6)
I Mogliche Storvariable als zusatzliche Variable erheben und beider statistischen Auswertung als Kontrollvariableberucksichtigen.
I Nur Personen mit einer bestimmten Auspragung dieser Variableuntersuchen (z.B. nur Personen, die keine Medikamenteeingenommen haben); d.h. die Variable konstant halten.
I Außerdem sollte man dafur sorgen, dass die Untersuchung inallen Vergleichsgruppen storungsfrei verlauft (= Ausschaltenvon Storfaktoren).
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 26/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Empirische Zuganglichkeit von Variablen
I Manifeste Variablen sind direkt beobachtbar. Z.B.Alkoholmenge, Gewicht, Geschlecht, usw.
I Latente Variablen sind nicht beobachtbar (sichtbar). Z.B.Konzentrationsfahigkeit, Intelligenz, etc. Hierbei handelt essich um sog. hypothetische Konstrukte, welche nur indirektgemessen werden konnen. Aufgrund der Auspragungen vonmanifesten Variablen wird auf die latente Eigenschaftgeschlossen.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 27/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Arten von MerkmalsauspragungenI Numerische oder Quantitative Variablen: Auspragungen sind
Zahlenwerte. Z.B. Gewicht, Alter, etc.
I Kategoriale oder Qualitative Variablen: Auspragungen sindZustande oder Kategorien. Z.B. Geschlecht, Familienstand,Staatsburgerschaft.
I Auspragungen quantitativer Variablen lassen sich durchMessen, Zahlen, Wiegen erfassen und unterscheiden sichdurch ihre Große.Auspragungen qualitativer Variablen unterscheiden sich durchihre Art und lassen sich nicht durch Messen, Zahlen, Wiegenerfassen.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 28/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Arten qualitativer und quantitativer Variablen
Weiters unterscheidet man:
I Bei quantitativen Variablen zwischen diskreten Variablen,welche nur ganzzahlige Auspragungen haben (1,2,3,. . . ) undstetigen oder kontinuierlichen Variablen, die beliebig feinabstufbar sind.
I Bei qualitativen Variablen zwischen dichotomen Variablen =Variablen mit nur zwei Auspragungen (z.B. Geschlecht) undpolytomen Variablen = Variablen mit mehr als zweiAuspragungen.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 29/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Skalenniveau (1)
I Um ein Merkmal zu messen werden den einzelnenAuspragungen Messwerte (Zahlen) auf einer Skala zugeordnet.
I Eine Skala ist eine Vorschrift, die jeder Person der Stichprobeeinen Beobachtungswert zuordnet, der die Auspragung desinteressierenden Merkmales angibt.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 30/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Skalenniveau (2)
In diesem Sinne lassen sich auch qualitative Merkmale ”messen”;man nennt diese Zuordnung von Zahlen zu denMerkmalsauspragungen auch Kodierung.Bei der Zuordnung der Zahlen ist zu beachten, dassunterschiedlichen Merkmalsauspragungen unterschiedliche Zahlenzugeordnet werden und jeder moglichen Merkmalsauspragungeindeutig eine Zahl zuordenbar ist.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 31/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Skalenniveau (3)
I Nominalskala: Die Skala mit dem niedrigsten Niveau.Rangordnung der Auspragungen nicht moglich oder sinnvoll,auch wenn ihnen Zahlen zugeordnet werden. Beurteilt nurGleichheit und Verschiedenheit von Merkmalsauspragungen.Beispiele: Geschlecht, Familienstand, Staatsburgerschaft.Nominalskalierte Variablen heissen nominale Merkmale.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 32/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Skalenniveau (4)
I Ordinalskala oder Rangskala: Auspragungen weisen naturlicheRangordnung auf. Macht Großer-Kleiner-Aussagen. DieAbstande zwischen den verschiedenen Werten einerordinalskalierten Variablen lassen sich jedoch nichtinterpretieren; die Ordinalskala macht keine Aussage uber dieGroße der Unterschiede zwischen den Auspragungen. Solangedie Großer-Kleiner-Relationen erhalten bleiben sind die Zahlenbeliebig wahlbar.
I Typisches Beispiel einer Ordinalskala: Platzierungen beisportlichen Wettkampfen. Platzierung gibt nur Auskunftdaruber wer z.B. am schnellsten war, nicht uber Zeitabstandezwischen den einzelnen Rangplatzen.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 33/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Skalenniveau (5)
I Metrische Variablen: Auspragungen unterliegen nicht nurRangordnung, sondern Differenzen sind sinnvollinterpretierbar. Gleich große Zahlendifferenzen entsprechenauch gleich großen Unterschieden zwischen denAuspragungen. Beispiele sind: Gewicht, Große, Alter.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 34/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Skalenniveau (7)
I Metrische Skalen konnen weiters noch unterteilt werden inI Intervallskala: kein naturlicher Nullpunkt (z.B. Kalender,
Temperatur in Grad Celsius); Verhaltnisse konnen nichtinterpretiert werden. In der Psychologie wird furPsychologische Tests angenommen, dass die Messwerteintervallskaliert sind.
I Rationalskala: absoluter (naturlicher) Nullpunkt, Verhaltnissekonnen interpretiert werden (Gewicht, Alter, Große, Anzahl derKinder, Temperatur in Kelvin, usw.)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 35/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Univariat, Bivariat, Multivariat
I Univariat: nur eine Variable wird betrachtet.
I Bivariat: zwei Variablen werden gemeinsam betrachtet.
I Multivariat: mehr als zwei Variablen werden gemeinsambetrachtet.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 36/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Hypothesengenerierende und HypothesenprufendeUntersuchungen
I Hypothesenprufende Untersuchungen: aufgrund vonVorinformationen aus bisherigen Untersuchungen konnenwissenschaftliche Hypothesen formuliert und statistischgepruft werden.
I Hypothesengenerierende Untersuchungen: bei neuenForschungsgebieten, fur welche zu wenige Informationenvorliegen um Hypothesen zu formulieren, werden zunachsthypothesenerkundende Untersuchungen durchgefuhrt. Ziel istdie Formulierung wissenschaftlicher Hypothesen, die in eineranschließenden hypothesenprufenden Untersuchung statistischgepruft werden.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 37/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Wissenschaftliche Hypothesen (1)
I Eine wissenschaftliche Hypothese behauptet eine mehr oderweniger prazise Beziehung zwischen zwei oder mehr Variablen,die fur eine bestimmte Population vergleichbarer Objekte oderEreignisse gelten soll. (Bortz & Doring)
I Die Hypothesen mussen im Rahmen derUntersuchungsplanung vor der Datenerhebung formuliertwerden!
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 38/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe
Wissenschaftliche Hypothesen (2)
I Wissenschaftliche Hypothesen (im Gegensatz zuAlltagsvermutungen)
I beziehen sich auf reale Sachverhalte, die empirisch uberprufbarsind,
I sind allgemeingultige, uber den Einzelfall hinausgehendeBehauptungen,
I mussen durch Erfahrung widerlegbar (falsifizierbar) sein,I mussen widerspruchsfrei sein,I sollen moglichst prazise formuliert sein,I mussen theoriegeleitet sein.
(vgl. Bortz & Doring)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 39/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
NotationSummenzeichen
I Die Anzahl der Personen in der Stichprobe =Stichprobenumfang wird mit N bzw. n bezeichnet.
I Die Merkmalsauspragungen der einzelnen Personen in derStichprobe bei Variable X werden mit x1, . . . , xi , . . . , xn (oderin anderer Schreibweise xi , i = 1, . . . , n) bezeichnet.
I Die moglichen Auspragungen (Realisierungen) einesMerkmales X werden mit x ′
1, . . . , x′j , . . . , x
′k (oder in anderer
Schreibweise: x ′j , j = 1, . . . , k) bezeichnet.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 40/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
NotationSummenzeichen
I Hat man nur ein Merkmal erhoben und notiert dieBefragungsergebnisse in der Reihenfolge der Befragung oderzufallig, bezeichnet man die entstehende Liste als Urliste oderBeobachtungsreihe.
I Beispiel: Erhobene Variable X : Anzahl der Kinder,Stichprobenumfang n = 15.
I Urliste:x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15
0 1 2 3 2 1 2 2 4 3 1 2 3 1 0
x2 = 1 bedeutet, dass die in die Urliste an zweiter Stelleeingetragene Person ein Kind hat.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 41/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
NotationSummenzeichen
Hat man mehrere Merkmale (Variablen) erhoben, fasst man diesein Form einer Datenmatrix zusammen. Die Matrix besteht aus nZeilen fur die Personen und p Spalten fur die erhobenen Variablen(n × p−Matrix).Zeile i enthalt die beobachteten Merkmalsauspragungen der i−tenPerson,Spalte k enthalt die bei den n Personen beobachtetenAuspragungen des Merkmales K .Die Eintragungen x11, . . . , xnp bezeichnen die Auspragungen dereinzelnen Merkmale bei den einzelnen Personen: x11 steht fur dieMerkmalsauspragung der ersten Person beim ersten Merkmal.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 42/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
NotationSummenzeichen
Beispiel einer Datenmatrix in allgemeiner Notation:
Variable1 2 . . . k . . . p
Person 1 x11 x12 . . . x1k . . . x1p
2 x21 x22 . . . x2k . . . x2p...
.... . .
...i xi1 xi2 . . . xik . . . xip...
.... . .
...n xn1 xn2 . . . xnk . . . xnp
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 43/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
NotationSummenzeichen
Beispiel einer Datenmatrix fur n = 50 Personen und erhobeneVariablen Geschlecht (1=weiblich, 2=mannlich), Kinderanzahl,Alter
VariableGeschlecht Kinder Alter
Person 1 1 2 402 2 0 25...
......
......
......
...50 2 1 45
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 44/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
NotationSummenzeichen
In der Statistik benotigt man sehr oft die Summe von Messwerten,z.B. in der Gesamtstichprobe oder einer Teilstichprobe.Hat eine Summe sehr viele Summanden, ist es zweckmaßig dasSummenzeichen
∑(griech. Sigma) zu verwenden.
Zum Beispiel: Summe aller xi fur i = 1 bis n:
x1 + x2 + x3 + . . . + xn =
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 45/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
NotationSummenzeichen
Zusatzmaterial:
http://www.mathe-online.at/materialien/klaus.berger/files/Summen/summenzeichen.pdf
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 46/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
NotationSummenzeichen
I Beispiel 1: Summe der Kinder aller Personen aus unsererUrliste
n∑i=1
xi = 0+1+2+3+2+1+2+2+4+3+1+2+3+1+0 = 27
I Beispiel 2: Summe der Kinder der ersten 5 Personen aus derUrliste
5∑i=1
xi = 0 + 1 + 2 + 3 + 2 = 8
I Beispiel 3: Summe der Kinder der letzten 5 Personen aus derUrliste (also Personen 11 bis 15)
15∑i=11
= 1 + 2 + 3 + 1 + 0 = 7
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 47/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
NotationSummenzeichen
I Laufindex ist beliebig wahlbar
n∑i=1
xi =n∑
j=1
xj =n∑
l=1
xl
I Aber!n∑
i=1
xi 6=n∑
j=1
xi
I
n∑i=1
(xi+yi ) = (x1+y1)+(x2+y2)+. . .+(xn+yn) =n∑
i=1
xi+n∑
i=1
yi
6=n∑
i=1
xi + yi = (x1 + x2 + . . . + xn) + yi
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 48/49
InhalteOrganisatorisches
EinfuhrungAufbereitung der erhobenen Daten
NotationSummenzeichen
In∑
i=1
a = a + a + a + ... = na
(a ist eine Konstante)
I
n∑i=1
axi = (ax1+ax2+. . .+axn) = a(x1+x2+. . .+xn) = an∑
i=1
xi
I Es gelten die allgemeinen Rechenregeln fur AdditionenZusatzmaterial:http://www.mathe-online.at/materialien/klaus.berger/files/Summen/regenregelnsummen.pdf
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 49/49
GrundbegriffeUnivariate Deskriptive Statistik
Einfuhrung in Quantitative Methoden
Mag. Dipl.Ing. Dr. Pantelis Christodoulides&
Mag. Dr. Karin Waldherr
SS 2011
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 1/62
GrundbegriffeUnivariate Deskriptive Statistik
Summenzeichen
In der Statistik benotigt man sehr oft die Summe von Messwerten,z.B. in der Gesamtstichprobe oder einer Teilstichprobe.Hat eine Summe sehr viele Summanden, ist es zweckmaßig dasSummenzeichen
∑(griech. Sigma) zu verwenden.
Zum Beispiel: Summe aller xi fur i = 1 bis n:
x1 + x2 + x3 + . . .+ xn =
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 2/62
GrundbegriffeUnivariate Deskriptive Statistik
Summenzeichen
Zusatzmaterial:
http://www.mathe-online.at/materialien/klaus.berger/files/Summen/summenzeichen.pdf
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 3/62
GrundbegriffeUnivariate Deskriptive Statistik
Summenzeichen
Urliste: Anzahl der Kinder von n = 15 Personenx1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15
0 1 2 3 2 1 2 2 4 3 1 2 3 1 0
I Beispiel 1: Summe der Kinder aller Personen aus der Urlisten∑
i=1
xi = 0 + 1 + 2 + 3 + 2 + 1 + 2 + 2 + 4 + 3 + 1 + 2 + 3 + 1 + 0 = 27
I Beispiel 2: Summe der Kinder der ersten 5 Personen aus der Urliste
5∑i=1
xi = 0 + 1 + 2 + 3 + 2 = 8
I Beispiel 3: Summe der Kinder der letzten 5 Personen aus der Urliste(also Personen 11 bis 15)
15∑i=11
xi = 1 + 2 + 3 + 1 + 0 = 7
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 4/62
GrundbegriffeUnivariate Deskriptive Statistik
Summenzeichen
I Laufindex ist beliebig wahlbarn∑
i=1
xi =n∑
j=1
xj =n∑
l=1
xl
I Aber!n∑
i=1
xi 6=n∑
j=1
xi
I
n∑i=1
(xi+yi ) = (x1+y1)+(x2+y2)+. . .+(xn+yn) =n∑
i=1
xi+n∑
i=1
yi
6=n∑
i=1
xi + yi = (x1 + x2 + . . .+ xn) + yi
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 5/62
GrundbegriffeUnivariate Deskriptive Statistik
Summenzeichen
In∑
i=1
a = a + a + a + ... = na
(a ist eine Konstante)
I
n∑i=1
axi = (ax1+ax2+. . .+axn) = a(x1+x2+. . .+xn) = an∑
i=1
xi
I Es gelten die allgemeinen Rechenregeln fur AdditionenZusatzmaterial:http://www.mathe-online.at/materialien/klaus.berger/files/Summen/regenregelnsummen.pdf
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 6/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
I Die Deskriptivstatistik dient der Beschreibung der erhobenenDaten in der Stichprobe durch
1. Tabellen,2. Statistische Kennwerte, und/oder3. Grafiken.
I Diese Strukturierung, Zusammenfassung und anschaulicheDarstellung der Daten dient aber auch dazu, sich zunachsteinen Uberblick zu verschaffen und ev. Widerspruchlichkeitenzu entdecken (verursacht z.B. durch Dateneingabefehler,falsche Angaben eines Untersuchungsteilnehmers, etc.).
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 7/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Die Datenmatrix liefert Informationen uber die Charakteristikajeder einzelnen Person. Im allgemeinen ist man allerdings daraninteressiert, wie haufig die einzelnen Merkmalsauspragungen in derStichprobe vorkommen. Dazu kann man sich die Haufigkeitstabellebzw. Haufigkeitsverteilung ansehen.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 8/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Nominalskalierte Merkmale
Absolute Haufigkeit, fj , ist die Anzahl von Personen mit der j-tenAuspragung des Merkmals X .
Es gilt stets: Die Summe der absoluten Haufigkeiten fur dieverschiedenen Auspragungen betragt n:
k∑j=1
fj = n
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 9/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
I Die absoluten Haufigkeiten sind vom Stichprobenumfangabhangig; eignen sich nicht um die Ergebnisse verschiedenerErhebungen mit unterschiedlichem Stichprobenumfang zuvergleichen. Großen, die unabhangig vom Stichprobenumfangsind, sind die relative Haufigkeit und Prozentwerte.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 10/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
I Relative Haufigkeit, rj , ist der Quotient
absolute Haufigkeit
Anzahl der Personen=
fjn
Es gilt stets: Es konnen nur Werte zwischen 0 und 1vorkommen; die Summe der relativen Haufigkeiten fur die
verschiedenen Auspragungen betragt 1.
k∑j=1
rj = 1
I Prozentwerte, pzj :
Prozentuelle Haufigkeit = rj × 100
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 11/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Datenbeispiel 1:
Allgemeine Bevolkerungsumfrage der Sozialwissenschaften(ALLBUS 2006):1 Variable ”Erhebungsgebiet: Alte Bundeslander(= Westdeutschland) oder Neue Bundeslander (=Ostdeutschland)”; Zufallsstichprobe von n = 50 Personen.Kodierung: 1 = Westdeutschland, 2 = Ostdeutschland.
Urliste: 2, 2, 2, 1, 1, 1, 1, 1, 2, 2, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1,1, 2, 2, 2, 2, 1, 2, 2, 1, 1, 1, 2, 1, 1, 2, 1, 2, 2, 1, 2, 1, 2, 2, 1, 1,2, 1, 2
1Das ALLBUS-Programm ist 1980-1986 und 1991 von der DFG (Deutsche Forschungsgemeinschaft) gefordert
worden. Die weiteren Erhebungen wurden von Bund und Landern uber die GESIS (Gesellschaftsozialwissenschaftlicher Infrastruktureinrichtungen) finanziert. ALLBUS wird innerhalb der GESIS an denStandorten Mannheim und Koln in Zusammenarbeit mit dem ALLBUS-Ausschuß realisiert. Die vorgenanntenInstitutionen und Personen tragen keine Verantwortung fur die Verwendung der Daten in dieser Vorlesung.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 12/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Haufigkeitstabelle fur Datenbeispiel 1Erhebungsgebiet Strichliste abs. H. rel. H. Prozent
x ′j fj rj pzjWestdeutschland ||||— ||||— ||||— ||||— ||||— |||| 29 0.58 58Ostdeutschland ||||— ||||— ||||— ||||— | 21 0.42 42
Summe 50 1 100
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 13/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Ordinalskalierte Merkmale
Zusatzlich kumulative Haufigkeitsfunktionen interessant undsinnvoll.Voraussetzung ist, dass die Merkmalsauspragungen der Große nachgeordnet sind.
I Kumulierte absolute Haufigkeit oder EmpirischeVerteilungsfunktion f + = die Summe der absolutenHaufigkeiten der betreffenden Merkmalsauspragung und allerkleineren. Gibt an, wieviele Personen einen Wert haben, derkleiner oder gleich der betreffenden Kategorie l ist.
f +l =
l∑j=1
fj
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 14/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
I Kumulierte relative Haufigkeit r+ = die Summe der relativenHaufigkeiten der betreffenden Merkmalsauspragung und allerkleineren. Anteil der Personen, die einen Wert haben, derkleiner oder gleich der betreffenden Kategorie l ist.
r+l =
1
n
l∑j=1
fj
I Kumulierte prozentuelle Haufigkeit pz+ = die Summe derprozentuellen Haufigkeiten der betreffendenMerkmalsauspragung und aller kleineren. Prozentwert derPersonen, die einen Wert haben, der kleiner oder gleich derbetreffenden Kategorie l ist.
pz+l = r+
l × 100
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 15/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Es gilt stets:
f +k =
k∑j=1
fj = n
r+k =
1
n
k∑j=1
fj = 1
pz+k = 100
bei j = 1, . . . , k Merkmalsauspragungen.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 16/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Datenbeispiel 2:Variable ”Gesundheitszustand” aus ALLBUS (2006): Kodierung: 1= sehr gut, 2 = gut, 3 = zufriedenstellend, 4 = weniger gut, 5 =schlecht; Zufallsstichprobe von n = 50 Personen.
Urliste: 1, 2, 3, 2, 3, 2, 3, 4, 3, 2, 2, 5, 2, 3, 3, 2, 2, 3, 2, 2, 2, 2,2, 1, 1, 1, 2, 4, 3, 3, 2, 4, 3, 5, 1, 3, 5, 2, 1, 2, 2, 2, 2, 4, 2, 3, 1,2, 4, 4
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 17/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Haufigkeitstabelle fur Datenbeispiel 2
Gesundheitszustand fj rj pzj f +j r+
j pz+j
sehr gut 7 0.14 14 7 0.14 14gut 22 0.44 44 29(7 + 22) 0.58 58zufriedenstellend 12 0.24 24 41(29 + 12) 0.82 82weniger gut 6 0.12 12 47 0.94 94schlecht 3 0.06 6 50 1.00 100
Summe 50 1.00 100 - - -
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 18/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Metrische Merkmale
Haufigkeitstabelle unubersichtlich, insbesondere bei stetigenVariablen → Intervalle (= Klassenzusammenfassung odergruppierte Daten). 5-15 Intervalle (max. 20). Je weniger Intervalleumso großer Informationsverlust, je mehr Intervalle umsounubersichtlicher.Variable ”Alter” aus ALLBUS (2006), Zufallsstichprobe vonn = 50 Personen.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 19/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Haufigkeitstabelle fur Datenbeispiel 3 mit Originaldaten
Alter fj rj pzj f +j r+
j pz+j
19 1 0.02 2 1 0.02 220 1 0.02 2 2 0.04 424 2 0.04 4 4 0.08 831 1 0.02 2 5 0.10 1033 1 0.02 2 6 0.12 1235 1 0.02 2 7 0.14 1436 2 0.04 4 9 0.18 1838 2 0.04 4 11 0.22 2240 4 0.08 8 15 0.30 3041 2 0.04 4 17 0.34 3442 2 0.04 4 19 0.38 3843 1 0.02 2 20 0.40 40
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 20/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Fortsetzung Haufigkeitstabelle fur Datenbeispiel 3 mitOriginaldaten
45 1 0.02 2 21 0.42 4246 2 0.04 4 23 0.46 4647 2 0.04 4 25 0.50 5048 2 0.04 4 27 0.54 5449 1 0.02 2 28 0.56 5651 1 0.02 2 29 0.58 5852 1 0.02 2 30 0.60 6053 2 0.04 4 32 0.64 6454 1 0.02 2 33 0.66 6655 2 0.04 4 35 0.70 7056 1 0.02 2 36 0.72 7257 1 0.02 2 37 0.74 7458 1 0.02 2 38 0.76 76
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 21/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Fortsetzung Haufigkeitstabelle fur Datenbeispiel 3 mitOriginaldaten
60 1 0.02 2 39 0.78 7862 1 0.02 2 40 0.80 8064 2 0.04 4 42 0.84 8466 1 0.02 2 43 0.86 8667 1 0.02 2 44 0.88 8869 1 0.02 2 45 0.90 9071 2 0.04 4 47 0.94 9475 1 0.02 2 48 0.96 9682 1 0.02 2 49 0.98 9885 1 0.02 2 50 1.00 100
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 22/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Haufigkeitstabelle fur Datenbeispiel 3 mit gruppierten Daten
Alter fj rj pzj f +j r+
j pz+j
≤ 29 Jahre 4 0.08 8 4 0.08 830-39 Jahre 7 0.14 14 11 0.22 2240-49 Jahre 17 0.34 34 28 0.56 5650-59 Jahre 10 0.20 20 38 0.76 7660-69 Jahre 7 0.14 14 45 0.90 90≥ 70 Jahre 5 0.10 10 50 1.00 100
Summe 50 1 100
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 23/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Haufigkeitstabelle mit SPSS
I Menu Analysieren...
I → Deskriptive Statistik
I → Haufigkeiten...
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 24/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Histogramm
I Histogramm oder Blockdiagramm - Grafische Darstellung derHaufigkeitstabelle
I Beobachtete Auspragungen x ′j geordnet auf der X -Achse
I Relative (rj) oder absolute Haufigkeiten (fj) auf der Y -Achse
I Rechtecksflachen sind gleich den rj oder fj
I Gesamtflache des Histogramms ist gleich 1 bzw. n
I Maßstab auf der X -Achse beliebig und wird so gewahlt, dassdie Verteilung moglichst anschaulich wird
I Balkendiagramm fur nominalskalierte Variablen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 25/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 26/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Treppenfunktion
I Grafische Darstellung der kumulativen Haufigkeitstabelleanalog zu Histogramm
I Letzte und großte Teilflache ist gleich 1 bzw. n
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 27/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Treppenfunktion
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 28/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Lagemaße - Zweck
I Wir wollen die zentrale Tendenz einer Stichprobe moglichstgut schatzen
I Eine Maßzahl, die in geeigneter Weise ein ’Zentrum’ derStichprobe angibt
I Mittelwert, Geometrisches Mittel, Modalwert und Median
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 29/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Arithmetisches Mittel (Mittelwert)
I Der Mittelwert oder Durchschnittswert ist die Summe allerWerte dividiert durch den Stichprobenumfang n:
Ix =
n∑i=1
xi
n=
1
n
n∑i=1
xi
I Das arithmetische Mittel ist nur fur metrische Variablensinnvoll!
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 30/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Arithmetisches Mittel (Mittelwert)
Beispiel: Anzahl der Kinder:
Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0
x =0 + 1 + 2 + 3 + 2 + 1 + 2 + 2 + 4 + 3 + 1 + 2 + 3 + 1 + 0
15=
=27
15= 1.8
Die durchschnittliche Kinderzahl in der Stichprobe betragt 1.8Kinder.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 31/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Arithmetisches Mittel (Mittelwert)Auf Grundlage der Haufigkeitstabelle lasst sich der Mittelwertberechnen, indem man jede Merkmalsauspragung mit ihrerabsoluten Haufigkeit multipliziert und die Summe uber alleMerkmalsauspragungen bildet.
x =1
n
k∑j=1
x ′j · fj
Beispiel: Berechnung des Mittelwertes fur Datenbeispiel 3 aus derHaufigkeitstabelle
x =1
50(19 · 1 + 20 · 1 + 24 · 2 + 31 · 1 + . . .) =
2459
50= 49.18
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 32/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Eigenschaften des Mittelwertes (1)
Die Summe der Differenzen aller Werte vom Mittelwert ist Null,
n∑i=1
(xi − x) = 0
d.h. positive und negative Abweichungen vom Mittelwert hebensich auf.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 33/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Eigenschaften des Mittelwertes (2)
Die Summe der quadrierten Differenzen aller Werte zum Mittelwertist ein Minimum (d.h. ist kleiner als die Summe der quadriertenDifferenzen aller Werte zu irgendeinem anderen Wert)
n∑i=1
(xi − x)2 = Min
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 34/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Gemeinsamer Mittelwert fur zwei oder mehr Datensatze
Den gemeinsamen Mittelwert aus zwei Stichproben mitMittelwerten x1 und x2 und Stichprobenumfangen n1 und n2
berechnet man, indem man die Mittelwerte mit denStichprobenumfangen gewichtet:
x =n1x1 + n2x2
n1 + n2
Analog fur mehr als zwei Datensatze.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 35/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Median und das α-QuantilI Der Median ist dadurch charakterisiert, dass jeweils
mindestens 50% der Beobachtungen einen Wert großer odergleich bzw. kleiner oder gleich dem Median annehmen
I Sind x(1) ≤ · · · ≤ x(n) die der Große nach geordnetenBeobachtungswerte, so ist der Median definiert als
x =
x( n+12
) falls n ungerade
x( n2
) + x( n+22
)
2 falls n gerade
I Bei einer ungeraden Anzahl von Merkmalsauspragungen istder Median der Wert in der Mitte der geordneten Reihe
I Bei einer geraden Anzahl ist der Median das arithmetischeMittel zwischen den beiden mittleren Werten der geordnetenReihe
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 36/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Median und das α-Quantil
I Beispiel 1: Anzahl der Kinder (n = 15):Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0
Geordn. Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4
x = x(8) = 2
I Beispiel 2: Anzahl der Kinder (n = 16):
Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0 5Geordn. Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4 5
x =x(8) + x(9)
2=
2 + 2
2= 2
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 37/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Median und das α-QuantilI Sind x(1) ≤ · · · ≤ x(n) die der Große nach geordneten
Beobachtungswerte, so ist das α-Quantil (0 < α < 1) definiertals
xα =
x(l) falls n · α keine ganze Zahl ist;
l = die auf n · α folgende ganze Zahlx(l)+x(l+1)
2 falls n · α eine ganze Zahl ist;l = n · α
I Der Median ist das Quantil mit α = 0.50 (0.50-Quantil)
I Die Quantile mit α = 0.25 und α = 0.75 heißen unteres bzw.oberes Quartil
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 38/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Median und das α-Quantil
Beispiel Anzahl der Kinder (n = 15):
Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0Geordnete Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4
x = x(8) = 2 x0.25 = x(4) = 1 x0.75 = x(12) = 3
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 39/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Median und das α-Quantil
I Der Median hat gegenuber dem arithmetischen Mittel denVorteil, dass er auch bei rangskalierten Merkmalen verwendetwerden kann
I Der Median ist weniger empfindlich gegenuber Ausreissern inder Stichprobe
I Werte, die weit von allen ubrigen entfernt liegen, beeinflussenden Median kaum
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 40/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Ausreisser - Graphische Uberprufung
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 41/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
ModalwertI Bei nominalskalierten Merkmalen wie Geschlecht oder Beruf
kann man weder das arithmetische Mittel noch den Medianals Lagemaß verwenden
I Der Modalwert (Mod) (haufigster Wert) ist ein dafurgeeignetes Lagemaß
I Der Modalwert gibt die Auspragung an, welche die großteHaufigkeit in der Stichprobe besitzt
I Falls mehrere Auspragungen diese Bedingung erfullen, derModalwert also nicht eindeutig ist, ist es nicht sinnvoll ihn alsLagemaß zu verwenden
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 42/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Modalwert
Beispiel Anzahl der Kinder (n = 15):
Urliste: 0 1 1 3 2 2 2 3 4 3 1 2 3 1 0
Mod = 1, 2, 3
I Modalwert nicht eindeutig
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 43/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Bemerkungen zu den Lagemaßen
I Bei mehrgipfeligen und U-formigen Haufigkeitsverteilungensind Lagemaße nicht charakteristisch fur die Verteilung
I Vor der Verwendung eines Lagemaßes immer seineSinnhaftigkeit uberprufen
I Charakterisierung von Haufigkeitsverteilungen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 44/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Charakterisierung von Haufigkeitsverteilungen
I Bei einer symmetrischen Verteilung gilt x = x = Mod
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 45/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Charakterisierung von Haufigkeitsverteilungen
I Lagemaße charakterisieren den Datensatz nicht richtig
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 46/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
I Bei einer linksschiefen Verteilung gilt x < x < Mod
I Bei einer rechtsschiefen Verteilung gilt x > x > Mod
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 47/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Wegweiser Lagemaße
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 48/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Streuungsmaße - ZweckI Streuungsmaße beschreiben die Abweichung von einem
Zentrum einer Haufigkeitsverteilung
I Prazisierung einer Haufigkeitsverteilung durch Lagemaß undStreuungsmaß
I Spannweite, Standardabweichung, Varianz,Variationskoeffizient und Quartilabstand
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 49/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
SpannweiteI Streubereich einer Haufigkeitsverteilung ist derjenige Bereich,
in dem alle Werte der Stichprobe liegen
I Sind x(1) ≤ · · · ≤ x(n) die der Große nach geordnetenBeobachtungswerte, so ist das Intervall
[x(1), x(n)
]der
Streubereich der Stichprobe
I Spannweite R = x(n) − x(1), d.h. die Breite des Streubereichs
I Ausreisser beeinflussen die Spannweite sehr stark
I Berechnung der Spannweite ist nur fur metrische Variablensinnvoll
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 50/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
VarianzI Die Varianz s2 ist ein Maß, das die Streuung der Werte um
den Mittelwert ausdruckt
I
s2 =1
n − 1
n∑i=1
(xi − x)2 =1
n − 1
[n∑
i=1
x2i −
(∑n
i=1 xi )2
n
]︸ ︷︷ ︸praktische Berechnungsformel
I Varianz ist ein quadratisches Streuungsmaß und nimmt somitstets positive Werte an
I Ausreisser beeinflussen die Varianz sehr stark, da dieBezugsgroße der Mittelwert ist
I Berechnung der Varianz ist nur fur metrische Variablensinnvoll
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 51/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
VarianzBeispiel Anzahl der Kinder (n = 15):
Urliste: 0 1 1 3 2 2 2 3 4 3 1 2 3 1 0
15∑i=1
xi = 2815∑i=1
x2i = 72 s2 =
1
14
[72− 784
15
]= 1.38
I Die Varianz laßt sich auch durch die Haufigkeitstabelleberechnen, analog zu Mittelwert
s2 =1
n − 1
k∑j=1
fjx′2j −
(∑k
j=1 fjx′j )
2
n
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 52/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Varianz
Beispiel Datenbeispiel 3:Haufigkeitstabelle siehe 1. Vorlesungseinheit
50∑i=1
xi = 245950∑i=1
x2i = 132027
s2 =1
49
[132027− 24592
50
]= 226.396
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 53/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
StandardabweichungI Die Standardabweichung s ist die positive Wurzel aus der
Varianz einer Stichprobe
I
s =+√s2 = +
√√√√ 1
n − 1
n∑i=1
(xi − x)2
I Die Standardabweichung besitzt die gleiche Dimension wie dieBeobachtungswerte (Vorteil gegenuber der Varianz)
I Ausreisser beeinflussen die Standardabweichung sehr stark, dadie Bezugsgroße der Mittelwert ist
I Berechnung der Standardabweichung ist sinnvoll nur furmetrische Variablen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 54/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
VariationskoeffizientI Der Variationskoeffizient v ist ein vom Mittelwert bereinigtes
Streuungsmaß
I
v =s
x
I Der Variationskoeffizient misst das Verhaltnis vonStandardabweichung und Mittelwert
I Berechnung von v nur fur metrische Variablen mit positivenWerten sinnvoll
I Der Variationskoeffizient eignet sich zum Vergleich derStreuungen verschiedener Messreihen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 55/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Quartilabstand
I
qA = x0.75 − x0.25
I Quartilabstand ist robust gegenuber Ausreissern
I Zwischen dem unteren und oberen Quartil liegen 50% allerWerte
I Berechnung des Quartilabstandes ist sinnvoll fur mindestensrangskalierte Variablen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 56/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Quartilabstand
Beispiel Anzahl der Kinder (n = 15):
Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0Geordnete Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4
x = x(8) = 2 x0.25 = x(4) = 1 x0.75 = x(12) = 3
qA = x0.75 − x0.25 = 2
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 57/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Ausreisser - Grafische Uberprufung
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 58/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Wegweiser Streuungsmaße
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 59/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Schiefe
I Die Schiefe g1 ist eine Maßzahl, die uns angibt, in welcheRichtung eine Haufigkeitsverteilung schief ist
g1 =1n
∑ni=1(xi − x)3√
( 1n
∑ni=1(xi − x)2)3
I Ist g1 = 0, so ist die Verteilung symmetrisch
I Je starker negativ/positiv g1 ist, destolinksschiefer/rechtsschiefer ist die Verteilung
I Die Schiefe ist sinnvoll fur eingipfelige Verteilungen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 60/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
I Messwerte von Personen verschiedener Populationen sind oftnicht direkt vergleichbar, z.B. die Leistung eines Madchens inKugelstoßen mit jener eines Knaben
I Dennoch mochte man ausdrucken konnen, wie gut jeder derbeiden Leistungen innerhalb der Bezugsgruppe ist
I Der Standardmesswert t∗i bezieht den beobachteten Messwertxi der i-ten Person auf den Mittelwert x der Gruppe unddruckt die Abweichung in Standardeinheiten s aus
I
t∗i =xi − x
s
I Es gilt t = 0 und s2t = 1
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 61/62
GrundbegriffeUnivariate Deskriptive Statistik
Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte
Beispiel
I Ein Knabe erzielt 5.20m bei Gruppenkennwerten xM = 5.03,bzw. sM = 0.92
I Ein Madchen erreicht 4.50m bei GruppenkennwertenxW = 4.21, bzw. sW = 0.85
I Daher ist t∗M = 0.18 und t∗W = 0.42
I Der Knabe liegt 0.18, das Madchen 0.42 Standardeinheitenuber dem Mittelwert (0!); die Leistung des Madchens istrelativ besser
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 62/62
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
3. Vorlesung
Einfuhrung in Quantitative Methoden
Karin Waldherr & Pantelis Christodoulides
23. Marz 2011
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 1/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Boxplot
Boxplot
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 2/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Ziele
I Gemeinsame Betrachtung zweier Variablen
I Aufschluss uber Art und Starke des Zusammenhangeszwischen den beiden Variablen
I Bei metrischen Merkmalen: Beschreibung einer funktionalenBeziehung und darauf beruhende Prognosen fehlender Werte
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 3/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Methoden
I Zweidimensionale numerische und grafische DarstellungI Bivariate Haufigkeitstabelle (Kontingenztafel, Kreuztabelle)I Grafiken zur Beschreibung der Art des ZusammenhangesI Maßzahlenermittlung zur Beschreibung der Starke des
Zusammenhanges zwischen den beiden VariablenI Bei metrischen Variablen Darstellung des Merkmales X als
Funktion des Merkmales Y : X = f (Y )
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 4/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Bivariate Haufigkeitstabelle
I Zwei Merkmale X und Y mit Auspragungen x ′j , j = 1, . . . , k,y ′l , l = 1, . . . ,m
I X = Zeilen, Y = Spalten; Auspragungen jeweils geordnetnach Große
I fjl , abs. H., oder rjl , rel.H. der Merkmalskombinationen inZellen
I Beispiel 1: X = vom Arzt gewogenes Gewicht; Y = selbstangegebenes Gewicht
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 5/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Beispiel 1: Variable X : vom Arzt gewogenes Gewicht; Variable Y :selbst angegebenes Gewicht; n = 20 16-jahrige Madchen
Beispiel: f46,46 = 1
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 6/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Beispiel 2
Variablen Erhebungsgebiet und Religionszugehorigkeit ausALLBUS (2006)X = Erhebungsgebiet (x ′1 = Westdeutschl., x ′2 = Ostdeutschland);Y = Religionszugehorigkeit (y ′1 = Evang., y ′2 = Rom.-Kath., y ′3 =andere, y ′4 = keine)
X = Y = ReligionszugehorigkeitErhebungs- Rom.-gebiet Evang. Kath. andere keine GesamtWestd. 905 838 165 377 2285Ostd. 284 45 25 765 1119
Gesamt 1189 883 190 1142 3404
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 7/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Kontingenztafel allgemein
y ′1 y ′2 . . . y ′m∑m
l=1
x ′1 f11 f12 . . . f1m f1.x ′2 f21 f22 . . . f2m f2....
......
......
...
x ′k fk1 fk2... fkm fk.∑k
j=1 f.1 f.2 . . . f.m f.. = n
fj . =∑m
l=1 fjl und f.l =∑k
j=1 fjl sind die univariatenRandhaufigkeiten.Die eindimensionalen Haufigkeitsverteilungen heißenRandverteilungen.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 8/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Bedingte relative Haufigkeiten (1)
Relative Haufigkeit einer bestimmten Auspragung des MerkmalesX unter der Bedingung des Auftretens einer bestimmtenAuspragung von Y , Y = y ′l
rX=x ′j |Y=y ′
l=
fjlf.l
(f.l > 0)
und vice versa
rY=y ′l |X=x ′
j=
fjlfj .
(fj . > 0)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 9/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Bedingte relative Haufigkeiten (2)
Beispiel 3: Relative Haufigkeit der Personen mit evangelischerReligionszugehorigkeit unter der Bedingung, dass sie a) inWestdeutschland und b) in Ostdeutschland wohnen
a) rY=Evang.|X=Westd. =905
2285≈ 0.40 b) rY=Evang.|X=Ostd. =
284
1119≈ 0.25
X = Y = ReligionszugehorigkeitErhebungs- Rom.-gebiet Evang. Kath. andere keine GesamtWestd. 905 838 165 377 2285Ostd. 284 45 25 765 1119
Gesamt 1189 883 190 1142 3404
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 10/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Empirische Unabhangigkeit (1)I X und Y sind unabhangig, wenn bedingte
Haufigkeitsverteilungen = unbedingte Haufigkeitsverteilung,d.h. wenn die Verteilungen in allen Spalten gleich sind jenerder Randverteilung (analog fur die Zeilen)
fjlf.l
=fj .n
bzw.fjlfj .
=f.ln
I Beispiel 4:Y
X ja nein Gesamtja 10 25 35 10
39 ≈25101 ≈
35140 ≈ 0.25
nein 29 76 105Gesamt 39 101 140
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 11/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Empirische Unabhangigkeit (2)
I außerdem:
fjl =fj .f.ln
fur alle j = 1, . . . , k, l = 1, . . . ,m.
y ′1 y ′2 . . . y ′m∑m
l=1
x ′1 f11 f12 . . . f1m f1....
......
......
...x ′k fk1 fk2
... fkm fk.∑kj=1 f.1 f.2 . . . f.m f.. = n
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 12/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Empirische Unabhangigkeit (3)
I Beispiel 4:Y
X ja nein Gesamtja 10 25 35nein 29 76 105Gesamt 39 101 140
39 · 35
140= 9.75 ≈ 10
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 13/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Zwei nominalskalierte Variablen: Balkendiagramm
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 14/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Dreidimensionales Balkendiagramm
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 15/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Zwei metrische Variablen: StreudiagrammBeispiel: Linearer Zusammenhang
VariablePerson X Y1 2 32 5 63 1 24 3 45 6 7
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 16/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Starker positiver Zusammenhang
große X -Werte, große Y -Werte
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 17/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Starker negativer Zusammenhang
große X -Werte, kleine Y -Werte
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 18/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Mittelmaßiger Zusammenhang
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 19/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Geringer Zusammenhang
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 20/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Nicht-linearer (U-formiger) Zusammenhang
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 21/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Kovarianz
Gemeinsame Variation der Variablen X und Y - mittleresAbweichungsprodukt
I Hoher Wert → positive Abweichung vom Mittelwert(xi − x > 0),niedriger Wert → negative Abweichung vom Mittelwert(xi − x < 0)
I Starker positiver Zusammenhang: hohe X -Werte → hoheY -Werte und niedrige X -Werte → niedrige Y -Werte
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 22/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
xi − x > 0 ∧ yi − y > 0 → (xi − x)(yi − y) > 0xi − x < 0 ∧ yi − y < 0 → (xi − x)(yi − y) > 0
cXY = 1n−1
∑ni=1(xi − x)(yi − y) großer positiver Wert
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 23/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
xi − x < 0 ∧ yi − y > 0 → (xi − x)(yi − y) < 0xi − x > 0 ∧ yi − y < 0 → (xi − x)(yi − y) < 0
⇒ cXY = 1n−1
∑ni=1(xi − x)(yi − y) großer negativer Wert
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 24/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
cXY =1
n − 1
n∑i=1
(xi − x)(yi − y) Betrag der Kovarianz klein
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 25/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Eigenschaften der Kovarianz
I Formel zur Berechnung der Kovarianz:
cXY =1
n − 1
n∑i=1
xiyi −nx y
n − 1=
1
n − 1
(n∑
i=1
xiyi − nx y
)
I Betrag der maximalen Kovarianz zweier Variablen ist Produktihrer Standardabweichungen
I Kovarianz einer Variablen mit sich selbst ist die Varianz derVariablen
I Kovarianz nicht direkt interpretierbar (kein standardisiertesMaß)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 26/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Bravais-Pearson-Korrelationskoeffizient(Produkt-Moment-Korrelation)
rXY =cXY
sX sY− 1 ≤ rXY ≤ 1
rXY = 0 X und Y kein linearer ZusammenhangrXY > 0 positiver ZusammenhangrXY < 0 negativer ZusammenhangrXY ± 1 perfekter Zusammenhang
Bestimmtheitsmaß: B = r2 gibt Anteil der Varianz von X wieder,der durch Darstellung von X als lineare Funktion von Y erklartwerden kann und vice versa (s. 4. VO)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 27/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 28/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Voraussetzungen fur Produkt-Moment-Korrelation
I Linearer Zusammenhang
I Metrische Variablen
I keine Ausreißer im Streudiagramm
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 29/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Ausreißer 1. Art
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 30/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Ausreißer 2. Art
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 31/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Datenbeispiel
Variable X : vom Arzt gewogenes Gewicht; Variable Y : selbstangegebenes Gewicht; n = 20 16-jahrige Madchen
vgl. Folie 5: Bivariate Haufigkeitstabelle
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 32/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Datenbeispiel
∑ni=1 xi = 1 · 46 + 1 · 48 + 1 · 51 + 4 · 52 + . . . =
∑ni=1 yi =
= 1062 = 1061
x = 53.1 y = 53.05∑ni=1 x2
i = 1× 462 + 1× 482 + . . . = 56558∑n
i=1 y2i = 56461
s2X = 8.73 s2
Y = 9.21
sX = 2.95 sY = 3.03∑ni=1 xiyi = 56494
cXY =1
1956494− 20
192816.96 = 8.15
rXY = 0.91⇒ B = 0.83 = 83% erklarter Varianzanteil
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 33/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Berechnung in SPSS - StreudiagrammBeispiel: Zusammenhang zwischen Selbstwert undKorperzufriedenheit
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 34/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Berechnung in SPSS - Korrelationskoeffizient
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 35/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Interpretation von Korrelationen
I rXY = 0 bedeutet nur: kein linearer Zusammenhang
I Keine Kausalinterpretation aufgrund großem rXY moglich
I rXY gibt keine Auskunft uber Ursache-Wirkungs-Beziehungen
I Scheinkorrelation: der Zusammenhang zwischen X und Y istdurch eine dritte Variable Z induziert (Frage nachsachlogischem Zusammenhang)
I Beispiel: Anzahl der Notarzte, die zu einem Einsatzort gerufenwurden, und Anzahl der spateren Todesopfer. PlausibelsteErklarung: beide Variablen werden von Schwere desKatastrophenfalles beeinflusst.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 36/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Beispiel: Zusammenhang zwischen Schuhgroße undEinkommen
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 37/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Partielle Korrelation
I Ziel: Korrelation zwischen Variablen X und Y ohne denEinfluss von Z → partielle Korrelation von X und Y unterKonstanthalten von Z (‘Z wird aus der Korrelation herauspartialisiert’)
I Partielle Korrelation:
rXY |Z =rXY − rXZ rYZ√
(1− r2XZ )(1− r2
YZ )
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 38/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Beispiel: Zusammenhang zwischen Gewissenhaftigkeit, X , undVertraglichkeit, Y , Kontrollvariable Extraversion, Z
rXY = 0.98; rXZ = 0.90; rYZ = 0.80
rXY |Z =0.98− (0.90)(0.80)√(1− .902)(1− .802)
= 0.99
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 39/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Berechnung in SPSSBeispiel: Zusammenhang zwischen Korperzufriedenheit undSelbstwertgefuhl (r = 0.775), Kontrollvariable Body Mass Index(BMI)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 40/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Rangkorrelation nach Spearman
I Variablen ordinalskaliert oder andere Voraussetzungen furProdukt-Moment-Korrelation nicht gegeben
I Produkt-Moment-Korrelation der Rangplatze R(xi ) und R(yi )I Berechnung:
I Zuordnung von Rangzahlen zu den der Große nach geordnetenMesswerten x(1) ≤ . . . ≤ x(n) und y(1) ≤ . . . ≤ y(n) getrennt furX und Y
I Tritt eine Auspragung x ′j mehrmals auf (Bindung) erhalten alle
Personen mit diesem x ′j als Rangplatz das arithmetische Mittel
der zu vergebenden RangplatzeBeispiel:geordnete Urliste: 10, 12, 12, 13, 15Rangplatze: 1, 2.5, 2.5, 4, 5
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 41/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
I Praktische Berechnungsformel:
rsp = 1−6∑n
i=1 d2i
n(n2 − 1)
mit di = R(xi )− R(yi )
I Kontrolle der Rangplatzvergabe:
n∑i=1
R(xi ) =n(n + 1)
2bzw.
n∑i=1
R(yi ) =n(n + 1)
2
n∑i=1
di = 0
I −1 ≤ rsp ≤ 1
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 42/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Beispiel fur Rangkorrelation nach Spearman
Bewertung des Preis-Leistungs-Verhaltnis von 15 Produkten durch
I NutzerInnen (5-Punkte Skala; hoher Wert = gutesPreis-Leistungs-Verhaltnis) und
I Expertin (Rangreihung; 1=schlechtestesPreis-Leistungs-Verhaltnis)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 43/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Beispiel fur Rangkorrelation nach SpearmanX = durchschnittliche Bewertung von NutzerInnen, Y = Expertin
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 44/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Punkt-biseriale Korrelation fur Zusammenhang einerdichotomen mit einer metrischen Variable
I Abgeleitet aus Produkt-Moment-Korrelation
rpb =x1 − x0
sx
√n1n0
n(n − 1)
I Voraussetzung: metrische Variable, keine Ausreißer
I Berechnung in SPSS mittels Produkt-Moment-Korrelation
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 45/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
BeispielALLBUS (2006): Zufallsstichprobe n = 22, Zusammenhangzwischen Geschlecht und Alter der Befragten; 1 = Mann, 0 = Frau
Person Geschlecht Alter Person Geschlecht Alter1 1 58 12 0 682 0 45 13 0 643 0 54 14 1 454 1 79 15 0 635 1 46 16 0 206 0 34 17 1 377 1 76 18 0 208 0 63 19 1 529 1 49 20 0 5010 0 55 21 1 4411 1 32 22 0 57
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 46/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
n1∑i=1
xi = 518, n1 = 10, x1 = 51.80
n0∑i=1
xi = 593, n0 = 12, x0 = 49.42
N∑i=1
xi = 1111,
N∑i=1
x2i = 61285, sX = 15.70
rpb =51.8− 49.42
15.7
√0.26 = 0.077
⇒ kein Zusammenhang zwischen Geschlecht und Alter
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 47/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Vierfelderkorrelation
X0 1
Y 0 f00 f01 f0.1 f10 f11 f1.
f.0 f.1 f..
Bei zwei dichotomen Variablen ergibt sich als Spezialfall derProdukt-Moment-Korrelation der Phi-Koeffizient:
rφ =f00f11 − f01f10√
f0.f1.f.0f.1
Vorzeichen von rφ ist abhangig von Vorzeichen der Determinantef00f11 − f01f10 (Uberwiegen der Kombinationen 00 und 11 oder 01und 10)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 48/49
Univariate Deskriptive StatistikBivariate Deskriptive Statistik
Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen
Beispiel
ALLBUS (2006): Zusammenhang zwischen Geschlecht undHandy-Besitz in Ostdeutschland
Handy-Besitzja nein
Geschlecht Mann 446 96 542Frau 414 165 579
860 261 1121
rφ =(446)(165)− (414)(96)√
(542)(579)(860)(261)=
33846
265404.57= 0.13
→ nur sehr geringer Zusammenhang zwischen Geschlecht undHandy-Besitz
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 49/49
Einfache Regressionsanalyse
Einfuhrung in Quantitative Methoden
Mag. Dipl.Ing. Dr. Pantelis Christodoulides&
Mag. Dr. Karin Waldherr
SS 2011
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 1/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
HistorischesI Regression geht auf Galton (1889) und seine Studien zur
Vererbung zuruck; Galton formulierte das Gesetz deruniversalen Regression
I Jede vom ’normalen’ abweichende Eigenschaft eines Menschenwird in der nachfolgenden Generation zwar ubernommen, aberim Durchschnitt in einem geringeren Ausmaß. Es tritt alsobzgl. dieser Eigenschaft ein Rucktritt (Regression) ein
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 2/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
HistorischesI Karl Pearson hat bei 1078 Familien die Große von Vater und
Sohn untersucht
I Obwohl große Vater dazu neigen große Sohne zu haben, sinddie Sohne von großen Vatern im Durchschnitt kleiner als ihreVater
I Ebenso wird die Besonderheit der Kleinheit von Vatern nichtin vollem Maße an die Sohne vererbt, denn diese sinddurchschnittlich großer als ihre Vater
I Es ist eine Regression oder ein Rucktritt in Bezug auf dieGroße bei Sohnen sichtbar
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 3/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Ziele
I Empirische Reprasentation großer Datenmengen
I Erkennen eines funktionalen Zusammenhanges
I Nachweis einer bereits bekannten Beziehung zwischen denVariablen
I Spezifizierung eines funktionalen Zusammenhanges zwischenzwei Variablen
I Schatzen der Parameter einer funktionalen Beziehung
I Interpolation fehlender bzw. Prognose zukunftiger Werte
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 4/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Ausgangslage
I Zusammenhang zwischen 2 metrischen Variablen X und Ymit Auspragungen xi und yi
I Spezifizierung einer funktionalen Beziehung Y = f (X ): Ywird mithilfe von X und f geschatzt
I Stichprobe mit n Objektpaaren - (x1, y1) · · · (xn, yn)
I Objektpaare (x1, y1) · · · (xn, yn) darstellbar als Punkte inkartesischem Koordinatensystem mit Koordinaten (xi , yi ) =Streudiagramm
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 5/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Ausgangslage
I Y ist der Regressand (abhangige Variable); X ist derRegressor (unabhangige Variable); Regression von Y auf X
I Annahmen - die abhangige Variable ist mit Zufallsfehlernuberlagert; die unabhangige Variable gilt als fehlerfrei
I Einfache Regression weil ein Regressor, im Vergleich zumultipler Regression mit mehr als einem Regressor
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 6/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Funktion f (X )I Linear: Y = a + bX , a und b reelle Zahlen, hochster
Polynomgrad ist 1
I Quadratisch: Y = c + wX + dX 2, c , w , und d reelle Zahlen,hochster Polynomgrad ist 2
I Exponentiell: Y = q(egX), q und g reelle Zahlen
I Logarithmisch: Y = h ln(Xp
), h und p reelle Zahlen, p
zusatzlich positiv
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 7/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Beispiel 1: Lineare Funktion f (X )I Treibstoffverbrauch (Y ) und Leistungsabgabe eines Motors
(X ) bei konstanter Drehzahl: Y ≈ 0.854 + 0.302X
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 8/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Beispiel 2: Quadratische Funktion f (X )I Kornerertrag (Y ) und Dungung (X ):
Y ≈ 5.78 + 2.29X − 0.09X 2
I Bis zu einer bestimmten Dungungsgrenze steigt derKornerertrag an, um wieder abzufallen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 9/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Beispiel 3: Logarithmische Funktion f (X )I Weber-Fechner’sches Gesetz: Bei einem linearen Anstieg der
Reizstarke (X ), wachst die Empfindung im Sinnesorgan (Y )logarithmisch an
I
Y = c ln
(X
b
)b = Schwellenreiz c = Konstante abhangig von der Reizart
I Weber-Fechner’sches Gesetz allgemein bekannt durch dieDezibel-Skala, die das logarithmische Verhaltnis zwischen Reizund Larmempfindung ubertragt
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 10/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Beispiel 3: Logarithmische Funktion f (X )
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 11/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
I Vermutet wird ein zumindest naherungsweise linearerZusammenhang zwischen zwei Variablen Y und X
I Die Variable Y soll naherungsweise durch eine lineareFunktion von X beschrieben werden
I
Y ≈ Y = bX + a mit a, b reelle Zahlen
I a (Schnitt mit Y -Achse) und b (Anstieg) sind unbekannt
I a und b so wahlen, dass Zusammenhang (Streudiagramm)zwischen Y und X ’am besten’ beschrieben wird
I Die Methode der kleinsten Quadrate ermittelt besteSchatzungen a und b fur a und b
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 12/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Kleinste Quadrate Schatzung (KQS)
I Residuum ei = yi − yi ; n Residuen (Abweichungen von derRegressionsgerade in Richtung abhangiger Variable)
I Zentrale Idee bei KQS ist, a und b derart zu wahlen, dass dieSumme der quadrierten Differenzen (Quadratsumme allerResiduen) minimal wird
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 13/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 14/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 15/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Kleinste Quadrate Schatzung (KQS)I Bestimme a und b derart, dass die Quadratsumme aller
Residuen minimal wird, d.h.
S2 =n∑
i=1
(yi − yi )2 =
n∑i=1
(yi − a− bxi )2 → Min
I Partielles Differenzieren von S2 nach den Unbekannten a undb und anschließendes Nullsetzen der Ableitungen liefert
b =cXYs2X
, a = y − bx
I b = Verhaltnis zwischen Kovarianz und Varianz des RegressorsI a ist abhangig von den Mittelwerten, x , y , und b
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 16/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
BeispielI Bei einer Stichprobe von n = 40 Personen wurden
Korpergroße (X ) und Gewicht (Y ) gemessen
40∑i=1
xi = 6814,40∑i=1
x2i = 1163780, s2
X = 77.31
40∑i=1
yi = 2722,40∑i=1
y2i = 190422, s2
Y = 133.07,40∑i=1
xiyi = 466599
I
cXY =1
39(
40∑i=1
xiyi − 40x y) =1
39(466599− 40
6814
40
2722
40)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 17/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
BeispielcXY = 74.52, s2
X = 77.31 ⇒ b =cXYs2X
= 0.9639
a = y − bx = 68.05− 0.9639 · 170.35 = −96.15
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 18/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Beispiel
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 19/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
I Produktmomentkorrelation rXY steht im engenZusammenhang zum Schatzer b
I Es gilt
rXY =cXYsX sY
, b =cXYsX sX
=cXY sYsY sX sX
=rXY sYsX
I Aus der Korrelation kann der Steigungsparameter geschatztwerden und umgekehrt
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 20/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
I Maß fur Gute der Anpassung einer Regression ist dasBestimmtheitsmaß B
I B misst das Verhaltnis der Varianz der geschatzten Werte yizur Varianz der beobachteten Werte yi
I B misst den Anteil der Varianz der abhangigen Variable Y ,der durch die unabhangige Variable X (bzw. die Regression)erklart werden kann
I Achtung ’verursacht’ nur bei Kausalitat
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 21/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
B =s2Y
s2Y
mit 0 ≤ B ≤ 1
I Je naher die Punkte zur Regressionsgerade liegen, destogroßer ist B
I Liegen alle Punkte auf der Regressionsgerade, dann ist B = 1und Y wird durch die Regression vollig erklart
I Das Bestimmtheitsmaß ist gleich dem Quadrat der Korrelation
I Es gilt also B = r2
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 22/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
B und Streudiagramm
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 23/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
BeispielI Gewicht und Korpergroße
b = 0.9639; r = 0.9639
√77.31√
133.07= 0.735
I
B = r2 = 0.7352 = 0.54
I 54% der Varianz vom Gewicht wird durch die lineareRegression mit Korpergroße erklart
I deswegen Korrelation von ’mittelmaßiger Hohe’
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 24/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Regression von X auf YI Vertauschen von abhangiger und unabhangiger Variable;
Vertauschen des Koordinatensystems X -Y
I X approximativ als lineare Funktion von Y darstellen
X ≈ b′Y + a′
I Wie andern sich unsere Parameter? Vertauschen von X undYin den Formeln, d.h.
b′ =cXYs2Y
a′ = x − b′y
I 2 Regressionsgeraden, je nach Fragestellung; beide gehendurch den Schwerpunkt des Punktschwarms (x , y)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 25/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Regression von X auf Y bzw. Y auf X
I Verschiedenheit beider Regressionsgeraden hat ihre Ursache inder Annahme, dass die unabhangige Variable als fehlerfreiangesehen wird, wahrend die abhangige Variable durch einenZufallsfehler uberlagert wird
I Darstellung beider Geraden im X -Y Koordinatensystem
Y = bX + a (1)
X = b′Y + a′ ⇒ Y =1
b′X − a′
b′(2)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 26/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
BeispielY = 0.624X + 35.13 (1) X = 0.789Y + 27.01
Y =1
0.789X − 27.01
0.789⇒ Y = 1.27X − 34.23 (2)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 27/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Bemerkungen
I Korrelation und Bestimmtheitsmaß andern sich nicht, da siesymmetrisch bzgl. X und Y sind
I Vorzeichen der Steigungsparameter bleibt auch unverandert
I Steigungsparameter andert sich um die jeweilige Varianz desRegressors X bzw.Y
I Regressionsgeraden fallen zusammen bei perfektem linearenZusammenhang zwischen X und Y , d.h. bei rXY = ±1
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 28/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
I Prognose von Y ⇒ Y als abhangige Variable; fur gegebenes xin die Modellgleichung y = bx + a einsetzen und y ausrechnen
I Prognose von X ⇒ X als abhangige Variable; fur gegebenes yin die Modellgleichung x = b′y + a′ einsetzen und xausrechnen
I Die zu prognostizierende Variable ist die im jeweiligen Modellabhangige Variable
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 29/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Beispiel
I Prognose von y bei x = 125 ⇒ y = (0.624)(125) + 35.13,d.h. y = 113.13
I Prognose von x bei y = 125 ⇒ x = (0.789)(125) + 27.01,d.h. x = 125.635
I Uberprufung der Gute der Prognose mithilfe der Abweichungdes beobachteten Wertes yi vom geschatzten yi (bzw. analogfur X )
I Betragsmaßig ’kleine’ Abweichungen sprechen fur eine ’gutePrognose’
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 30/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Allgemeine Richtlinien
I Grafische Uberprufung der Daten und der Regressionsgeradeim Streudiagramm; Daten sollten annahernd auf einenlinearen Zusammenhang hinweisen
I Große und Struktur der Residuen: Betragsmaßig kleineResiduen, die in einem Streudiagramm mit den geschatztenWerten yi keine erkennbare Struktur zeigen, weisen auf eingutes Modell hin
I Hohes Bestimmtheitsmaß: Dieses Kriterium sollte imZusammenhang mit einer Residualanalyse und grafischenUberprufung der Daten verwendet werden
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 31/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Residualanalyse
I ’Betragsmaßig kleine’ Residuen ei = yi − yi weisen auf eingutes Regressionsmodell hin
I Residuen sind aber abhangig von den Maßeinheiten in Y und X
I∑n
i=1 ei = 0 und auch e = 0, d.h. der Mittelwert der Residuenist 0
I Standardisieren der Residuen mit
s2e =
1
n − 2
n∑i=1
e2i , also ei =
ei√s2e
ei sind die normierten Residuen, welche bei einem ’gutenModell’ im Intervall [−2.5, 2.5] liegen sollten
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 32/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
BeispielI Datei ’bspreg.sav’, n = 61, Y sei die abhangige VariableI Streudiagramm spricht eher fur einen positiven linearen
Zusammenhang
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 33/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Beispiel
I y = 0.92x + 3.63, B = 0.86, rXY = 0.93
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 34/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Beispiel
I Berechnung der Residuen und normierten Residuen mit√s2e = 1.45
i yi xi yi ei ei1 33 32 33.20 -0.20 -0.142 33 33 34.13 -1.13 -0.783 35 35 35.98 -0.98 -0.67...
......
......
...61 47 48 47.99 -0.99 -0.68
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 35/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
BeispielI Graph der normierten Residuen mit Konfidenzbereich
[−2.5, 2.5]I i auf der X Achse, ei auf der Y Achse
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 36/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
BeispielI Graph der normierten Residuen gegen die geschatzten Werte
yiI yi auf der X Achse, ei auf der Y Achse
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 37/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Problematische DarstellungenI Graph der normierten Residuen gegen die geschatzten Werte
yiI linearer Trend, Hinweis auf Messfehler oder inadaquates
Modell
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 38/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Problematische DarstellungenI Graph der normierten Residuen gegen die geschatzten Werte
yiI Ansteigende Varianzen mit ansteigendem yi
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 39/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Problematische DarstellungenI Graph der normierten Residuen gegen die geschatzten Werte
yiI Nicht-linearer Verlauf der Residuen, inadaquates Modell
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 40/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Regression mit Standardmesswerten
I Wir betrachten die Regression von Y auf X mitstandardisierten Variablen t∗Y und t∗X
I Kovarianz, Korrelation und Regressionskoeffizient b sindgleich dem mittleren Messwertprodukt, und dieRegressionskonstante a = 0.
I
ct∗Y t∗X= rt∗Y t∗X
= bt∗Y t∗X=
1
n − 1
n∑i=1
t∗yi t∗xi
I Regressionseffekt (bei |rXY | < 1: |yi − y | < |xi − x |) leichtererkennbar, da x , y und y standardisiert sind
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 41/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Partielle Korrelation rXY |Z
I Berechnung der partiellen Korrelation mithilfe der Residuen
I Regression von X auf Z durchfuhren und die Residuenei = (xi − xi ) berechnen; diese Residuen drucken jeneVariation von X aus, die durch Z nicht erklart wird
I Regression von Y auf Z durchfuhren und die Residuenei = (yi − yi ) berechnen; diese Residuen drucken jeneVariation von Y aus, die durch Z nicht erklart wird
I rXY |Z ist identisch mit rE ,E
I Einfachere Berechnung mit Formel von letzter Einheit
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 42/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Einfluss von Ausreissern
I Einzelne Ausreisser konnen die Regressionsgerade beeinflussen
I b und a werden sehr stark durch Ausreisser verfalscht
I Schlimmster Fall, wenn Ausreisser nicht in Richtung desPunktschwarms liegen
I Leichtes Erkennen von Ausreissern im Streudiagramm derDaten
I Nur in manchen Fallen sind Ausreisser auch durch großenormierte Residuen erkennbar (Residuengraphs)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 43/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Einfluss von Ausreissern
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 44/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Einfluss von Ausreissern
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 45/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Einfluss von Ausreissern
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 46/47
Einfache Regressionsanalyse
EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse
Nichtlineares f (X )
I Quadratisch: Y = c + dX 2 ⇒ KQS
I Exponentiell: Y = qegX ⇒ Logarithmieren ergibtln(Y ) = ln(q) + gX also ln(Y ) = q′ + gX ⇒ KQS fur q′ undg
I Logarithmisch: Y = ln (hX p) ⇒ Y = p ln(X ) + ln(h); KQS
fur p und ln(h)
I Achtung auf richtige Interpretation der Parameter!
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 47/47
InferenzstatistikKombinatorik
5. Vorlesung
Einfuhrung in Quantitative Methoden
Karin Waldherr & Pantelis Christodoulides
6. April 2011
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 1/24
InferenzstatistikKombinatorik
Inferenzstatistik
I Schluss von Zufallsstichprobe auf Population
I Grundlage Wahrscheinlichkeitsrechnung
I Zentral: Zufallsprozesse (Ausgang unsicher, nicht mitSicherheit vorhersagbar)
”Zufall ist das unberechenbare Geschehen, das sich unsererVernunft und unserer Absicht entzieht.”(Gebruder Grimm, Deutsches Worterbuch. Band 32, Sp. 345. Leipzig: S. Hirzel 1854-1960.)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 2/24
InferenzstatistikKombinatorik
Kann man Zufall berechnen?
I Rudolf Taschner: ”Mathematik ist der Versuch, alles zubandigen, auch den Zufall.”
I ”Wenn man weiß, wie ein Wurfel wahrscheinlich fallt, kannman sogar damit reich werden.” (Rudolf Taschner,kurier.at/nachrichten/2076992.php)
I Beispiel: WurfelspielI Ich lasse Sie werfen. Sie zahlen mir 100 Euro dafur, dass Sie
werfen durfen. Wenn Sie eine 6 werfen, gebe ich Ihnen 500Euro.
I Wollen Sie 6000 Mal werfen, erhalte ich 600.000 Euro.I Bei etwa 1/6 der Falle (ca. 1000 Mal) wird eine 6 kommen.I Ich muss also 500.000 zahlen, 100.000 bleiben mir.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 3/24
InferenzstatistikKombinatorik
Stochastik
I die Kunst des Vermutens (altgriechisch: στoχαστικη τεχvη,stochastike techne)
I Mathematik setzt Vorstellung von Zufall voraus (= Modellevon Situationen, deren Ausgang unsicher ist) undquantifizierbar ist
I Keine Einzelereignisse vorhersagbar, aber:
I Erkennen von Regelmaßigkeiten bei Vorgangen, derenErgebnisse vom Zufall abhangen.
I Hinderer (1980): ’Statistischer Wahrscheinlichkeitsbegriffdient der Beschreibung von beobachteten Haufigkeiten beibeliebig oft wiederholbaren Vorgangen, deren Ausgang nichtvorhersehbar ist.’
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 4/24
InferenzstatistikKombinatorik
Geschichte der Wahrscheinlichkeitsrechnung II Interesse am Zufall bis in fruheste Menschheitsgeschichte
zuruckzuverfolgenI Lat. ’Astragali’ genannte Knochen wurden im romischen
Reich als Spielwurfel verwendet - zum Glucksspiel um Geld,oder zu rituellen Zwecken um Auskunft uber die Meinung derGotter zu erhalten.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 5/24
InferenzstatistikKombinatorik
Geschichte der Wahrscheinlichkeitsrechnung II
I Solche und ahnliche Orakel auf der Grundlage vonZufallsereignissen weltweit zu beobachten.
I Bereits fruh auch Wurfel in der heute ublichen Kubusformoder als Tetraeder → faire und damit besonders interessanteSpiele
I Einer der fruhesten Funde im heutigen Iran datiert etwa auf3000 v. Chr.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 6/24
InferenzstatistikKombinatorik
Geschichte der Wahrscheinlichkeitsrechnung III
I Statistischer Wahrscheinlichkeitsbegriff geht zuruck auf 17.Jahrhundert (Frankreich)
I Im Jahr 1654 wandte sich der Glucksspieler Chevalier de Meremit mehreren Fragen an den franzosischen MathematikerBlaise Pascal
I Teilungsproblem: Fiktives Spiel: jener Spieler gewinnt einenGeldpreis, der zuerst eine festgesetzte Anzahl von fairenRunden gewinnt (bei denen jeder Spieler je eine Siegchancevon 50 % besitzt, unabhangig vom Ausgang dervorangegangenen Runden). Das Spiel wird aber durch hohereGewalt vor der Entscheidung abgebrochen. Betrag sollabhangig vom Spielstand zum Abbruch gerecht geteilt werden.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 7/24
InferenzstatistikKombinatorik
Geschichte der Wahrscheinlichkeitsrechnung IV
I Briefwechsel zwischen Blaise Pascal und Pierre de Fermat(Mathematiker)
I Schluss: Einsatz musse entsprechendGewinnwahrscheinlichkeiten der ausstehenden Rundenaufgeteilt werden
I Pascal zeigte auf, wie diese mit Hilfe der Kombinatorik undspeziell dem von ihm entwickelten Pascalschen Dreieckberechnet werden konne
Blaise Pascal (1623-1662)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 8/24
InferenzstatistikKombinatorik
Kombinatorik
I Rechenregeln zur Berechnung von:
I In wie vielen unterschiedlichen Reihenfolgen konnen nElemente angeordnet werden? = Permutationen
I Wieviele Moglichkeiten gibt es, aus n Elementen eineTeilmenge von k Elementen auszuwahlen? = Kombinationen
1. mit oder ohne Wiederholung (= mit oder ohne Zurucklegen)2. mit oder ohne Berucksichtigung der Reihenfolge
I Grundlage fur Wahrscheinlichkeitsrechnung
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 9/24
InferenzstatistikKombinatorik
Permutationen ohne WiederholungPermutation = jede Anordnung einer endlichen Anzahl vonElementen, bei der alle Elemente verwendet werdenBeispiel: 3 Kugeln sollen auf 3 Platten angeordnet werden
¶ · ¸
→ ¬ l l
{→ ¬ l {→ ¬ ®
→ ¬ l {→ ¬ ®
→ l ¬ l
{→ ¬ l {→ ¬ ®
→ l ¬ {→ ® ¬
→ l l ¬
{→ l ¬ {→ ® ¬
→ l ¬ {→ ® ¬
1. Kugel: 3 Moglichkeiten (allgemein:n) → 2. Kugel: 2Moglichkeiten (allgemein: n − 1) → 3. Kugel: 1 Moglichkeit⇒ allgemein: n(n − 1)(n − 2) . . . 1 = n! MoglichkeitenAnmerkung: n! = n Fakultat = 1 · 2 · . . . · n (z.B.4! = 1 · 2 · 3 · 4 = 24); 0! = 1
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 10/24
InferenzstatistikKombinatorik
Permutationen mit Wiederholung
Wie viele Moglichkeiten gibt es, n Elemente, die sich in mverschiedene Typen (Klassen) mit je k Elementen unterscheidenlassen, anzuordnen? Z.B. n = 4 Kugeln, m = 2 Klassen (m1=blau,m2 = schwarz), k1 = 2, k2 = 2
l l l l
l l l ll l l ll l l ll l l ll l l ll l l l
n Elemente → n! verschiedene Anordnungsmoglichkeitenm verschiedene Klassen mit k1, k2 . . . , km nicht unterscheidbarenElementen → k1!k2! . . . km! Anordnungsmoglichkeiten nichtunterscheidbar, daher⇒ n!
k1!k2! . . . km!verschiedene Anordnungsmoglichkeiten
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 11/24
InferenzstatistikKombinatorik
Spezialfall m = 2 Klassen
Hier gilt:n!
k!(n − k)!=:
(n
k
)(nk
)= Binomialkoeffizient, n ≥ k
Beispiel: 2 blaue, 2 schwarze Kugeln(4
2
)=
4!
2!2!=
4 · 3 · 2 · 1(2 · 1)(2 · 1)
= 6
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 12/24
InferenzstatistikKombinatorik
Rechenregeln fur BinomialkoeffizientenEs gilt:
I (n
n − k
)=
n!
(n − k)!k!=
(n
k
)I (
n
0
)=
(n
n
)=
n!
0!n!= 1
I (n
1
)=
(n
n − 1
)=
n!
1!(n − 1)!=
n(n − 1)(n − 2) . . . 1
(n − 1)(n − 2) . . . 1= n
I (n
2
)=
(n
n − 2
)=
n(n − 1)(n − 2) . . . 1
2(n − 2) . . . 1=
n(n − 1)
2
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 13/24
InferenzstatistikKombinatorik
Kombinationen mit Zurucklegen mit Berucksichtigung derReihenfolge
k Elemente sollen aus n Elementen ausgewahlt werden (k Versucheoder Ziehungen), wobei sich jedes der n Elemente beliebig oftwiederholen kann (d.h. zuruckgelegt wird).Beispiel: Ziehen von k = 2 aus n = 3 Kugeln
l l l
→ l
→ l l→ l l→ l l
→ l
→ l l→ l l→ l l
→ l
→ l l→ l l→ l l
→ nk verschiedene Reihenfolgen
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 14/24
InferenzstatistikKombinatorik
Beispiel
Ein Zahlencode besteht aus 4 voneinander unabhangigen,nacheinander einzugebenden Ziffern von 0 bis 9. Wie vieleMoglichkeiten gibt es?
n = 10, k = 4nk = 104 = 10000
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 15/24
InferenzstatistikKombinatorik
Kombinationen ohne Zurucklegen mit Berucksichtigungder Reihenfolge
Ziehen von k Elementen aus insgesamt n Elementen, wobei jedesder n Elemente nur einmal gewahlt werden kann (d.h. nichtzuruckgelegt wird)Beispiel: Ziehen von k = 2 aus n = 3 Kugeln
l l l
→ l
{→ l l
→ l l
→ l
{→ l l
→ l l
→ l
{→ l l
→ l l
n!
(n − k)!=
3!
(3− 2)!= 6
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 16/24
InferenzstatistikKombinatorik
Beispiel
Bei einem Pferderennen sind 8 Pferde am Start. Wie vieleMoglichkeiten gibt es fur die Belegung der ersten drei Platze?
n = 8, k = 3
n!
(n − k)!=
8!
(8− 3)!= 336 Moglichkeiten
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 17/24
InferenzstatistikKombinatorik
Kombinationen ohne Zurucklegen ohne Berucksichtigungder Reihenfolge
Wie viele Moglichkeiten gibt es, k Elemente aus n Elementen inbeliebiger Reihenfolge auszuwahlen, wobei jedes der n Elementenur ein Mal gewahlt werden kann?Beispiel: Ziehen von k = 2 aus n = 3 Kugeln, Reihenfolge egal
l l l
l l
l l
l l
(n
k
)=
n!
k!(n − k)!
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 18/24
InferenzstatistikKombinatorik
BeispielLotto 6 aus 45
n = 45, k = 6(n
k
)=
(45
6
)=
45!
6!39!=
45 · 44 · 43 · 42 · 41 · 40
6 · 5 · 4 · 3 · 2 · 1= 8145060
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 19/24
InferenzstatistikKombinatorik
Kombinationen mit Zurucklegen ohne Berucksichtigungder Reihenfolge
Aus n Elementen sollen k Elemente in beliebiger Reihenfolgeausgewahlt werden, wobei sich jedes der n Elemente beliebig oftwiederholen kann.Beispiel: Ziehen von k = 2 aus n = 3 Kugeln, Reihenfolge egal
l l l
l l
l l
l l
l l
l l
l l
(n + k − 1
k
)=
(n + k − 1)!
k!(n − 1)!=
4!
2!2!= 6
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 20/24
InferenzstatistikKombinatorik
Beispiel
Gummibarchenorakel: Man wahlt k = 5 Gummibarchen aus n = 5Elementen (= Farben). Wieviele verschiedene Farbkombinationensind moglich?
(n + k − 1
k
)=
(5 + 5− 1
5
)=
(9
5
)=
9!
5!4!= 126
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 21/24
InferenzstatistikKombinatorik
Kombinationen - Zusammenfassende Ubersicht
Wiederholung (= Zurucklegen)nein ja
Berucksichtigung jan!
(n − k)!nk Variationen
d. Reihenfolge nein
(n
k
) (n + k − 1
k
)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 22/24
InferenzstatistikKombinatorik
Beispiele
I Ein Intelligenztest besteht aus 15 Aufgaben. DerTestentwickler mochte uberprufen, ob die Testergebnisseunabhangig von der Reihenfolge der Vorgabe der Aufgabensind. Wie viele verschiedene Testversionen (Reihenfolgen)kann er erstellen?
Losung in der Vorlesung
I Eine Klinische Psychologin hat sich auf drei Storungsbilderspezialisiert. Im Laufe eines Monats meldeten sich 9 neuePatientInnen mit einem dieser Storungsbilder. Wie vieleMoglichkeiten der PatientInnenzusammensetzung gibt es?
Losung in der Vorlesung
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 23/24
InferenzstatistikKombinatorik
Beispiele
I Die zwei Studierenden mit den besten Seminararbeiten sollenStipendien in unterschiedlicher Hohe erhalten. Insgesamtnehmen 20 Studierende teil. Wie viele verschiedeneMoglichkeiten gibt es fur die Belegung der Platze 1 und 2?
Losung in der Vorlesung
I Wieviele Moglichkeiten ergeben sich, wenn die beiden bestenStudierenden Stipendien derselben Hohe erhalten sollen, d.h.es ist gleichgultig wer den 1. und wer den 2. Platz erhalt.
Losung in der Vorlesung
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 24/24
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Einfuhrung in Quantitative Methoden
Pantelis Christodoulides & Karin Waldherr
4. Mai 2011
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 1/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Dichtefunktion
I Eine stetige ZV X kann jeden Wert in einem Intervall [a, b]annehmen
I Die Wahrscheinlichkeiten der einzelnen Auspragungen (Werte)einer stetigen ZV konnen (im Gegensatz zum diskreten Fall)nicht angegeben werden
I Es konnen nur Wahrscheinlichkeiten f (x)dx angegebenwerden, mit welchen die Werte innerhalb von Intervallen dxum die Werte x auftreten
I Beispielsweise fragt man nicht, wie viele Personen exakt 1.75Meter groß sind, sondern z.B., wie viele Personen zwischen1.75 und 1.76 Meter groß sind
I Die Funktion f (x) heißt Dichtefunktion
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 2/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
I Die Wahrscheinlichkeit, dass die ZV Werte zwischen a und bannimmt, wird dann allgemein definiert als das Integral uberdie Dichtefunktion mit Integrationsgrenzen a und b.
I Analog zum diskreten Fall erhalt man durch Integration dieVerteilungsfunktion
F (x) = P(X ≤ x) =
∫t≤x
f (t)dt
I Die Wahrscheinlichkeit ist definiert als Flache unter derDichtefunktion
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 3/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
I Es gilt fur alle a < b
P(a ≤ X ≤ b) = P(a < X < b) =
∫ b
af (x)dx
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 4/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Eigenschaften der Dichtefunktion
I Es gilt weiters fur alle x
f (x) ≥ 0 und
∫xf (x)dx = 1
I P(a ≤ X ≤ b) = F (b)− F (a)
I f (x) = dF (x)dx = F ′(x)
I f (x) gibt an mit welcher Wahrscheinlichkeit Beobachtungenin der ’Nahe’ von x auftreten
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 5/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Eigenschaften der Verteilungsfunktion
I MonotonieF (x1) ≤ F (x2) fur x1 ≤ x2
I Normierung im Intervall [0, 1]
F (x)→ 0 fur ’sehr kleines’ x
F (x)→ 1 fur ’sehr großes’ x
I P(c ≤ X ≤ b) = F (b)− F (c) fur c < b
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 6/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
I Es seien X und Y ZV; die gemeinsame Verteilungsfunktionvon X und Y ist definiert als
F (x , y) = P(X ≤ x ∧ Y ≤ y)
I X und Y heißen stochastisch unabhangig wenn gilt:
F (x , y) = P(X ≤ x ∧ Y ≤ y) = P(X ≤ x) P(Y ≤ y)
I Bei diskreten ZV folgt Unabhangigkeit aus
P(X = x ∧ Y = y) = P(X = x) P(Y = y)
I Bei stetigen ZV folgt Unabhangigkeit aus
f (x , y) = f (x) f (y)
I Obige Regeln sind verallgemeinbar auf beliebig viele ZV
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 7/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Beispiel
I Beim zweimaligen Wurfeln bezeichne X die Augenzahl beimersten und Y die Augenzahl beim zweiten Wurf
I Das Ereignis Y = 2 ist unabhangig vom Ereignis X < 2
I Auch das Ereignis Y = {2, 4, 6} ist unabhangig vom EreignisX = {1, 3, 5}
I X und Y sind stochastisch unabhangig, weil fur jede Auswahlvon Ereignissen in beiden ZV Unabhangigkeit vorliegt
I Die Bedingung Y = y beeinflusst nicht die Verteilung von Xund umgekehrt
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 8/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
ErwartungswertI Beispiel: X ist die erhaltene Augenzahl bei einmaligem
Wurfeln; die Wahrscheinlichkeitsverteilung von X ist
xi 1 2 3 4 5 6
f (xi )16
16
16
16
16
16
I Welchen Wert ’erwarten’ wir, wenn wir diesesZufallsexperiment sehr lange durchfuhren?
I Intuitiv erwarten wir X = 1 bei 16 der Wurfe, X = 2 bei 1
6 beider Wurfe, usw.
I Der Durchschnitt von X auf lange Sicht ist derErwartungswert von X
11
6+ 2
1
6+ · · ·+ 6
1
6= 3.5,
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 9/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Erwartungswert
I Der Erwartungswert einer ZV ist ein Maß fur das Zentrum derVerteilung
I Bei einer diskreten ZV X ist der Erwartungswert definiertE [X ] als der gewichtete Durchschnitt uber alle moglichenAuspragungen von X ; die Gewichte sind die jeweiligenWahrscheinlichkeiten.
E [X ] =∑x
xf (x)
I Bei einer stetigen ZV Y analog
E [X ] =
∫xxf (x)dx
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 10/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Erwartungswert
I Folgende Eigenschaft folgt direkt aus der Definition desErwartungswerts; fur beliebige Konstanten a und b gilt
E [aX + b] = aE [X ] + b
I Weiters gilt
E [X1 + X2 + · · ·+ Xn] = E [X1] + · · ·+ E [Xn]
I Fur unabhangige ZV X1 · · ·Xn gilt
E [X1 · X2 · . . . · Xn] = E [X1] · . . . · E [Xn]
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 11/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Varianz, Kovarianz, Korrelation
I Die Varianz σ2 ist ein Streuungsmaß der Verteilung
σ2X = E[(X − E [X ])2
]= E
[X 2]− (E [X ])2
I Analog zur Stichprobenkovarianz ist die Kovarianz zwischen 2ZV definiert als
σXY = E [XY ]− E [X ]E [Y ]
I Die Varianz einer ZV ist die Kovarianz dieser ZV mit sichselbst!
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 12/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Varianz, Kovarianz, Korrelation
I Die Korrelation ρXY ist das Verhaltnis zwischen der Kovarianzund dem Produkt der Standardabweichungen
ρXY =σXYσXσY
I Gleiche Interpretation wie in Stichprobe
I Sind zwei ZV Variablen unabhangig, dann ist ihre Korrelation0; Achtung die umgekehrte Folgerung ist nicht immer richtig!
I Aus Korrelation gleich 0 folgt nicht unbedingt stochastischeUnabhangigkeit
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 13/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Varianz, Kovarianz, Korrelation
I Es gilt fur beliebige ZV bzw. fur Konstanten a und b
σ2(aX+b) = a2σ2X
I Weiters
σ2(X+Y ) = σ2X +σ2Y +2σXY bzw. σ2(X−Y ) = σ2X +σ2Y −2σXY
I
σ(aX+b)(cY+d) = acσXY
I Und schließlich
ρ(aX+b)(cY+d) = sgn(ac)ρXY
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 14/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Varianz
I Beispiel: X ist die beobachtete Augenzahl bei einmaligemWurfeln; die Wahrscheinlichkeitsverteilung von X ist
xi 1 2 3 4 5 6
f (xi )16
16
16
16
16
16
I
σ2 = E[X 2]− (E [X ])2︸ ︷︷ ︸
3.52
und E[X 2]
=6∑
i=1
x2i p(x2i )
E[X 2]
= 121
6+ · · ·+ 62
1
6= 15.17, σ2 = 2.92, σ = 1.71
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 15/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Erwartungswert und Varianz
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 16/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
α-Quantil
I Als α-Quantil qα wird ein Wert bezeichnet, unterhalb dessenein vorgegebener Anteil α aller Falle der Verteilung liegen
I Jeder Wert unterhalb von qα unterschreitet den Anteil α, mitα als reelle Zahl zwischen 0 (gar kein Fall der Verteilung) und1 (alle Falle oder 100% der Verteilung)
I Fur stetige ZV gilt
F (qα) = P(X ≤ qα) =
∫t≤qα
f (t)dt = α
I α-Quantile sind fur die wichtigsten stetigen Verteilungen inTabellen ausgegeben
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 17/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Stetige ZV
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 18/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
α-Quantil
I Fur diskrete ZV gilt
F (qα) = P(X ≤ qα) =∑t≤qα
P(X = t) ≥ α
F (x) < α fur jedes x kleiner als qα
I Aufrunden auf die nachste großere ganzzahlige Auspragung,analog zur Stichprobe
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 19/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Diskrete ZV
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 20/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Diskrete Gleichverteilung
I Diese Verteilung beschreibt eine ZV, welche die Zahlen1, 2, · · · ,m annehmen kann, und
I es gilt
P(X = x) =1
mfur alle x = 1, 2, · · · ,m
E [X ] =(m + 1)
2
σ2 =(m2 − 1)
12
I Anwendung bei Zufallsexperimenten, deren Ergebnisse gleichhaufig sind, also wenn angenommen wird, dass die mElementarereignisse gleichwahrscheinlich sind
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 21/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Diskrete Gleichverteilung
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 22/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Diskrete Gleichverteilung
I Erwartungswert und Varianz
E [X ] =m∑i=1
i1
m=
1
m
m∑i=1
i︸︷︷︸m(m + 1)
2
=m + 1
2
E[X 2]
=1
m
m∑i=1
i2 =1
m
m(m + 1)(2m + 1)
6
σ2 =(m + 1)(2m + 1)
6−(m + 1
2
)2
= · · · =(m + 1)(m − 1)
12
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 23/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Diskrete Gleichverteilung
I Beispiel: X = die erhaltene Augenzahl bei einmaligem Wurfeln
E [X ] =(6 + 1)
2= 3.5
σ2 =(62 − 1)
12= 2.92
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 24/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Binomialverteilung
I Wir betrachten ein Zufallsexperiment mit 2 Ausgangen,’Erfolg (1)’ und ’Misserfolg (0)’
I Die Wahrscheinlichkeit fur Erfolg sei p, mit p zwischen 0 und1
I Wir fuhren dieses Experiment n-mal durch, wobei zwischenden einzelnen Durchfuhrungen Unabhangigkeit angenommenwird (’Ziehen mit Zurucklegen’)
I Die ZV X beschreibt die Anzahl der Erfolge und istbinomialverteilt mit Parametern n und p, X v B(n, p)
P(X = k) =
(n
k
)pk(1− p)n−k fur k = 0, 1, · · · , n
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 25/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Binomialverteilung
I Beispiel: Ein Glucksrad besteht aus 20 Feldern, wobei 5 davonGewinnfelder sind. Wie groß ist die Wahrscheinlichkeit, dassSie zwei Mal gewinnen, wenn Sie das Glucksrad drei Maldrehen?
I Experiment mit 2 Ausgangen, Erfolg (5 Gewinnfelder) undMisserfolg
I n = 3, weil wir das Glucksrad drei Mal drehen
I p = 520 = 0.25 ist die Wahrscheinlichkeit zum Erfolg
P(X = 2) =
(3
2
)0.252(1− 0.25)1 =
3!
2!1!0.0625 · 0.75 = 0.14
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 26/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Binomialverteilung
I Binomialverteilte ZV nimmt Werte zwischen 0 und n an
I Binomialverteilung ist symmetrisch fur p = 0.5
I Je kleiner/großer p desto rechts/links-schiefer die Verteilung
I Erwartungswert und Varianz
E [X ] = np σ2 = np(1− p)
I Fur n = 1: B(1, p) ist eine Bernoulli-ZV mit Erwartungswertp und Varianz p(1− p)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 27/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Binomialverteilung
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 28/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Poisson-Verteilung
I Diese Verteilung beschreibt ZV, die alle naturliche Zahlen und0 annehmen konnen
I Die Wahrscheinlichkeitsfunktion
P(X = k) =λke−λ
k!fur k = 0, 1, · · · ,∞
I λ ist der Parameter der Poisson-Verteilung und kann jedereelle positive Zahl sein
I Erwartungswert und Varianz
E [X ] = λ σ2 = λ
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 29/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Poisson-Verteilung
I Poisson-Verteilung ist Grenzverteilung der Binomialverteilungbei n→∞ und p → 0 unter der Nebenbedingung, dassnp = λ beschrankt bleibt
I Poisson-Verteilung kann als gute Approximation fur dieBinomialverteilung bei großem n und kleinem p verwendetwerden
I Poisson-Verteilung beschreibt seltene Ereignisse
I Anwendung bei binomialverteilter ZV mit unbekanntem odergroßem n (leichtere Berechnung) und kleinem p
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 30/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Poisson-Verteilung
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 31/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Poisson-Verteilung
I Beispiel: Die Wahrscheinlichkeit, dass ein Patient die Injektioneines Serums nicht vertragt sei 0.001. Wie groß ist dieWahrscheinlichkeit, dass von 200 Patienten mehr als 1 dieInjektion nicht vertragen?
I Wahrscheinlichkeiten (Poisson-Verteilung)
I E [X ] = λ = (200)(0.001) = 0.2
P(X = 0) =0.20e−0.2
0!= 0.818731, P(X = 1) = 0.163746
P(X > 1) = 1− P(X = 0)− P(X = 1) = 0.017523
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 32/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Poisson-Verteilung
I Wahrscheinlichkeiten (Binomialverteilung B(200, 0.001))
P(X = 0) =
(200
0
)(0.001)0(1− 0.001)(200−0) = 0.818649
P(X = 1) = 0.163894
P(X > 1) = 1− P(X = 0)− P(X = 1) = 0.017458
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 33/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Poisson-Verteilung
I Beispiel: In einer Telefonzentrale kommen in einer Minutedurchschnittlich 3 Gesprache an. Mit welcherWahrscheinlichkeit kommen in einer Minute mehr als 3Gesprache an?
I Denkt man sich eine Minute in n gleiche Zeitabschnittezerlegt, die so klein sind, dass in jedem Abschnitt hochstensein Gesprach ankommen kann, so liegt eine BinomialverteilungB(n, 3n ) vor
I n ist unbekannt ⇒ Poissonverteilung mit λ = 3
P(X > 3) = 1−P(X = 0)−P(X = 1)−P(X = 2)−P(X = 3)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 34/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Poisson-Verteilung
I
P(X = 0) =30e−3
0!= 0.0498
I
P(X = 1) =31e−3
1!= 0.1494
I
P(X = 2) =32e−3
2!= 0.2240
I
P(X = 3) =33e−3
3!= 0.2240
I
P(X > 3) = 1− 0.0498− 0.1494− 0.2240− 0.2240 = 0.3528
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 35/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Geometrische Verteilung
I Wir fuhren eine Serie von Versuchen mit zwei moglichenAusgangen, ’Erfolg (1)’ und ’Misserfolg (0)’, so lange durchbis wir den ersten Erfolg haben
I Die Wahrscheinlichkeit fur Erfolg sei p
I Unsere ZV X erfasst die Anzahl der Durchfuhrungen bis zumersten Erfolg
P(X = k) = p(1− p)k−1 fur k = 1, 2, · · · ,∞
E [X ] =1− p
pσ2 =
1− p
p2
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 36/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Geometrische Verteilung
I Anwendung bei der Analyse von Wartezeiten bis zumEintreffen eines bestimmten Ereignisses
I Lebensdauerbestimmung von Geraten und Bauteilen, d.h.dem Warten bis zum ersten Ausfall
I Ruckfalle bei Suchterkrankungen
I Bestimmung der Anzahl haufiger Ereignisse zwischenunmittelbar aufeinanderfolgenden seltenen Ereignissen wiez.B. Fehlern
I Bestimmung der Zuverlassigkeit von Geraten
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 37/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Hypergeometrische Verteilung
I Aus einer Gesamtheit von N Elementen, wobei A (A ≤ N)markiert sind, wird zufallig eine Stichprobe von n (n ≤ N)Elementen ohne Zurucklegen entnommen
I Mit welcher Wahrscheinlichkeit kommt in der Stichprobe einebestimmte Anzahl a von markierten Elementen vor?
P(X = a) =
(Aa
)(N−An−a)(N
n
)E [X ] = n
A
Nσ2 = n
A
N
(1− A
N
)(N − n
N − 1
)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 38/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Hypergeometrische Verteilung
I Beispiel: Lotto 6 aus 45N = 45 Kugeln (=Zahlen) insgesamt, A = 6 Kugeln sind’markiert’ (d.h. am Lottoschein angekreuzt), n = 6 Kugelnwerden gezogen (ohne Zurucklegen). Die einzelnenGewinnwahrscheinlichkeiten ergeben sich durch dieHypergeometrische Verteilung
P(X = 3) =
(63
)(393
)(456
) =20 · 9139
8145060= 0.022
P(X = 6) =
(66
)(390
)(456
) =1
8145060= 0.000000123
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 39/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Wahrscheinlichkeitsfunktion Beispiel Lotto
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 40/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Hypergeometrische und Binomialverteilung
I Hypergeometrische Verteilung kann durch B(n, AN ) angenahertwerden, wenn n
N ≤ 0.05
I Beispiel: In der Population der Personen mit Adipositas, diesich einer Magenbypass-Operation unterzogen haben, haben10% einige Jahre nach der Operation (noch) eineBinge-Eating Storung (BED). In einer spezialisierten Klinikwurden in den letzten Jahren 1500 Personen operiert. Wiegroß ist die Wahrscheinlichkeit in einer Stichprobe von n = 50Personen maximal eine Person mit BED zu finden?
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 41/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Hypergeometrische und Binomialverteilung
I Binomialverteilung B(50, 0.10)
P(X = 0) =
(50
0
)0.100(1− 0.10)50 = 0.005154
P(X = 1) = 0.028632, ⇒ P(X = 0) +P(X = 1) = 0.033786
I Hypergeometrische Verteilung, N = 1500, A = 150, n = 50
P(X = 0) =
(1500
)(135050
)(150050
) = 0.004697
P(X = 1) = 0.027075 ⇒ P(X = 0) + P(X = 1) = 0.031771
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 42/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Normalverteilung (NV)
I Die NV ist eine stetige Verteilung, die durch 2 Parameter µund σ charakterisiert ist
I Es sei X eine ZV die N(µ, σ2) verteilt ist; X kann Wertezwischen −∞ und +∞ annehmen
I Die Dichtefunktion φ(x)
φ(x) =1
σ√
2πe−1
2
(x − µσ
)2
I Geht x → ±∞ strebt φ(x) gegen 0
I φ(x) ist symmetrisch um µ, d.h. µ+ a = µ− a (a =Konstante)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 43/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Normalverteilung (NV)
I σ gibt den Abstand zwischen µ und den Wendepunkten derDichtefunktion an
I Wendepunkte an den Stellen µ± σI Wenn σ groß ist, ist die Verteilung breit und niedrig, wenn σ
klein ist, ist die Verteilung schmal und hoch
I Flache unter φ(x) zwischen −∞ und +∞ ist gleich 1
I Die Flache µ± σ umfasst ca. 68% aller Falle
I Die Flache µ± 2σ umfasst ca. 95% aller Falle
I Es existieren unendlich viele NV durch beliebige Auswahl vonµ und σ
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 44/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Normalverteilung (NV)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 45/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Standardnormalverteilung N(0, 1)
I Spezielle NV fur µ = 0 und σ = 1 (Gauß’sche Glockenkurve)
I Verteilung der N(0,1) ist tabelliert; Flache zwischen µ = 0und einem beliebigen Wert z ist ablesbar (Tabelle 1c)
I Quantile der NV; 1-Flache rechts von einem Wert z , und linksvon −z (Tabelle 1b)
I Beispiele
P(0 ≤ Z ≤ 1) = 0.3413 (Tabelle 1c)
P(−1 ≤ Z ≤ 1) = 0.6826 (Tabelle 1b)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 46/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Standardnormalverteilung N(0, 1)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 47/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Standardnormalverteilung N(0, 1)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 48/49
Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen
Standardnormalverteilung N(0, 1)
I Ist X N(µ, σ2) verteilt dann fuhrt die Transformation X−µσ auf
eine N(0, 1) Verteilung
I Vorteil, da Quantile ablesbar (Tabelle 1b)
I Beispiel: X ∼ N(11, 5.53). Wie hoch ist P(X ≥ 14.5)?
z =14.5− 11
2.35= 1.49
P(Z ≥ 1.49) = 0.0681 (Tabelle 1b)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 49/49
Tabelle 1b: Verteilungsfunktion der Standard-Normalverteilung(einseitige Fragestellung)
z0 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 .5000 .4960 .4920 .4880 .4840 .4801 .4761 .4721 .4681 .46410.1 .4602 .4562 .4522 .4483 .4443 .4404 .4364 .4325 .4286 .42470.2 .4207 .4168 .4129 .4090 .4052 .4013 .3974 .3936 .3897 .38590.3 .3821 .3783 .3745 .3707 .3669 .3632 .3594 .3557 .3520 .34830.4 .3446 .3409 .3372 .3336 .3300 .3264 .3228 .3192 .3156 .3121
0.5 .3085 .3050 .3015 .2981 .2946 .2912 .2877 .2843 .2810 .27760.6 .2743 .2709 .2676 .2643 .2611 .2578 .2546 .2514 .2483 .24510.7 .2420 .2389 .2358 .2327 .2296 .2266 .2236 .2206 .2177 .21480.8 .2119 .2090 .2061 .2033 .2005 .1977 .1949 .1922 .1894 .18670.9 .1841 .1814 .1788 .1762 .1736 .1711 .1685 .1660 .1635 .1611
1.0 .1587 .1562 .1539 .1515 .1492 .1469 .1446 .1423 .1401 .13791.1 .1357 .1335 .1314 .1292 .1271 .1251 .1230 .1210 .1190 .11701.2 .1151 .1131 .1112 .1093 .1075 .1056 .1038 .1020 .1003 .09851.3 .0968 .0951 .0934 .0918 .0901 .0885 .0869 .0853 .0838 .08231.4 .0808 .0793 .0778 .0764 .0749 .0735 .0721 .0708 .0694 .0681
1.5 .0668 .0655 .0643 .0630 .0618 .0606 .0594 .0582 .0571 .05591.6 .0548 .0537 .0526 .0516 .0505 .0495 .0485 .0475 .0465 .04551.7 .0446 .0436 .0427 .0418 .0409 .0402 .0392 .0384 .0375 .03671.8 .0359 .0351 .0344 .0336 .0329 .0322 .0314 .0307 .0301 .02941.9 .0287 .0281 .0274 .0268 .0262 .0256 .0250 .0244 .0239 .0233
2.0 .0228 .0222 .0217 .0212 .0207 .0202 .0197 .0192 .0188 .01832.1 .0179 .0174 .0170 .0166 .0162 .0158 .0154 .0150 .0146 .01432.2 .0139 .0136 .0132 .0129 .0126 .0122 .0119 .0116 .0113 .01102.3 .0107 .0104 .0102 .0099 .0096 .0094 .0091 .0089 .0087 .00842.4 .0082 .0080 .0078 .0076 .0073 .0071 .0070 .0068 .0066 .0064
2.5 .0062 .0060 .0059 .0057 .0055 .0054 .0052 .0051 .0049 .00482.6 .0047 .0045 .0044 .0043 .0042 .0040 .0039 .0038 .0037 .00362.7 .0035 .0034 .0033 .0032 .0031 .0030 .0029 .0028 .0027 .00262.8 .0026 .0025 .0024 .0023 .0023 .0022 .0021 .0021 .0020 .00192.9 .0019 .0018 .0018 .0017 .0016 .0016 .0015 .0015 .0014 .0014
3.0 .00135 Die Tabelle gibt die Wahrscheinlich-3.1 .00097 keiten P (Z ≥ z0) fur beliebige3.2 .00069 Werte z0 einer standardnormal-3.3 .00048 verteilten Variablen Z an. (Ist z03.4 .00034 negativ, so ist |z0| zu verwenden!)
3.5 .00023 Ist die Irrtumswahrscheinlich-3.6 .00016 keit α gegeben, so ist jenes z03.7 .00011 (kritischer Wert) gesucht,3.8 .00007 fur welches gilt:3.9 .00005 P (Z ≥ z0) = α.
4.0 .00003 Fur α = 0.01 und α = 0.05 sind diese5.0 .0000003 kritischen Werte: 2.33 und 1.645.
Tabelle 1c: Verteilungsfunktion der Standard-Normalverteilung
z0 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .03590.1 .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .07530.2 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .1064 .1103 .11410.3 .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .15170.4 .1554 .1591 .1628 .1664 .1700 .1736 .1772 .1808 .1844 .1879
0.5 .1915 .1950 .1985 .2019 .2054 .2088 .2123 .2157 .2190 .22240.6 .2257 .2291 .2324 .2357 .2389 .2422 .2454 .2486 .2517 .25490.7 .2580 .2611 .2642 .2673 .2703 .2734 .2764 .2794 .2823 .28520.8 .2881 .2910 .2939 .2967 .2995 .3023 .3051 .3078 .3106 .31330.9 .3159 .3186 .3212 .3238 .3264 .3289 .3315 .3340 .3365 .3389
1.0 .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .36211.1 .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3790 .3810 .38301.2 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .40151.3 .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .41771.4 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319
1.5 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .44411.6 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .45451.7 .4554 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .46331.8 .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4699 .47061.9 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767
2.0 .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .48172.1 .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .48572.2 .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 .48902.3 .4893 .4896 .4898 .4901 .4904 .4906 .4909 .4911 .4913 .49162.4 .4918 .4920 .4922 .4925 .4927 .4929 .4931 .4832 .4934 .4936
2.5 .4938 .4940 .4941 .4943 .4945 .4946 .4948 .4949 .4951 .49522.6 .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .49642.7 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .49742.8 .4974 .4975 .4976 .4977 .4977 .4978 .4979 .4979 .4980 .49812.9 .4981 .4982 .4982 .4983 .4984 .4984 .4985 .4985 .4986 .4986
3.0 .49865 Die Tabelle gibt die Wahrscheinlich-3.1 .49903 keiten P (0 ≤ Z ≤ z0) fur beliebige3.2 .49931 Werte z0 einer standardnormal-3.3 .49952 verteilten Variablen Z an. (Ist z03.4 .49966 negativ, so ist |z0| zu verwenden!)
3.5 .499773.6 .499843.7 .499893.8 .499933.9 .49995
4.0 .499975.0 .4999997
Wahrscheinlichkeitsverteilungen II
Einfuhrung in Quantitative Methoden
Karin Waldherr & Pantelis Christodoulides
11. Mai 2011
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 1/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Poisson-Verteilung
I Diese Verteilung beschreibt ZV, die alle naturliche Zahlen und0 annehmen konnen
I Die Wahrscheinlichkeitsfunktion
P(X = k) =λke−λ
k!fur k = 0, 1, · · · ,∞
I λ ist der Parameter der Poisson-Verteilung und kann jedereelle positive Zahl sein
I Erwartungswert und Varianz
E [X ] = λ σ2 = λ
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 2/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Poisson-Verteilung
I Poisson-Verteilung ist Grenzverteilung der Binomialverteilungbei n→∞ und p → 0 unter der Nebenbedingung, dassnp = λ beschrankt bleibt
I Poisson-Verteilung kann als gute Approximation fur dieBinomialverteilung bei großem n und kleinem p verwendetwerden
I Poisson-Verteilung beschreibt seltene Ereignisse
I Anwendung bei binomialverteilter ZV mit unbekanntem odergroßem n (leichtere Berechnung) und kleinem p
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 3/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Poisson-Verteilung
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 4/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Poisson-Verteilung
I Beispiel: Die Wahrscheinlichkeit, dass ein Patient die Injektioneines Serums nicht vertragt sei 0.001. Wie groß ist dieWahrscheinlichkeit, dass von 200 Patienten mehr als 1 dieInjektion nicht vertragen?
I Wahrscheinlichkeiten (Poisson-Verteilung)
I E [X ] = λ = (200)(0.001) = 0.2
P(X = 0) =0.20e−0.2
0!= 0.818731, P(X = 1) = 0.163746
P(X > 1) = 1− P(X = 0)− P(X = 1) = 0.017523
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 5/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Poisson-Verteilung
I Wahrscheinlichkeiten (Binomialverteilung B(200, 0.001))
P(X = 0) =
(200
0
)(0.001)0(1− 0.001)(200−0) = 0.818649
P(X = 1) = 0.163894
P(X > 1) = 1− P(X = 0)− P(X = 1) = 0.017458
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 6/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Poisson-Verteilung
I Beispiel: In einer Telefonzentrale kommen in einer Minutedurchschnittlich 3 Gesprache an. Mit welcherWahrscheinlichkeit kommen in einer Minute mehr als 3Gesprache an?
I Denkt man sich eine Minute in n gleiche Zeitabschnittezerlegt, die so klein sind, dass in jedem Abschnitt hochstensein Gesprach ankommen kann, so liegt eine BinomialverteilungB(n, 3
n ) vor
I n ist unbekannt ⇒ Poissonverteilung mit λ = 3
P(X > 3) = 1−P(X = 0)−P(X = 1)−P(X = 2)−P(X = 3)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 7/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Poisson-Verteilung
I
P(X = 0) =30e−3
0!= 0.0498
I
P(X = 1) =31e−3
1!= 0.1494
I
P(X = 2) =32e−3
2!= 0.2240
I
P(X = 3) =33e−3
3!= 0.2240
I
P(X > 3) = 1− 0.0498− 0.1494− 0.2240− 0.2240 = 0.3528
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 8/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Geometrische Verteilung
I Wir fuhren eine Serie von Versuchen mit zwei moglichenAusgangen, ’Erfolg (1)’ und ’Misserfolg (0)’, so lange durchbis wir den ersten Erfolg haben
I Die Wahrscheinlichkeit fur Erfolg sei p
I Variante 1: Unsere ZV X erfasst die Anzahl derDurchfuhrungen bis zum ersten Erfolg (Anzahl der Versuche,die notwendig sind, bis zum Erfolg)
P(X = k) = p(1− p)k−1 fur k = 1, 2, · · · ,∞
E [X ] =1
p; σ2 =
1− p
p2
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 9/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Geometrische Verteilung
I Beispiel: Wurfeln einer 6, p = 1/6
I P(6 beim 1. Wurf): P(X = 1) = p = 1/6I P(6 beim 2. Wurf): P(X = 2) =?
I 1. Wurf keine 6: P(keine 6 beim 1.Wurf) = (1− p) = 5/6I P(6 beim 2.Wurf) = p = 1/6I P(X = 2) = p(1− p) = 1/6× 5/6 = 5/36 = 0.14
I allgemein: P(X = k) = p(1− p)k−1
I E (X ) = 1/16 = 6
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 10/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Geometrische Verteilung
I Variante 2: Unsere ZV Y erfasst die Anzahl der Misserfolgebis zum ersten Erfolg (Anzahl der Fehlversuche vor demErfolg)
P(Y = k) = p(1− p)k fur k = 0, 1, 2, · · · ,∞
E [Y ] = E (X )− 1 =1− p
p; σ2 =
1− p
p2
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 11/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Geometrische Verteilung
I Anwendung bei der Analyse von Wartezeiten bis zumEintreffen eines bestimmten Ereignisses
I Lebensdauerbestimmung von Geraten und Bauteilen, d.h.dem Warten bis zum ersten Ausfall
I Ruckfalle bei Suchterkrankungen
I Bestimmung der Anzahl haufiger Ereignisse zwischenunmittelbar aufeinanderfolgenden seltenen Ereignissen wiez.B. Fehlern
I Bestimmung der Zuverlassigkeit von Geraten
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 12/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Hypergeometrische Verteilung
I Aus einer Gesamtheit von N Elementen, wobei A (A ≤ N)markiert sind, wird zufallig eine Stichprobe von n (n ≤ N)Elementen ohne Zurucklegen entnommen
I Mit welcher Wahrscheinlichkeit kommt in der Stichprobe einebestimmte Anzahl a von markierten Elementen vor?
P(X = a) =
(Aa
)(N−An−a
)(Nn
)E [X ] = n
A
Nσ2 = n
A
N
(1− A
N
)(N − n
N − 1
)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 13/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Hypergeometrische Verteilung
I Beispiel: Lotto 6 aus 45N = 45 Kugeln (=Zahlen) insgesamt, A = 6 Kugeln sind’markiert’ (d.h. am Lottoschein angekreuzt), n = 6 Kugelnwerden gezogen (ohne Zurucklegen). Die einzelnenGewinnwahrscheinlichkeiten ergeben sich durch dieHypergeometrische Verteilung
P(X = 3) =
(63
)(393
)(456
) =20 · 9139
8145060= 0.022
P(X = 6) =
(66
)(390
)(456
) =1
8145060= 0.000000123
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 14/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Wahrscheinlichkeitsfunktion Beispiel Lotto
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 15/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Hypergeometrische und Binomialverteilung
I Hypergeometrische Verteilung kann durch B(n, AN ) angenahert
werden, wenn nN ≤ 0.05
I Beispiel: In der Population der Personen mit Adipositas, diesich einer Magenbypass-Operation unterzogen haben, haben10% einige Jahre nach der Operation (noch) eineBinge-Eating Storung (BED). In einer spezialisierten Klinikwurden in den letzten Jahren 1500 Personen operiert. Wiegroß ist die Wahrscheinlichkeit in einer Stichprobe von n = 50Personen maximal eine Person mit BED zu finden?
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 16/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Hypergeometrische und Binomialverteilung
I Binomialverteilung B(50, 0.10)
P(X = 0) =
(50
0
)0.100(1− 0.10)50 = 0.005154
P(X = 1) = 0.028632, ⇒ P(X = 0) + P(X = 1) = 0.033786
I Hypergeometrische Verteilung, N = 1500, A = 150, n = 50
P(X = 0) =
(1500
)(135050
)(150050
) = 0.004697
P(X = 1) = 0.027075 ⇒ P(X = 0) + P(X = 1) = 0.031771
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 17/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Normalverteilung (NV)
I Die NV ist eine stetige Verteilung, die durch 2 Parameter µund σ charakterisiert ist
I Es sei X eine ZV die N(µ, σ2) verteilt ist; X kann Wertezwischen −∞ und +∞ annehmen
I Die Dichtefunktion φ(x)
φ(x) =1
σ√
2πe−1
2
(x − µσ
)2
I Geht x → ±∞ strebt φ(x) gegen 0
I φ(x) ist symmetrisch um µ, d.h. µ+ a = µ− a (a =Konstante)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 18/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Normalverteilung (NV)
I σ gibt den Abstand zwischen µ und den Wendepunkten derDichtefunktion an
I Wendepunkte an den Stellen µ± σI Wenn σ groß ist, ist die Verteilung breit und niedrig, wenn σ
klein ist, ist die Verteilung schmal und hoch
I Flache unter φ(x) zwischen −∞ und +∞ ist gleich 1
I Die Flache µ± σ umfasst ca. 68% aller Falle
I Die Flache µ± 2σ umfasst ca. 95% aller Falle
I Es existieren unendlich viele NV durch beliebige Auswahl vonµ und σ
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 19/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Normalverteilung (NV)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 20/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Standardnormalverteilung N(0, 1)
I Spezielle NV fur µ = 0 und σ = 1 (Gauß’sche Glockenkurve)
I Verteilung der N(0,1) ist tabelliert; Flache zwischen µ = 0und einem beliebigen Wert z ist ablesbar (Tabelle 1c)
I Quantile der NV (Tabelle 1b)I 1 - Flache rechts von einem Wert z ,I Flache links von −z
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 21/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Standardnormalverteilung N(0, 1)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 22/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Standardnormalverteilung - Beispiel 1
P(0 ≤ Z ≤ 1) = 0.3413 (Tabelle 1c)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 23/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Standardnormalverteilung - Beispiel 2
P(−1 ≤ Z ≤ 1)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 24/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 25/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
I Tabelle 1c: P(−1 ≤ Z ≤ 1) = 2× 0.3413 = 0.6826
I Tabelle 1b:
P(−1 ≤ Z ≤ 1) = 1− 2× 0.1587 = 0.6826
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 26/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Standardnormalverteilung N(0, 1)
I Ist X N(µ, σ2) verteilt dann fuhrt die Transformation X−µσ auf
eine N(0, 1) Verteilung
I Vorteil, da Quantile ablesbar (Tabelle 1b)
I Beispiel: X ∼ N(11, 5.53). Wie hoch ist P(X ≥ 14.5)?
z =14.5− 11
2.35= 1.49
P(Z ≥ 1.49) = 0.0681 (Tabelle 1b)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 27/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 28/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Zentraler Grenzwertsatz
I Große Zahl voneinander unabhangiger ZV Xi mit beliebiger,identischer Verteilung mit gleichem E (Xi ) = µ und VarianzVar(Xi ) = σ2
I Zentraler Grenzwertsatz von Lindeberg & Levy (1922):Die Summe Y = X1 + X2 + . . .Xn ist asymptotischnormalverteilt mit E (Y ) = E (X1) + E (X2) + . . .E (Xn) = nµund Varianz σ2(Y ) = nσ2.
I Fur B(n, p) Satz von de Moivre und Laplace:Summe vieler Xi mit Bernoulli-Verteilung B(1, p) istasymptotisch normalverteilt mit µ = np und σ2 = np(1− p).Voraussetzung: np ≥ 5 und n(1− p) ≥ 5.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 29/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
BinomialverteilungExperiment mit zwei Ausgangen, z.B. Erfolg und Misserfolg. DieZV K , Anzahl der Erfolge bei n Versuchen, ist binomialverteilt mitParametern n und p, K v B(n, p)
P(K = k) =
(n
k
)pk(1− p)n−k fur k = 0, 1, · · · , n
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 30/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
NV-Approximation der BinomialverteilungBeispiel: n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 31/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
NV-Approximation der Binomialverteilung
I Vorteil: Verwendung der Standardnormalverteilung N(0,1), databelliert
I Berechnen von E (K ) = np und σ =√
np(1− p), unduberprufen ob np ≥ 5 und n(1− p) ≥ 5
I Standardisieren der Variable (d.h. Berechnung desStandardmesswertes), auch z-Transformation genannt
Z =k − µσ
I Bestimmen der Wahrscheinlichkeiten aus der Tabelle derN(0,1)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 32/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
NV-Approximation der Binomialverteilung - Beispiel 1I n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58I Beispiel P(k ≥ 7)I k = 7: Dem diskreten Wert 7 entspricht bei der stetigen NV
das Intervall [6.5,7.5].I Stetigkeitskorrektur (Kontinuitatskorrektur)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 33/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
z =6.5− 5
1.58= 0.95
Tab. 1b: P(Z ≥ 0.95) = 0.1711
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 34/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Beispiel 2
n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58Beispiel P(K ≤ 7):
1− P(k ≥ 7) = 1− 0.1711 = 0.829
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 35/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Beispiel 3n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58Beispiel P(K ≤ 3): Dem diskreten Wert 3 entspricht bei derstetigen NV das Intervall [2.5,3.5].
z =3.5− 5
1.58= −0.95
Tab. 1b: P(Z ≤ −0.95) = P(Z ≥ 0.95) = 0.1711
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 36/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Beispiel 4n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58P(4 ≤ K ≤ 6):
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 37/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Beispiel 4 - Tabelle 1b
z1:
z1 =3.5− 5
1.58= −0.95
z2:
z2 =6.5− 5
1.58= 0.95
Tab. 1b:P(−0.95 ≤ Z ≤ 0.95)] = 1− P(Z ≤ −0.95)− P(Z ≥ 0.95) =
1− 2× 0.1711 = 0.6578
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 38/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
Beispiel 4 - Tabelle 1c
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 39/40
Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung
P(−0.95 ≤ Z ≤ 0.95) = 0.3289 + 0.3289 = 0.6578
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 40/40
Einfuhrung in Quantitative Methoden
Karin Waldherr & Pantelis Christodoulides
Korrektur der Folie 35 vom 11. Mai 2011
Karin Waldherr & Pantelis Christodoulides Einfuhrung in Quantitative Methoden
Beispiel 2
n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58Beispiel P(K ≤ 6):
1− P(k ≥ 7) = 1− 0.1711 = 0.829
Karin Waldherr & Pantelis Christodoulides Einfuhrung in Quantitative Methoden
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Einfuhrung in Quantitative Methoden
Pantelis Christodoulides & Karin Waldherr
18. Mai 2011
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 1/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
Prufverteilungen - Motivation
I Inferenzstatistik verwendet Stichprobenkennwerte(Stichprobenmittelwert, Stichprobenvarianz oder auch denQuotient zweier Stichprobenvarianzen) als Schatzfunktionenfur die entsprechenden Populationsparameter.
I Zieht man immer wieder voneinander unabhangigeZufallsstichproben und berechnet die Kennwerte, werden dieeinzelnen Kennwerte aufgrund der zufalligenZusammensetzung der Stichproben nicht ident sein sondernstreuen zufallig um den Erwartungswert. Die Kennwerteeinzelner Zufallsstichproben sind Realisierungen vonZufallsvariablen (z.B. X , S2).
I Kenntnis der Verteilung dieser ZV (= Stichprobenverteilung)ist Grundlage fur Inferenzstatistik, z.B. von Hypothesentests,Vertrauensbereichen fur Schatzwerte.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 2/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
Empirische und Theoretische Verteilungen
Empirisch (beobachtet) Theoretisch (erwartet)
Stichprobe Population(Umfang n) n→∞
Haufigkeitsverteilung Wahrscheinlichkeitsfunktionbzw. Dichte
Kumulative relative VerteilungsfunktionHaufigkeitsverteilung
Kennwerte der Verteilungx E (X ) = µs2 σ2
rXY ρXYEmpirische Quantile Theoretische Quantile
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 3/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
χ2-VerteilungI Gegeben: standardnormalverteilte ZV (µ = 0, σ = 1)I Man entnimmt wiederholt (theoretisch unendlich oft) zufallig
einzelne z-Werte und quadriert diese. Diese Zufallsvariablewird als Z 2 = χ2
(1)-verteilte ZV bezeichnet.I Welche Verteilungsform ergibt sich?
I da die z-Werte quadriert werden, konnen nur Werte ≥ 0vorkommen
I da bei einer N(0,1)-verteilten ZV die Werte zwischen 0 und ±1 am haufigsten sind, werden daher auch χ2-Werte zwischen 0und 1 am haufigsten sein
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 4/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
χ2-Verteilung
I Entnimmt man wiederholt 2, 3, 4 . . . , oder m unabhangigezi -Werte, quadriert diese und bildet die Summe der z2
i ,ergeben sich χ2
(2), χ2(3), χ2
(4), ... bzw. χ2(m)- verteilte ZV
I Es entstehen χ2-Verteilungen mit 2, 3, 4, . . . , bzw. mFreiheitsgraden (df )
I Freiheitsgrade = Anzahl der Summanden, die frei variierendurfen (d.h. fur die es gleichgultig ist, welchen Wert sieannehmen)
I E (χ2) = df , σ2 = 2df
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 5/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
Dichten verschiedener χ2-Verteilungen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 6/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
χ2-Verteilung
I Die Summe einer χ2-verteilten Variablen mit df = n und einerunabhangigen χ2-verteilten Variablen mit df = m ist ebenfallsχ2-verteilt mit df = m + n. (= Reproduktionseigenschaft derχ2-Verteilung)
I Mit wachsender Anzahl von Summanden wird dieχ2-Verteilung immer symmetrischer und nahert sich einer NVmit µ = df und σ2 = 2df (vgl. Zentraler Grenzwertsatz)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 7/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
χ2-Tabelle
Tabelle 2 gibt ausgewahlte α-Quantile der χ2-Verteilung furverschiedene Freiheitsgrade an (jene Werte χ2
0, fur die giltP(χ2 ≤ χ2
0) = α).
α
0.005 0.01 0.025 0.05 0.90 0.95 0.975 0.99 0.995
df1 0.00 0.00 0.00 0.00 2.71 3.84 5.02 6.64 7.882 0.01 0.02 0.05 0.10 4.61 5.99 7.38 9.21 10.603 0.07 0.11 0.22 0.35 6.25 7.82 9.35 11.34 12.844 0.21 0.30 0.48 0.71 7.78 9.49 11.14 13.28 14.865 0.41 0.55 0.83 1.15 9.24 11.07 12.83 15.09 16.75...
......
......
......
......
...
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 8/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
Beispiel: df = 15, α = 0.95α
0.005 0.01 0.025 0.05 0.90 0.95 0.975 0.99 0.995
df1 0.00 0.00 0.00 0.00 2.71 3.84 5.02 6.64 7.88...
......
......
......
......
...15 4.60 5.23 6.26 7.26 22.31 25.00 27.49 30.58 32.80
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 9/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
Asymptotische Entwicklung von χ2
I Wenn df > 100 asymptotische Entwicklung von χ2
I Beispiel df = 200: annahernd normalverteilt mitN(200,
√400)
I
Z =χ2 − E (χ2)
σ(χ2)=χ2 − 200√
400I
χ20.99 − 200
20∼ z0.99 = 2.33(Tab. 1b)
I
χ20.99 ∼ 200 + 20 · 2.33 = 246.6
I
χ20.01 ∼ 200− 20 · 2.33 = 153.4
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 10/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
t-Verteilung
I Durch Standardisieren einer normalverteilten Variablen erhaltman eine standardnormalverteilte Variable
Z =X − µXσX
=X − µX√
σ2Xn
I Ist Populationsvarianz jedoch nicht bekannt und mussgeschatzt werden, dann ist der Quotient nichtstandardnormalverteilt sondern t-verteilt
T =X − µXσX
=X − µX√
σ2Xn
mit n Freiheitsgraden.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 11/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
Dichten verschiedener t-VerteilungenDie t-Verteilung ist wie die NV eingipfelig und symmetrisch, mitE (T ) = 0 (fur df ≥ 2), und Varianz n/(n − 2) (fur df ≥ 3).Mit wachsender Zahl der Freiheitsgrade nahert sich diet-Verteilung der N(0,1).
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 12/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
t-Tabelle
Tabelle 3 gibt ausgewahlte α-Quantile der t-Verteilung furverschiedene Freiheitsgrade an (jene Werte t0, fur welche giltP(t ≤ t0) = α)
α0.90 0.95 0.975 0.99 0.995 0.999 0.9995
df1 3.09 6.31 12.71 31.82 63.66 318.31 636.622 1.89 2.92 4.30 6.97 9.93 22.33 31.60...
......
......
......
...
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 13/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
Beispielα
0.90 0.95 0.975 0.99 0.995 0.999 0.9995
df10 1.37 1.81 2.23 2.76 3.17 4.14 4.59
......
......
......
......
120 1.29 1.66 1.98 2.36 2.62 3.16 3.37∞ 1.28 1.65 1.96 2.33 2.58 3.09 3.29
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 14/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
F -Verteilung
I Gegeben seien zwei stochastisch unabhangige χ2-verteilteVariablen, χ2
(n) und χ2(m).
I Der Quotientχ2
(n)
nχ2
(m)
m
ist F -verteilt mit df1 = n (Zahlerfreiheitsgrade) und df2 = m(Nennerfreiheitsgrade)
I F -Verteilungen sind stetig und asymmetrisch
I Da F das Verhaltnis zweier quadrierter Werte ist, konnen nurpositive Werte vorkommen
I Form ist abhangig von der Anzahl der Zahler- undNennerfreiheitsgrade
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 15/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
Dichten verschiedener F -Verteilungen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 16/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
F -TabelleI Tabelle 4a gibt jene Werte F0 einer F -verteilten Variablen mit
bestimmter Anzahl von Freiheitsgraden an, fur welche giltP(F ≤ F0) = α.
I Quotient wird so gebildet, dass der großere Wert im Zahlersteht.
I Fur die Werte in der jeweils oberen Zeile ist α = 0.95, fur jeneder unteren Zeile ist α = 0.99.
I df1 . . . Anzahl der ZahlerfreiheitsgradeI df2 . . . Anzahl der Nennerfreiheitsgrade
df1 1 2 3 4 5 . . . 10
df21 161 200 216 225 230 . . . 242
4052 4999 5403 5625 5764 . . . 6056
2 18.51 19.00 19.16 19.25 19.30 . . . 19.4098.50 99.00 99.17 99.25 99.30 . . . 99.40
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 17/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
Fortsetzung Spezielle stetige Verteilungen
Beispieldf1 1 2 3 4 5 . . . 10
df21 161 200 216 225 230 . . . 242
4052 4999 5403 5625 5764 . . . 6056
2 18.51 19.00 19.16 19.25 19.30 . . . 19.4098.50 99.00 99.17 99.25 99.30 . . . 99.40
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 18/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
Parameterschatzung
I Schatzung von Populationsparameter aufgrund einerStichprobe
1. Punktschatzer2. Vertrauensbereiche (Konfidenzintervalle)
I Punktschatzer: Wir benotigen eine Schatzfunktion (kurz:Schatzer).
I Bei der Konstruktion von Schatzern werden bestimmteEigenschaften berucksichtigt.
I ”Gute” (Qualitat) eines Schatzers spielt zentrale Rolle.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 19/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
Gutekriterien von Schatzfunktionen nach R.A. Fisher
Populationsparameter sollen aus Stichprobenkennwerten moglichst’gut’ geschatzt werden. Nach welchen Kriterien konnen wirentscheiden, ob ein Stichprobenkennwert ein brauchbarer Schatzerist?
I Erwartungstreue
I Konsistenz
I Effizienz
I Suffizienz (erschopfend)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 20/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
Erwartungstreue
I Eine Schatzfunktion (kurz: Schatzer) Θ ist erwartungstreu,wenn sein Erwartungswert dem Populationsparameterentspricht.
E (Θ) = θ
D.h., zieht man aus der Population immer wieder Stichprobenvom Umfang n und berechnet z.B. jedes Mal x , entspricht(auf lange Sicht) das arithmetische Mittel dieser xi demPopulationsparameter µ. Der Erwartungswert der ZV X ist µ.
I Unter- oder uberschatzt ein Schatzer den Parametersystematisch, weist er einen Bias auf. Der Bias ist dieDifferenz E (Θ)− θ.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 21/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
Beispiel GewehrErwartungstreues Gewehr und Gewehr mit Bias
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 22/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
I X ist ein erwartungstreuer Schatzer fur denPopulationsparameter µ: E (X ) = µ.
I
S2 =1
n − 1
n∑i=1
(Xi − X )2
ist ein erwartungstreuer Schatzer fur denPopulationsparameter σ2.
I
S2 =1
n
n∑i=1
(Xi − X )2
ist kein erwartungstreuer Schatzer fur σ2. Wurde man dieVarianzen aller moglichen Zufallsstichproben aus derPopulation mit dieser Formel berechnen, und daraus denDurchschnittswert, wurde die Populationsvarianz um denFaktor (n − 1)/n unterschatzt.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 23/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
I Analog fur die Kovarianz:
CXY =1
n − 1
n∑i=1
(Xi − X )(Yi − Y )
ist ein erwartungstreuer Schatzer.
I Weitere erwartungstreue Schatzer: Die relative Haufigkeit Rfur die Wahrscheinlichkeit eines Ereignisses, und dieStichprobenkorrelation fur ρXY
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 24/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
EffizienzI Ein Schatzer soll auch schon fur kleine Stichprobenumfange
eine moglichst geringe Varianz aufweisen.I Effizienz meint also die Prazision eines Schatzers.I Je kleiner die Varianz der Verteilung eines
Stichprobenkennwertes, umso großer ist seine Effizienz alsSchatzer.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 25/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
Streuung von Stichprobenmittelwerten
I Wie effizient ist X als Schatzer fur µ?
I Standardabweichung von Stichprobenkennwerten heißtStandardfehler
I Der Standardfehler des Mittelwertes σX ist abhangig von derVarianz der Variable X in der Population. σX andert sichproportional zur Populationsstreuung.
I Weiters beeinflusst der Stichprobenumfang denStandardfehler. Mit zunehmendem Stichprobenumfang wirdσX kleiner.
I Der Standardfehler des Mittelwertes betragt
σX =
√σ2X
n
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 26/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
Standardfehler des Medians
I Der Standardfehler des Medians betragt
σMd = 1.25
√σ2X
n
I Somit ist die Varianz der Medianwerteverteilung immer großerals jene der Mittelwerteverteilung.
I Der Mittelwert schatzt µ effizienter als der Median.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 27/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
Konsistenz
I Ein Schatzer soll fur große Stichprobenumfange (n→∞)einen moglichst kleinen zufalligen Fehler aufweisen, d.h. mitgroßer werdendem Stichprobenumfang soll Θn gegen denwahren Parameter θ streben, also immer genauer werden.
I Mathematisch
P(|Θn − θ| > ε)−→n→∞
0 fur jedes ε > 0.
Ein Schatzer ist konsistent, wenn die Wahrscheinlichkeit, dassder Absolutbetrag der Differenz zum wahren Parameter großerals jede beliebig kleine reelle Zahl ist, mit wachsendem ngegen 0 strebt.
I Konsistente Schatzer sind: Relative Haufigkeit, X , S2, und dieKorrelation.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 28/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
Suffizienz
I Ein Schatzer ist dann suffizient (oder erschopfend), wenn eralle in den Daten einer Stichprobe enthaltenen Informationenberucksichtigt, so dass die Berechnung eines weiterenstatistischen Kennwertes keine zusatzliche Information uberden zu schatzenden Parameter liefert.
I X und S2 sind suffiziente Schatzer
I Beispiel: Unter ganz bestimmten Bedingungen ist derRohscore (= Anzahl richtig geloster Aufgaben), den einePerson in einem Test erreicht, eine erschopfendeSchatzfunktion fur die Fahigkeit der Person. Die Kenntnis,welche Aufgaben die Person gelost hat und welche nicht,liefert keine zusatzliche Information uber die Fahigkeit derPerson.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 29/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
Methode der kleinsten Quadrate
I auch Ordinary Least Squares-Methode genannt.
I Schatzwert θ fur θ, sodass Stichprobe moglichst gutreprasentiert wird in der Form,
I dass die Summe der quadrierten Abweichungen zwischen θund Messwerten minimiert wird.
I Es wird die Summe der Abweichungsquadrate gebildet,
S(θ) =n∑
i=1
(xi − θ)2 → min,
und anschließend die partielle Ableitung nach dem ParameterNull gesetzt.
I Beispiel: Regression
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 30/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
Beispiel Mittelwert
S(µ) =n∑
i=1
(xi − µ)2 =n∑
i=1
(x2i − 2µxi + µ2) =
=n∑
i=1
x2i − 2µ
n∑i=1
xi + nµ2
∂S
∂µ= 2
n∑i=1
xi + 2nµ = 0
⇒ µ =
∑ni=1 xin
= x
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 31/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
Maximum-Likelihood SchatzungI Likelihood-Funktion: Wahrscheinlichkeit konkret beobachteter
Daten unter einem bestimmten Wahrscheinlichkeitsmodell.I Fur eine diskrete Verteilung, die durch den Parameter θ
charakterisiert ist, ist die Likelihood-Funktion definiert durch:
L(θ) =n∏
i=1
P(Xi = xi |θ)
I Gesucht: Maximum der Likelihood-Funktion fur diebeobachteten Daten, d.h. jenes θ, bei dem die Likelihood dengroßten Wert hat.
I Man bestimmt die Wahrscheinlichkeit fur das Auftreten derbeobachteten Daten unter der Annahme aller in Fragekommenden Stichprobenverteilungen.
I Der ML-Schatzer ist der Parameter jener Verteilung, bei demdas beobachtete Resultat am wahrscheinlichsten ist.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 32/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
Beispiel: Schatzen des Parameters p einerBinomialverteilung aufgrund beobachteter Daten
I Pilotstudie mit neuem Antidepressivum; bei 5 der 15teilnehmenden PatientInnen erfolgreich. Wie kann manaufgrund dieser Beobachtungen den Parameter p fur Erfolg inder Population schatzen?
I Numerische Losung: Einsetzen verschiedener p inL(p) =
(155
)p5(1− p)10
I
L(p = 0.1) = 0.01 L(p = 0.2) = 0.103
L(p = 0.3) = 0.206 L(p = 0.4) = 0.186
L(p = 0.5) = 0.092
I Die Likelihoodfunktion hat den großten Wert bei p = 0.3.Vielleicht ist ein Wert rund um 0.3 noch besser?
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 33/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
I Analytische Losung: Finden des Maximums der Funktion
L(p) =
(n
k
)pk(1− p)n−k
durch partielles Differenzieren und Nullsetzen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 34/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
Da mathematisch einfacher: Logarithmieren der Likelihoodfunktionln L
ln L(p) = ln
(n
k
)+ k ln p + (n − k) ln(1− p)→ Max
∂ ln L
∂p= k
∂ ln p
∂p+ (n − k)
∂ ln(1− p)
∂p= 0
k
p+ (n − k)
−1
1− p= 0
k(1− p) = (n − k)p
p =k
n= r
2. Ableitung ist < 0 ⇒ r ist der ML-Schatzer fur den Parameter pder Binomialverteilung. L(p = 0.33) = 0.214
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 35/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
ML-Schatzer fur Poisson-Verteilung
P(K = k |λ) =λke−λ
k!
ln L = k lnλ− ln k!− λ→ Max
∂ ln L
∂λ=
k
λ− 1 = 0
λ = k
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 36/37
Wahrscheinlichkeitsverteilungen IIIParameterschatzung
PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern
Eigenschaften von ML-Schatzern
Sie sind stets
I konsistent,
I suffizient,
I nicht unbedingt erwartungstreu (z.B. Varianz berechnet mit1/n)
I ML-Schatzer sind z.B.: R, X
I Nachteile: Oft existiert keine analytische Losung. NumerischeLosungsverfahren oft mathematisch nicht trivial
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 37/37
Tabelle 2: Ausgewahlte α-Quantile der χ2-Verteilung
Die Tabelle gibt jene Werte χ20 einer χ2-verteilten Variablen mit bestimmter
Anzahl von Freiheitsgraden an, sodass P (χ2 ≤ χ20) = α.
α
0.005 0.01 0.025 0.05 0.90 0.95 0.975 0.99 0.995df1 0.00 0.00 0.00 0.00 2.71 3.84 5.02 6.64 7.882 0.01 0.02 0.05 0.10 4.61 5.99 7.38 9.21 10.603 0.07 0.11 0.22 0.35 6.25 7.82 9.35 11.34 12.844 0.21 0.30 0.48 0.71 7.78 9.49 11.14 13.28 14.865 0.41 0.55 0.83 1.15 9.24 11.07 12.83 15.09 16.756 0.68 0.87 1.24 1.64 10.64 12.59 14.45 16.81 18.557 0.99 1.24 1.69 2.17 12.02 14.07 16.01 18.48 20.288 1.34 1.65 2.18 2.73 13.36 15.51 17.53 20.09 21.969 1.74 2.09 2.70 3.33 14.68 16.92 19.02 21.67 23.59
10 2.16 2.56 3.25 3.94 15.99 18.31 20.48 23.21 25.1911 2.60 3.05 3.82 4.58 17.28 19.68 21.92 24.74 26.7612 3.07 3.57 4.40 5.23 18.55 21.03 23.34 26.22 28.3013 3.57 4.11 5.01 5.89 19.81 22.36 24.74 27.69 29.8214 4.08 4.66 5.63 6.57 21.06 23.68 26.12 29.14 31.3215 4.60 5.23 6.26 7.26 22.31 25.00 27.49 30.58 32.8016 5.14 5.81 6.91 7.96 23.54 26.30 28.85 32.00 34.2717 5.70 6.41 7.56 8.67 24.77 27.59 30.19 33.41 35.7218 6.27 7.02 8.23 9.39 25.99 28.87 31.53 34.81 37.1619 6.84 7.63 8.91 10.12 27.20 30.14 32.85 36.19 38.5820 7.43 8.26 9.59 10.85 28.41 31.41 34.17 37.57 40.0021 8.03 8.90 10.28 11.59 29.62 32.67 35.48 38.93 41.4022 8.64 9.54 10.98 12.34 30.81 33.92 36.78 40.29 42.8023 9.26 10.20 11.69 13.09 32.01 35.17 38.08 41.64 44.1824 9.89 10.86 12.40 13.85 33.20 36.42 39.36 42.98 45.5625 10.52 11.52 13.12 14.61 34.38 37.65 40.65 44.31 46.9326 11.16 12.20 13.84 15.38 35.56 38.89 41.92 45.64 48.2927 11.81 12.88 14.57 16.15 36.74 40.11 43.19 46.96 49.6428 12.46 13.56 15.31 16.93 37.92 41.34 44.46 48.28 50.9929 13.12 14.26 16.05 17.71 39.09 42.56 45.72 49.59 52.3430 13.79 14.95 16.79 18.49 40.26 43.77 46.98 50.89 53.6740 20.71 22.16 24.43 26.51 51.80 55.76 59.34 63.69 66.7750 27.99 29.71 32.36 34.76 63.17 67.50 71.42 76.15 79.4960 35.53 37.48 40.48 43.19 74.40 79.08 83.30 88.38 91.9570 43.28 45.44 48.76 51.74 85.53 90.53 95.02 100.42 104.2280 51.17 53.54 57.15 60.39 96.58 101.88 106.63 112.33 116.3290 59.20 61.75 65.65 69.13 107.56 113.14 118.14 124.12 128.30
100 67.33 70.06 74.22 77.93 118.50 124.34 129.56 135.81 140.17200 151.36 156.43 162.73 168.28 226.02 233.99 241.06 249.06 254.27
Tabelle 4a: Ausgewahlte 0.95- und 0.99-Quantile der F -Verteilung
Die Tabelle gibt jene Werte F0 einer F -verteilten Variablen mit bestimmterAnzahl von Freiheitsgraden an, fur welche gilt: P (F ≤ F0) = α.F ist stets der Quotient aus dem großeren durch den kleineren Wert.Fur die Werte in der jeweils oberen Zeile ist α = 0.95, fur jene der unteren Zeileist α = 0.99.df1 . . . Anzahl der Zahlerfreiheitsgrade,df2 . . . Anzahl der Nennerfreiheitsgrade.
df1 1 2 3 4 5 6 7 8 9 10
df21 161 200 216 225 230 234 237 239 241 242
4052 4999 5403 5625 5764 5859 5928 5981 6022 60562 18.51 19.00 19.16 19.25 19.30 19.33 19.36 19.37 19.38 19.40
98.50 99.00 99.17 99.25 99.30 99.33 99.34 99.36 99.38 99.403 10.13 9.55 9.28 9.12 9.01 8.94 8.88 8.84 8.81 8.78
34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.234 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96
21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.545 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.78 4.74
16.26 13.27 12.06 11.39 10.97 10.67 10.45 10.27 10.15 10.056 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06
13.74 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.877 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.63
12.25 9.55 8.45 7.85 7.46 7.19 7.00 6.84 6.71 6.628 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.34
11.26 8.65 7.59 7.01 6.63 6.37 6.19 6.03 5.91 5.829 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.13
10.56 8.02 6.99 6.42 6.06 5.80 5.62 5.47 5.35 5.2610 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.97
10.04 7.56 6.55 5.99 5.64 5.39 5.21 5.06 4.95 4.8511 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.86
9.65 7.20 6.22 5.67 5.32 5.07 4.88 4.74 4.63 4.5412 4.75 3.88 3.49 3.26 3.11 3.00 2.92 2.85 2.80 2.76
9.33 6.93 5.95 5.41 5.06 4.82 4.65 4.50 4.39 4.3013 4.67 3.80 3.41 3.18 3.02 2.92 2.84 2.77 2.72 2.67
9.07 6.70 5.74 5.20 4.86 4.62 4.44 4.30 4.19 4.1014 4.60 3.74 3.34 3.11 2.96 2.85 2.77 2.70 2.65 2.60
8.86 6.51 5.56 5.03 4.69 4.46 4.28 4.14 4.03 3.9415 4.54 3.68 3.29 3.06 2.90 2.79 2.70 2.64 2.59 2.55
8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80
Fortsetzung Tabelle 4a: 0.95- und 0.99-Quantile der F -Verteilung
df1 1 2 3 4 5 6 7 8 9 10
df216 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49
8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.6917 4.45 3.59 3.20 2.96 2.81 2.70 2.62 2.55 2.50 2.45
8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.5918 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41
8.28 6.01 5.09 4.58 4.25 4.01 3.85 3.71 3.60 3.5119 4.38 3.52 3.13 2.90 2.74 2.63 2.55 2.48 2.43 2.38
8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.4320 4.35 3.49 3.10 2.87 2.71 2.60 2.52 2.45 2.40 2.35
8.10 5.85 4.94 4.43 4.10 3.87 3.71 3.56 3.45 3.3722 4.30 3.44 3.05 2.82 2.66 2.55 2.47 2.40 2.35 2.30
7.94 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.2624 4.26 3.40 3.01 2.78 2.62 2.51 2.43 2.36 2.30 2.26
7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.25 3.1726 4.22 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22
7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.17 3.0928 4.20 3.34 2.95 2.71 2.56 2.44 2.36 2.29 2.24 2.19
7.64 5.45 4.57 4.07 3.76 3.53 3.36 3.23 3.11 3.0330 4.17 3.32 2.92 2.69 2.53 2.42 2.34 2.27 2.21 2.16
7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.06 2.9832 4.15 3.30 2.90 2.67 2.51 2.40 2.32 2.25 2.19 2.14
7.50 5.34 4.46 3.97 3.66 3.42 3.25 3.12 3.01 2.9434 4.13 3.28 2.88 2.65 2.49 2.38 2.30 2.23 2.17 2.12
7.44 5.29 4.42 3.93 3.61 3.38 3.21 3.08 2.97 2.8936 4.11 3.26 2.86 2.63 2.48 2.36 2.28 2.21 2.15 2.10
7.39 5.25 4.38 3.89 3.58 3.35 3.18 3.04 2.94 2.8640 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.07
7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.88 2.8050 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.02
7.17 5.06 4.20 3.72 3.41 3.18 3.02 2.83 2.78 2.7060 4.00 3.15 2.76 2.52 2.37 2.25 2.17 2.10 2.04 1.99
7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.6370 3.98 3.13 2.74 2.50 2.35 2.23 2.14 2.07 2.01 1.97
7.01 4.92 4.08 3.60 3.29 3.07 2.91 2.77 2.67 2.59100 3.94 3.09 2.70 2.46 2.30 2.19 2.10 2.03 1.97 1.92
6.90 4.82 3.98 3.51 3.20 2.99 2.82 2.69 2.59 2.51200 3.89 3.04 2.65 2.41 2.26 2.14 2.05 1.98 1.92 1.87
6.76 4.71 3.88 3.41 3.11 2.90 2.73 2.60 2.50 2.41∞ 3.84 2.99 2.60 2.37 2.21 2.09 2.01 1.94 1.88 1.83
6.64 4.60 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32
Fortsetzung Tabelle 4a: 0.95- und 0.99-Quantile der F -Verteilung
11 12 14 16 20 24 30 50 100 ∞ df1
df2
243 244 245 246 248 249 250 252 253 254 16082 6106 6142 6169 6208 6234 6258 6302 6334 636619.40 19.41 19.42 19.43 19.44 19.45 19.46 19.47 19.49 19.50 299.41 99.42 99.43 99.44 99.45 99.46 99.47 99.48 99.49 99.508.76 8.74 8.71 8.69 8.66 8.64 8.62 8.58 8.56 8.53 3
27.13 27.05 26.92 26.83 26.69 26.60 26.50 26.35 26.23 26.125.93 5.91 5.87 5.84 5.80 5.77 5.74 5.70 5.66 5.63 4
14.45 14.37 14.24 14.15 14.02 13.93 13.83 13.69 13.57 13.464.70 4.68 4.64 4.60 4.56 4.53 4.50 4.44 4.40 4.36 59.96 9.89 9.77 9.68 9.55 9.47 9.38 9.24 9.13 9.024.03 4.00 3.96 3.92 3.87 3.84 3.81 3.75 3.71 3.67 67.79 7.72 7.60 7.52 7.39 7.31 7.23 7.09 6.99 6.883.60 3.57 3.52 3.49 3.44 3.41 3.38 3.32 3.28 3.23 76.54 6.47 6.35 6.27 6.15 6.07 5.98 5.85 5.75 5.653.31 3.28 3.23 3.20 3.15 3.12 3.08 3.03 2.98 2.93 85.74 5.67 5.56 5.48 5.36 5.28 5.20 5.06 4.96 4.863.10 3.07 3.02 2.98 2.93 2.90 2.86 2.80 2.76 2.71 95.18 5.11 5.00 4.92 4.80 4.73 4.64 4.51 4.41 4.312.94 2.91 2.86 2.82 2.77 2.74 2.70 2.64 2.59 2.54 104.78 4.71 4.60 4.52 4.41 4.33 4.25 4.12 4.01 3.912.82 2.79 2.74 2.70 2.65 2.61 2.57 2.50 2.45 2.40 114.46 4.40 4.29 4.21 4.10 4.02 3.94 3.80 3.70 3.602.72 2.69 2.64 2.60 2.54 2.50 2.46 2.40 2.35 2.30 124.22 4.16 4.05 3.98 3.86 3.78 3.70 3.56 3.46 3.362.63 2.60 2.55 2.51 2.46 2.42 2.38 2.32 2.26 2.21 134.02 3.96 3.85 3.78 3.67 3.59 3.51 3.37 3.27 3.162.56 2.53 2.48 2.44 2.39 2.35 2.31 2.24 2.19 2.13 143.86 3.80 3.70 3.62 3.51 3.43 3.34 3.21 3.11 3.002.51 2.48 2.43 2.39 2.33 2.29 2.25 2.18 2.12 2.07 153.73 3.67 3.56 3.48 3.36 3.29 3.20 3.07 2.97 2.87
Fortsetzung Tabelle 4a: 0.95- und 0.99-Quantile der F -Verteilung
11 12 14 16 20 24 30 50 100 ∞ df1
df2
2.45 2.42 2.37 2.33 2.28 2.24 2.20 2.13 2.07 2.01 163.61 3.55 3.45 3.37 3.25 3.18 3.10 2.96 2.86 2.752.41 2.38 2.33 2.29 2.23 2.19 2.15 2.08 2.02 1.96 173.52 3.45 3.35 3.27 3.16 3.08 3.00 2.86 2.76 2.652.37 2.34 2.29 2.25 2.19 2.15 2.11 2.04 1.98 1.92 183.44 3.37 3.27 3.19 3.07 3.00 2.91 2.78 2.68 2.572.34 2.31 2.26 2.21 2.15 2.11 2.07 2.00 1.94 1.88 193.36 3.30 3.19 3.12 3.00 2.92 2.84 2.70 2.60 2.492.31 2.28 2.23 2.18 2.12 2.08 2.04 1.96 1.90 1.84 203.30 3.23 3.13 3.05 2.94 2.86 2.77 2.63 2.53 2.422.26 2.23 2.18 2.13 2.07 2.03 1.98 1.91 1.84 1.78 223.18 3.12 3.02 2.94 2.83 2.75 2.67 2.53 2.42 2.312.22 2.18 2.13 2.09 2.02 1.98 1.94 1.86 1.80 1.73 243.09 3.03 2.93 2.85 2.74 2.66 2.58 2.44 2.33 2.212.18 2.15 2.10 2.05 1.99 1.95 1.90 1.82 1.76 1.69 263.02 2.96 2.86 2.77 2.66 2.58 2.50 2.36 2.25 2.132.15 2.12 2.06 2.02 1.96 1.91 1.87 1.78 1.72 1.65 282.95 2.90 2.80 2.71 2.60 2.52 2.44 2.30 2.18 2.062.12 2.09 2.04 1.99 1.93 1.89 1.84 1.76 1.69 1.62 302.90 2.84 2.74 2.66 2.55 2.47 2.38 2.24 2.13 2.012.10 2.07 2.02 1.97 1.91 1.86 1.82 1.74 1.67 1.59 322.86 2.80 2.70 2.62 2.51 2.42 2.34 2.20 2.08 1.962.08 2.05 2.00 1.95 1.89 1.84 1.80 1.71 1.64 1.57 342.82 2.76 2.66 2.58 2.47 2.38 2.30 2.15 2.04 1.912.06 2.03 1.98 1.93 1.87 1.82 1.78 1.69 1.62 1.55 362.78 2.72 2.62 2.54 2.43 2.35 2.26 2.12 2.00 1.872.04 2.00 1.95 1.90 1.84 1.79 1.74 1.66 1.59 1.51 402.73 2.66 2.56 2.49 2.37 2.29 2.20 2.05 1.94 1.811.98 1.95 1.90 1.85 1.78 1.74 1.69 1.60 1.52 1.44 502.62 2.56 2.46 2.39 2.26 2.18 2.10 1.94 1.82 1.681.95 1.92 1.86 1.81 1.75 1.70 1.65 1.56 1.48 1.39 602.56 2.50 2.40 2.32 2.20 2.12 2.03 1.87 1.74 1.601.93 1.89 1.84 1.79 1.72 1.67 1.62 1.53 1.45 1.35 702.51 2.45 2.35 2.28 2.15 2.07 1.98 1.82 1.69 1.531.88 1.85 1.79 1.75 1.68 1.63 1.57 1.48 1.39 1.28 1002.43 2.36 2.26 2.19 2.06 1.98 1.89 1.73 1.59 1.431.83 1.80 1.74 1.69 1.62 1.57 1.52 1.42 1.32 1.19 2002.34 2.28 2.17 2.09 1.97 1.88 1.79 1.62 1.48 1.281.79 1.75 1.69 1.64 1.57 1.52 1.46 1.35 1.24 1.00 ∞2.24 2.18 2.07 1.99 1.87 1.79 1.69 1.52 1.36 1.00
Fortsetzung Tabelle 4b: 0.975- und 0.995-Quantile der F -Verteilung
11 12 14 16 20 30 50 100 ∞ df1
df2
973 977 983 987 993 1001 1008 1013 1018 124334 24426 24572 24681 24836 25044 25211 25337 25500
39.4 39.4 39.4 39.4 39.4 39.5 39.5 39.5 39.5 2199 199 199 199 199 199 199 199 20014.4 14.3 14.3 14.2 14.2 14.1 14.0 14.0 13.9 343.5 43.4 43.2 43.0 42.8 42.5 42.2 42.0 41.88.79 8.75 8.69 8.64 8.56 8.46 8.38 8.32 8.26 420.8 20.7 20.5 20.4 20.2 19.9 19.7 19.5 19.36.57 6.52 6.46 6.41 6.33 6.23 6.14 6.08 6.02 513.5 13.4 13.2 13.1 12.9 12.7 12.5 12.3 12.15.41 5.37 5.30 5.25 5.17 5.07 4.98 4.92 4.85 610.1 10.0 9.88 9.76 9.59 9.36 9.17 9.03 8.884.71 4.67 4.60 4.54 4.47 4.36 4.28 4.21 4.14 78.27 8.18 8.03 7.93 7.75 7.53 7.35 7.22 7.084.24 4.20 4.13 4.08 4.00 3.89 3.81 3.74 3.67 87.10 7.01 6.87 6.76 6.61 6.40 6.22 6.09 5.953.91 3.87 3.80 3.74 3.67 3.56 3.47 3.40 3.33 96.31 6.23 6.09 5.98 5.83 5.62 5.45 5.32 5.193.66 3.62 3.55 3.50 3.42 3.31 3.22 3.15 3.08 105.75 5.66 5.53 5.42 5.27 5.07 4.90 4.77 4.643.47 3.43 3.36 3.30 3.23 3.12 3.03 2.96 2.88 115.32 5.24 5.10 5.00 4.86 4.65 4.49 4.36 4.233.32 3.28 3.21 3.15 3.07 2.96 2.87 2.80 2.72 124.99 4.91 4.77 4.67 4.53 4.33 4.17 4.04 3.903.20 3.15 3.08 3.03 2.95 2.84 2.74 2.67 2.60 134.72 4.64 4.51 4.41 4.27 4.07 3.91 3.78 3.653.09 3.05 2.98 2.92 2.84 2.73 2.64 2.56 2.49 144.51 4.43 4.30 4.20 4.06 3.86 3.70 3.57 3.443.01 2.96 2.89 2.84 2.76 2.64 2.55 2.47 2.40 154.33 4.25 4.12 4.02 3.88 3.69 3.52 3.39 3.26
Fortsetzung Tabelle 4b: 0.975- und 0.995-Quantile der F -Verteilung
11 12 14 16 20 30 50 100 ∞ df1
df2
2.93 2.89 2.82 2.76 2.68 2.57 2.47 2.40 2.32 164.18 4.10 3.97 3.87 3.73 3.54 3.37 3.25 3.112.87 2.82 2.75 2.70 2.62 2.50 2.41 2.33 2.25 174.05 3.97 3.84 3.75 3.61 3.41 3.25 3.12 2.982.81 2.77 2.70 2.64 2.56 2.44 2.35 2.27 2.19 183.94 3.86 3.73 3.64 3.50 3.30 3.14 3.01 2.872.76 2.72 2.65 2.59 2.51 2.39 2.30 2.22 2.13 193.84 3.76 3.64 3.54 3.40 3.21 3.04 2.91 2.782.72 2.68 2.60 2.55 2.46 2.35 2.25 2.17 2.09 203.76 3.68 3.55 3.46 3.32 3.12 2.96 2.83 2.692.65 2.60 2.53 2.47 2.39 2.27 2.17 2.09 2.00 223.61 3.54 3.41 3.31 3.18 2.98 2.82 2.69 2.552.59 2.54 2.47 2.41 2.33 2.21 2.11 2.02 1.94 243.50 3.42 3.30 3.20 3.06 2.87 2.70 2.57 2.432.54 2.49 2.42 2.36 2.28 2.16 2.05 1.97 1.88 263.40 3.33 3.20 3.11 2.97 2.77 2.61 2.47 2.332.49 2.45 2.37 2.32 2.23 2.11 2.01 1.92 1.83 283.32 3.25 3.12 3.03 2.89 2.69 2.53 2.39 2.252.46 2.41 2.34 2.28 2.20 2.07 1.97 1.88 1.79 303.25 3.18 3.06 2.96 2.82 2.63 2.46 2.32 2.182.43 2.38 2.31 2.25 2.16 2.04 1.93 1.85 1.75 323.20 3.12 3.00 2.90 2.77 2.57 2.40 2.26 2.112.40 2.35 2.28 2.22 2.13 2.01 1.90 1.82 1.72 343.15 3.07 2.95 2.85 2.72 2.52 2.35 2.21 2.062.37 2.33 2.25 2.20 2.11 1.99 1.88 1.79 1.69 363.10 3.03 2.90 2.81 2.67 2.48 2.30 2.17 2.012.33 2.29 2.21 2.15 2.07 1.94 1.83 1.74 1.64 403.03 2.95 2.83 2.74 2.60 2.40 2.23 2.09 1.932.26 2.22 2.14 2.08 1.99 1.87 1.75 1.66 1.55 502.90 2.82 2.70 2.61 2.47 2.27 2.10 1.95 1.792.22 2.17 2.09 2.03 1.94 1.82 1.70 1.60 1.48 602.82 2.74 2.62 2.53 2.39 2.19 2.01 1.86 1.692.18 2.14 2.06 2.00 1.91 1.78 1.66 1.56 1.44 702.76 2.68 2.56 2.47 2.33 2.13 1.95 1.80 1.622.12 2.08 2.00 1.94 1.85 1.71 1.59 1.48 1.35 1002.66 2.58 2.46 2.37 2.23 2.02 1.84 1.68 1.492.06 2.01 1.93 1.87 1.78 1.64 1.51 1.39 1.23 2002.54 2.47 2.35 2.25 2.11 1.91 1.71 1.54 1.311.99 1.94 1.87 1.80 1.71 1.57 1.43 1.30 1.00 ∞2.43 2.36 2.24 2.14 2.00 1.79 1.59 1.40 1.00
Tabelle 4b: Ausgewahlte 0.975- und 0.995-Quantile der F -Verteilung
Die Tabelle gibt jene Werte F0 einer F -verteilten Variablen mit bestimmterAnzahl von Freiheitsgraden an, fur welche gilt: P (F ≤ F0) = α.F ist stets der Quotient aus dem großeren durch den kleineren Wert.Fur die Werte in der jeweils oberen Zeile ist α = 0.975, fur jene der unterenZeile ist α = 0.995.df1 . . . Anzahl der Zahlerfreiheitsgrade,df2 . . . Anzahl der Nennerfreiheitsgrade.
df1 1 2 3 4 5 6 7 8 9 10
df21 648 800 864 900 922 937 948 957 963 969
16211 20000 21615 22500 23056 23437 23715 23925 24091 242242 38.5 39.0 39.2 39.2 39.3 39.3 39.4 39.4 39.4 39.4
198 199 199 199 199 199 199 199 199 1993 17.4 16.0 15.4 15.1 14.9 14.7 14.6 14.5 14.4 14.4
55.6 49.8 47.5 46.2 45.4 44.8 44.4 44.1 43.9 43.74 12.2 10.6 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84
31.3 26.3 24.3 23.2 22.5 22.0 21.6 21.4 21.1 21.05 10.0 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62
22.8 18.3 16.5 15.6 14.9 14.5 14.2 14.0 13.8 13.66 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46
18.6 14.5 12.9 12.0 11.5 11.1 10.8 10.6 10.4 10.27 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76
16.2 12.4 10.9 10.0 9.52 9.16 8.89 8.68 8.51 8.388 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30
14.7 11.0 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.219 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
13.6 10.1 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.4210 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72
12.8 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.8511 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53
12.2 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 5.4212 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37
11.8 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.0913 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25
11.4 8.19 6.93 6.23 5.79 5.48 5.25 5.08 4.94 4.8214 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15
11.1 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.6015 6.20 4.76 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06
10.8 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42
Fortsetzung Tabelle 4b: 0.975- und 0.995-Quantile der F -Verteilung
df1 1 2 3 4 5 6 7 8 9 10
df216 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99
10.6 7.51 6.30 5.64 5.21 4.91 4.69 4.52 4.38 4.2717 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92
10.4 7.35 6.16 5.50 5.07 4.78 4.56 4.39 4.25 4.1418 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87
10.2 7.21 6.03 5.37 4.96 4.66 4.44 4.28 4.14 4.0319 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82
10.1 7.09 5.92 5.27 4.85 4.56 4.34 4.18 4.04 3.9320 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77
9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.8522 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76 2.70
9.73 6.81 5.65 5.02 4.61 4.32 4.11 3.94 3.81 3.7024 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64
9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.5926 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65 2.59
9.41 6.54 5.41 4.79 4.38 4.10 3.89 3.73 3.60 3.4928 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61 2.55
9.28 6.44 5.32 4.70 4.30 4.02 3.81 3.65 3.52 3.4230 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51
9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.3432 5.53 4.15 3.56 3.22 3.00 2.84 2.72 2.62 2.54 2.48
9.09 6.28 5.17 4.56 4.17 3.89 3.68 3.52 3.39 3.2934 5.50 4.12 3.53 3.19 2.97 2.81 2.69 2.59 2.52 2.45
9.01 6.22 5.11 4.50 4.11 3.84 3.63 3.47 3.34 3.2436 5.47 4.09 3.51 3.17 2.94 2.79 2.66 2.57 2.49 2.43
8.94 6.16 5.06 4.46 4.06 3.79 3.58 3.42 3.30 3.1940 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39
8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.1250 5.34 3.98 3.39 3.06 2.83 2.67 2.55 2.46 2.38 2.32
8.63 5.90 4.83 4.23 3.85 3.58 3.38 3.22 3.09 2.9960 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27
8.49 5.80 4.73 4.14 3.76 3.49 3.29 3.13 3.01 2.9070 5.25 3.89 3.31 2.98 2.75 2.60 2.48 2.38 2.30 2.24
8.40 5.72 4.65 4.08 3.70 3.43 3.23 3.08 2.95 2.85100 5.18 3.83 3.25 2.92 2.70 2.54 2.42 2.32 2.24 2.18
8.24 5.59 4.54 3.96 3.59 3.33 3.13 2.97 2.85 2.74200 5.10 3.76 3.18 2.85 2.63 2.47 2.35 2.26 2.18 2.11
8.06 5.44 4.41 3.84 3.47 3.21 3.01 2.85 2.73 2.63∞ 5.02 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11 2.05
7.88 5.30 4.28 3.72 3.35 3.09 2.90 2.74 2.62 2.52
Tabelle 4b: Ausgewahlte 0.975- und 0.995-Quantile der F -Verteilung
Die Tabelle gibt jene Werte F0 einer F -verteilten Variablen mit bestimmterAnzahl von Freiheitsgraden an, fur welche gilt: P (F ≤ F0) = α.F ist stets der Quotient aus dem großeren durch den kleineren Wert.Fur die Werte in der jeweils oberen Zeile ist α = 0.975, fur jene der unterenZeile ist α = 0.995.df1 . . . Anzahl der Zahlerfreiheitsgrade,df2 . . . Anzahl der Nennerfreiheitsgrade.
df1 1 2 3 4 5 6 7 8 9 10
df21 648 800 864 900 922 937 948 957 963 969
16211 20000 21615 22500 23056 23437 23715 23925 24091 242242 38.5 39.0 39.2 39.2 39.3 39.3 39.4 39.4 39.4 39.4
198 199 199 199 199 199 199 199 199 1993 17.4 16.0 15.4 15.1 14.9 14.7 14.6 14.5 14.4 14.4
55.6 49.8 47.5 46.2 45.4 44.8 44.4 44.1 43.9 43.74 12.2 10.6 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84
31.3 26.3 24.3 23.2 22.5 22.0 21.6 21.4 21.1 21.05 10.0 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62
22.8 18.3 16.5 15.6 14.9 14.5 14.2 14.0 13.8 13.66 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46
18.6 14.5 12.9 12.0 11.5 11.1 10.8 10.6 10.4 10.27 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76
16.2 12.4 10.9 10.0 9.52 9.16 8.89 8.68 8.51 8.388 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30
14.7 11.0 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.219 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96
13.6 10.1 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.4210 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72
12.8 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.8511 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53
12.2 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 5.4212 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37
11.8 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.0913 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25
11.4 8.19 6.93 6.23 5.79 5.48 5.25 5.08 4.94 4.8214 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15
11.1 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.6015 6.20 4.76 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06
10.8 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42
Fortsetzung Tabelle 4b: 0.975- und 0.995-Quantile der F -Verteilung
df1 1 2 3 4 5 6 7 8 9 10
df216 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99
10.6 7.51 6.30 5.64 5.21 4.91 4.69 4.52 4.38 4.2717 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92
10.4 7.35 6.16 5.50 5.07 4.78 4.56 4.39 4.25 4.1418 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87
10.2 7.21 6.03 5.37 4.96 4.66 4.44 4.28 4.14 4.0319 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82
10.1 7.09 5.92 5.27 4.85 4.56 4.34 4.18 4.04 3.9320 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77
9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.8522 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76 2.70
9.73 6.81 5.65 5.02 4.61 4.32 4.11 3.94 3.81 3.7024 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64
9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.5926 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65 2.59
9.41 6.54 5.41 4.79 4.38 4.10 3.89 3.73 3.60 3.4928 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61 2.55
9.28 6.44 5.32 4.70 4.30 4.02 3.81 3.65 3.52 3.4230 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51
9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.3432 5.53 4.15 3.56 3.22 3.00 2.84 2.72 2.62 2.54 2.48
9.09 6.28 5.17 4.56 4.17 3.89 3.68 3.52 3.39 3.2934 5.50 4.12 3.53 3.19 2.97 2.81 2.69 2.59 2.52 2.45
9.01 6.22 5.11 4.50 4.11 3.84 3.63 3.47 3.34 3.2436 5.47 4.09 3.51 3.17 2.94 2.79 2.66 2.57 2.49 2.43
8.94 6.16 5.06 4.46 4.06 3.79 3.58 3.42 3.30 3.1940 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39
8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.1250 5.34 3.98 3.39 3.06 2.83 2.67 2.55 2.46 2.38 2.32
8.63 5.90 4.83 4.23 3.85 3.58 3.38 3.22 3.09 2.9960 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27
8.49 5.80 4.73 4.14 3.76 3.49 3.29 3.13 3.01 2.9070 5.25 3.89 3.31 2.98 2.75 2.60 2.48 2.38 2.30 2.24
8.40 5.72 4.65 4.08 3.70 3.43 3.23 3.08 2.95 2.85100 5.18 3.83 3.25 2.92 2.70 2.54 2.42 2.32 2.24 2.18
8.24 5.59 4.54 3.96 3.59 3.33 3.13 2.97 2.85 2.74200 5.10 3.76 3.18 2.85 2.63 2.47 2.35 2.26 2.18 2.11
8.06 5.44 4.41 3.84 3.47 3.21 3.01 2.85 2.73 2.63∞ 5.02 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11 2.05
7.88 5.30 4.28 3.72 3.35 3.09 2.90 2.74 2.62 2.52
Tabelle 3: Ausgewahlte Quantile der t-Verteilung
Die Tabelle gibt ausgewahlte α-Quantile der t-Verteilung fur verschiedeneFreiheitsgrade an (jene Werte t0, fur welche gilt P (t ≤ t0) = α)
α0.90 0.95 0.975 0.99 0.995 0.999 0.9995
df1 3.08 6.31 12.71 31.82 63.66 318.31 636.622 1.89 2.92 4.30 6.97 9.93 22.33 31.603 1.64 2.35 3.18 4.54 5.84 10.21 12.924 1.53 2.13 2.78 3.75 4.60 7.17 8.61
5 1.48 2.02 2.57 3.37 4.03 5.89 6.876 1.44 1.94 2.45 3.14 3.71 5.21 5.967 1.42 1.90 2.37 3.00 3.50 4.79 5.418 1.40 1.86 2.31 2.90 3.36 4.50 5.049 1.38 1.83 2.26 2.82 3.25 4.30 4.78
10 1.37 1.81 2.23 2.76 3.17 4.14 4.5911 1.36 1.80 2.20 2.72 3.11 4.03 4.4412 1.36 1.78 2.18 2.68 3.06 3.93 4.3213 1.35 1.77 2.16 2.65 3.01 3.85 4.2214 1.35 1.76 2.15 2.62 2.98 3.79 4.14
15 1.34 1.75 2.13 2.60 2.95 3.73 4.0716 1.34 1.75 2.12 2.58 2.92 3.69 4.0217 1.33 1.74 2.11 2.57 2.90 3.65 3.9718 1.33 1.73 2.10 2.55 2.88 3.61 3.9219 1.33 1.73 2.09 2.54 2.86 3.58 3.88
20 1.33 1.73 2.09 2.53 2.85 3.55 3.8521 1.32 1.72 2.08 2.52 2.83 3.53 3.8222 1.32 1.72 2.07 2.51 2.82 3.51 3.7923 1.32 1.71 2.07 2.50 2.81 3.49 3.7724 1.32 1.71 2.06 2.49 2.80 3.47 3.75
25 1.32 1.71 2.06 2.49 2.79 3.45 3.7326 1.32 1.71 2.06 2.48 2.78 3.44 3.7127 1.31 1.70 2.05 2.47 2.77 3.42 3.6928 1.31 1.70 2.05 2.47 2.76 3.41 3.6729 1.31 1.70 2.05 2.46 2.76 3.40 3.66
30 1.31 1.70 2.04 2.46 2.75 3.39 3.6540 1.30 1.68 2.02 2.42 2.70 3.31 3.5660 1.30 1.67 2.00 2.39 2.66 3.23 3.46
120 1.29 1.66 1.98 2.36 2.62 3.16 3.37∞ 1.28 1.65 1.96 2.33 2.58 3.09 3.29
Konfidenzintervalle und Statistische Tests
Einfuhrung in Quantitative Methoden
Karin Waldherr & Pantelis Christodoulides
25. Mai 2011
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 1/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Allgemeines
I Wir interessieren uns fur einen unbekannten wahren Parameterθ, der die Verteilung einer Zufallsvariable charakterisiert
I θ wird durch eine Schatzfunktion Θ aus einer(reprasentativen) Stichprobe mit Umfang n geschatzt
I Es wird davon ausgegangen, dass die Stichprobe in etwa dieGrundgesamtheit widerspiegelt, und dass deshalb dieSchatzung in der Nahe des wahren Parameters liegen musste
I Die Schatzfunktion ist selbst eine Zufallsvariable mit einerVerteilung, die den Parameter θ enthalt
I Bei der Schatzung von Parametern geht es nicht nur darum,Schatzfunktionen zu finden und deren Eigenschaften(Erwartungstreue, Konsistenz, etc.) abzuklaren
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 2/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
AllgemeinesI Man mochte auch Intervalle angeben, in welchen θ mit einer
gewissen Sicherheit liegtI Es sei α eine vorgegebene Irrtumswahrscheinlichkeit, und a
bzw. b reelle Zahlen, mit a ≤ b. Die Schatzung des Bereichesa ≤ θ ≤ b mit der Vertrauenswahrscheinlichkeit (1− α)nennen wir Konfidenzintervall des Parameters θ mitIrrtumswahrscheinlichkeit α
I Θ Punktschatzung von θ, im Vergleich zur IntervallschatzungI Wir konstruieren ein symmetrisches Konfidenzintervall auf
Grundlage einer Schatzfunktion ΘI Von besonderem Interesse ist die Breite des
Konfidenzintervalls. Diese bestimmt sich durch dieStandardabweichung von Θ
I Erwunscht ist in der Regel ein moglichst schmalesKonfidenzintervall, denn dies weist auf eine genaue Schatzunghin
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 3/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Uberblick
I Konfidenzintervall fur den Parameter p einer B(n, p) Variable
I Konfidenzintervall fur den Erwartungswert µ einer N(µ, σ2)Variable bei bekannter Varianz σ2
I Konfidenzintervall fur den Erwartungswert µ einer N(µ, σ2)Variable bei unbekannter Varianz σ2
I Naherungsweises Konfidenzintervall fur den Erwartungswert µeiner Variable mit unbekannter Verteilung
I Konfidenzintervall fur die Varianz σ2 einer N(µ, σ2) Variable
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 4/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur p einer B(n, p)
I Befragung einer Zufallsstichprobe von n Personen aus einerunendlichen Population zu einem Thema mitAntwortkategorien ja/nein
I k ist die Anzahl der ’ja’ Antworten in der Stichprobe
I r = kn die entsprechende relative Haufigkeit
I p = P (’ja’) ist der wahre (unbekannte) Anteil derJa-Stimmen in der Population
I r ist ein erwartungstreuer Schatzer fur p
I K ist jene Zufallsvariable, die durch wiederholte Ziehungunabhangiger Stichproben vom Umfang n aus der unendlichenPopulation entsteht, R ist die entsprechende Zufallsvariableder relativen Haufigkeiten
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 5/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur p einer B(n, p)
I K ∼ B(n, p)
I Wenn np ≥ 5 und n(1− p) ≥ 5 darf die Binomialverteilungnaherungsweise durch die N(np, np(1− p)) ersetzt werden
I K ∼a N(np, np(1− p)) und auch
I R ∼a N(npn ,
np(1−p)n2 ) = N(p, p(1−p)
n )
I Um die Tabelle der N(0, 1) fur die Bestimmung derEndpunkte des Konfidenzintervalls anwenden zu konnen,standardisieren wir R
I
Z =R − E (R)
σR=
R − p√p(1−p)
n
∼ N(0, 1)
I Sei α = 0.05
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 6/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur p einer B(n, p)
Tabelle 1b: P(−1.96 ≤ Z ≤ 1.96) = 0.95
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 7/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur p einer B(n, p)
I Fur 95% aller Stichproben mit Umfang n gilt
|Z | =|R − p|√
p(1−p)n
≤ 1.96
I Wir ersetzen σR durch einen Schatzer σR
σR =
√p(1− p)
n, σR =
√r(1− r)
n − 1
I Also gilt fur 95% aller Stichproben mit Umfang n
|R − p| ≤ 1.96
√r(1− r)
n − 1
I Grundlage fur ein KI mit einer Irrtumswahrscheinlichkeitα = 0.05
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 8/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur p einer B(n, p)
I Die Grenzen des KI mit Irrtumswahrscheinlichkeit α = 0.05werden wie folgt bestimmt
p1,2 = r ± 1.96
√r(1− r)
n − 1
I Allgemeiner fur beliebige Irrtumswahrscheinlichkeit α
p1,2 = r ± z1−α2
√r(1− r)
n − 1
I KI ist symmetrisch um den Punkt r , symmetrisches KI
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 9/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur p einer B(n, p)
I Bei gegebenem p hangt die Breite des KI von zwei Faktorenab: der gewunschten Sicherheit und dem Stichprobenumfang
I Je hoher die Sicherheit, desto kleiner dieIrrtumswahrscheinlichkeit α, desto großer wird z1−α
2, und
desto breiter das Intervall
I Je großer die Stichprobe, desto kleiner wird σR und dessenSchatzung σR , und desto schmaler das Intervall
I Interpretation des KI: Werden immer wieder unabhangigeStichproben vom Umfang n gezogen, und wird fur jede dieserStichproben p = r gerechnet, so liegt p in (1− α) Prozentdieser Stichproben innerhalb des Intervalles [p1, p2]. DerParameter p wird mit einer Vertrauenswahrscheinlichkeit von(1− α) vom Intervall [p1, p2] uberdeckt
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 10/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur p einer B(n, p)
I Beispiel: Es wurden n = 200 Personen befragt, von denenk = 78 mit ’ja’ geantwortet haben. α = 0.05, bzw. α = 0.01
I r = p = 78200 = 0.39
I
p1,2 = 0.39± 1.96
√(0.39)(0.61)
199= 0.39± 0.068
p1,2 = 0.39± 2.58
√(0.39)(0.61)
199= 0.39± 0.089
I
p1,2 = [0.322, 0.458] p1,2 = [0.301, 0.479]
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 11/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI in SPSSFile: SPSS-Konfidenzintervalle.sav;Konfidenzintervall fur Anteil der Haustierbesitzer (n = 166,α = 0.05)Deskriptive Statistiken → Explorative Datenanalyse
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 12/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 13/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei bekanntem σ2
I Die Normalverteilung ist eine reproduzierende Verteilung
I Seien X1,X2, . . . ,Xn voneinander unabhangig normalverteilteZufallsvariablen mit Erwartungswerten µ1, µ2, . . . , µn undVarianzen σ2
1, σ22, . . . , σ
2n. Dann ist die Zufallsvariable
Y = X1 + X2 + . . .+ Xn ebenfalls normalverteilt mitE [Y ] = µ1 + µ2 + . . .+ µn und σ2
Y = σ21 + σ2
2 + . . .+ σ2n
I Wie ist die Verteilung von Mittelwerten x einernormalverteilten Variable?
I X sei N(µ, σ2)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 14/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei bekanntem σ2
I Wir ziehen unabhangige Zufallsstichproben vom Umfang n.Die Mittelwerte x aller Zufallsstichproben erzeugen eineVariable X = 1
n (X1 + X2 + . . .+ Xn)
I X ist abgesehen von der multiplikativen Konstante 1n eine
Summe normalverteilter Variablen, und es gilt
X ∼ N(µ,σ2
n)
I Wenn X normalverteilt ist, hat X wiederum Normalverteilungmit dem selben Erwartungswert, aber wesentlich kleinererVarianz σ2
n
I Die Mittelwerte aus Stichproben vom Umfang n gruppierensich also enger zusammen als die Messwerte
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 15/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei bekanntem σ2
I Wir verwenden die Verteilung von X um ein KI fur µaufzustellen
I Standardisieren der normalverteilten Variable X
Z =X − µ
σ√n
I Es gilt fur (1− α)% aller Stichproben mit Umfang n
|x − µ| ≤ z1−α2
σ√n
I
µ1,2 = x ± z1−α2
σ√n
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 16/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei bekanntem σ2
I Die Breite des KI hangt von 3 Faktoren ab: von der Streuungder Variable X bzw. σ, von n, und von derIrrtumswahrscheinlichkeit α
I Je kleiner σ, desto enger das KI
I Je großer die Stichprobe, desto enger das KI
I Je kleiner α, desto breiter das KI
I Beispiel: Eine Stichprobe von n = 234 14-jahrigenSchulerInnen wurde mit einem Intelligenztest, der fur 14-18jahrige Jugendliche normiert wurde, getestet. Der Mittelwertder 14-Jahrigen ist x = 98.10. In der Gesamtpopulation allerJugendlichen wurde der Test so geeicht, dass die Messwertenormalverteilt mit µ = 100 und σ = 15 sind.
I In welchem Bereich liegt der Erwartungswert der 14-Jahrigen,µ14 (α = 0.05)?
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 17/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei bekanntem σ2
I
µ1,2 = 98.10± 1.9615√234
= 98.10± 1.92
I µ14 wird mit einer Vertrauenswahrscheinlichkeit von 0.95 vomKI [96.18, 100.02] uberdeckt
I Berechnung des KI beruht auf der Voraussetzung, dass σ2
bekannt und gultig auch fur die Teilpopulation der14-Jahrigen ist
I Es kommt selten vor, dass σ2 bekannt ist
I Typischer ist der Fall unbekannter Varianz
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 18/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei unbekanntem σ2
I Unbekannte Varianz σ2 wird aus den vorliegenden Datengeschatzt
σ2 =1
n − 1
n∑i=1
(xi − x)2
I Anstelle der Verteilung
Z =X − µ
σ√n
∼ N(0, 1)
I wird folgender Ausdruck als Grundlage fur das KI verwendet
T =X − µ
σ√n
∼ t(n−1)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 19/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei unbekanntem σ2
I Das KI fur µ ergibt sich aus∣∣X − µ∣∣σ√n
≤ t1−α2, df = n − 1
I Mit Irrtumswahrscheinlichkeit α gilt
|x − µ| ≤ t1−α2
σ√n, df = n − 1
I Und schließlich das KI
µ1,2 = x ± t1−α2
σ√n, df = n − 1
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 20/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei unbekanntem σ2
I Beispiel: Der Subtest ’Rechenaufgaben’ eines Intelligenztestswird einer Zufallsstichprobe von n = 87 15-jahrigen WienerHauptschulabsolventInnen vorgegeben, wobei x = 25.48 unds = 6.12. Gesucht ist das Konfidenzintervall fur denErwartungswert µ der Population der WienerHauptschulabsolventInnen (α = 0.05 bzw. 0.01)
I
µ1,2 = 25.48± t1−α2
6.12√87, df = 86
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 21/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei unbekanntem σ2
I Tabelle enthalt keine Eintragung fur df = 86, abernachstgelegene Wert ist df = 60; t0.975 = 2.00 bzw.t0.995 = 2.66
µ1,2 = 25.48± (2.00)6.12√
87, µ1,2 = 25.48± (2.66)
6.12√87
I µ liegt mit einer Irrtumswahrscheinlichkeit α = 0.05 bzw. 0.01im Intervall [24.17, 26.79] bzw. [23.74, 27.23]
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 22/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Naherungsweises KI fur µ einer Variable mit unbekannterVerteilung
I Normalverteilung der betrachteten Variable X war Grundlagefur alle dargestellten KI
I Was tun, wenn die Normalverteilungsannahme nichtgerechtfertigt erscheint?
I KI bleiben naherungsweise gultig wegen ZentralemGrenzwertsatz
I Gute der Naherung hangt von der Verteilung von X und demStichprobenumfang n ab
I Bei kleinem n sollte sich die Verteilung von X nicht allzusehrvon einer Normalverteilung entfernen
I Großes n kann praktisch jede Abweichung von derNormalverteilung kompensieren
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 23/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur σ2 einer N(µ, σ2)
I Ebenso wichtig wie die Verteilung von X ist auch jene von S2,wobei S2 jene Variable bezeichnet, die durch wiederholtesZiehen von Zufallsstichproben vom Umfang n und Berechnungvon s2 in dieser Stichprobe entsteht
I Um σ2 zu schatzen, verwenden wir
S2 =1
n − 1
n∑i=1
(xi − x)2 = σ2 1
n − 1
n∑i=1
(xi − x
σ
)2
︸ ︷︷ ︸∼χ2
(n−1)
I
S2 =σ2
n − 1χ2
(n−1) oderχ2
(n−1)
n − 1=
S2
σ2
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 24/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur σ2 einer N(µ, σ2)
I Grundlage fur Aufstellung eines KI fur σ2
I
(n − 1)S2
χ2(n−1)
= σ2
I KI mit Irrtumswahrscheinlichkeit α und Freiheitsgradendf = n − 1
(n − 1)s2
χ2α2
≥ σ2 ≥ (n − 1)s2
χ21−α
2
I Beispiel: Angenommen, s = 14.7 fur eine normalverteilteVariable in einer Stichprobe von (n = 234) Personen: inwelchem Bereich vermuten wir σ2 fur die entsprechendePopulation (α = 0.05)?
I Tabelle enthalt fur df = 233 keine Eintragungen ⇒asymptotische Entwicklung
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 25/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur σ2 einer N(µ, σ2)
I Bei df →∞ strebt χ2 gegen die Normalverteilung N(df , 2df )
I
z0.975 = 1.96 =χ2
0.975 − 233√466
χ20.975 = 233 + 1.96
√466 = 275.3
z0.025 = −1.96 =χ2
0.025 − 233√466
χ20.025 = 233− 1.96
√466 = 190.7
I KI fur die Varianz
23314.72
275.3≤ σ2 ≤ 233
14.72
190.7⇒ 182.89 ≤ σ2 ≤ 264.02
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 26/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur σ2 einer N(µ, σ2)
I Beispiel: Wie vorhin, aber mit einer Stichprobe vom Umfangn = 24
I Aus Tabelle fur df = 23
χ20.975 = 38.08 χ2
0.025 = 11.69
I KI fur σ2
2314.72
38.08≤ σ2 ≤ 23
14.72
11.69⇒ 130.52 ≤ σ2 ≤ 425.16
I Wir sehen, dass die kleine Stichprobe zu einerunzuverlassigeren Schatzung (breiteres KI) der Varianz fuhrt
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 27/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
AllgemeinesI Ein statistischer Test ist ein Entscheidungsverfahren, das nach
Sammlung von empirischer Information (Daten) eineEntscheidung uber a priori formulierte Vermutungen(Hypothesen) trifft
I Der statistische Test basiert auf der Formulierung zweierkomplementarer Hypothesen (Null- und Alternativ) bezuglicheines unbekannten Parameters bzw. der Verteilungsform derGrundgesamtheit, auf welche man durch eine Stichprobeschließen mochte
I Ziel: Fur eine der zwei Hypothesen entscheiden mit moglichstkleinem Risiko
I Da die vorhandenen Daten Realisationen von Zufallsvariablensind, lasst sich niemals mit Sicherheit sagen, ob eineHypothese stimmt oder nicht. Man versucht daher, dieWahrscheinlichkeiten fur Fehlentscheidungen zu kontrollieren
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 28/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Grundlagen
I Hypothese: eine anhand empirischer Daten zu prufendeAnnahme. Wir unterscheiden als Gegensatzpaar zwischen derNullhypothese, H0, und der Alternativhypothese, H1
I Die H0 formuliert eine a priori Vermutung uber die Verteilungeiner Zufallsvariable oder den Wert θ0 eines Parameters θ. H0:θ = θ0. Die H0 beinhaltet diejenige Aussage, welche falsifiziertwerden soll
I Die H0 ist fur die Entscheidung von zentraler Bedeutung: sielegt die Annahmen fur die Formulierung einesWahrscheinlichkeitsmodells fest; bei Gultigkeit der H0 ist dieVerteilung der Prufgroße bekannt
I Zu jeder H0 wird eine H1 formuliert, z.B. H1: θ > θ0, oderH1: θ < θ0, oder H1: θ 6= θ0. Die H1 enthalt die Aussage, dieman aufzeigen mochte
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 29/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Grundlagen
I Ein statistisches Testverfahren lasst sich im Prinzip mit einemGerichtsverfahren vergleichen. Es wird immer von derUnschuld eines Verdachtigen ausgegangen. Nur, wenn dieIndizien fur die Schuld eines Angeklagten deutlich uberwiegen,kommt es zu einer Verurteilung
I Es gibt zu Beginn des Verfahrens die beiden Hypothesen H0:’der Verdachtige ist unschuldig’, und H1: ’der Verdachtige istschuldig’
I Um einen Unschuldigen nicht zu schnell zu verurteilen, wirddie Hypothese der Unschuld erst dann verworfen, wenn einIrrtum sehr unwahrscheinlich ist
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 30/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Grundlagen
I Wir definieren zwei Wahrscheinlichkeiten: DieWahrscheinlichkeit fur einen Fehler erster Art (das Verurteilendes Unschuldigen) und die Wahrscheinlichkeit fur einen Fehlerzweiter Art (das Freisprechen des Schuldigen)
I
P(Fehler erster Art) = α = P(H0 verwerfen|H0 wahr)
P(Fehler zweiter Art) = β = P(H0 beibehalten|H0 falsch)
I Wir berechnen die Wahrscheinlichkeit fur die empirischerhobenen Daten unter der Annahme, dass H0 gilt
I Ist das empirische Ergebnis bei Gultigkeit der H0 sehrunwahrscheinlich, nehmen wir an, dass H0 nicht wahr ist undverwerfen die H0
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 31/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Beispiel: Binomialtest
I Ein statistischer Test zur Uberprufung von hellseherischenFahigkeiten.
I Wir zeigen einer Person 25 Mal die Ruckseite einer reinzufallig gewahlten Spielkarte und fragen sie jeweils danach, zuwelcher der vier Farben (Kreuz, Pik, Herz, Karo) die Kartegehort. Unsere ZV X erfasst die Anzahl der Treffer
I H0 besagt, die Person sei nicht hellseherisch begabt; die H1
besagt, die Person hat hellseherische Fahigkeiten;
I Formal:
H0 : p =1
4, und H1 : p >
1
4
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 32/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
PrinzipI Unter Annahme der Gultigkeit der H0 ist X ∼ B(25, 1
4)I Wenn die Person alle 25 Karten richtig benennt, werden wir
sie als Hellseher betrachten, und die H0 verwerfen, mit 24oder 23 Treffern vermutlich auch
I Wo liegt aber die kritische Anzahl an Treffern k, von der anwir nicht mehr glauben konnen, es seien reine Zufallstreffer?
I In der Praxis kommt es darauf an, wie oft man eineFehlentscheidung erster Art zulassen will
I Mit k = 24 ist die Wahrscheinlichkeit einer solchenFehlentscheidung P(H0 verwerfen | H0 wahr)
P(X ≥ 24) = P(X = 24) + P(X = 25) = (0.675)(10−13)
I Mit k = 10 erhalten wir eine etwas großere Wahrscheinlichkeit
P(X ≥ 10) = 0.07
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 33/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Prinzip
I Wir brauchen eine Entscheidungsregel
I In der Praxis wird die obere Grenze fur die Wahrscheinlichkeiteiner Fehlentscheidung erster Art a priori festgesetzt(Signifikanzniveau). Typische Werte sind 0.01 und 0.05
I Beispiel Binomialtest: Kann man von hellseherischenFahigkeiten einer Person ausgehen (α = 0.01)?
I Angenommen, die Person erzielt 18 Treffer.
I H0: p = 14 , H1: p > 1
4 . Unsere Zufallsvariable X hat unterAnnahme, die H0 sei wahr, eine B(25, 1
4)
I Dieses Hypothesenpaar teilt unter Annahme der Gultigkeit vonH0 und dem Signifikanzniveau α alle Realisationen(Stichproben) von X in zwei Bereiche: den Annahmebereichund den Verwerfungsbereich der H0 in Relation zur H1
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 34/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Prinzip
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 35/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Prinzip
I Wie wahrscheinlich ist es, tatsachlich dieses (oder ein nochextremeres Ergebnis) unter der Annahme, die H0 sei wahr, zubeobachten?
I Die Teststatistik errechnet sich aus der vorhandenenStichprobe und H0. Mithilfe der Teststatistik wird eineEntscheidungsregel fur oder gegen die H0 erstellt
P(X ≥ 18) =25∑
x=18
(25
x
)(1
4
)x (3
4
)(25−x)
P(X ≥ 18) = 0.000001 ≤ α = 0.01
I Unter H0 ist die Wahrscheinlichkeit, dieses Ergebnis (oder einnoch extremeres) zu bekommen, kleiner als das von unsangenommene Risiko fur einen Fehler erster Art, d.h. bei derVerwerfung der H0 eine falsche Entscheidung zu treffen
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 36/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Prinzip
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 37/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Prinzip
I Entscheidungsregel: Liegt die Teststatistik imVerwerfungsbereich, wird die H0 verworfen. Liegt dieTeststatistik im Annahmebereich, wird die H0 beibehalten(’Freispruch aus Mangel an Beweisen’).
I Aufgrund der Entscheidungsregel wird die H0: p = 14
zugunsten der H1: p > 14 mit einem Irrtumsrisiko von
0.000001 verworfen. Das Ergebnis ist signifikant
I Auch wenn es wunschenswert ist, dass der Test aufgrund dervorliegenden Daten ’richtig’ entscheidet, besteht dieMoglichkeit von Fehlentscheidungen. Bei richtiger H0 undEntscheidung fur H1 (Fehler erster Art oder α-Fehler), bzw.bei falscher H0 und Entscheidung fur die H0 (Fehler zweiterArt oder β-Fehler)
I ’Entscheiden’ ist immer an ein Risiko fur Fehler gebunden
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 38/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Vorgangsweise
I Formulierung eines Hypothesenpaares, H0 bzw. H1, undAuswahl eines Signifikanzniveaus α vor Realisation derStichprobe
I Bestimmung der Verteilung der Teststatistik unter Gultigkeitder H0
I Verwerfungsbereich beinhaltet die α% extremsten Falle dieserVerteilung zugunsten der H1
I Berechnung der Teststatistik bei der vorhandenen Stichprobe.Liegt das Ergebnis im Verwerfungsbereich, so wird die H0
verworfen, andernfalls wird die H0 beibehalten
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 39/39
Konfidenzintervalle und Statistische Tests
Einfuhrung in Quantitative Methoden
Karin Waldherr & Pantelis Christodoulides
25. Mai 2011
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 1/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Allgemeines
I Wir interessieren uns fur einen unbekannten wahren Parameterθ, der die Verteilung einer Zufallsvariable charakterisiert
I θ wird durch eine Schatzfunktion Θ aus einer(reprasentativen) Stichprobe mit Umfang n geschatzt
I Es wird davon ausgegangen, dass die Stichprobe in etwa dieGrundgesamtheit widerspiegelt, und dass deshalb dieSchatzung in der Nahe des wahren Parameters liegen musste
I Die Schatzfunktion ist selbst eine Zufallsvariable mit einerVerteilung, die den Parameter θ enthalt
I Bei der Schatzung von Parametern geht es nicht nur darum,Schatzfunktionen zu finden und deren Eigenschaften(Erwartungstreue, Konsistenz, etc.) abzuklaren
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 2/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
AllgemeinesI Man mochte auch Intervalle angeben, in welchen θ mit einer
gewissen Sicherheit liegtI Es sei α eine vorgegebene Irrtumswahrscheinlichkeit, und a
bzw. b reelle Zahlen, mit a ≤ b. Die Schatzung des Bereichesa ≤ θ ≤ b mit der Vertrauenswahrscheinlichkeit (1− α)nennen wir Konfidenzintervall des Parameters θ mitIrrtumswahrscheinlichkeit α
I Θ Punktschatzung von θ, im Vergleich zur IntervallschatzungI Wir konstruieren ein symmetrisches Konfidenzintervall auf
Grundlage einer Schatzfunktion ΘI Von besonderem Interesse ist die Breite des
Konfidenzintervalls. Diese bestimmt sich durch dieStandardabweichung von Θ
I Erwunscht ist in der Regel ein moglichst schmalesKonfidenzintervall, denn dies weist auf eine genaue Schatzunghin
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 3/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Uberblick
I Konfidenzintervall fur den Parameter p einer B(n, p) Variable
I Konfidenzintervall fur den Erwartungswert µ einer N(µ, σ2)Variable bei bekannter Varianz σ2
I Konfidenzintervall fur den Erwartungswert µ einer N(µ, σ2)Variable bei unbekannter Varianz σ2
I Naherungsweises Konfidenzintervall fur den Erwartungswert µeiner Variable mit unbekannter Verteilung
I Konfidenzintervall fur die Varianz σ2 einer N(µ, σ2) Variable
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 4/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur p einer B(n, p)
I Befragung einer Zufallsstichprobe von n Personen aus einerunendlichen Population zu einem Thema mitAntwortkategorien ja/nein
I k ist die Anzahl der ’ja’ Antworten in der Stichprobe
I r = kn die entsprechende relative Haufigkeit
I p = P (’ja’) ist der wahre (unbekannte) Anteil derJa-Stimmen in der Population
I r ist ein erwartungstreuer Schatzer fur p
I K ist jene Zufallsvariable, die durch wiederholte Ziehungunabhangiger Stichproben vom Umfang n aus der unendlichenPopulation entsteht, R ist die entsprechende Zufallsvariableder relativen Haufigkeiten
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 5/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur p einer B(n, p)
I K ∼ B(n, p)
I Wenn np ≥ 5 und n(1− p) ≥ 5 darf die Binomialverteilungnaherungsweise durch die N(np, np(1− p)) ersetzt werden
I K ∼a N(np, np(1− p)) und auch
I R ∼a N(npn ,
np(1−p)n2 ) = N(p, p(1−p)
n )
I Um die Tabelle der N(0, 1) fur die Bestimmung derEndpunkte des Konfidenzintervalls anwenden zu konnen,standardisieren wir R
I
Z =R − E (R)
σR=
R − p√p(1−p)
n
∼ N(0, 1)
I Sei α = 0.05
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 6/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur p einer B(n, p)
Tabelle 1b: P(−1.96 ≤ Z ≤ 1.96) = 0.95
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 7/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur p einer B(n, p)
I Fur 95% aller Stichproben mit Umfang n gilt
|Z | =|R − p|√
p(1−p)n
≤ 1.96
I Wir ersetzen σR durch einen Schatzer σR
σR =
√p(1− p)
n, σR =
√r(1− r)
n − 1
I Also gilt fur 95% aller Stichproben mit Umfang n
|R − p| ≤ 1.96
√r(1− r)
n − 1
I Grundlage fur ein KI mit einer Irrtumswahrscheinlichkeitα = 0.05
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 8/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur p einer B(n, p)
I Die Grenzen des KI mit Irrtumswahrscheinlichkeit α = 0.05werden wie folgt bestimmt
p1,2 = r ± 1.96
√r(1− r)
n − 1
I Allgemeiner fur beliebige Irrtumswahrscheinlichkeit α
p1,2 = r ± z1−α2
√r(1− r)
n − 1
I KI ist symmetrisch um den Punkt r , symmetrisches KI
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 9/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur p einer B(n, p)
I Bei gegebenem p hangt die Breite des KI von zwei Faktorenab: der gewunschten Sicherheit und dem Stichprobenumfang
I Je hoher die Sicherheit, desto kleiner dieIrrtumswahrscheinlichkeit α, desto großer wird z1−α
2, und
desto breiter das Intervall
I Je großer die Stichprobe, desto kleiner wird σR und dessenSchatzung σR , und desto schmaler das Intervall
I Interpretation des KI: Werden immer wieder unabhangigeStichproben vom Umfang n gezogen, und wird fur jede dieserStichproben p = r gerechnet, so liegt p in (1− α) Prozentdieser Stichproben innerhalb des Intervalles [p1, p2]. DerParameter p wird mit einer Vertrauenswahrscheinlichkeit von(1− α) vom Intervall [p1, p2] uberdeckt
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 10/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur p einer B(n, p)
I Beispiel: Es wurden n = 200 Personen befragt, von denenk = 78 mit ’ja’ geantwortet haben. α = 0.05, bzw. α = 0.01
I r = p = 78200 = 0.39
I
p1,2 = 0.39± 1.96
√(0.39)(0.61)
199= 0.39± 0.068
p1,2 = 0.39± 2.58
√(0.39)(0.61)
199= 0.39± 0.089
I
p1,2 = [0.322, 0.458] p1,2 = [0.301, 0.479]
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 11/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI in SPSSFile: SPSS-Konfidenzintervalle.sav;Konfidenzintervall fur Anteil der Haustierbesitzer (n = 166,α = 0.05)Deskriptive Statistiken → Explorative Datenanalyse
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 12/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 13/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei bekanntem σ2
I Die Normalverteilung ist eine reproduzierende Verteilung
I Seien X1,X2, . . . ,Xn voneinander unabhangig normalverteilteZufallsvariablen mit Erwartungswerten µ1, µ2, . . . , µn undVarianzen σ2
1, σ22, . . . , σ
2n. Dann ist die Zufallsvariable
Y = X1 + X2 + . . .+ Xn ebenfalls normalverteilt mitE [Y ] = µ1 + µ2 + . . .+ µn und σ2
Y = σ21 + σ2
2 + . . .+ σ2n
I Wie ist die Verteilung von Mittelwerten x einernormalverteilten Variable?
I X sei N(µ, σ2)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 14/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei bekanntem σ2
I Wir ziehen unabhangige Zufallsstichproben vom Umfang n.Die Mittelwerte x aller Zufallsstichproben erzeugen eineVariable X = 1
n (X1 + X2 + . . .+ Xn)
I X ist abgesehen von der multiplikativen Konstante 1n eine
Summe normalverteilter Variablen, und es gilt
X ∼ N(µ,σ2
n)
I Wenn X normalverteilt ist, hat X wiederum Normalverteilungmit dem selben Erwartungswert, aber wesentlich kleinererVarianz σ2
n
I Die Mittelwerte aus Stichproben vom Umfang n gruppierensich also enger zusammen als die Messwerte
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 15/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei bekanntem σ2
I Wir verwenden die Verteilung von X um ein KI fur µaufzustellen
I Standardisieren der normalverteilten Variable X
Z =X − µ
σ√n
I Es gilt fur (1− α)% aller Stichproben mit Umfang n
|x − µ| ≤ z1−α2
σ√n
I
µ1,2 = x ± z1−α2
σ√n
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 16/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei bekanntem σ2
I Die Breite des KI hangt von 3 Faktoren ab: von der Streuungder Variable X bzw. σ, von n, und von derIrrtumswahrscheinlichkeit α
I Je kleiner σ, desto enger das KI
I Je großer die Stichprobe, desto enger das KI
I Je kleiner α, desto breiter das KI
I Beispiel: Eine Stichprobe von n = 234 14-jahrigenSchulerInnen wurde mit einem Intelligenztest, der fur 14-18jahrige Jugendliche normiert wurde, getestet. Der Mittelwertder 14-Jahrigen ist x = 98.10. In der Gesamtpopulation allerJugendlichen wurde der Test so geeicht, dass die Messwertenormalverteilt mit µ = 100 und σ = 15 sind.
I In welchem Bereich liegt der Erwartungswert der 14-Jahrigen,µ14 (α = 0.05)?
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 17/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei bekanntem σ2
I
µ1,2 = 98.10± 1.9615√234
= 98.10± 1.92
I µ14 wird mit einer Vertrauenswahrscheinlichkeit von 0.95 vomKI [96.18, 100.02] uberdeckt
I Berechnung des KI beruht auf der Voraussetzung, dass σ2
bekannt und gultig auch fur die Teilpopulation der14-Jahrigen ist
I Es kommt selten vor, dass σ2 bekannt ist
I Typischer ist der Fall unbekannter Varianz
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 18/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei unbekanntem σ2
I Unbekannte Varianz σ2 wird aus den vorliegenden Datengeschatzt
σ2 =1
n − 1
n∑i=1
(xi − x)2
I Anstelle der Verteilung
Z =X − µ
σ√n
∼ N(0, 1)
I wird folgender Ausdruck als Grundlage fur das KI verwendet
T =X − µ
σ√n
∼ t(n−1)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 19/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei unbekanntem σ2
I Das KI fur µ ergibt sich aus∣∣X − µ∣∣σ√n
≤ t1−α2, df = n − 1
I Mit Irrtumswahrscheinlichkeit α gilt
|x − µ| ≤ t1−α2
σ√n, df = n − 1
I Und schließlich das KI
µ1,2 = x ± t1−α2
σ√n, df = n − 1
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 20/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei unbekanntem σ2
I Beispiel: Der Subtest ’Rechenaufgaben’ eines Intelligenztestswird einer Zufallsstichprobe von n = 87 15-jahrigen WienerHauptschulabsolventInnen vorgegeben, wobei x = 25.48 unds = 6.12. Gesucht ist das Konfidenzintervall fur denErwartungswert µ der Population der WienerHauptschulabsolventInnen (α = 0.05 bzw. 0.01)
I
µ1,2 = 25.48± t1−α2
6.12√87, df = 86
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 21/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur µ einer N(µ, σ2) bei unbekanntem σ2
I Tabelle enthalt keine Eintragung fur df = 86, abernachstgelegene Wert ist df = 60; t0.975 = 2.00 bzw.t0.995 = 2.66
µ1,2 = 25.48± (2.00)6.12√
87, µ1,2 = 25.48± (2.66)
6.12√87
I µ liegt mit einer Irrtumswahrscheinlichkeit α = 0.05 bzw. 0.01im Intervall [24.17, 26.79] bzw. [23.74, 27.23]
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 22/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Naherungsweises KI fur µ einer Variable mit unbekannterVerteilung
I Normalverteilung der betrachteten Variable X war Grundlagefur alle dargestellten KI
I Was tun, wenn die Normalverteilungsannahme nichtgerechtfertigt erscheint?
I KI bleiben naherungsweise gultig wegen ZentralemGrenzwertsatz
I Gute der Naherung hangt von der Verteilung von X und demStichprobenumfang n ab
I Bei kleinem n sollte sich die Verteilung von X nicht allzusehrvon einer Normalverteilung entfernen
I Großes n kann praktisch jede Abweichung von derNormalverteilung kompensieren
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 23/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur σ2 einer N(µ, σ2)
I Ebenso wichtig wie die Verteilung von X ist auch jene von S2,wobei S2 jene Variable bezeichnet, die durch wiederholtesZiehen von Zufallsstichproben vom Umfang n und Berechnungvon s2 in dieser Stichprobe entsteht
I Um σ2 zu schatzen, verwenden wir
S2 =1
n − 1
n∑i=1
(xi − x)2 = σ2 1
n − 1
n∑i=1
(xi − x
σ
)2
︸ ︷︷ ︸∼χ2
(n−1)
I
S2 =σ2
n − 1χ2
(n−1) oderχ2
(n−1)
n − 1=
S2
σ2
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 24/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur σ2 einer N(µ, σ2)
I Grundlage fur Aufstellung eines KI fur σ2
I
(n − 1)S2
χ2(n−1)
= σ2
I KI mit Irrtumswahrscheinlichkeit α und Freiheitsgradendf = n − 1
(n − 1)s2
χ2α2
≥ σ2 ≥ (n − 1)s2
χ21−α
2
I Beispiel: Angenommen, s = 14.7 fur eine normalverteilteVariable in einer Stichprobe von (n = 234) Personen: inwelchem Bereich vermuten wir σ2 fur die entsprechendePopulation (α = 0.05)?
I Tabelle enthalt fur df = 233 keine Eintragungen ⇒asymptotische Entwicklung
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 25/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur σ2 einer N(µ, σ2)
I Bei df →∞ strebt χ2 gegen die Normalverteilung N(df , 2df )
I
z0.975 = 1.96 =χ2
0.975 − 233√466
χ20.975 = 233 + 1.96
√466 = 275.3
z0.025 = −1.96 =χ2
0.025 − 233√466
χ20.025 = 233− 1.96
√466 = 190.7
I KI fur die Varianz
23314.72
275.3≤ σ2 ≤ 233
14.72
190.7⇒ 182.89 ≤ σ2 ≤ 264.02
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 26/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
KI fur σ2 einer N(µ, σ2)
I Beispiel: Wie vorhin, aber mit einer Stichprobe vom Umfangn = 24
I Aus Tabelle fur df = 23
χ20.975 = 38.08 χ2
0.025 = 11.69
I KI fur σ2
2314.72
38.08≤ σ2 ≤ 23
14.72
11.69⇒ 130.52 ≤ σ2 ≤ 425.16
I Wir sehen, dass die kleine Stichprobe zu einerunzuverlassigeren Schatzung (breiteres KI) der Varianz fuhrt
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 27/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
AllgemeinesI Ein statistischer Test ist ein Entscheidungsverfahren, das nach
Sammlung von empirischer Information (Daten) eineEntscheidung uber a priori formulierte Vermutungen(Hypothesen) trifft
I Der statistische Test basiert auf der Formulierung zweierkomplementarer Hypothesen (Null- und Alternativ) bezuglicheines unbekannten Parameters bzw. der Verteilungsform derGrundgesamtheit, auf welche man durch eine Stichprobeschließen mochte
I Ziel: Fur eine der zwei Hypothesen entscheiden mit moglichstkleinem Risiko
I Da die vorhandenen Daten Realisationen von Zufallsvariablensind, lasst sich niemals mit Sicherheit sagen, ob eineHypothese stimmt oder nicht. Man versucht daher, dieWahrscheinlichkeiten fur Fehlentscheidungen zu kontrollieren
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 28/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Grundlagen
I Hypothese: eine anhand empirischer Daten zu prufendeAnnahme. Wir unterscheiden als Gegensatzpaar zwischen derNullhypothese, H0, und der Alternativhypothese, H1
I Die H0 formuliert eine a priori Vermutung uber die Verteilungeiner Zufallsvariable oder den Wert θ0 eines Parameters θ. H0:θ = θ0. Die H0 beinhaltet diejenige Aussage, welche falsifiziertwerden soll
I Die H0 ist fur die Entscheidung von zentraler Bedeutung: sielegt die Annahmen fur die Formulierung einesWahrscheinlichkeitsmodells fest; bei Gultigkeit der H0 ist dieVerteilung der Prufgroße bekannt
I Zu jeder H0 wird eine H1 formuliert, z.B. H1: θ > θ0, oderH1: θ < θ0, oder H1: θ 6= θ0. Die H1 enthalt die Aussage, dieman aufzeigen mochte
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 29/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Grundlagen
I Ein statistisches Testverfahren lasst sich im Prinzip mit einemGerichtsverfahren vergleichen. Es wird immer von derUnschuld eines Verdachtigen ausgegangen. Nur, wenn dieIndizien fur die Schuld eines Angeklagten deutlich uberwiegen,kommt es zu einer Verurteilung
I Es gibt zu Beginn des Verfahrens die beiden Hypothesen H0:’der Verdachtige ist unschuldig’, und H1: ’der Verdachtige istschuldig’
I Um einen Unschuldigen nicht zu schnell zu verurteilen, wirddie Hypothese der Unschuld erst dann verworfen, wenn einIrrtum sehr unwahrscheinlich ist
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 30/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Grundlagen
I Wir definieren zwei Wahrscheinlichkeiten: DieWahrscheinlichkeit fur einen Fehler erster Art (das Verurteilendes Unschuldigen) und die Wahrscheinlichkeit fur einen Fehlerzweiter Art (das Freisprechen des Schuldigen)
I
P(Fehler erster Art) = α = P(H0 verwerfen|H0 wahr)
P(Fehler zweiter Art) = β = P(H0 beibehalten|H0 falsch)
I Wir berechnen die Wahrscheinlichkeit fur die empirischerhobenen Daten unter der Annahme, dass H0 gilt
I Ist das empirische Ergebnis bei Gultigkeit der H0 sehrunwahrscheinlich, nehmen wir an, dass H0 nicht wahr ist undverwerfen die H0
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 31/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Beispiel: Binomialtest
I Ein statistischer Test zur Uberprufung von hellseherischenFahigkeiten.
I Wir zeigen einer Person 25 Mal die Ruckseite einer reinzufallig gewahlten Spielkarte und fragen sie jeweils danach, zuwelcher der vier Farben (Kreuz, Pik, Herz, Karo) die Kartegehort. Unsere ZV X erfasst die Anzahl der Treffer
I H0 besagt, die Person sei nicht hellseherisch begabt; die H1
besagt, die Person hat hellseherische Fahigkeiten;
I Formal:
H0 : p =1
4, und H1 : p >
1
4
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 32/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
PrinzipI Unter Annahme der Gultigkeit der H0 ist X ∼ B(25, 1
4)I Wenn die Person alle 25 Karten richtig benennt, werden wir
sie als Hellseher betrachten, und die H0 verwerfen, mit 24oder 23 Treffern vermutlich auch
I Wo liegt aber die kritische Anzahl an Treffern k, von der anwir nicht mehr glauben konnen, es seien reine Zufallstreffer?
I In der Praxis kommt es darauf an, wie oft man eineFehlentscheidung erster Art zulassen will
I Mit k = 24 ist die Wahrscheinlichkeit einer solchenFehlentscheidung P(H0 verwerfen | H0 wahr)
P(X ≥ 24) = P(X = 24) + P(X = 25) = (0.675)(10−13)
I Mit k = 10 erhalten wir eine etwas großere Wahrscheinlichkeit
P(X ≥ 10) = 0.07
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 33/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Prinzip
I Wir brauchen eine Entscheidungsregel
I In der Praxis wird die obere Grenze fur die Wahrscheinlichkeiteiner Fehlentscheidung erster Art a priori festgesetzt(Signifikanzniveau). Typische Werte sind 0.01 und 0.05
I Beispiel Binomialtest: Kann man von hellseherischenFahigkeiten einer Person ausgehen (α = 0.01)?
I Angenommen, die Person erzielt 18 Treffer.
I H0: p = 14 , H1: p > 1
4 . Unsere Zufallsvariable X hat unterAnnahme, die H0 sei wahr, eine B(25, 1
4)
I Dieses Hypothesenpaar teilt unter Annahme der Gultigkeit vonH0 und dem Signifikanzniveau α alle Realisationen(Stichproben) von X in zwei Bereiche: den Annahmebereichund den Verwerfungsbereich der H0 in Relation zur H1
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 34/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Prinzip
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 35/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Prinzip
I Wie wahrscheinlich ist es, tatsachlich dieses (oder ein nochextremeres Ergebnis) unter der Annahme, die H0 sei wahr, zubeobachten?
I Die Teststatistik errechnet sich aus der vorhandenenStichprobe und H0. Mithilfe der Teststatistik wird eineEntscheidungsregel fur oder gegen die H0 erstellt
P(X ≥ 18) =25∑
x=18
(25
x
)(1
4
)x (3
4
)(25−x)
P(X ≥ 18) = 0.000001 ≤ α = 0.01
I Unter H0 ist die Wahrscheinlichkeit, dieses Ergebnis (oder einnoch extremeres) zu bekommen, kleiner als das von unsangenommene Risiko fur einen Fehler erster Art, d.h. bei derVerwerfung der H0 eine falsche Entscheidung zu treffen
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 36/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Prinzip
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 37/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Prinzip
I Entscheidungsregel: Liegt die Teststatistik imVerwerfungsbereich, wird die H0 verworfen. Liegt dieTeststatistik im Annahmebereich, wird die H0 beibehalten(’Freispruch aus Mangel an Beweisen’).
I Aufgrund der Entscheidungsregel wird die H0: p = 14
zugunsten der H1: p > 14 mit einem Irrtumsrisiko von
0.000001 verworfen. Das Ergebnis ist signifikant
I Auch wenn es wunschenswert ist, dass der Test aufgrund dervorliegenden Daten ’richtig’ entscheidet, besteht dieMoglichkeit von Fehlentscheidungen. Bei richtiger H0 undEntscheidung fur H1 (Fehler erster Art oder α-Fehler), bzw.bei falscher H0 und Entscheidung fur die H0 (Fehler zweiterArt oder β-Fehler)
I ’Entscheiden’ ist immer an ein Risiko fur Fehler gebunden
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 38/39
Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests
Vorgangsweise
I Formulierung eines Hypothesenpaares, H0 bzw. H1, undAuswahl eines Signifikanzniveaus α vor Realisation derStichprobe
I Bestimmung der Verteilung der Teststatistik unter Gultigkeitder H0
I Verwerfungsbereich beinhaltet die α% extremsten Falle dieserVerteilung zugunsten der H1
I Berechnung der Teststatistik bei der vorhandenen Stichprobe.Liegt das Ergebnis im Verwerfungsbereich, so wird die H0
verworfen, andernfalls wird die H0 beibehalten
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 39/39
Statistische Tests II
Einfuhrung in Quantitative Methoden
Pantelis Christodoulides & Karin Waldherr
1. Juni 2011
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 1/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Ein- und Zweiseitige Hypothesen
I H0: p = 14 gegenuber
I Einseitige (= gerichtete) HypotheseH1 : p > 1
4 oder H ′1 : p < 1
4
I versus
I Zweiseitige Hypothese H ′′1 : p 6= 1
4
I Beim einseitigen Testen ist die Kontrolle des α-Fehlers nur ineine Richtung notwendig, beim zweiseitigen Testen ist dieseKontrolle in beide Richtungen erforderlich
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 2/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Zweiseitiges Testen α = 0.05
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 3/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Einseitiges vs. zweiseitiges Testen
I Die Wahl der Alternativhypothese muss a priori, d.h. ohneBerucksichtigung der aktuellen Daten aufgrund inhaltlicherKriterien erfolgen
I Insbesondere die Wahl einer der einseitigen Alternativen mussauf einer von den aktuellen Daten unabhangigenVorinformation beruhen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 4/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Beispiel: Binomialtest mit NV-Approximation
I Wenn Voraussetzungen fur NV-Approximation der BVgegeben; µ = np, σ2 = np(1− p)
I Standardnormalverteilte Teststatistik:
Z =K − µσ
=K − np0√np0(1− np0)
∼ N(0, 1)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 5/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
NV-Approximation der Binomialverteilung:Kontinuitatskorrektur
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 6/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Beispiel Einseitiges Testen
I Eine Psychologin vermutet, dass weniger als 50% der Frauen,die eine Diat machen, ubergewichtig sind.
I H0: p = 0.50; H1: p < 0.50; α = 0.05
I Verwerfungsbereich:
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 7/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
I In einer von ihr erhobenen Stichprobe von n = 200 Frauen, diederzeit Diat aus Figurgrunden halten, sind 87 ubergewichtig.
I µ = np = 100, k = 87
I
z =87.5− 100√
200 · 0.50 · 0.50= −1.77
Tab. 1b: P(Z ≤ −1.77) = 0.0384 < α = 0.05 ⇒ H0
verwerfen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 8/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Einseitiges Testen
I Verwerfung der H0 zugunsten der H1 mit einem Risiko fureinen Fehler erster Art von 0.0384
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 9/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Einseitiges Testen
Angenommen, die Psychologin hatte die folgenden Hypothesenformuliert:H0: p = 0.5; H1: p > 0.5Verwerfungsbereich:
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 10/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
z = −1.77 liegt nicht im Verwerfungsbereich
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 11/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Beispiel Zweiseitiges Testen
I Angenommen, die Psychologin hatte keine Vermutung in einebestimmte Richtung gehabt und die H1 ungerichtet formuliert:
I H0: p = 0.50; H1: p 6= 0.50; α = 0.05
I Kontrolle des α-Fehlers in beide Richtungen notwendig
I P(Z ≤ −1.77) + P(Z ≥ 1.77) = 0.0384 + 0.0384 = 0.0768 >α = 0.05; Ergebnis liegt noch im Annahmebereich der H0
I Oder aquivalent: nur eine Seite betrachten: α2 = 0.025
I 0.0384 > 0.025;
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 12/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Fortsetzung
Es konnen bei denselben Daten unterschiedliche Entscheidungenresultieren. Beim einseitigen Testen kommt man eher zu einerVerwerfung der H0
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 13/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Einseitiges vs. Zweiseitiges Testen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 14/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
p-WertI In Statistik-Softwareprodukten wird zusammen mit der
Teststatistik eines statistischen Tests ein sogenannter p-Wertausgegeben
I Der p-Wert gibt die Wahrscheinlichkeit fur den Fehler ersterArt an, also die Wahrscheinlichkeit, eine gultige H0 zuverwerfen aufgrund der beobachteten Daten
I Vorteil des p-Wertes liegt darin, dass bei der Entscheidungkeine Tabelle der Verteilung der Teststatistik benotigt wird
I Wird der zweiseitige p-Wert angegeben und die H1 istgerichtet, muss man den p-Wert durch 2 dividieren und mit αvergleichen.
I Bei einseitigen Hypothesen ist die zusatzliche Uberprufungnotwendig, ob die Teststatistik tatsachlich imVerwerfungsbereich der H0 liegt
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 15/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
p-WertI SPSS-Beispiel in Datei ’binom.sav’, α = 0.05, B(11, 0.5),
x = 9I H0: p = 0.5, H1: p 6= 0.5, ’Signifikanz’ (zweiseitig!) =
0.065 > α = 0.05 ⇒ H0 wird beibehalten
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 16/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
p-WertI H0: p = 0.5, H ′
1: p > 0.5, Signifikanz (zweiseitig!) = 0.065⇒, ’Signifikanz’ (einseitig!) = 0.065
2 = 0.0325 < α = 0.05 undTeststatistik liegt im Verwerfungsbereich ⇒ H0 wird verworfen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 17/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
p-WertI H0: p = 0.5, H ′′
1 : p < 0.5, Signifikanz (zweiseitig!) = 0.065⇒ ’Signifikanz’ (einseitig!) = 0.065
2 = 0.0325 < α = 0.05,aber Teststatistik liegt nicht im Verwerfungsbereich !!! ⇒ H0
wird beibehalten
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 18/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Unspezifische H0 bei einseitigem Testen
I Bisher spezifische H0: θ = θ0
I Bei H1: θ < θ0 korrekterweise H0: θ ≥ θ0 (unspezifische H0)
I Kann die H0: θ = θ0 mit einer Irrtumswahrscheinlichkeit αverworfen werden, so kann jede weitere H0: θ > θ0 mit einernoch kleineren Irrtumswahrscheinlichkeit verworfen werden
I Es genugt also, die H1: θ < θ0 an der spezifischen H0: θ = θ0zu testen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 19/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Fehler bei statistischen Tests
I α = 0.05 bedeutet: fuhrt man dasselbe Experiment haufigdurch, verwirft man in ca. 5% der Falle die H0 irrtumlich,obwohl sie tatsachlich gilt (Fehler 1. Art oder α-Fehler)
I Man versucht, Wahrscheinlichkeiten fur Fehlentscheidungenzu minimieren, kann sie aber niemals vollig ausschalten
I Statistische Fehler beziehen sich nicht auf unkorrekteVorgangsweise beim Hypothesentesten, sondern aufEntscheidungsfehler. Richtige Prozeduren fuhren zuFehlentscheidungen.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 20/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Fehler bei statistischen Tests
I β-Fehler (Fehler 2. Art) = Wahrscheinlichkeit H0
beizubehalten, obwohl sie falsch ist.
I Vergleiche Gerichtsverfahren: Freispruch aus Mangel anBeweisen (Beibehalten der H0: der Verdachtige istunschuldig) bedeutet nicht, dass er mit Sicherheit unschuldigist (β-Fehler). Die Beweise fur seine Schuld waren nichtausreichend
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 21/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Fehler bei Statistischen Tests
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 22/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Statistische Fehler
I Je kleiner α, umso kleiner der Fehler 1. Art (H0 irrtumlich zuverwerfen)
I → α moglichst klein wahlen, z.B. α = 0.001?
I Entscheiden fur Signifikanzniveau ist vergleichbar mit demAbschluss einer Versicherung. Umso besser derVersicherungsschutz gegen einen α-Fehler, umso hoher dieKosten.
I Was sind die Kosten eines kleinen Signifikanzniveaus?
I Großerer Fehler 2. Art (β-Fehler = H0 irrtumlichbeizubehalten) und geringere Teststarke 1− β (Macht oderPower = Wahrscheinlichkeit, H0 zugunsten einer H1 zuverwerfen, wenn tatsachlich H1 gilt)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 23/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Beziehungen zwischen Statistischen Fehlern - 1
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 24/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Beziehungen zwischen Statistischen Fehlern - 2
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 25/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Richtige und falsche Entscheidungen
Reale SituationH0 H1
Ergebnis d. verworfen Fehler 1. Art Richtige E.Hypothesen- H0 α Macht, 1− β
tests beibehalten Richtige E. Fehler 2. Art1− α β
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 26/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Dilemma
I Versicherung gegen α-Fehler hat die Kosten eines hoherenβ-Fehlers und geringerer Macht des Tests
I Versicherung gegen β-Fehler hat die Kosten eines hoherenα-Fehlers
I Kompromiss in der Praxis: α = 0.05 oder α = 0.01 jenachdem, welchen Fehler man eher riskieren mochte
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 27/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Macht eines Tests (Teststarke)
I 1− β ist die Wahrscheinlichkeit dafur, dass ein statistischerTest zugunsten einer H1 entscheidet, wenn diese gilt (d.h. dieH0 richtigerweise zu verwerfen)
I Die Teststarke hangt von verschiedenen Faktoren ab:I Signifikanzniveau αI Ein- oder zweiseitige Alternativhypothese (bei einseitiger H1
hoher)I Große des UnterschiedesI Streuung der Variable X in der PopulationI Stichprobenumfang nI Verwendeter statistischer Test: je hoher der verwendete
Informationsgehalt der Daten, umso hoher seine Macht
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 28/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Teststarke und Große der Unterschiede
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 29/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Teststarke und Populationsstreuung
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 30/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Teststarke und Stichprobenumfang
I Beispiel: Binomialtest mit NV-Approximation, Anteil derubergewichtigen Frauen
I Stichprobengroße n = 2000 Frauen (statt n = 200), gleicherAnteil wie vorher: 43.5% ubergewichtig = 870.
I µ = np = 1000, k = 870
I
z =870.5− 1000√
2000 · 0.50 · 0.50= −5.79
zum Vergleich z = −1.77 bei n = 200
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 31/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Statistische Signifikanz und praktische Relevanz
I Mit genugend großem Stichprobenumfang kann man praktischjede H0 verwerfen
I Festlegung einer Effektgroße ε (z.B. praktisch relevanterUnterschied) und einer spezifischen H1
I Muss aufgrund inhaltlicher Uberlegungen vor Datenerhebungfestgelegt werden
I Vorteil: notwendiger Stichprobenumfang, der bei gegebenemα, gewunschtem 1− β und bestimmter Effektgroße eineeindeutige Entscheidung ermoglicht, bestimmbar
I Tabellen bzw. Computerprogramme im Internet (z.B. GPowervon Erdfelder, Faul & Buchner, 1996).
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 32/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Kumulierung des α-Fehlers
I Fuhrt man mehrere statistische Tests durch, hat man beijedem dieser Tests das Risiko eines α-Fehlers
I Angenommen, jemand fuhrt drei statistische Tests durch umeine Hypothese zu prufen
I Selbst bei Annahme der Unabhangigkeit der einzelnen Testsware Wahrscheinlichkeit, dass mindestens 1 Test signifikantwird = 1 − (Wahrscheinlichkeit kein Test signifikant) =1− (1− 0.05)3 = 0.14
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 33/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Kumulierung des α-Fehlers
I Fuhrt man k unabhangige statistische Tests zur Uberprufungeiner H0 durch, kommt es zu einer Kumulierung des α-FehlerRisikos α′ = 1− (1− α)k
I Lasst es sich nicht vermeiden, mehrere statistische Tests zurPrufung einer Hypothese durchzufuhren, muss eine α-FehlerKorrektur vorgenommen werden
I α-Fehler Adjustierung: αadj = 1− (1− α)1/k
I 3 Tests: αadj = 1− (1− 0.05)1/3 = 0.017
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 34/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Darstellung des Ergebnisses
I Voraussetzung: Formulierung der H0 und H1, Angabe von α,Stichprobenbeschreibung
I Angabe des p-Wertes
I Angabe der Teststatistik (+ df wo notig)
I ev. Teststarke und Effektgroße
I Korrekte Formulierung bei nicht-signifikantem Ergebnis: ’H0
wird beibehalten’; Formulierung, ’H0 wurde bewiesen’, istfalsch
I Falsche Interpretationen:I ’Je kleiner der p-Wert, umso großer der Effekt.’ Der p-Wert ist
keine Effektgroße.I ’Der p-Wert gibt die Wahrscheinlichkeit fur das Zutreffen der
H0 an.’ Der p-Wert ist die P(beobachtetesErgebnis|H0).
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 35/35
Statistische Tests II
Einfuhrung in Quantitative Methoden
Pantelis Christodoulides & Karin Waldherr
1. Juni 2011
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 1/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Ein- und Zweiseitige Hypothesen
I H0: p = 14 gegenuber
I Einseitige (= gerichtete) HypotheseH1 : p > 1
4 oder H ′1 : p < 1
4
I versus
I Zweiseitige Hypothese H ′′1 : p 6= 1
4
I Beim einseitigen Testen ist die Kontrolle des α-Fehlers nur ineine Richtung notwendig, beim zweiseitigen Testen ist dieseKontrolle in beide Richtungen erforderlich
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 2/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Zweiseitiges Testen α = 0.05
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 3/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Einseitiges vs. zweiseitiges Testen
I Die Wahl der Alternativhypothese muss a priori, d.h. ohneBerucksichtigung der aktuellen Daten aufgrund inhaltlicherKriterien erfolgen
I Insbesondere die Wahl einer der einseitigen Alternativen mussauf einer von den aktuellen Daten unabhangigenVorinformation beruhen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 4/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Beispiel: Binomialtest mit NV-Approximation
I Wenn Voraussetzungen fur NV-Approximation der BVgegeben; µ = np, σ2 = np(1− p)
I Standardnormalverteilte Teststatistik:
Z =K − µσ
=K − np0√np0(1− np0)
∼ N(0, 1)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 5/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
NV-Approximation der Binomialverteilung:Kontinuitatskorrektur
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 6/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Beispiel Einseitiges Testen
I Eine Psychologin vermutet, dass weniger als 50% der Frauen,die eine Diat machen, ubergewichtig sind.
I H0: p = 0.50; H1: p < 0.50; α = 0.05
I Verwerfungsbereich:
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 7/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
I In einer von ihr erhobenen Stichprobe von n = 200 Frauen, diederzeit Diat aus Figurgrunden halten, sind 87 ubergewichtig.
I µ = np = 100, k = 87
I
z =87.5− 100√
200 · 0.50 · 0.50= −1.77
Tab. 1b: P(Z ≤ −1.77) = 0.0384 < α = 0.05 ⇒ H0
verwerfen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 8/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Einseitiges Testen
I Verwerfung der H0 zugunsten der H1 mit einem Risiko fureinen Fehler erster Art von 0.0384
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 9/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Einseitiges Testen
Angenommen, die Psychologin hatte die folgenden Hypothesenformuliert:H0: p = 0.5; H1: p > 0.5Verwerfungsbereich:
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 10/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
z = −1.77 liegt nicht im Verwerfungsbereich
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 11/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Beispiel Zweiseitiges Testen
I Angenommen, die Psychologin hatte keine Vermutung in einebestimmte Richtung gehabt und die H1 ungerichtet formuliert:
I H0: p = 0.50; H1: p 6= 0.50; α = 0.05
I Kontrolle des α-Fehlers in beide Richtungen notwendig
I P(Z ≤ −1.77) + P(Z ≥ 1.77) = 0.0384 + 0.0384 = 0.0768 >α = 0.05; Ergebnis liegt noch im Annahmebereich der H0
I Oder aquivalent: nur eine Seite betrachten: α2 = 0.025
I 0.0384 > 0.025;
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 12/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Fortsetzung
Es konnen bei denselben Daten unterschiedliche Entscheidungenresultieren. Beim einseitigen Testen kommt man eher zu einerVerwerfung der H0
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 13/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Einseitiges vs. Zweiseitiges Testen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 14/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
p-WertI In Statistik-Softwareprodukten wird zusammen mit der
Teststatistik eines statistischen Tests ein sogenannter p-Wertausgegeben
I Der p-Wert gibt die Wahrscheinlichkeit fur den Fehler ersterArt an, also die Wahrscheinlichkeit, eine gultige H0 zuverwerfen aufgrund der beobachteten Daten
I Vorteil des p-Wertes liegt darin, dass bei der Entscheidungkeine Tabelle der Verteilung der Teststatistik benotigt wird
I Wird der zweiseitige p-Wert angegeben und die H1 istgerichtet, muss man den p-Wert durch 2 dividieren und mit αvergleichen.
I Bei einseitigen Hypothesen ist die zusatzliche Uberprufungnotwendig, ob die Teststatistik tatsachlich imVerwerfungsbereich der H0 liegt
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 15/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
p-WertI SPSS-Beispiel in Datei ’binom.sav’, α = 0.05, B(11, 0.5),
x = 9I H0: p = 0.5, H1: p 6= 0.5, ’Signifikanz’ (zweiseitig!) =
0.065 > α = 0.05 ⇒ H0 wird beibehalten
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 16/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
p-WertI H0: p = 0.5, H ′
1: p > 0.5, Signifikanz (zweiseitig!) = 0.065⇒, ’Signifikanz’ (einseitig!) = 0.065
2 = 0.0325 < α = 0.05 undTeststatistik liegt im Verwerfungsbereich ⇒ H0 wird verworfen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 17/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
p-WertI H0: p = 0.5, H ′′
1 : p < 0.5, Signifikanz (zweiseitig!) = 0.065⇒ ’Signifikanz’ (einseitig!) = 0.065
2 = 0.0325 < α = 0.05,aber Teststatistik liegt nicht im Verwerfungsbereich !!! ⇒ H0
wird beibehalten
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 18/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Unspezifische H0 bei einseitigem Testen
I Bisher spezifische H0: θ = θ0
I Bei H1: θ < θ0 korrekterweise H0: θ ≥ θ0 (unspezifische H0)
I Kann die H0: θ = θ0 mit einer Irrtumswahrscheinlichkeit αverworfen werden, so kann jede weitere H0: θ > θ0 mit einernoch kleineren Irrtumswahrscheinlichkeit verworfen werden
I Es genugt also, die H1: θ < θ0 an der spezifischen H0: θ = θ0zu testen
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 19/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Fehler bei statistischen Tests
I α = 0.05 bedeutet: fuhrt man dasselbe Experiment haufigdurch, verwirft man in ca. 5% der Falle die H0 irrtumlich,obwohl sie tatsachlich gilt (Fehler 1. Art oder α-Fehler)
I Man versucht, Wahrscheinlichkeiten fur Fehlentscheidungenzu minimieren, kann sie aber niemals vollig ausschalten
I Statistische Fehler beziehen sich nicht auf unkorrekteVorgangsweise beim Hypothesentesten, sondern aufEntscheidungsfehler. Richtige Prozeduren fuhren zuFehlentscheidungen.
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 20/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Fehler bei statistischen Tests
I β-Fehler (Fehler 2. Art) = Wahrscheinlichkeit H0
beizubehalten, obwohl sie falsch ist.
I Vergleiche Gerichtsverfahren: Freispruch aus Mangel anBeweisen (Beibehalten der H0: der Verdachtige istunschuldig) bedeutet nicht, dass er mit Sicherheit unschuldigist (β-Fehler). Die Beweise fur seine Schuld waren nichtausreichend
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 21/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Fehler bei Statistischen Tests
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 22/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Statistische Fehler
I Je kleiner α, umso kleiner der Fehler 1. Art (H0 irrtumlich zuverwerfen)
I → α moglichst klein wahlen, z.B. α = 0.001?
I Entscheiden fur Signifikanzniveau ist vergleichbar mit demAbschluss einer Versicherung. Umso besser derVersicherungsschutz gegen einen α-Fehler, umso hoher dieKosten.
I Was sind die Kosten eines kleinen Signifikanzniveaus?
I Großerer Fehler 2. Art (β-Fehler = H0 irrtumlichbeizubehalten) und geringere Teststarke 1− β (Macht oderPower = Wahrscheinlichkeit, H0 zugunsten einer H1 zuverwerfen, wenn tatsachlich H1 gilt)
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 23/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Beziehungen zwischen Statistischen Fehlern - 1
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 24/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Beziehungen zwischen Statistischen Fehlern - 2
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 25/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Richtige und falsche Entscheidungen
Reale SituationH0 H1
Ergebnis d. verworfen Fehler 1. Art Richtige E.Hypothesen- H0 α Macht, 1− β
tests beibehalten Richtige E. Fehler 2. Art1− α β
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 26/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Dilemma
I Versicherung gegen α-Fehler hat die Kosten eines hoherenβ-Fehlers und geringerer Macht des Tests
I Versicherung gegen β-Fehler hat die Kosten eines hoherenα-Fehlers
I Kompromiss in der Praxis: α = 0.05 oder α = 0.01 jenachdem, welchen Fehler man eher riskieren mochte
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 27/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Macht eines Tests (Teststarke)
I 1− β ist die Wahrscheinlichkeit dafur, dass ein statistischerTest zugunsten einer H1 entscheidet, wenn diese gilt (d.h. dieH0 richtigerweise zu verwerfen)
I Die Teststarke hangt von verschiedenen Faktoren ab:I Signifikanzniveau αI Ein- oder zweiseitige Alternativhypothese (bei einseitiger H1
hoher)I Große des UnterschiedesI Streuung der Variable X in der PopulationI Stichprobenumfang nI Verwendeter statistischer Test: je hoher der verwendete
Informationsgehalt der Daten, umso hoher seine Macht
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 28/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Teststarke und Große der Unterschiede
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 29/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Teststarke und Populationsstreuung
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 30/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Teststarke und Stichprobenumfang
I Beispiel: Binomialtest mit NV-Approximation, Anteil derubergewichtigen Frauen
I Stichprobengroße n = 2000 Frauen (statt n = 200), gleicherAnteil wie vorher: 43.5% ubergewichtig = 870.
I µ = np = 1000, k = 870
I
z =870.5− 1000√
2000 · 0.50 · 0.50= −5.79
zum Vergleich z = −1.77 bei n = 200
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 31/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Statistische Signifikanz und praktische Relevanz
I Mit genugend großem Stichprobenumfang kann man praktischjede H0 verwerfen
I Festlegung einer Effektgroße ε (z.B. praktisch relevanterUnterschied) und einer spezifischen H1
I Muss aufgrund inhaltlicher Uberlegungen vor Datenerhebungfestgelegt werden
I Vorteil: notwendiger Stichprobenumfang, der bei gegebenemα, gewunschtem 1− β und bestimmter Effektgroße eineeindeutige Entscheidung ermoglicht, bestimmbar
I Tabellen bzw. Computerprogramme im Internet (z.B. GPowervon Erdfelder, Faul & Buchner, 1996).
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 32/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Kumulierung des α-Fehlers
I Fuhrt man mehrere statistische Tests durch, hat man beijedem dieser Tests das Risiko eines α-Fehlers
I Angenommen, jemand fuhrt drei statistische Tests durch umeine Hypothese zu prufen
I Selbst bei Annahme der Unabhangigkeit der einzelnen Testsware Wahrscheinlichkeit, dass mindestens 1 Test signifikantwird = 1 − (Wahrscheinlichkeit kein Test signifikant) =1− (1− 0.05)3 = 0.14
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 33/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Kumulierung des α-Fehlers
I Fuhrt man k unabhangige statistische Tests zur Uberprufungeiner H0 durch, kommt es zu einer Kumulierung des α-FehlerRisikos α′ = 1− (1− α)k
I Lasst es sich nicht vermeiden, mehrere statistische Tests zurPrufung einer Hypothese durchzufuhren, muss eine α-FehlerKorrektur vorgenommen werden
I α-Fehler Adjustierung: αadj = 1− (1− α)1/k
I 3 Tests: αadj = 1− (1− 0.05)1/3 = 0.017
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 34/35
Statistische Tests II
Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses
Darstellung des Ergebnisses
I Voraussetzung: Formulierung der H0 und H1, Angabe von α,Stichprobenbeschreibung
I Angabe des p-Wertes
I Angabe der Teststatistik (+ df wo notig)
I ev. Teststarke und Effektgroße
I Korrekte Formulierung bei nicht-signifikantem Ergebnis: ’H0
wird beibehalten’; Formulierung, ’H0 wurde bewiesen’, istfalsch
I Falsche Interpretationen:I ’Je kleiner der p-Wert, umso großer der Effekt.’ Der p-Wert ist
keine Effektgroße.I ’Der p-Wert gibt die Wahrscheinlichkeit fur das Zutreffen der
H0 an.’ Der p-Wert ist die P(beobachtetesErgebnis|H0).
Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 35/35
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Einfuhrung in Quantitative Methoden
Karin Waldherr & Pantelis Christodoulides
8. Juni 2011
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 1/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
Anpassungstests allgemein
I Gegeben: Haufigkeitsverteilung der Variable X in einerStichprobe aus bestimmter Population (empirische Verteilung)
I Unbekannt: Verteilungsfunktion der Variable X , F (x), in derPopulation
I Nullhypothese spezifiziert theoretische (erwartete) VerteilungF0(x) (z.B. Gleichverteilung, Normalverteilung)
I H0: F (x) = F0(x) gegen H1: F (x) 6= F0(x)
I Anpassungstest pruft, ob Stichprobe aus Population stammt,in welcher X die Verteilung F0(x) aufweist
I Abweichung empirische - theoretische Verteilung, d.h.Vergleich der empirisch beobachteten Haufigkeiten derAuspragungen von X mit theoretisch erwarteten Haufigkeiten,wenn H0 gilt
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 2/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
χ2-Anpassungstest
I Variable X mit j = 1, . . . , k Auspragungen
I fj = beobachtete Haufigkeiten in der Stichprobe, ej =erwartete Haufigkeiten unter H0
k∑j=1
(fj − ej)2
ejasympt. χ2 − verteilt mit df = k − 1
I Empirische und theoretische Verteilung ident ⇒ χ2 → 0
I Abweichungen groß ⇒ χ2 →∞I H0 verworfen, wenn χ2 im Verwerfungsbereich: χ2 > χ2
(df ;1−α)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 3/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
Erklarung Freiheitsgrade: Summe der Haufigkeiten muss mitStichprobenumfang identisch sein. Bei k Auspragungen durfen nurbei k − 1 Auspragungen die Haufigkeiten frei variieren.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 4/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
Beispiel 1: Gleichverteilung
I Ist erstmaliges Auftreten von Depressionen gleich verteilt aufdie vier Jahreszeiten?
I H0: Gleichverteilung; H1: keine Gleichverteilung; α = 0.05
I n = 100 Personen mit Depression
I Erwartete Haufigkeiten:
ej =n
k=
100
4= 25
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 5/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
Beispiel 1: Gleichverteilung
I
Fruhling Sommer Herbst Winter∑
fj 21 19 27 33 100ej 25 25 25 25 100
I
χ2 =k∑
j=1
(fj − ej)2
ej=
(21− 25)2
25+
(19− 25)2
25+
+(27− 25)2
25+
(33− 25)2
25=
= 0.64 + 1.44 + 0.16 + 2.56 = 4.8
I df = 3, χ2(3;0.95) = 7.82 (Tab. 3)
I 4.8 < 7.82 ⇒ χ2 = 4.8 gehort nicht zu den 5% derextremsten Falle unter H0 ⇒ H0 beibehalten.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 6/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
χ2-Anpassungstest mit SPSSI Menu AnalysierenI Nichtparametrische TestsI Chi-Quadrat . . .
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 7/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
SPSS-Output χ2-Test
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 8/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
Voraussetzungen fur χ2-Test
I Jede Person muss eindeutig einer Merkmalsauspragungzuordenbar sein
I Beobachtungen mussen voneinander unabhangig sein
I Eintragungen mussen absolute Haufigkeiten sein
I Approximation der Prufgroße an χ2-Verteilung ausreichend,wenn mind. 80% der ej ≥ 5 und kein ej kleiner 1.
I Fur alle Verteilungen geeignet
I Bei stetigen Verteilungen mussen Merkmalsauspragungen zuKlassen zusammengefasst werden
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 9/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
Beispiel 2: beliebige Verteilung
I Laut Statistik der Wiener Gebietskrankenkasse aus dem Jahr2009 verteilten sich vier bestimmte psychiatrische DiagnosenA,B,C,D im Verhaltnis A:B:C:D=4:3:2:1.
I Eine Diplomandin erhebt eine Stichprobe von 320 Personen,die wegen einer dieser vier psychiatrischen Erkrankungen inBehandlung sind.
I Die vier Diagnosen verteilen sich in ihrer Stichprobeprozentmaßig folgendermaßen:
I Diagnose A: 45%I Diagnose B: 25%I Diagnose C: 15%I Diagnose D: 15%
I Entspricht die Verteilung der vier Diagnosen in ihrerStichprobe jener in der Population?
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 10/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
Beispiel 2 Fortsetzung
I H0: F (x) = F0(x) = 4 : 3 : 2 : 1; H1: F (x) 6= F0(x)I Erwartete Haufigkeiten:
I Diagnose A: 320 : 10 × 4 = 128I Diagnose B: 320 : 10 × 3 = 96I Diagnose C: 320 : 10 × 2 = 64I Diagnose D: 320 : 10 × 1 = 32
I Beobachtete Haufigkeiten:I Diagnose A: 45% von 320 = 144I Diagnose B: 25% von 320 = 80I Diagnose C: 15% von 320 = 48I Diagnose D: 15% von 320 = 48
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 11/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
Beispiel 2 Fortsetzung
I Erwartete und beobachtete HaufigkeitenDiagnose A Diagnose B Diagnose C Diagnose D
∑ej 128 96 64 32 320
fj 144 80 48 48 320I
χ2 =(144− 128)2
128+
(80− 96)2
96+
(48− 64)2
64+
(48− 32)2
32=
= 16.67
I df = 3, χ23;0.95 = 7.82 ⇒ Nullhypothese verwerfen
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 12/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
Kolmogorov-Smirnov-Test (K-S-Test)
I Theoretische Verteilung stetig; bei diskreten Verteilungenanwendbar, jedoch weniger Macht
I ”Standardverfahren” zur Prufung auf NV
I Fur kleine Stichproben besser geeignet als χ2-Test, da dieserapproximativ und K-S exakt
I Basiert auf maximalem Abstand zwischen empirischerVerteilungsfunktion (kumulierte Haufigkeitsverteilung) underwarteter Verteilungsfunktion F0(x) (z.B. Normalverteilung)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 13/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
Signifikanzkorrektur nach Lilliefors
I Zwei Falle:
1. spezifische NV: H0: Variable X ist in der Population NV mitParametern µ0 und σ0 (z.B. BMI bei Wiener FrauenN(20.64,2.31)-verteilt)
2. unspezifische NV: H0: Verteilung der Variable X in derPopulation ist eine NV (irgendeine NV, mit nicht festgelegtenParametern)
I Bei Fall 2 werden x bzw. s2 aus der Stichprobe als Schatzungfur µ bzw. σ2 verwendet.
I Sind µ und σ2 der theoretischen Verteilung nicht bekannt undmussen aus Stichprobe geschatzt werden, ist K-S-Test sehrkonservativ (d.h. H0 wird zu lange beibehalten) → Korrekturdes kritischen Wertes (Lilliefors, 1967).
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 14/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
K-S-Test mit Korrektur nach Lilliefors in SPSSI Menu AnalysierenI Deskriptive Statistiken . . .I Explorative Datenanalyse . . .I Schaltflache Diagramme
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 15/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
SPSS-Output K-S-Test mit korrigierten kritischen Wertennach Lilliefors
”originaler” K-S-Test ohne Korrektur nach Lilliefors fur nichtbekanntes µ und σ) ⇒ konservativer, H0 wird langer beibehalten
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 16/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
Ein-Stichproben-t-Test
I Hypothesen uber µ einer normalverteilten Variable, wobei σ2
unbekanntI Mogliche Hypothesen:
I H0: µ = µ0; H1: µ 6= µ0
I H0: µ ≤ µ0; H1: µ > µ0
I H0: µ ≥ µ0; H1: µ < µ0
I Pruft anhand des Mittelwerts einer Stichprobe ob derErwartungswert in der entsprechenden Grundgesamtheit gleicheinem vorgegebenen Wert ist (dem unter H0 erwarteten µ0).
I Vergleich eines Stichprobenmittelwertes mit einemhypothetischen Populationsparameter µ0.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 17/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
Ein-Stichproben-t-Test: Beispiel 1
I Weicht der Mittelwert einer Zufallsstichprobe aus dem Iran,xI , in einem in Osterreich entwickelten sprachfreienIntelligenztest signifikant vom Populationsparameter inOsterreich, µA = 100, ab?
I n = 108, Testpunkte normalverteilt, xI = 99.32, sI = 4.03,
I H0: µI = 100; H1: µI 6= 100; α = 0.05
I Teststatistik:
T =X − µ
σ√n
∼ t(n−1)
t =99.32− 100
4.03√108
= −1.75
df = 107, t120;0.975 = 1.98 1.75 < 1.98 ⇒ H0 beibehalten
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 18/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
Ein-Stichproben-t-Test mit SPSS
I Menu Analysieren
I Mittelwerte vergleichen
I T-Test bei einer Stichprobe . . .
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 19/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
SPSS-Output Ein-Stichproben-t-Test
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 20/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
Ein-Stichproben-t-Test: Beispiel 2I Stichprobe von n = 36 Schulern mit Unterricht in
Darstellender Geometrie (DG)I Raumvorstellungstest normiert in Population auf µ = 100I Es soll die Hypothese gepruft werden, dass Erwartungswert bei
Schulern mit DG-Unterricht hoher.I H0: µDG ≤ µ; H1: µDG > µ; α = 0.05I xDG = 101.32, sDG = 4.15I NV gegeben ⇒ Ein-Stichproben-t−Test
t =101.32− 100
4.15√36
= 1.91
df = 35, t30;0.95 = 1.70, t40;0.95 = 1.68I Richtung stimmt: unter H1 positiver t-Wert erwartet;
1.91 > 1.69 ⇒ H0 verworfen: Schuler mit DG-Unterrichthaben uberdurchschnittliche Testleistungen.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 21/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
SPSS-Output
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 22/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
Hypothesen uber p einer B(n, p)
I Binomialtest exakt oder mit NV-Approximation (vgl. letzteVO)
I H0: p = p0; H1: p 6= p0 bzw.
I H0: p ≤ p0; H1: p > p0 oder H0: p ≥ p0, H1: p < p0
I Voraussetzungen fur NV-Approximation der BV gegeben:µ = np, σ2 = np(1− p) → Teststatistik:
Z =K − µσ
=K − np0√
np0(1− np0)∼ N(0, 1)
I Voraussetzung fur NV-Approximation der BV nicht gegeben:
P(k|n, p) =
(n
k
)pk(1− p)n−k
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 23/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter
Ein-Stichproben-Verfahren im Uberblick
Test Prufbare Hypothesen / Voraussetzungen
χ2-Anpassungstest Testen von Verteilungsannahmenalle Verteilungen prufbarabsolute Haufigkeiten
Kolmogorov-Smirnov-Test Testen von Verteilungsannahmeninsbesondere stetige Verteilungen (NV)
Ein-Stichproben-t-Test Vergleich eines x mit µ einer NV (µ, σ2)σ2 unbekannt, NV
Binomialtest exakt Hypothesen uber p einer B(n, p)NV-Approximation nicht moglich
Binomialtest NV-App. Hypothesen uber p einer B(n, p)NV-App. moglich (np und n(1− p) ≥ 5)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 24/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
Unabhangige vs. abhangige Stichproben
I Abhangige Stichproben: die Elemente der zwei Stichprobenkonnen einander paarweise zugeordnet werden, weilbeispielsweise die gleichen Personen zwei Mal befragt wurden(Messwiederholungen), es sich um Paare handelt(Geschwisterpaare, Ehepaare,..), oder die Personen aufgrundeines oder mehrerer Variablen parallelisiert wurden (z.B.aufgrund eines Vortests werden je zwei Personen mit gleicherPunktezahl zu Paaren zusammengefasst).
I Unabhangige Stichproben: es besteht kein Zusammenhang(keine Beziehung) zwischen den Elementen der Stichproben.Werte in der einen Stichprobe erlauben keine Vorhersage uberWerte in der anderen Stichprobe (unkorreliert). Z.B.: zufalligeZuteilung von Personen in VG und KG; Zufallsstichproben auszwei unterschiedlichen Populationen, z.B. Frauen und Manner(wobei es sich nicht um Paare handeln darf).
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 25/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
Vergleich zweier Varianzen: F -Test
I Unterscheiden sich die Varianzen zweier unabhangigerStichproben aus normalverteilten Grundgesamtheiten?
I H0,1: σ21 = σ2
2; H1,1: σ21 6= σ2
2
I H0,2: σ21 ≤ σ2
2; H1,1: σ21 > σ2
2
I H0,3: σ21 ≥ σ2
2; H1,3: σ21 < σ2
2
I Prufgroße:
F =σ2
1
σ22
df1 = n1 − 1, df2 = n2 − 1
I Voraussetzungen: NV in jeder Population
I Achtung! Großere Varianz muss im Zahler stehen!
I H0,1: σ21 = σ2
2 wird verworfen, wenn F > F(df1,df2,1−α/2)
I H0,2 und H0,3 werden verworfen, wenn F > F(df1,df2,1−α)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 26/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
F -Test - Beispiel 1
I Im Rahmen eines Experimentes hort die Versuchsgruppewahrend der Bearbeitung eines GedachtnistestsHintergrundmusik, die Kontrollgruppe bearbeitet den Testohne Hintergrundmusik. Streuen die Testleistungen der beidenBedingungen unterschiedlich stark?
I H0: σ2VG = σ2
KG ; H1: σ2VG 6= σ2
KG ; α = 0.05
I s2VG = 8.5, s2
KG = 4.7, nVG = nKG = 50, NV der Daten injeder Gruppe
F =8.5
4.7= 1.81 df1 = 49, df2 = 49
I Tabelle 4b: F50;50;0.975 = 1.75 < 1.81 ⇒ H0 wird verworfen
I Die Varianzen sind unterschiedlich.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 27/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
F -Test - Beispiel 2
I Im Rahmen eines Experimentes erhalt die VG einKonzentrationstraining, die KG erhalt kein Training.Anschließend bearbeiten beide Gruppen einenKonzentrationstest. Der Versuchsleiter vermutet, dass dieLeistungen in der VG homogener sind.
I H0: σ2VG ≥ σ2
KG ; H1: σ2VG < σ2
KG ; α = 0.05
I s2KG = 10.2, s2
VG = 5.9, nVG = 40, nKG = 60, NV der Datenin jeder Gruppe
F =10.2
5.9= 1.73 df1 = 59, df2 = 39
I Tabelle 4a: F50;40;0.95 = 1.66 < 1.73 ⇒ H0 wird verworfen
I Die Leistungen der Versuchsgruppe streuen weniger.
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 28/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
t-Test fur unabhangige Stichproben mit gleichen Varianzen
I Unterscheiden sich die Mittelwerte zweier unabhangigerStichproben aus normalverteilten Grundgesamtheitensignifikant voneinander?
I Stammen die beiden Stichproben aus zwei Populationen, indenen das Merkmal X identisch normalverteilt ist?
I Ungerichtete Hypothese:I H0: µ1 = µ2 bzw. µ1 − µ2 = 0 und σ1 = σ2 = σI H1: µ1 6= µ2 bzw. µ1 − µ2 6= 0 und σ1 = σ2 = σ
I Gerichtete Hypothese z.B.:I H0: µ1 ≤ µ2 bzw. µ1 − µ2 ≤ 0 und σ1 = σ2 = σI H1: µ1 > µ2 bzw. µ1 − µ2 > 0 und σ1 = σ2 = σ
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 29/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
t-Test fur unabhangige Stichproben
I Zieht man aus 2 normalverteilten Populationen, N(µ1, σ21)
und N(µ2, σ22), immer wieder zwei voneinander unabhangige
Stichproben ⇒ Verteilung der Differenzen derStichprobenmittelwerte = Normalverteilung
N(µ(X1−X2), σ2(X1−X2)
) = N(µ1 − µ2,σ2
1n1
+σ2
2n2
)
I Wegen Reproduktionseigenschaft der NV
I X1 − X2 = X1 + (−X2)
I µ(X1−X2) = µ1 + (−µ2) = µ1 − µ2 (Erwartungswert einerDifferenz = Differenz der Erwartungswerte)
I Ist µ1 = µ2, sind die Differenzen normalverteilt mitµ(X1−X2) = 0
I σ2(X1 − X2) = σ2(X1) + σ2(−X2) = σ2(X1) + σ2(X2)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 30/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
Streuung der Mittelwertsdifferenz σ(x1−x2)
I Standardfehler des Mittelwertes (vgl. VO vom 9.1.08, Folie32)
σx =
√σ2
n
I Standardfehler der Mittelwertsdifferenz
σ(x1−x2) =
√σ2
1
n1+σ2
2
n2
I Bei σ21 = σ2
2 = σ2
σ(x1−x2) =
√σ2
(1
n1+
1
n2
)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 31/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
t-Test fur unabhangige Stichproben
I Abweichung (x1 − x2)− (µ1 − µ2) in Relation zur Streuungder Mittelwertsdifferenz (= Standardfehler derMittelwertsdifferenz)
(x1 − x2)− (µ1 − µ2)
σ(x1−x2)∼ N(0, 1)
I Unter H0: µ1 − µ2 = 0 ⇒
x1 − x2
σ(x1−x2)∼ N(0, 1)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 32/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
Varianzschatzung innerhalb
I Populationsvarianz nicht bekannt ⇒ Schatzung ausStichproben
I Beste Schatzung: gewichtete mittlere Varianzschatzung
I Varianzschatzung innerhalb (der Stichproben)
σ2 =(n1 − 1)σ2
1 + (n2 − 1)σ22
(n1 − 1) + (n2 − 1)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 33/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
Warum Varianzschatzung innerhalb?I Unter H1 beide Stichproben normalverteilt mit gleichem σ,
aber unterschiedlichen MittelwertenI Wurde man die Stichproben zu einer einzigen zusammenfassen
und die Varianz berechnen, entstunde eine zweigipfeligeVerteilung und man erhielte eine großere Varianz
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 34/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
Standardfehler der Mittelwertsdifferenz
I Standardfehler der Mittelwertsdifferenz bei σ21 = σ2
2 = σ2
σ(x1−x2) =
√σ2
(1
n1+
1
n2
)I Schatzung des Standardfehlers der Mittelwertsdifferenz
σ(x1−x2) =
√(n1 − 1)σ2
1 + (n2 − 1)σ22
(n1 − 1) + (n2 − 1)
(1
n1+
1
n2
)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 35/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
Prufgroße t
I
t =x1 − x2√
(n1−1)σ21+(n2−1)σ2
2(n1−1)+(n2−1)
(1n1
+ 1n2
) df = n1 + n2 − 2
I Zweiseitige H0 wird verworfen, wenn |t| > t(df ;1−α/2)
I Einseitige H0 wird verworfen, wenn Abweichung in dieerwartete Richtung und |t| > t(df ;1−α)
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 36/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
t-Test - Voraussetzungen
I Unabhangige Stichproben
I Metrische Variable
I Normalverteilung in beiden Populationen
I Homogene Varianzen → F -Test
I Sind Voraussetzungen fur t-Test erfullt, ist er der machtigsteTest zum Vergleich zweier unabhangiger Stichproben
I Ist eine (oder mehrere) der Voraussetzungen nicht erfullt, liegtkeine t-Verteilung vor, das reale α entspricht nicht demvorgegebenen α und es kommt zu Fehlentscheidungen
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 37/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
t-Test - Beispiel
I Es soll uberpruft werden, ob zusatzliches autogenes Trainingeinen positiven Effekt bei der Behandlung von Depressionenhat. Klassischer Zwei-Gruppen-Versuchsplan: eine Gruppe vonPatientinnen erhalt nur die konventionelle Therapie (KG), einezweite Gruppe erhalt zusatzlich autogenes Training (VG).Operationalisierung des Effekts der Therapien: Scoredifferenz(vorher minus nachher) in einem Depressionsfragebogen.
I H0: µVG ≤ µKG , σ2VG = σ2
KG
I H1: µVG > µKG , σ2VG = σ2
KG
I VG: xVG = 7.22, s2VG = 6.12, n = 53
I KG: xKG = 4.91, s2KG = 6.54, n = 51
I NV gegeben, α = 0.05
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 38/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
t-Test - Beispiel
I Homogenitat der Varianzen: H0: σ21 = σ2
2, H1: σ21 6= σ2
2
F =6.54
6.12= 1.07 df1 = 50, df2 = 52
Tabelle 4b: F50;50;0.975 = 1.75 > 1.07 ⇒ H0 wird beibehalten,Varianzen sind homogen
I
t =7.22− 4.91√
52·6.12+50·6.5452+50
(1
52 + 150
) = 4.64, df = 102
Tabelle 3: t102;0.95 = 1.66 < 4.64 ⇒ H0 verworfen, Ergebnisspricht dafur, dass autogenes Training zusatzlichen Effekt hat
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 39/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
t-Test fur unabhangige Stichproben mit SPSSI Es soll uberpruft werden, ob sich die beiden Gruppen (mit vs.
ohne autogenes Training) bezuglich Alter unterscheiden.I H0: µ1 = µ2, σ1 = σ2; H1: µ1 6= µ2, σ1 = σ2; α = 0.05
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 40/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
t-Test fur unabhangige Stichproben mit SPSS
I Menu Analysieren
I Mittelwerte vergleichen
I T-Test bei unabhangigen Stichproben . . .
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 41/42
Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben
Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ
t-Test fur unabhangige Stichproben mit SPSS
Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 42/42
E�ektgröÿen (E�ektstärken)
Einführung in Quantitative Methoden
Pantelis Christodoulides & Karin Waldherr
15. Juni 2011
Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 1/10
E�ektgröÿen (E�ektstärken)
Allgemeines
I Wie groÿ ist der E�ekt (d.h. Ausmaÿ der Wirkung) eines
experimentellen Faktors?
I Ist er bedeutsam oder trivial?
I Ein E�ekt kann statistisch signi�kant sein, obwohl praktisch
nicht relevant.
I Ist der E�ekt in einer Studie gröÿer als in einer anderen?
I Vergleich der Ergebnisse verschiedener Studien im Rahmen
einer sog. Metaanalyse.
I Publication Manual of the American Psychological
Association, 2002: "For the reader to fully understand the
importance of your �ndings, it is almost always necessary to
include some index of e�ect size ... "
Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 2/10
E�ektgröÿen (E�ektstärken)
Allgemeines
I Hängen mit statistischer Signi�kanz insofern zusammen, als
geringe E�ektstärken gröÿere Stichproben erfordern, damit
Ergebnisse signi�kant werden
I Können als Ergänzung zu vielen Verfahren berechnet werden
I E�ektgröÿen zur Planung der Untersuchung (Berechnung der
notwendigen Stichprobe). Entsprechende Vorinformation
notwendig
I Grundsätzlich Einteilung in zwei Arten: Abstandsmaÿe und
Korrelationsmaÿe
I Beide Arten drücken dieselbe Information aus
I Ineinander überführbar
I Besonders bekannt gemacht durch Cohen (1962)
Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 3/10
E�ektgröÿen (E�ektstärken)
Abstandsmaÿe
I Naheliegende E�ektgröÿe für Unterschiede zwischen zwei
Gruppen ist der Abstand zwischen den Mittelwerten
(=Rohscore-E�ektgröÿe)
I Probleme:
1. Verwendung unterschiedlicher Skalen, z.B. Konzentrationstest
mit Scores 1-10 vs. Konzentrationstest mit Scores 50-150
2. Unterschied bezieht sich darauf, wie sehr sich die Verteilungen
der beiden Gruppen nicht überschneiden → abhängig von
Streuung der Messwerte
Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 4/10
E�ektgröÿen (E�ektstärken)
Ein�uss der Streuung
Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 5/10
E�ektgröÿen (E�ektstärken)
Abstandsmaÿe: Cohen's d
I Lösung: Standardisiertes Maÿ, das die relative Gröÿe der
Mittelwertsdi�erenz zwischen zwei Populationen angibt
I
d =µ1 − µ2
σ
I Schätzer:
d =x1 − x2√
σ2
1+σ2
2
2
I Modi�kation für ungleiche Gruppengröÿen: Hedge's g
g =x1 − x2√
σ2
1(n1−1)+σ2
2(n2−1)
n1+n2−2
Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 6/10
E�ektgröÿen (E�ektstärken)
E�ektgröÿe aus t-Wert berechnen
I
g =x1 − x2√
(n1−1)σ2
1+(n2−1)σ2
2
(n1−1)+(n2−1)
t =x1 − x2√
(n1−1)σ2
1+(n2−1)σ2
2
(n1−1)+(n2−1)
(1
n1+ 1
n2
)⇒
g = t
√1
n1+
1
n2
Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 7/10
E�ektgröÿen (E�ektstärken)
Einteilung der E�ektgröÿen nach Cohen
I Schwacher E�ekt: ab d = 0.2 oder r = 0.1
I Mittlerer E�ekt: ab d = 0.5 oder r = 0.3
I Starker E�ekt: ab d = 0.8 oder r = 0.5
I Einteilung beruht auf sozialwissenschaftlichem Usus und auf
durchschnittlich in Studien gefundenen Werten.
Bedeutsamkeit der E�ektgröÿe ist stark vom jeweiligen
Problembereich abhängig.
Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 8/10
E�ektgröÿen (E�ektstärken)
Schwacher E�ekt: d = 0.2
Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 9/10
E�ektgröÿen (E�ektstärken)
Starker E�ekt: d = 0.8
Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 10/10