1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005

STATISIK

LV Nr.: 1852

WS 2005/06

20. Dezember 2005

Theorie

• Schätzen– Punktschätzer– Intervallschätzer– Eigenschaften

• Testen– Einführung– Hypothesen– Fehlentscheidungen– Spezielle Tests

Schätzverfahren

• Schluss von der Grundgesamtheit auf eine Stichprobe: Inklusionsschluss (direkter Schluss)

• Schluss von einer Stichprobe auf Parameter einer Grundgesamtheit: Repräsentationsschluss (indirekter Schluss)

• Unterscheidung: – Punktschätzer (einziger Schätzwert)– Intervallschätzer (Konfidenzintervall)

Schätzverfahren

• Punktschätzer: Für den zu schätzenden Parameter wird nur ein einziger Schätzwert angegeben. – Bsp. Schätze das unbekannte arithm. Mittel einer

Grundgesamtheit μ durch das arithm. Mittel der Stichprobe

• Vorsicht: Die in einer Stichprobe realisierten Merkmalsausprägungen sind zufallsabhängig, Punktschätzer stimmen daher nur in den seltensten Fällen mit dem wahren Parameter überein.

Schätzverfahren

• Intervallschätzer: Ausgehend von einer Stichprobe wird ein Intervall bestimmt, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit liegt (Konfidenzintervall).

• Irrtumswahrscheinlichkeit ≤ α

• Konfidenzintervall zum Niveau 1-α (Vertrauensbereich od. Vertrauensintervall)

Schätzverfahren

• Ges: Konfidenzintervall für das arithm. Mittel: ZV

• Symmetrische Wahrscheinlichkeitsintervall

• Symmetrie: z(α /2) = –z(1-α/2)

daher: z = –z(1-α/2) und –z = z(α /2) und

α α1

X-μW(z n z ) 1- α

2X~N(μ,σ )

α1)zσμXzσW(μ XX

Schätzverfahren

• In diesem Wahrscheinlichkeitsintervall liegt das arithm. Mittel mit der Wahrscheinlichkeit 1- α.

• Gesucht ist ist aber nicht das Ws-Intervall der ZV, sondern das Konfidenzintervall für das unbekannte arithm. Mittel µ der Grundgesamtheit. – Varianz σ² der Grundgesamtheit bekannt– Varianz σ² der Grundgesamtheit unbekannt

Schätzverfahren

• Konfidenzintervall für µ bei bekannter Varianz σ² der Grundgesamtheit:

Konkreter Stichprobenmittelwert XX zσxμzσx

Schätzverfahren

• Konfidenzintervall für µ bei unbekannter Varianz σ² der Grundgesamtheit:

• Statt der unbekannte Varianz σ² wird die Stichprobenvarianz S² verwendet.

• Zufallsvariable:

T ist t- verteilt mit v=n-1 Freiheitsgradenn

Verteilungen

• Es gilt:– Ist T der Quotient einer Standardnormalverteilung und

der Quadratwurzel des Mittelwerts von n quadrierten unabhängigen N(0,1)-verteilten ZV Xi, dann folgt T einer t-Verteilung mit v=n Freiheitsgraden.

• Zufallsvariable:

T ist t- verteilt mit v=n Freiheitsgraden T~tn

• t-Verteilung ist symmetrisch

Verteilungen

• t- Verteilung mit v Freiheitsgraden:– Erwartungswert (für n>1):

E(T) = 0– Varianz (für n>2):

Var(T) = n / (n-2)

• Für n→∞ geht die t-Verteilung in die N(0,1) über.

• Approximation durch N(0,1)-Vt für n ≥ 30

• Wahrscheinlichkeitsintervall für das arithm. Mittel bei unbekannter Varianz:

• Wobei t = t(1-α/2);n-1 = – t(α/2);n-1 die Punkte sind, bei denen die Verteilungsfunktion der t- Verteilung mit n-1 Freiheitsgraden die Werte 1-α/2 bzw. α/2 besitzt.

Schätzverfahren

α α;n-1 1- ;n-1

X-μW(t t ) 1- α

• Konfidenzintervall für das arithm. Mittel bei unbekannter Varianz:

Konkreter Stichprobenmittelwert

Konkrete Stichprobenvarianz

Schätzverfahren

XX σ̂txμσ̂tx

Schätzverfahren

• Konfidenzintervall für den Anteilswert:

• Ann. genügend großer Stichprobenumfang, d.h. Approximation durch N-Vt möglich, E(P) = θ und Var(P) = σP

• Standardisierte ZV:

P-θZ=

Schätzverfahren

• Wahrscheinlichkeitsintervall:

• Konfidenzintervall:

• Ist σP unbekannt, verwendet man stattdessen die Stichprobenvarianz des Anteilswertes als Schätzer.

α α1

P-θW(z z ) 1- α

P Pp-zσ θ p+zσ

Schätzverfahren

• Konfidenzintervall für die Varianz

• ZV (n-1)S² / σ² ist χ² verteilt mit v=n-1 Freiheitsgraden

• Wahrscheinlichkeitsintervall:

• Konfidenzintervall:

22 2α α

;n-1 1- ;n-1P2 2

(n-1)SW(χ χ ) 1- α

2 2α α

1- ;n-1 ;n-12 2

(n-1)S (n-1)S;

Stichprobenumfang

• Bisher: – Geg: Stichprobenumfang n, Sicherheitsgrad 1-α– Ges: Konfidenzintervall

• Jetzt: – Geg: Konfidenzintervall, Sicherheitsgrad 1-α– Ges: Stichprobenumfang

• Absoluter Fehler Δμ = zσX ist ein Maß für die Genauigkeit der Schätzung

• Breite des Konfidenzintervalls: 2Δμ

Stichprobenumfang

• Frage: Welchen Stichprobenumfang benötigt man, um einen Parameter (arithm. Mittel) bei vorgegebener Genauigkeit und vorgegebenem Sicherheitsgrad zu schätzen?

Eigenschaften von Schätzern

Eigenschaften von Schätzfunktionen:

• Erwartungstreue

• Effizienz

• Konsistenz

• Suffizienz

• Erwartungstreue

• Eine Schätzfunktion heißt erwartungstreu (unverzerrt, unbiased), wenn ihr Erwartungswert mit dem wahren Parameter übereinstimmt.

• Bedingung:

• Es gilt:

Θ)Θ̂E(

μ)XE( 22 σ)E(S

• Effizienz:

• Von 2 erwartungstreuen Schätzfunktionen gilt jene als effizienter (wirksamer), die die kleinere Varianz aufweist.

• Eine Schätzfunktion heißt effizient, wenn folgende Bedingungen erfüllt sind:

Θ)Θ̂E( )Θ̂Var()Θ̂Var( *

tionSchätzfunk treueerwartungsbeliebigeΘ̂*

• Konsistenz:

• Eine Schätzfunktion heißt konsistent, wenn der Schätzwert bei laufender Vergrößerung des Stichprobenumfangs (n→∞ oder n→N) mit dem zu schätzenden Parameter zusammenfällt.

• Suffizienz:

• Eine Schätzfunktion heißt suffizient (erschöpfend), wenn sie sämtliche Informationen über den zu schätzenden Parameter, welche die Stichprobe enthält ausschöpft.

Schätzverfahren

• Methode der Kleinsten Quadrat

• Maximum Likelihood

• Momentenmethode

Konfidenzintervall

• Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit (1-α) liegt.

Konfidenzintervall

• Bsp. Arithmetisches Mittel (ist bei N-Vt. Grundgesamtheit bzw. bei genügend großem Stichprobenumfang N-Vt.). Der wahre Parameter µ liegt mit der Wahrscheinlichkeit (1-α) im Intervall

zσX;zσX

KonfidenzintervallKonfidenzintervall für den Parameter µ (bei N-Vt. des Stichprobenmittelwertes)

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Stichprobenmittelwert

1-α = 0,95

α/2 = 0,025

Konfidenzintervall

α/2 = 0,025

x-z(α/2)σ x+z(1-α/2)σ

Konfidenzintervall

• Bsp. Körpergröße: – Mittelwert =173,42– Standardabweichung = 9,54 – N = 73– 2-seitiges KI zum Niveau α=0,05

Wahrscheinlichkeit, dass der wahre Parameter im KI liegt ist 0,95. Quantile der t-Vt: t=±1,99 Quantil der N(0,1)-Vt: z=±1,96

KI [171,19 ≤ µ ≤ 175,65] t-VtKI [171,23 ≤ µ ≤ 175,61] N(0,1)-Vt

Statistische Tests

• Fragen: – Besteht ein Zusammenhang zw. dem

Geschlecht und dem Rauchverhalten?– Ist der Ausschussanteil kleiner als 5%?– Ist die mittlere Länge eines Werkstücks, das

von zwei verschiedenen Maschinen hergestellt wird, gleich?

– Soll ein neues Medikament zugelassen werden?– Stammen Daten aus einer N-Vt

Grundgesamtheit?– …

Statistische Tests

• Deskriptive Analyse der Daten– Lage- und Streuungsmassen– Kontingenztafeln – Korrelationsmaße– Verteilungsdiagramme– …

• Statistischer Test, um eine theoretisch abgesicherte Entscheidung zu treffen.

Statistische Tests

Einführung:

• Testen von Hypothesen (Annahmen, Behauptungen)

• Statistischer Test: Verfahren, mit dessen Hilfe sich bestimmte Hypothesen auf ihre Richtigkeit hin überprüfen lassen.

• Statistische Testverfahren basieren auf Stichprobentheorie

Statistische Tests

Einführung:• Ziel: Richtigkeit von Aussagen über die

Verteilung einer Zufallsvariablen überprüfen. • Entscheidungsgrundlage: Ergebnis eines

zufälligen Vorgangs.• Daher: Entscheidungen nicht immer richtig• Aber: Beim Vorliegen einiger der möglichen

Verteilungen ist die Wahrscheinlichkeit falsch zu entscheiden beschränkt.

Statistische Tests: Hypothesen

Hypothesen:

• Annahmen, Behauptungen, Aussagen über unbekannte Grundgesamtheit

• 2 Arten von Hypothesen:– Parameterhypothesen, Überprüfung durch

Parametertests– Verteilungshypothesen, Überprüfung durch

Verteilungstests

Formulierung von Hypothesen:

• Nullhypothese H0 (Ausgangshypothese)

• Alternativhypothese H1 (Gegenhypothese)

Bsp.• Anteile:

– H0: Ausschussanteil = 10%

– H1: Ausschussanteil > 10%

• Mittelwerte: – H0: Mittlere Länge eines Werkstücks = 5cm

– H1: Mittlere Länge eines Werkstücks 5cm

• Gruppenvergleich: – H0: Gruppe 1 und Gruppe 2 sind gleich

– H1: Gruppe 1 und Gruppe 2 sind ungleich

Statistische Tests

• Entscheidung für H0 oder H1 basiert auf einer Stichprobe x1,…,xn

• Wahrscheinlichkeitsaussage ob H0 zutrifft oder nicht.

• Frage: H0 ablehnen (verwerfen) oder H0 nicht ablehnen?

Statistische Tests

Mögliche Fehlentscheidungen:

• Fehler 1. Art (α-Fehler): obwohl H0 korrekt ist wird H0 abgelehnt

• Fehler 2. Art (β-Fehler): obwohl H0 falsch ist wird H0 nicht abgelehnt.

Statistische Tests

• Fehlentscheidungen

Trifft zu

EntscheidungH0 H1

H0Richtige

EntscheidungFehler 2. Art (β -Fehler)

H1Fehler 1. Art

(α-Fehler)Richtige

Entscheidung

Statistische Tests

Problem bei Fehlentscheidungen:

• Falsche Entscheidung

• Man weiß nicht, ob man in einer konkreten Situation einen Fehler macht, sondern nur welcher Art dieser ist.

Statistische Tests

• Signifikanzniveau eines Tests α:– Die Wahrscheinlichkeit eine Fehler 1. Art zu

machen ist höchstens α, daher „Test zum Niveau α“ - egal mit welcher Wahrscheinlichkeit ein Fehler 2. Art begangen wird.

Statistische Tests

• Trifft H0 zu und entscheidet man sich für H1, dann ist die Wahrscheinlichkeit dabei einen Fehler zu machen ≤ α (α bekannt, wird festgelegt).

• Trifft H1 zu und entscheidet man sich für H0, dann ist die Wahrscheinlichkeit dabei eine Fehler zu machen = β (β unbekannt).

Statistische TestsFehler 1. Art und Fehler 2. Art

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6

N(0,1) N(3,1)

Fehler 1. Art

Fehler 2. Art

µ0=0 µ1=3

Statistische Tests

• D.h. durch Festlegen des α-Niveaus ist nur die Entscheidung für H1 abgesichert.

• Bei Entscheidung für H1: – H1 ist richtig, – H1 ist falsch, ich mache einen Fehler mit

Wahrscheinlichkeit ≤ α.

• Daher: Formuliere H0 so, dass sie abgelehnt werden soll. bzw. in H0 soll diejenige Annahme festgelegt werden, der die größere Bedeutung zukommt.

Statistische Tests

• Bsp. Medikamententest H0: Medikament ist nicht wirksam gegen H1: Medikament wirkt. – Fehler 1. Art: das Medikament wirkt nicht, man

glaubt aber dass es wirkt– Fehler 2. Art: das Medikament wirkt, man

glaubt aber dass es unwirksam ist.

Wähle α=0,01 (sehr klein), da Risiko ein nichtwirksames Medikament als wirksam einzustufen sehr groß ist.

Statistische Tests

• Arten von Hypothesen:

• Einseitige Hypothesen– H0: θ ≤ θ0 gegen H1: θ > θ0

– H0: θ ≥ θ0 gegen H1: θ < θ0

• Zweiseitige Hypothesen– H0: θ = θ0 gegen H1: θ ≠ θ0

• Verteilungshypothesen:– H0: bestimmten Vt. gegen H1: nicht diese Vt.

Statistische Tests

• Arten von Testproblemen:– Einseitige Testprobleme

• Tests für einseitige Hypothesen

– Zweiseitige Testprobleme• Tests für zweiseitige Hypothesen

– Anpassungstests• Test für Verteilungshypothesen

Statistische Tests

• Gütefunktion oder Macht g(θ): Wahrscheinlichkeit sich für H1 zu entscheiden, falls θ der wahre Parameter ist.

• Test zum Niveau α:– g(θ) ≤ α für alle θ H0

– g(θ) ≥ α für alle θ H1

– Ist θ H1, ist 1-g(θ) Wahrscheinlichkeit für den Fehler 2. Art.

– Funktion 1-g(θ) heißt Operationscharakteristik (OC)

Statistische TestsGütefunktion (einseitiger Test)

499 499,5 500 500,5 501 501,5 502

µ0=500

Statistische TestsOperationscharaktersitik OC Kurve (einseitiger Test)

499,5 500 500,5 501 501,5 502

µ0=500

Statistische Tests

• Trennschärfe eines Tests:– Steilheit der OC Kurve 1-g(θ)– Es gilt: Je größer die Stichprobe umso besser

die Trennschärfe.

Statistische TestsOperationscharaktersitik OC Kurve (einseitiger Test),

unterschiedliche Stichprobengrößen n (n=9, n=100, n=10000)

499,5 500 500,5 501 501,5 502

µ0=500

Statistische Tests

• Vorgehensweise bei statistischen Tests (I):– Formulierung von H0 und H1 und Festlegen des

Signifikanzniveaus– Festlegung einer geeigneten Prüfgröße und

Bestimmung der Testverteilung unter H0.– Bestimmung des kritischen Bereichs– Berechnung der Prüfgröße (=Teststatistik)– Entscheidung und Interpretation

Statistische Tests

• Vorgehensweise bei statistischen Tests (II):– Formulierung von H0 und H1 und Festlegen des

Signifikanzniveaus– Festlegung einer geeigneten Prüfgröße und

Bestimmung der Testverteilung unter H0.– Berechnung der Prüfgröße (=Teststatistik)– Bestimmung des p-Wertes der Teststatistik– Entscheidung und Interpretation

Statistische Tests

• p-Wert– Anstatt den kritischen Bereich bzw. die

kritischen Werte zu bestimmen, Berechnung des „p-Wertes“.

– p-Wert (p-value): Niveau, bei dem der Test gerade noch abgelehnt hätte.

– Vergleich des p-Wertes mit dem vorher festgesetzten Niveau α.

– Entscheidung: Lehne H0 ab, wenn p-Wert < α

Statistische Tests

• Einseitige Tests (I)– H0: θ ≤ θ0 gegen H1: θ > θ0 und α = 0,05

– Teststatistik (T) und deren Verteilung unter H0

bestimmen.– Bestimmung des kritischen Bereichs bzw. des

kritischen Werts (c)

– T > c, lehne H0 ab

– T ≤ c, lehne H0 nicht ab

Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

1-α = 0,95

α = 0,05

Kritischer BereichH0 ablehnen

H0 nicht ablehnen

Kritischer Wert: c

Statistische Tests

• Einseitige Tests (II)– H0: θ ≤ θ0 gegen H1: θ > θ0 und α = 0,05

bestimmen.– Bestimmung des p-Wertes

– p < α, lehne H0 ab

– p ≥ α, lehne H0 nicht ab

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

1-α = 0,95

α = 0,05

H0 nicht ablehnen

Kritischer Wert: c

Prüfgröße=1,64 p-Wert=0,05

Statistische Tests

• Einseitige Tests (I)– H0: θ ≥ θ0 gegen H1: θ < θ0 und α = 0,05

bestimmen.– Bestimmung des kritischen Bereichs bzw. des

kritischen Werts (c)

– T < c, lehne H0 ab

– T ≥ c, lehne H0 nicht ab

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

1-α = 0,95

α = 0,05

H0 nicht ablehnen

Kritischer Wert: c

Statistische Tests

• Einseitige Tests (II)– H0: θ ≥ θ0 gegen H1: θ < θ0 und α = 0,05

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

1-α = 0,95

α = 0,05

H0 nicht ablehnen

Kritischer Wert: c

Prüfgröße=-1,64 p-Wert=0,05

Statistische Tests

• Zweiseitige Tests (I)– H0: θ = θ0 gegen H1: θ ≠ θ0 und α = 0,05

bestimmen.– Bestimmung des kritischen Bereichs bzw. der

kritischen Werte (cu und co)

– T < cu oder T > co, lehne H0 ab

– cu ≤ T ≤ co, lehne H0 nicht ab

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

1-α = 0,95

α/2 = 0,025

Kritischer Bereich

H0 ablehnen

H0 nicht ablehnen

Kritischer Wert: co

Kritischer Bereich

H0 ablehnen

α/2 = 0,025

Kritischer Wert: cu

Statistische Tests

• Zweiseitige Tests (II)– H0: θ = θ0 gegen H1: θ ≠ θ0 und α = 0,05

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

Prüfgröße

1-α = 0,95

α/2 = 0,025

Kritischer Bereich

H0 ablehnen

H0 nicht ablehnen

Kritischer Wert: co

Kritischer Bereich

H0 ablehnen

α/2 = 0,025

Kritischer Wert: cu

Prüfgröße= -1,96, +1,96 p-Wert=0,05

Statistische Tests

• Kritischer Wert: Wert auf der Achse

• p-Wert: Fläche unter der Dichte

• Entscheidung: – Lehne H0 ab, wenn Prüfgröße im kritischen

Bereich

– Lehen H0 ab, wenn p-Wert der Prüfgröße < α

χ² Unabhängigkeitstest

Chi-Quadrat (χ²) Unabhängigkeitstest

• Teste ob 2 nominalskalierte Merkmale voneinander unabhängig sind.

• Bsp. Sind Geschlecht und Rauchverhalten voneinander unabhängig?

Chi-Quadrat (χ²) Unabhängigkeitstest

• H0: die beiden Merkmale sind voneinander unabhängig.

• H1: die beiden Merkmale sind nicht voneinander unabhängig, d.h. sie sind voneinander abhängig

• Festlegen des Signifikanzniveaus α.

• Kontingenztafel:– Absolute Häufigkeiten der

Merkmalsausprägungen

A \ B b1 ... bs ∑

a1 h11 … h1s h1.

: : : :

ar hr1 … hrs hr.

∑ h.1 ... h.s h.. = n

• Bsp. 4-Felder Tafel:– Absolute Häufigkeiten der

Merkmalsausprägungen

Raucher Nichtraucherweiblich 9 32 41männlich 5 27 32

14 59 73

Prüfgröße und Testverteilung:

• Prinzip: Vergleiche die Werte, die man unter Unabhängigkeit der Merkmale erwarten würde (he), mit den tatsächlich beobachteten Werten (ho).

• Wenn H0 gilt, welche Werte würde man erwarten?

• Berechung der unter H0 erwarteten absoluten Häufigkeiten.

• Unter H0 erwartete absoluten Häufigkeiten

• Interpretation der relativen Häufigkeiten als Wahrscheinlichkeiten

• Dann: unter H0 erwartete absoluten Häufigkeiten

o oi je h h

• Bsp. Geschlecht - Rauchverhalteno oi je h h

Geschlecht j nw 9 32 41m 5 27 32

14 59 73

Raucher

Geschlecht j nw 7,9 33,1 41m 6,1 25,9 32

14 59 73

Raucher

• Teststatistik χ²:– Abweichung der beobachteten Häufigkeiten

von den erwartete Häufigkeiten

2o er sij ij2

ei=1 j=1 ij

h hχ =

Verteilung der Teststatistik χ²:

• χ²-Verteilung mit v = (r-1)·(s-1) Freiheitsgraden

Kritischer Bereich:

• Signifikanzniveau α

• Kritischer Wert: α-Quantil der χ²(r-1)·(s-1) Verteilung

• Lehne H0 ab, wenn gilt:

Wert der Teststatistik > kritischer Wert

Bsp. Geschlecht – Rauchverhalten: Teststatistik χ²

• Verteilung der Teststatistik: χ²1

Chi-Quadrat Verteilung mit einem Freiheitsgrad

2o e2 2ij ij2

ei=1 j=1 ij

h hχ = 0,5

Bsp. Geschlecht – Rauchverhalten:

• Kritischer Wert: 0,05-Quantil der χ²1 Vt. = 3,84

• Entscheidung:

(I) Teststatistik = 0,5 < 3,84 = kritischer Wert. Also: Lehne H0 nicht ab.

(II) p-Wert = 0,496 > 0,05. Also: Lehne H0 nicht ab.

• Interpretation: Geschlecht und Rauchverhalten sind voneinander unabhängig.

χ² Homogenitätstest

Chi-Quadrat (χ²) Homogenitätstest

• Betrachte zwei Gruppen bzw. Stichproben.

• Teste, ob die Stichproben aus der gleichen Grundgesamtheit stammen.

Chi-Quadrat (χ²) Homogenitätstest

• H0: die beiden Stichproben stammen aus der gleichen Grundgesamtheit.

• H1: die beiden Stichproben stammen nicht aus der gleichen Grundgesamtheit.

• Festlegen des Signifikanzniveaus α.

Bsp. Geschlecht – Rauchverhalten

• H0: Das Rauchverhalten der beiden Gruppen stimmt überein.

• H1: Das Rauchverhalten der beiden Gruppen stimmt nicht überein.

Prüfgröße und Testverteilung:

• Prinzip: Vergleiche die Werte, die man unter H0 (gleiche Grundgesamtheit) erwarten würde (he), mit den tatsächlich beobachteten Werten (ho).

• Wenn H0 gilt, welche Werte würde man erwarten?

• Berechung der unter H0 erwarteten absoluten Häufigkeiten.

• Unter H0 erwartete absoluten Häufigkeiteno oi je h h

• Teststatistik χ²:– Abweichung beobachteten Häufigkeiten und

erwartete Häufigkeiten

• Verteilung der Teststatistik χ²:

χ²-Verteilung mit v = (r-1)·(s-1) Freiheitsgraden

2o er sij ij2

ei=1 j=1 ij

h hχ =

Bsp. Geschlecht – Rauchverhalten:• Teststatistik χ² = 0,5• Verteilung der Teststatistik: χ²1 • Entscheidung:

– (I) χ² = 0,5 < 3,84. Lehne H0 nicht ab. – (II) p-Wert = 0,496 > 0,05. Lehne H0 nicht ab.

• Interpretation: die beiden Gruppen (Männer, Frauen) stammen aus der gleichen Grundgesamtheit, sie sind homogen.

χ² Tests

χ² Unabhängigkeits- und Homogenitätstests:

• Teststatistik und Testverteilung sind gleich

• Nullhypothese und Interpretation sind verschieden. – Test auf Unabhängigkeit (die Merkmale sind

unabhängig voneinander)– Test auf Homogenität (die Stichproben

stammen aus der gleichen Grundgesamtheit).

χ² Tests

χ² Unabhängigkeits- und Homogenitätstests:

• Für die Approximation durch die χ²-Vt. sollten die erwarteten Häufigkeiten jeder Zelle 5 sein und keine der Zellen sollte unbesetzt sein.

• Sind die Voraussetzungen verletzt, kann man einen exakten Test durchführen

(siehe Hartung S. 414ff)

Anpassungstests

Test einer Verteilungshypothese – Nichtparametrische Testverfahren

• Betrachtet Unterschied zw. Stichproben-Vt. und theoretischer Verteilung.

• „Anpassungstest“ weil die Güte der Anpassung einer theoretischen Vt. an eine empirische Vt. überprüft wird.

Anpassungstests

χ² Anpassungstest:

• H0: die Grundgesamtheit gehorcht einer bestimmten Verteilung.

• Vorgehensweise: – Bestimme die unter H0 zu erwartenden

Häufigkeiten he und vergleiche sie mit den beobachteten Häufigkeiten ho.

– Abweichung groß – Entscheidung gegen H0, Abweichung klein – Entscheidung für H0.

Anpassungstests

• Teststatistik:

k ... Anzahl der Merkmalsausprägungen (diskrete Merkmale) bzw. Anzahl der Klassen (stetigen Merkmalen)

• Testverteilung: χ²v verteilt mit v=n-1

• Es gilt wieder: he sollten 5 sein.

)h(hχ

Anpassungstests

• Entscheidung: – Bestimmung des kritischen Bereichs,

χ² > kritischer Wert, lehne H0 ab

– Bestimmung des p-Wertes,

p-Wert < α lehne H0 ab

Anpassungstest

• Bsp. χ² Anpassungstest:– H0: Augenfarbe ist gleichverteilt

– H1: Augenfarbe ist nicht gleichverteilt

– α = 0,05

• Teststatistik: 8,583 > 5,991 (0,05 Quantil der χ²2 Verteilung) => H0 ablehnen

• p-Wert: 0,014 < 0,05 => H0 ablehnen

Merkmal ho he

1 35 242 22 243 15 24

Anpassungstests

Kolmogorov-Smirnov- Anpassungstest:

• Test zur Beurteilung der Güte der Anpassung einer erwarteten theoretischen Verteilung an eine beobachtete empirische Verteilung.

• H0: die Grundgesamtheit gehorcht einer bestimmten Verteilung.

• Prinzip: Abweichung empirische- von der theoretische Verteilungsfunktion.

Anpassungstests

Kolmogorov-Smirnov- Anpassungstest: • Prüfgröße (D):

– größte beobachtete absolute Abweichung der theoretischen von der empirischen Verteilungsfunktion.

• Testverteilung: – „Kolmogorov-Smirnov- Verteilung“, hängt nur

vom Stichproben-umfang n ab (1-α Quantile in Tabelle nachschlagen).

• Entscheidung: – D > kritischer Wert (aus Tabelle), lehne H0 ab.

1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005

Documents

1 STATISIK LV Nr.: 0021 WS 2005/06 3. November 2005

8 Schulter - bilder.buecher.de · Therapie: Wärme, Elektrobehandlung, lokale Injektionen, evtl. Entfernung der Bursa. ... 1 Otto Sprengel, Chirurg, Braunschweig (1852–1915) bzw

Strafgesetz 1852 (Österreich)

Jecker v. Montgomery, 54 U.S. 498 (1852)

1 STATISIK LV Nr.: 1852 WS 2005/06 12. Jänner 2006

1 STATISIK LV Nr.: 0021 WS 2005/06 18. Oktober 2005

1 STATISIK LV Nr.: 1375 SS 2005 8. März 2005. 2 Zweidimensionale Merkmale Frage: Wie lässt sich der Zusammenhang bzw. die Abhängigkeit zw. zwei Merkmalen

Ernst August Gries: Progreßburschenschafter in Halle 1844–1852 · 2019. 5. 27. · Ernst August Gries: Progreßburschenschafter in Halle 1844–1852 bearbeitet und herausgegeben

KARL MARX - The Charnel-House · Otto Wigand an Karl Marx, 20. März 1852 305 883 Hermann Ebner an Friedrich Engels, 22. März 1852 306 884 Jânos Bangya an Karl Marx, 2. April 1852

1 STATISIK LV Nr.: 1852 WS 2005/06 6. Dezember 2005

1 STATISIK LV Nr.: 1375 SS 2005 10. März 2005. 2 Normalverteilung Approximation durch Normalverteilung: Mit wachsendem n nähern sich viele theoretische

J.C.K. Hofmann (1852). «Ueber Die Entstehungszeit Des Buches Henoch». ZDMG 6, 87-91

1 STATISIK LV Nr.: 0028 SS 2005 23. Mai 2005. 2 Zufallsvariable Zufallsvariable: Variable deren Wert vom Zufall abhängt (z.B. X, Y, Z) –Bsp. Zufallsexperiment:

Name Vorname Auswanderungsjahr Schiffsnamekjtonner.de/Auswanderung/Downloads_files/auswandererschiff.pdf · Koenigs Nikolaus 1852 Hero Koenigs Christian 1852 Hero Koenigs Anna Maria

Landkarten 1561 bis 1852

1 STATISIK LV Nr.: 0028 SS 2005 1. Juni 2005. 2 Test für arithmetisches Mittel Zweistichprobentest für die Differenz zweier arithmetischer Mittel –Unterscheiden

1 STATISIK LV Nr.: 1852 WS 2005/06 15. Dezember 2005

Das Erstaunen des Herrn Becquerel und die Folgen Der französische Physiker Antoine Henri Becquerel (1852 - 1908) beschäftigte sich mit der Lumineszenz

Werk - gdz.sub.uni-goettingen.de fileWerk Titel: Journal für die reine und angewandte Mathematik Verlag: de Gruyter Jahr: 1852 Kollektion: Mathematica Digitalisiert: Niedersächsische

1 STATISIK LV Nr.: 0021 WS 2005/06 8. November 2005