TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der...

Preview:

Citation preview

TESTS

TESTS

TESTS

TESTSTESTS

TESTS

TESTS

Worum es geht

Man möchte „testen“, ob eine bestimmteAnnahme (Hypothese) über Parameter der Realität entspricht oder nicht.

Beobachtung(Stichprobe)

EntscheidungEntscheidungVorgabe:

„Irrtumswahr-scheinlichkeit“

Formulierung einer

HypotheseNullhypotheseNullhypothese

In der Statistik kann man nie ganz sichersein. Die „Irrtumswahr-scheinlichkeit“ solltewenigstens klein sein.

Mathematischer Rahmen ITESTS

Statistische Struktur

Testproblem(Hypothese)

NullhypotheseNullhypothese

Niveau

Gegeben sind:

Stetiger Fall Diskreter Fall

Mathematischer Rahmen IITESTS

TestTest gegeben durch:

Ablehnungsbereich

Teilmenge der Grund-gesamtheit :

Menge aller Beobachtungen ,die zur Ablehnung der Hypothese führen

Mathematischer Rahmen IIITESTS

Beobachtung (Stichprobe)(Stichprobe)

Entweder Oder

Beobachtung liegtim Annahmebereich

Beobachtung liegtim Ablehnungsbereich

Hypotheseannehmen!

Hypothese ablehnen!

Fehler erster und zweiter Art

Hypotheseakzeptiert

Hypotheseabgelehnt

Hypothesewahr

Hypothesefalsch

Entschei-Entschei-dungdung

RealitätRealität

Fehler 1. Art

Fehler 2. Art

Niveau und Macht

Obere Grenze für die Wahr-scheinlichkeit, einen FehlerFehler1. Art1. Art zu begehen

NiveauNiveau

1 - Wahrscheinlichkeit, einenFehler 2. ArtFehler 2. Art zu begehen,wenn der wahre Parameter-wert in dem Punkt liegt

MachtMacht in einem

Punkt der Alter-native

Neyman-Pearson-Test

Für einen Test mit

gilt immer:

Sei * ein Neyman-Pearson Test vom Niveau :

Jeder Test, der vom Niveau eines gegebenen Neyman-Pearson-Tests ist, besitzt

höchstens die Machthöchstens die Macht dieses Neyman-Pearson-Tests.

Tafel für die Verteilungsfunktionbei Normalverteilung

Approximative Konfidenzintervalleim Bernoulli-Fall II

Vereinfachung für großes n(n 100)

BeispielKaufhaus-Konzern

Kauf würde in Erwägung

gezogen

Kauf würde nicht in Erwägung

gezogen

572 1428

Tafel für die Verteilungsfunktionbei Normalverteilung

ZusammenhangKonfidenzintervalle - Tests

Gegeben sei ein KonfidenzintervallKonfidenzintervallC() vom Niveau

ist dann mit dem AblehnungsbereichAblehnungsbereich

Für eine einfache Hypothese

ein Test Test vom Niveau gegeben, denn:

Konfidenzintervalle

Intervallschätzung

Jeder Beobachtung wirdein Intervall C()

der reellen Zahlen zugeordnet

Niveau

Dabei ist die Wahrscheinlichkeit.eine Beobachtung zu machen,für die der wahre Parameter

im zugehörigen Intervall liegt, größer oder gleich 1 -

Tafel für die Verteilungsfunktionbei Normalverteilung

Rechenbeispiel

Stichprobe vom Umfang n = 5

3.5 7.2 5.0 4.3 7.9

Stichprobenfunktionen

Konfidenzintervallefür diese konkrete Stichprobe

1.Fall

2.Fall

3.Fall

4.Fall

5.Fall

6.Fall

18.28

BeispielGewicht von ÄpfelnÄpfeln

Gewicht von Äpfeln der Sorte Cox-Orange aus einem bestimmten italienischen Anbaugebiet

Konfidenzintervallefür diese konkrete Stichprobe

2.Fall

5.Fall

Tafel für die Verteilungsfunktionbei Normalverteilung

Student-Verteilung

Testfür den Erwartungswert

Varianz bekannt

Fall Normalverteilung

Testfür den Erwartungswert

Varianz unbekannt

Fall Normalverteilung

Vergleich zweier unabhängigerStichproben 1. Fall

2 unabhängige Stichprobenmit Stichprobenvariablen X und Y

Annahmen:

X und Y normalverteilt

Varianz von X = Varianz von Y

Hypothese:

Erwartungswert von X = Erwartungswert von Y

Für n unabhängigeunabhängige Zufallsvariablen

mit

hat man:

Mathematische Bedeutung der Chi-Quadrat-Verteilung

Für unabhängigeunabhängige ZufallsvariablenW und U mit

hat man:

Mathematische Bedeutung der t-Verteilung

Vergleich zweier unabhängigerStichproben 1. Fall

Prüfgröße

n: Umfang der Stichprobe 1(Stichprobenvariable X)

m: Umfang der Stichprobe 2(Stichprobenvariable Y)

Ablehnungsbereich

bestimmt durch

Vergleich zweier unabhängigerStichproben 2. Fall

2 unabhängige Stichprobenmit Stichprobenvariablen X und Y

Annahmen:

X und Y normalverteilt

n und m groß (> 30), damitApproximation der Varianzensinnvoll

Hypothese:

Erwartungswert von X = Erwartungswert von Y

Vergleich zweier unabhängigerStichproben 2. Fall

Ausgangspunkt

Approximation

Prüfgröße

Ablehnungsbereich

bestimmt durch

Chi-Quadrat-Tests

Satz von Karl Pearson I

X: Stichprobenvariable, die r > 2 verschieden Werte annehmen kann:

Die Verteilung von X ist durch einenWahrscheinlichkeitsvektor

gegeben.

Stichprobe vom Umfang n:

Satz von Karl Pearson II

Dann hat man:

Dabei ist:

1857 - 1936

Geboren in London. Er versuchte, statistische Methoden auf biologische Probleme der Ver-erbung und der Evolution anzuwenden. In 18Veröffentlichungen mit dem Titel „MathematicalContributions to the Theory of Evolution“ führteer die Regressions-Analyse, den Korrelationsko-effizienten und den Chi-Quadrat-Test ein.

1895 - 1980

Geboren in London als Sohn von Karl Pearson.Egon Pearson arbeitete ab 1921 im Institut seinesVaters am University College in London. Er be-suchte zunächst alle Vorlesungen seines Vaters mit dem Erfolg, dass er bald selbst hervorragende Arbei-ten auf dem Gebiet der Statistik produzierte. S. Neyman war 1925 - 26 als Stipendiat am UniversityCollege. Die Zusammenarbeit mit Egon Pearson begann.

Geboren in Bendery, Moldavien. Als Jerzy Neymansein Stipendium in London antrat, um mit KarlPearson zusammenzuarbeiten, war er enttäuscht als erfeststellte, dass Karl Pearson die moderne Mathematikignorierte. Er kooperierte dann mit Egon Pearson undrevolutionierte durch seine Ergebnisse die Statistik.

1876 - 1937

William Gosset, der unter dem Namen Student ver-öffentlichte, entdeckte die Gestalt der t-Verteilung(Student-Verteilung) durch eine Kombination mathe-matischer und empirischer Methoden. Er war Chemiker in der Guiness-Brauerei in Dublin 1899und erfand die t-Verteilung, um die Qualitätskontrolledurchführen zu können.

Chi-Quadrat-Testauf Anpassung

Hypothese

Ablehnungsbereich

Fairer Würfel?

Hypothese verwerfen!Hypothese verwerfen!

Chi-Quadrat-Verteilung

falsch0.831

Bakterielle InfektionBakterielle Infektiondurch Stämme I, II, IIIdurch Stämme I, II, III

Vermutung

Konkrete Stichprobe (80 Infektionen)

(siehe: Gelbrich)

Typ

Prozentsatz

I II III

30 50 20

Anzahl

I II IIITyp

30 32 18

Chi-Quadrat-Verteilung

falsch0.831

Mendelsche Gesetze

rund und gelbrunzeligrunzelig und gelbrund und grünrunzeligrunzelig und grün

0.56250.18750.18750.0625

rund und gelbrunzeligrunzelig und gelbrund und grünrunzeligrunzelig und grün

271889328

Prozentsätze nach der Theorie

Beobachtete Häufigkeiten

Summe 480

Chi-Quadrat-Verteilung

falsch0.831

Krankmeldungen

Wochentag Mo Di Mi Do Fr n

44 28 24 20 34 150 AnzahlKrankmeldungen

Chi-Quadrat-Verteilung

falsch0.831

Recommended