24
Statistik II f¨ ur Betriebswirte Vorlesung 4 Dr. Andreas W¨ unsche TU Bergakademie Freiberg Institut f¨ ur Stochastik 5. November 2018 Dr. Andreas W¨ unsche Statistik II f¨ ur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 1

Statistik II für Betriebswirte Vorlesung 4 · Statistik II fur Betriebswirte Vorlesung 4 Dr. Andreas W unsche TU Bergakademie Freiberg Institut f ur Stochastik 5. November 2018 Dr

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Statistik II fur BetriebswirteVorlesung 4

Dr. Andreas Wunsche

TU Bergakademie FreibergInstitut fur Stochastik

5. November 2018

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 1

5. Varianzanalyse

I ”ANOVA” – ”Analysis of Variance”.I Die Varianzanalyse wurde ursprunglich von Sir R.A. Fisher

(1890-1962) fur die landwirtschaftliche Versuchstechnik entwickeltund findet heute Anwendung in ganz verschiedenen Gebieten.

I Sie gestattet es, den Einfluss eines qualitativen Merkmales (hierFaktor genannt), auf ein quantitatives oder messbares Merkmal zuuntersuchen (Verallgemeinerung des doppelten t−Tests zumVergleich von Mittelwerten zweier unabhangiger Stichproben ausnormalverteilten Grundgesamtheiten).

I Unterteilungen:I Modell mit festen Effekten, Modell I;

Modell mit zufalligen Effekten, Modell II;Modell mit festen und zufalligen Effekten, Modell III;

I einfache Klassifikation, einfaktorielle Varianzanalyse;zweifache Klassifikation, zweifaktorielle Varianzanalyse; . . . ;

I eindimensionale oder univariate Varianzanalyse (ANOVA);mehrdimensionale oder multivariate Varianzanalyse (MANOVA) .

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 2

5.1 Einfache Varianzanalyse

I Frage: Wie stellt man fur ein zufalliges Merkmal X anhandeiner Stichprobe fest, ob dieses Merkmal von einem Faktor Aabhangt, der in mehreren Stufen (Auspragungen) auftritt ?

I Antwort: Man untersucht die Variabilitat des Merkmals:

Uberwiegt die Variabilitat zwischen den Gruppen (die durch jeweilseine Stufe des Faktors A erzeugt werden) im Vergleich zu derVariabilitat innerhalb der Gruppen, dann ist die Entscheidung fur dieUngleichheit der Erwartungswerte und damit fur einen Einfluss derFaktorstufe begrundet.

I Beispiele:I X Produktion eines Gutes, A verschiedene Maschinen;

I X Umsatz einer Firma, A verschiedene Regionen;

I X Kenngroße fur die Wirkung eines Medikaments (einerBehandlung), A verschiedene Medikamente (Behandlungen).

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 3

Datenschema

I Datenschema:Gruppen (Stufen)

j\i 1 . . . p

1 x11 . . . xp12 x12 . . . xp2...

.... . .

...

x1n1 . . ....

xpnpni n1 . . . npxi• x1• . . . xp•x i• x1• . . . xp•

I ni Gruppenumfang, xi• Gruppensumme, x i• Gruppenmittel .

I Gilt n1 = . . . = np , dann heißt der Versuchsplan balanciert oderorthogonal, ansonsten unbalanciert oder nichtorthogonal .

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 4

Beispielaufgabe

I Es soll die Abhangigkeit der Ernteertrage einer bestimmtenGetreidesorte von unterschiedlichen Dungemitteln D1, . . . ,Dk

untersucht werden.

I Jedes Dungemittel Di wird auf ni gleich großen Feldernangewendet.

I Xij bezeichne den Ertrag (in kg) vom j−ten Feld, welches mit demi−ten Dungemittel gedungt wurde.

I Es soll festgestellt werden, ob ein signifikanter Einfluss desverwendeten Dungemittels auf den Ernteertrag besteht.

I Merkmal X : Ernteertrag.

I Faktor A : Dungemittel mit den Faktorstufen”ohne“, D1 , . . . , Dk .

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 5

Beispiel 5.1: Dungemittel

Dungemittelohne D1 D2 D3 D4

xij

66 60 64 97 9068 35 79 99 7942 51 72 64 8756 69 82 91 71

ni 4 4 4 4 4

xi• 232 215 297 351 327

x i• 58.00 53.75 74.25 87.75 81.75

(Quelle: J. Lehn, H. Wegmann: Einfuhrung in die Statistik, B. G.Teubner Verlag, 2006, Beispiel 3.61.)

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 6

Allgemeines Modell

Xij = µi + εij , i = 1, . . . , p, j = 1, . . . , ni , mit

Xij j−te Merkmalszufallsgroße fur i−te Stufe;

µi Erwartungswert des Merkmals auf Stufe i ;

εij zufalliger Fehler;

Hypothesen:

I H0 : µ1 = . . . = µp .

I HA : µi 6= µk fur mindestens ein Paar i 6= k .

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 7

Allgemeines Modell (mit Effekten)

Xij = µ+ αi + εij , i = 1, . . . , p, j = 1, . . . , ni , mit

µ allgemeiner Erwartungswert ;

αi = µi − µ fester Effekt (systematische Komponente) der Stufe i ;

mit

p∑i=1

niαi = 0 der Reparametrisierungsbedingung .

Hypothesen:

I H0 : α1 = . . . = αp = 0 .

I HA : αi 6= 0 fur mindestens ein i .

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 8

Hypothesen und Voraussetzungen fur den F−Test

I Hypothese H0 : µ1 = . . . = µp (bzw. α1 = . . . = αp = 0) .

I Hypothese HA : µi 6= µk fur mindestens ein Paar i 6= k(bzw. αi 6= 0 fur mindestens ein i) .

I Voraussetzungen fur den F−Test:

I die Merkmalszufallsgroßen Xij sind unabhangig und normalverteiltmit Erwartungswert µi fur die i−te Stufe jeweils (und damit sind diezufalligen Fehler εij unabhangig und normalverteilt mitErwartungswert 0);

I die Varianzen der Merkmalszufallsgroßen Xij (und damit derzufalligen Fehler εij) sind alle gleich groß,

VarXij = Varεij = σ2, i = 1, . . . , p, j = 1, . . . , ni ;

I die Varianz σ2 der einzelnen Merkmalszufallsgroßen muss nichtbekannt sein.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 9

Hilfsgroßen fur den Test

I X i• =1

ni

ni∑j=1

Xij Mittelwert der i−ten Stufe (i = 1, . . . , p) .

I X •• =1

N

p∑i=1

ni∑j=1

Xij totaler Mittelwert.

I SSA =

p∑i=1

ni(X i• − X ••

)2Summe der Abweichungsquadrate

zwischen den Gruppen, charakterisiert die Variabilitat zwischen denStufen (Gruppen), (”Sum of Squares for Factor A”), manchmalauch ”SST” (”Sum of Squares for Treatments”) genannt.

I SSR =

p∑i=1

ni∑j=1

(Xij − X i•

)2Summe der Abweichungsquadrate

innerhalb der Gruppen, charakterisiert die Variabilitat innerhalb derStufen (Gruppen), (”Sum of Squares for Residuals”), auch ”SSE”(”Sum of Squares for Errors”) genannt.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 10

Testgroße und kritischer Bereich

I MSA =SSA

p − 1(”Mean Square for Factor A”), auch ”MST”

(”Mean Square for Treatments”) genannt.

I MSR =SSR

N − p(”Mean Square for Residual”), auch ”MSE”,

(”Mean Square for Errors”) genannt.

I Testgroße: T =MSA

MSR.

I Kritischer Bereich: K = {t ∈ R : t > Fp−1;N−p;1−α} mit demQuantil der F−Verteilung mit (p − 1;N − p) Freiheitsgraden (FG).

I Bemerkung: Es gilt fur die Totalvariabilitat SST (”Sum ofSquares Total”) die sogenannte

”Streuungszerlegung“:

SST =

p∑i=1

ni∑j=1

(Xij − X ••

)2= SSA + SSR .

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 11

ANOVA-Tabelle (ANOVA-Tafel)

Quelle der Freiheits- Summe der MittlereVariation grade Quadrate Quadrate Testgroße

Streuung

zwischen p − 1 SSA MSA = SSAp−1 T = MSA

MSR

der Stufen(Faktor A)

Streuung

innerhalb N − p SSR MSR = SSRN−p

der Stufen(Rest)

Gesamt-streuung N − 1 SST

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 12

ANOVA in Statgraphics fur Beispiel 5.1 Ernteertrage

Compare → Analysis of Variance → One-Way ANOVA...

ANOVA Table for Ertrag by Düngemittel

Source Sum of Squares Df Mean Square F-Ratio P-Value

Between groups 3492,8 4 873,2 5,81 0,0050

Within groups 2253,0 15 150,2

Total (Corr.) 5745,8 19

ANOVA Table for Ertrag by Düngemittel

Source Sum of Squares Df Mean Square F-Ratio P-Value

Between groups 3492,8 4 873,2 5,81 0,0050

Within groups 2253,0 15 150,2

Total (Corr.) 5745,8 19

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 13

ANOVA in Statgraphics (Zweite Moglichkeit)

Compare → Multiple-Samples → Multiple-Sample Comparsion...Wenn sich die Daten fur jede Gruppe in einer separaten Spalte befinden,gelangt man nur uber diesem Weg zur ANOVA-Tabelle. Im Beispiel 5.1liegen die Daten aber in einer Spalte (Ertrag) vor. Daneben gibt es dieSpalte Dungemittel. In dieser ist angegeben zu welchen Dungemittel(Level Codes) der Ertrag gehort.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 14

Der Kruskal-Wallis-Test

I Sind die Merkmalszufallsgroßen nicht normalverteilt, dann kann manmit dem Kruskal-Wallis-Test (auch H−Test) die Gleichheit derMediane (bzw. die Gleichheit der Verteilungsfunktionen) derMerkmalszufallsgroßen zu den einzelnen Stufen des Faktors Auberprufen.

I Der Kruskal-Wallis-Test ist eine Verallgemeinerung desWilcoxon-Rangsummentests auf den Fall von mehr als 2unabhangigen Stichproben.

I Voraussetzung: die Merkmalszufallsgroßen haben eine stetigeVerteilung.

I Bezeichnungen:p Anzahl der Stufen (Gruppen);ni Anzahl der Beobachtungswerte in der Stufe i , i = 1, . . . , p ;

N Gesamtanzahl der Beobachtungswerte, N =p∑

i=1ni .

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 15

Vorgehen beim Kruskal-Wallis-Test

I In der gemeinsamen Stichprobe (alle p Gruppen, Stichproben)werden die Range bestimmt.

rij sei die Rangzahl der j−ten Beobachtung in der i−ten Stufe,i = 1, . . . , p , j = 1, . . . , ni .

I Bei der Bestimmung der Rangzahlen achtet man auf moglicherweiseauftretende Bindungen (mehrfach auftretende Werte in dergemeinsamen Stichprobe).Es bezeichneg die Anzahl der auftretenden Bindungen;th die Anzahl der ubereinstimmenden Beobachtungswerte

in der h−ten Bindung, h = 1, . . . , g .

I Man berechnet die Summe der Range in der Stufe i fur allei = 1, . . . , p , diese wird mit ri• bezeichnet.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 16

Testgroße und kritischer Bereich beim Kruskal-Wallis-Test

I Testgroße:

T =1

B

[12

N(N + 1)

p∑i=1

1

nir2i• − 3(N + 1)

]

mit B = 1− 1

N3 − N

g∑h=1

(t3h − th) ,

dabei ist1

Bein Korrekturfaktor, falls Bindungen vorkommen,

kommen keine Bindungen vor, setzt man B = 1 .

I Kritischer Bereich: K = {t ∈ R : t > χ2p−1;1−α} .

I Der angegebene kritische Bereich beruht wieder auf einerasymptotischen Verteilung, er gilt nur naherungsweise.

Als Faustregel kann man mit ihm rechnen, falls alle ni > 5 sind(fur p = 3 sollte allerdings mindestens ein ni > 8 sein).

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 17

Beispiel 5.2: Zugfestigkeit von 3 Drahtsorten

Drahtsorte

1 2 3j\i x1j r1j x2j r2j x3j r3j1 9.0 7 7.3 4.5 18.0 192 15.4 16 15.6 17 9.6 83 8.2 6 14.2 13 11.5 114 3.9 2 13.0 12 19.4 215 7.3 4.5 6.8 3 17.1 186 10.8 10 9.7 9 14.4 157 3.8 1 19.4 218 19.4 219 14.3 14

ri• 46.5 58.5 148.0

Quelle: nach J. Hartung, Statistik: Oldenbourg Verlag, 2009, Kap. XI,Abschnitt 1.1.A .

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 18

Kruskal-Wallis-Test fur Beispiel 5.2

I B = 1− 1

223 − 22((23 − 2) + (33 − 3)) = 0.9971767 .

I Wert der Testgroße:

t =1

0.9971767

[12

22 · 23·(

46.52

7+

58.52

6+

1482

9

)− 3 · 23

]= 9.597 .

I Kritischer Bereich (α = 0.05) :

K =(χ22;0.95; +∞

)= (5.99; +∞) .

I Testentscheidung: t ∈ K , die Nullhypothese uber die Gleichheitder Erwartungswerte wird abgelehnt.

I Testergebnis: Die drei Drahtsorten unterscheiden sich, beimSignifikanzniveau von 5%, hinsichtlich der (erwarteten) Zugfestigkeitsignifikant voneinander.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 19

Statgraphics fur Beispiel 5.2

Compare → Multiple-Samples → Multiple-Sample Comparsion...Kruskal-Wallis Test

Sample Size Average Rank

Drahtsorte1 6 6,41667

Drahtsorte2 6 8,58333

Drahtsorte3 6 13,5

Test statistic = 5,55251 P-Value = 0,0622712

Kruskal-Wallis Test

Sample Size Average Rank

Drahtsorte1 6 6,41667

Drahtsorte2 6 8,58333

Drahtsorte3 6 13,5

Test statistic = 5,55251 P-Value = 0,0622712

Hier befinden sich die Daten in der Statgraphics-Datendatei fur jedeGruppe (Drahtsorte1,. . . ,Drahtsorte3) in einer separaten Spalte.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 20

Statgraphics-Ausgabe fur Beispiel 5.2

Statgraphics-Ausgabe:

Kruskal-Wallis Test

Sample Size Average Rank

Drahtsorte1 7 6,64286

Drahtsorte2 6 9,75

Drahtsorte3 9 16,4444

Test statistic = 9,59735 P-Value = 0,00824067

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 21

Paarweise Tests

I Sind die Mittelwerte von p unabhangigen Stichproben signifikantunterschiedlich (global) und mochte man zusatzlich herausfinden,welche Mittelwerte paarweise verschieden sind, bedient man sich derpaarweisen Vergleiche.

I Die bekanntesten Verfahren fur normalverteilte Stichproben mitubereinstimmender Varianz sind der Scheffe-Test und derTukey-Test.

I Der Scheffe-Test ist flexibler, der Tukey-Test besitzt eine hohereGute.

I Statgraphics: Compare → Analysis of Variance → One-WayANOVA... , dann im Auswahlfenster fur Tables and Graphs unterTABLES Multiple Range Tests aktivieren;

durch Rechtsklick im Ergebnisfenster fur die Multiple Range Tests→ Pane-Options... kann man das Testverfahren auswahlen.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 22

Signifikanzniveau bei paarweisen Vergleichen

I Fur die paarweisen Tests gibt es 2 mogliche Bedeutungen fur dasSignifikanzniveau α :

I globales Niveau: die Wahrscheinlichkeit mindestens eine wahreHypothese Hkl

0 : µk = µl abzulehnen, unter der Voraussetzung,dass die Globalnullhypothese richtig ist (d.h. alle Einzelnullhypothesenwahr sind), ist ≤ α ;

I multiples Niveau: die Wahrscheinlichkeit mindestens eine wahreHypothese Hkl

0 abzulehnen, unabhangig davon, wieviele und welcheder Einzelnullhypothesen wahr sind, ist ≤ α .

I Sowohl der Scheffe-Test, als auch der Tukey-Test halten multiplesNiveau, allerdings ist der Scheffe-Test konservativer, d.h. er erkenntweniger Unterschiede als signifikant; deshalb ist der Tukey-Testvorzuziehen.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 23

Weitere Bemerkungen

I Zur Uberprufung der Annahme uber die Gleichheit der p Varianzenkann unter anderem der Bartlett-Test verwendet werden (beiungleichen Stichprobenumfangen ni und normalverteiltenGrundgesamtheiten; siehe Literatur, z.B. Storm, Abschnitt 14.2.5oder Hartung, Kap. XI, Abschnitt 1.3.).

I Ein weiterer Test fur dieses Problem ist z.B. der Levene-Test .

I Statgraphics: Compare → Analysis of Variance → One-WayANOVA... , dann im Auswahlfenster fur Tables and Graphs unterTABLES Variance Check aktivieren;

durch Rechtsklick im Ergebnisfenster fur die Variance Check →Pane-Options.... kann man das Testverfahren auswahlen.

Dr. Andreas Wunsche Statistik II fur Betriebswirte Vorlesung 4 Version: 30. Oktober 2018 24