23
Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2 Abb. 1.1: Der Startbildschirm von STATISTICA. 1 Erste Schritte in STATISTICA Das Programm STATISTICA umfasst eine sehr große Sammlung statis- tischer Verfahren und grafischer Methoden, ist aber trotzdem ein sehr überschaubares und leicht bedienbares Programm geblieben. Dazu trägt auch die benutzerfreundliche Oberfläche bei, die den meisten Computeranwendern ohnehin durch EXCEL oder ähnliche Tabellen- kalkulationsprogramme vertraut erscheinen dürfte. Wie in Abbildung 1.1 angedeutet, verfügt das Tabellenblatt von STATISTICA über ähnliche Funktionen wie das von EXCEL. So kann man beispielsweise auch hier eine Reihe von Zahlen mittels Mauszeiger fortsetzen.

1 Erste Schritte in STATISTICA - hsu-hh.de · Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2 4 1 Erste Schritte

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

Abb. 1.1: Der Startbildschirm von STATISTICA.

1 Erste Schritte inSTATISTICA

Das Programm STATISTICA umfasst eine sehr große Sammlung statis-tischer Verfahren und grafischer Methoden, ist aber trotzdem einsehr überschaubares und leicht bedienbares Programm geblieben. Dazuträgt auch die benutzerfreundliche Oberfläche bei, die den meistenComputeranwendern ohnehin durch EXCEL oder ähnliche Tabellen-kalkulationsprogramme vertraut erscheinen dürfte.

Wie in Abbildung 1.1 angedeutet, verfügt das Tabellenblatt vonSTATISTICA über ähnliche Funktionen wie das von EXCEL. So kannman beispielsweise auch hier eine Reihe von Zahlen mittels Mauszeigerfortsetzen.

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

4 1 Erste Schritte in STATISTICA

Abb. 1.2: Öffnen der Datendatei.

Abweichend von EXCEL ist allerdings die Funktion von Zeilen undSpalten. Während bei EXCEL Zeilen und Spalten prinzipiell gleichwertigsind, sind in STATISTICA, wie bei einer Datenbank, die Spaltenden Zeilen übergeordnet. Jedoch erlaubt STATISTICA, bei Bedarf einTabellenblatt zu transponieren.

Die Spalten, hier Variablen genannt, bezeichnen verschiedene Merkmale,in den Zeilen, den Fällen, werden die einzelnen konkreten Messwertegesammelt. Ein Beispiel:

Beim innerdeutschen Vergleich der PISA-Studie (OECD PISA 2000,zusammengefasst vom Berliner Max-Planck-Institut für Bildungs-forschung 2002) wurde u. a. die Fähigkeit im Lesen, in der Mathematikund den Naturwissenschaften von Schülern der Jahrgangsstufe 9 in14 deutschen Bundesländern (ohne Hamburg und Berlin) gemessen.In diesem Fall wären Lesefähigkeit, Math. Fähigkeit und Naturwiss.Fähigkeit die drei Variablen, die Fälle würden mit den einzelnen Bundes-ländern bezeichnet und die jeweils erzielten Werte enthalten.

Nehmen wir dieses Beispiel, um uns ein wenig mit STATISTICA vertrautzu machen:

Die konkreten Daten befinden sich in der (Text-)Datei PISA.dat undmüssen erst in ein STATISTICA-Tabellenblatt importiert werden.1 Dazuwählt man wie gewohnt den Menüpunkt Datei → Öffnen, worauf einDialogfenster wie in Abbildung 1.2 erscheint. Nachdem man bei DateitypAlle Dateien eingestellt hat, wird die gesuchte Datei angezeigt und kannausgewählt werden.

1Es sei an dieser Stelle nochmals erwähnt, dass alle in diesem Text besprochenenDatensätze von der im Vorwort angegebenen Seite heruntergeladen werden können.

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

1 Erste Schritte in STATISTICA 5

Abb. 1.3: Die Datendatei als Tabelle importieren und Dateityp Auto wählen.

Im nächsten Dialog, vergleiche Abbildung 1.3, wählt man Als Tabelleimportieren und belässt es anschließend beim Dateityp Auto.

Nun öffnet sich das Fenster Textdatei öffnen aus Abbildung 1.4. Hiermüssen einige Einstellungen gemacht werden. Ein Blick in die DateiPISA.dat zeigt, dass sich über dem eigentlichen Datensatz ein paarZeilen mit einer kleinen Beschreibung befinden. Da der beschreibendeText nicht im Tabellenblatt erscheinen soll, beginnen wir den Importbei Zeile 4, welche die Bezeichnungen der späteren Variablen enthält.Wir machen einen Haken bei Variablennamen aus erster Zeile. Ebensoverfahren wir bei Fallnamen aus erster Spalte, damit die Fälle die Namender einzelnen Bundesländer tragen. Schließlich darf bei Feldtrennung(en)lediglich Tabulator markiert sein. Eine Auswahl von Komma würdedagegen dazu führen, dass die Kommazahlen in mehrere Spalten zerlegtwürden.

7LSS���Falls der Computer auf deutsche Sprache eingestellt ist, verwendet STATISTICAdie deutsche Schreibweise, insbesondere also das Komma als Dezimaltrennzeichen.In der Praxis hat man jedoch häufig Datensätze aus dem angloamerikanischenRaum vorliegen, die Punkte verwenden. Damit solche Daten importiert werdenkönnen, müssen bei den Versionen bis inkl. 6.1 vorher in einem Editor die Punktedurch Kommata ersetzt werden. Alternativ, aber wohl problematischer, kann inder Systemsteuerung unter Ländereinstellungen die Sprache geändert werden. SeitVersion 7 werden auch Punkte als Dezimaltrennzeichen erkannt. 66

7788VVeerrssiioonn

..11Neu ab Version 7 sind leicht modifizierte Dialoge zum Importvon Dateien, verglichen mit denen aus den Abbildungen 1.3 und 1.4.Nützlich sind dabei insbesondere einige weitere Optionen im DialogTextdatei öffnen aus Abbildung 1.4, wie etwa Voranst. Leerzeichenabschneiden oder Leere Zeilen ignorieren. Ferner erlaubt ein Häkchenbei Ansicht/Bearbeiten von Spaltentypen vor Import eine Vorschau aufdie von STATISTICA erstellten Variablen. •

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

6 1 Erste Schritte in STATISTICA

Abb. 1.4: Unter Textdatei öffnen müssen eine Reihe wichtiger Einstellungengemacht werden.

Nun ist es geschafft, und durch Klick in das weiße Feld links oben inder Tabelle kann diese markiert werden. Durch erneuten Klick mit derrechten Maustaste ins Tabellenblatt öffnet sich ein PopUp-Menü. Dortkann unter Format der Befehl Optimale Höhe/Breite betätigt werden,damit die Daten und Randbeschriftungen tatsächlich gut lesbar sind,vergleiche hierzu Abbildung 1.5.

Betrachten wir die Daten genauer: In den Disziplinen Lesen, Mathematikund Naturwissenschaften wurde jeweils der Anteil von Schülern anden Stufen 3 bis 5 gemessen, konkret: Wenn wir unter der RubrikLesen bei Baden-Württemberg eine 63,4 finden, so bedeutet dies, dass63,4 % aller dortigen Schüler der 9. Klasse über mittlere bis sehr guteLesekenntnisse verfügen. Wir wollen uns die Werte der Variablen Lesengrafisch veranschaulichen, und zwar mit Hilfe eines Balkendiagramms.Dazu wählen wir wie in Abbildung 1.6 den Menüpunkt Grafik → 2D-Grafiken → Balkenplots. Anschließend stellen wir wie in Abbildung 1.7Lesen Stufe 3-5 als Variable und horizontale Ausrichtung ein, undbetätigen dann den OK -Knopf. Nun wird eine Arbeitsmappe (Workbook)erstellt und die gewünschte Grafik in Selbige eingefügt. Das Ergebnis istin Abbildung 1.8 zu sehen.

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

1 Erste Schritte in STATISTICA 7

Abb. 1.5: Die gewünschten Daten wurden nun als Tabellenblatt importiert.

Abb. 1.6: Wir erstellen ein Balkendiagramm der Daten.

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

8 1 Erste Schritte in STATISTICA

Abb. 1.7: Als Variable wählen wir Lesen Stufe 3-5.

Balkenplot (Pisa 3v*14c)

Lesen Stufe 3-50 10 20 30 40 50 60 70

Baden-Württemberg

Bayern

Brandenburg

Bremen

Hessen

Mecklenburg-Vorpommern

Niedersachsen

Nordrhein-Westfalen

Rheinland-Pfalz

Saarland

Sachsen

Sachsen-Anhalt

Schleswig-Holstein

Thüringen

Abb. 1.8: Ein Balkendiagramm der Lesedaten.

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

1 Erste Schritte in STATISTICA 9

Abb. 1.9: Aktives Grafikmenü – Reaktivierung per Knopfdruck.

Links unten im STATISTICA-Fenster befindet sich nun ein Knopf,mit dem das Balkendiagramm-Menü mit den getroffenen Einstellungenwieder aktiviert werden kann, siehe Abbildung 1.9. Nach erneuter Akti-vierung können weitere Diagramme, etwa alle drei Disziplinen in einemmehrfachen Balkendiagramm, erstellt werden können. Dies sei dem Leserzur Übung empfohlen. Parallel dazu können auch beliebige weitereAnalysen gestartet werden, auch hier sei an die Experimentierfreude desLesers appelliert.

Bis zu dem Zeitpunkt, an dem wir die erstellte Arbeitsmappe zumersten Mal schließen, werden alle weiteren Analyseresultate, auch wennsie von anderen Datenblättern herrühren sollten, in dieser Arbeits-mappe abgelegt. Man erkennt dies zum Beispiel im Hintergrund vonAbbildung 2.2 auf Seite 15. Beim Abspeichern der Arbeitsmappebekommt diese die Dateiendung .stw.

7LSS���Setzt man zu einem späteren Zeitpunkt Analysen fort, die man gern in einerfrüheren Arbeitsmappe ablegen möchte, gibt es zwei Möglichkeiten: Entwederman analysiert wie gewohnt, öffnet am Ende die gewünschte Arbeitsmappe undzieht mit gedrückter Maustaste die Resultate in die Zielarbeitsmappe. Oder manwählt vor Beginn der Analysen den Punkt Datei → Ausgabemanager, woraufhinder Optionen-Dialog geöffnet wird, mit der Karte Ausgabemanager in Front.Dort wählt man Alle Ergebnisse (. . . ) in → Arbeitsmappen → BestehendeArbeitsmappe, und in letzterem Feld die gewünschte Zielarbeitsmappe. NachBestätigung mit OK werden alle weiteren Analyseresultate dort eingefügt.

Achtung! STATISTICA merkt sich diese Einstellung. Solange Sie daran nichtsändern, werden von nun an immer Resultate in genau dieser Arbeitsmappeabgelegt. 66

7788VVeerrssiioonn

..11Neu ab Version 7 ist die Möglichkeit, sog. Variablenbündel zudefinieren, und zwar immer vom Variablendialog einer Analyse aus. Beiaktuellen STATISTICA-Versionen verfügt dieser nämlich, im Gegensatzzu Abbildung 1.7, noch über den zusätzlichen Knopf [ Bündel ]. . . , nachdessen Betätigung sich der Variablenbündel-Manager öffnet. Hier kannman bestehende Bündel verändern, oder durch Klick auf Neu. . . einneues definieren. Im letztgenannten Fall muss man zuerst einen Namen

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

10 1 Erste Schritte in STATISTICA

für das Bündel angeben, anschließend erscheint ein Variablenauswahl-dialog wie in Abbildung 1.7. Hier wählt man die Variablen für das Bündelaus und bestätigt.

Zukünftig werden, wenn die Tabelle im .sta-Format ab Version 7gespeichert wird, im Variablendialog neben den Variablen selbst auch diedefinierten Bündel angezeigt. Klickt man auf ein solches, so werden aufeinen Schlag genau jene Variablen ausgewählt, die im Bündel vermerktsind. Gerade bei Dateien mit vielen Variablen, bei denen immer wiederdie gleiche Auswahl einer Analyse unterzogen wird, ist dies eine großeErleichterung. •

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

222 9 Konfidenzintervalle und stat. Testverfahren

9.7 Kruskal-Wallis- und Friedman-TestDie im vorigen Abschnitt 9.6 betrachtete ANOVA hat den Nachteil,dass sie an die vorliegenden Daten die Forderung nach Normalverteilungstellt. In vielen Fällen ist diese Forderung jedoch nicht einmal näherungs-weise erfüllt. Sind dann auch noch die Stichprobenumfänge klein, somüssen wir uns in einem solchen Fall nach einer Alternative umsehen.

Eine nichtparametrische Alternative ist der Kruskal-Wallis-Test. Dieserbetrachtet nicht die konkreten Realisierungen xi,j selbst, sondern nurihre jeweiligen Ränge ri,j .

Hintergrund 9.7.1 ��

��

�� ����

��

��

?? !!

��

!!

���

Seien y1, . . . , yN die realisierten Werte einer Stichprobe, und bezeichney(i,N) die i-größte Realisation, vgl. Anhang A.1.1 zu Ordnungsstatistiken.Nehmen alle yi verschiedene Werte an, d. h. gilt

y(1,N) < y(2,N) < . . . < y(i,N) < . . . < y(N,N),

so ist der Rang von y(i,N) gerade i.

Gibt es dagegen übereinstimmende Werte im Datensatz, und sind dieDaten angeordnet gemäß

y(1,N) ≤ . . . < y(i,N) = . . . = y(k,N) < . . . ≤ y(N,N),

so ordnet man einem jedem der y(i,N), . . . , y(k,N) den mittleren Rang i+k2

zu. ⋄

Voraussetzung 9.7.2

��

��

�� ����

��

��

?? !!

��

!!

���

Die Zufallsvariablen Xi,j , j = 1, . . . , ni, der i-ten Stichprobe besitzendie gleiche stetige Verteilung, i = 1, . . . , I. Es sei N := n1 + . . . + nI .Ferner sind alle Zufallsvariablen unabhängig voneinander. •

Es wird nun die Hypothese H0 untersucht, dass sogar alle Zufallsvariab-len ein und derselben Verteilung unterliegen, womit insbesondere auchihre Erwartungswerte übereinstimmen würden.

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

9.7 Kruskal-Wallis- und Friedman-Test 223

(a)

Am

thor

Muc

k

Mün

ter

Rei

ß

Sta

hl

Thi

ergä

rtne

r2,8

3,0

3,2

3,4

3,6

3,8

4,0

(b)

Bonferroni Test; Variable Urteil (Wein.sta)Homogene Gruppen, Alpha = ,05000Fehler: MQ(Zwischen) = ,13107, FG = 222,00

Zelle Nr.Prüfer Urteil

Mittel1 2

235416

Muck 3,036429 ****Münter 3,555333 ****

Stahl 3,559800 ****Reiß 3,584667 ****

Amthor 3,619714 ****Thiergärtner 3,625000 ****

(c)

Bonferroni Test; Variable Urteil (Wein.sta)Simultane KonfidenzintervalleFehler: MQ(Zwischen) = ,13107, FG = 222,00

Zelle Nr.versusZelle Nr

MittelDiffer.

StandardFehler

p -95,00%LSD KG

+95,00%LSD KG

1

2

3

4

5

2 0,583286 0,091792 0,000000 0,310912 0,8556603 0,064381 0,090076 1,000000 -0,202902 0,3316644 0,035048 0,081593 1,000000 -0,207063 0,2771585 0,059914 0,079788 1,000000 -0,176841 0,2966696 -0,005286 0,083794 1,000000 -0,253928 0,2433573 -0,518905 0,095131 0,000002 -0,801187 -0,2366234 -0,548238 0,087141 0,000000 -0,806812 -0,2896645 -0,523371 0,085454 0,000000 -0,776938 -0,2698056 -0,588571 0,089206 0,000000 -0,853272 -0,3238714 -0,029333 0,085332 1,000000 -0,282538 0,2238725 -0,004467 0,083608 1,000000 -0,252556 0,2436236 -0,069667 0,087439 1,000000 -0,329125 0,1897915 0,024867 0,074390 1,000000 -0,195872 0,2456066 -0,040333 0,078672 1,000000 -0,273777 0,1931106 -0,065200 0,076799 1,000000 -0,293085 0,162685

Abb. 9.11: Mittelwertvergleiche der Weinprüferdaten aus Beispiel 9.6.8.

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

224 9 Konfidenzintervalle und stat. Testverfahren

Hintergrund 9.7.3 ��

��

�� ����

��

��

?? !!

��

!!

���

Bezeichnet Ri,j den zufälligen (mittleren) Rang von Xi,j in der Gesamt-stichprobe, so definieren wir in Analogie zu Hintergrund 9.6.2 das Rang-Gesamtmittel R̄•• = 1

N

PIi=1

Pni

j=1 Ri,j = N+12

und das i-te Rang-Gruppenmittel R̄i• = 1

ni

Pnij=1 Ri,j . Die Zwischengruppen-Quadratsumme

SSA aus (9.13) ersetzen wir durch

SRSA =

IX

i=1

niX

j=1

(R̄i• − R̄••)2, (9.17)

und man kann zeigen:

Kruskal-Wallis-Test: Es gelte Voraussetzung 9.7.2. Ist die Hypothese H0

erfüllt, so ist

12

N(N + 1)· SRSA =

IX

i=1

niX

j=1

R̄2i• − 3 · (N + 1)

approximativ χ2-verteilt mit I − 1 Freiheitsgraden. ⋄

Bemerkung zu Hintergrund 9.7.3.

��

��

�� ����

��

��

?? !!

��

!!

���

Die beim Kruskal-Wallis-Test gemachte Approximation durch die χ2-Vertei-lung ist für praktische Bedürfnisse als hinreichend zu erachten, wenn gilt:

I = 2, n1, n2 ≥ 4, N ≥ 20, oder I = 3, n1, n2, n3 ≥ 5,

oder I ≥ 4, n1, . . . , nI ≥ 4.�

��

��

�� ����

��

��

?? !!

��

!!

��� Durchführung 9.7.4

Den eben besprochenen Kruskal-Wallis-Test findet man im MenüStatistik → Nichtparametrische Verfahren → Vergleich für mehrereunabhängige Stichproben (Gruppen). Dabei müssen die Daten infolgender Form vorliegen: In einer Variablen befinden sich alleDaten, in einer anderen die jeweiligen Gruppenzugehörigkeiten.Erstere Variable wählt man als Abhängige Variable, zweitere alsGruppierungsvariable. Anschließend drückt man auf Zusammen-fassung. •

Beispiel 9.7.5

��

��

�� ����

��

��

?? !!

��

!!

���Wenden wir dieses Verfahren nun ebenfalls auf die Weinprüferdatenaus Beispiel 9.6.4 an. Auch der Kruskal-Wallis-Test aus Abbil-dung 9.12 zeigt, dass die Hypothese, die Prüfer würden die Wein-sorten gleichartig bewerten, abzulehnen ist. Nach unseren Überlegun-gen aus Beispiel 9.6.4 sollten wir auch hier erneut das Testverfahren

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

9.7 Kruskal-Wallis- und Friedman-Test 225

Kruskal-Wallis ANOVA_; Gesamturteil (Wein.sta)Unabhängige (Grupp.) Variable: PrüferKruskal-Wallis-Test: H ( 5, N= 228) =39,87527 p =,0000

Abh.:Gesamturteil

Code GültigeN

Rang-summe

AmthorMuckMünterReißStahlThiergärtner

101 35 4557,000102 28 1239,000103 30 3503,500104 45 5555,000105 50 6003,000106 40 5248,500

Abb. 9.12: Kruskal-Wallis ANOVA der sechs Weinprüfer.

Kruskal-Wallis ANOVA_; Gesamturteil (Wein.sta)Unabhängige (Grupp.) Variable: PrüferKruskal-Wallis-Test: H ( 4, N= 200) =1,701151 p =,7905

Abh.:Gesamturteil

Code GültigeN

Rang-summe

AmthorMünterReißStahlThiergärtner

101 35 3722,500103 30 2807,500104 45 4478,500105 50 4811,000106 40 4280,500

Abb. 9.13: Kruskal-Wallis ANOVA von nur fünf der sechs Weinprüfer.

auf die fünf Prüfer ohne Muck anwenden (Abbildung 9.13). DasResultat zeigt, dass der Kruskal-Wallis-Test unserer Vermutung nichtwiderspricht, dass wenigstens die fünf übrigen Prüfer die von ihnengetesteten Weine auf ähnlichem Niveau bewerten. �

In den Abschnitten 9.6 und 9.7 gingen wir bisher davon aus, dass dieeinzelnen Stichproben, die es zu vergleichen gilt, voneinander unab-hängig sind. In den Abschnitten 9.1 und 9.2 hatten wir jedoch bereitseine Situation kennengelernt, bei der zwar zwei Stichproben vorlagenmit interner Unabhängigkeit, bei der jedoch zwischen den Stichprobeneine Abhängigkeit bestand. Diese wurde durch zusammengehörige Paare(matched pairs) verursacht, und es ist naheliegend, diese Situation aufmehr als zwei Stichproben zu verallgemeinern, so dass man allgemeinervon zusammengehörigen Tupeln sprechen könnte. Üblicher ist es jedoch,dies als Messwiederholungen zu bezeichnen, da eine solche Abhängigkeithäufig durch mehrfache Messungen an jeweils denselben Objektenentsteht. Beispielsweise werden mehrere Probanden, welche jeweilsunabhängig voneinander sind, wiederholt einer bestimmten Analyseunterzogen, etwa im Rahmen einer Langzeitstudie.

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

226 9 Konfidenzintervalle und stat. Testverfahren

Voraussetzung 9.7.6

��

��

�� ����

��

��

?? !!

��

!!

���

Die Zufallsvariablen Xi,j , j = 1, . . . , n, der i-ten Stichprobe besitzendie gleiche stetige Verteilung, i = 1, . . . , I. Es sei N := I · n. Fernersind alle Zufallsvektoren (X1,j, . . . , XI,j) unabhängig voneinander.Die Komponenten eines Vektors untereinander dagegen dürfen Ab-hängigkeiten aufweisen. •

Es wird nun die Hypothese H0 untersucht, dass sogar alle Zufalls-variablen ein und derselben Verteilung unterliegen.

Hintergrund 9.7.7 ��

��

�� ����

��

��

?? !!

��

!!

���

Bezeichnet Ri,j den zufälligen (mittleren) Rang von Xi,j im j-tenTupel (X1,j , . . . , XI,j), so definieren wir die Rang-Gesamtsumme R•• =Pn

j=1

PIi=1 Ri,j = nI(I+1)

2und die i-te Rang-Gruppensumme Ri• =

Pnj=1 Ri,j . Die mittlere Quadratsumme

MRSA =1

I

IX

i=1

(Ri• − 1IR••)

2 (9.18)

der Abweichungen zwischen den Messungen wird zur Definition einer Test-statistik verwendet:

Friedman-Test: Es gelte Voraussetzung 9.7.6. Ist die Hypothese H0

erfüllt, so ist

12

n(I + 1)· MRSA =

12

nI(I + 1)

IX

i=1

R2i• − 3n(I + 1)

approximativ χ2-verteilt mit I − 1 Freiheitsgraden. ⋄

Auch hier ist die Approximation durch die χ2-Verteilung wieder nur dannzulässig, wenn die Teilstichprobenumfänge groß genug sind, etwa n ≥ 10für I = 3 und n ≥ 5 für I ≥ 4.

��

��

�� ����

��

��

?? !!

��

!!

��� Durchführung 9.7.8

Der Friedman-Test ist analog zum Kruskal-Wallis-Test aus Durch-führung 9.7.4 implementiert, nur wählt man hierVergleich für mehrereabhängige Stichproben (Variablen). Dabei müssen die einzelnen Stich-proben in einzelnen Variablen vorliegen, so dass jede Zeile einzusammengehöriges Tupel beschreibt. Man wählt dann einfach alleVariablen aus und klickt auf Zusammenfassung. •

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

9.8 Die mehrfaktorielle Varianzanalyse (ANOVA) 227

(a)

Friedmans ANOVA und Kendalls Konkordanzkoeff.ANOVA Chi² (N = 35, FG = 3) = 63,41143 p = ,00000Konkordanz-Koeffizient = ,60392 Mittl. Rang r = ,59227

VariableMittl.Rang

Rang-summe

Mittelw. Stdabw.

Trunk1Trunk2Trunk3Trunk4

2,057143 72,0000 2,197609 0,1165062,057143 72,0000 2,189411 0,0908374,000000 140,0000 2,503286 0,1034291,885714 66,0000 2,187582 0,089164

(c)

Friedmans ANOVA und Kendalls Konkordanzkoeff.ANOVA Chi² (N = 35, FG = 2) = ,6857143 p = ,70974Konkordanz-Koeffizient = ,00980 Mittl. Rang r = -,0193

VariableMittl.Rang

Rang-summe

Mittelw. Stdabw.

Trunk1Trunk2Trunk4

2,057143 72,00000 2,197609 0,1165062,057143 72,00000 2,189411 0,0908371,885714 66,00000 2,187582 0,089164

(b) 1 2 3 41,8

1,9

2,0

2,1

2,2

2,3

2,4

2,5

2,6

2,7

2,8

Abb. 9.14: Friedman-Test und Boxplots zu Beispiel 9.7.9.

Beispiel 9.7.9

��

��

�� ����

��

��

?? !!

��

!!

���Die Datei Erfrischung.sta enthält (fiktive) Daten zu 35 Personen,welche jeweils vier verschiedene Erfrischungsgetränke testeten. Derenerfrischende Wirkung schlägt sich u. a. in der kurzfristigen Steigerungeines bestimmten Blutwertes nieder. Gibt es Unterschiede in derWirksamkeit der Getränke?

Um dies zu untersuchen, wird der Friedman-Test durchgeführt,welcher die Hypothese H0: ‘Alle Getränke wirken gleich’ prüft. DasResultat aus Abbildung 9.14 (a) zeigt, dass diese Hypothese abzu-lehnen ist. Ein Blick auf die Boxplots aus Abbildung 9.14 (b) machtdeutlich, dass dies wohl auf eine stärkere Wirkung von Getränk 3zurückzuführen ist. Zwischen der Wirksamkeit der Getränke 1, 2und 4 dagegen lässt sich kein signifikanter Unterschiede feststellen,siehe Abbildung 9.14 (c). �

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

12.1 Statistische Prozesskontrolle 337

12.1.5 Kontrollkarten für Messdaten: KomplexereAnsätze

In Abschnitt 12.1.3 beschäftigten wir uns mit den elementarstenArten von Kontrollkarten für Messdaten, den sog. Shewhartkarten.Charakteristisch für diese ist, dass die nacheinander aufgetragenenKontrollstatistiken vollkommen unabhängig voneinander sind, so dassdiese Karten, wenn man keine Verlaufsregeln berücksichtigt, völlig‘gedächtnislos’ sind. Deshalb wollen wir in diesem Abschnitt drei

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

338 12 Statistische Qualitätskontrolle und Six Sigma

populäre Kontrollkarten mit Gedächtnis vorstellen, d. h. Karten, derenKontrollstatistiken auch immer frühere Prozesswerte berücksichtigen. Essind dies die EWMA-Kontrollkarte, die Moving-Average-Kontrollkarteund die CUSUM-Karte. Auch diese Karten beschränken sich aufProzesse, die Voraussetzung 12.1.3.1 genügen, d. h. der beobachteteProzess (Xt)T ist univariat, und im Zustand statistischer Kontrolle wirdangenommen, dass der Prozess unabhängig und identisch verteilt (i. i. d.)ist mit Randverteilung N(µ0, σ0

2).

Beginnen wir mit der EWMA-Karte, wobei EWMA hier wieder alsKürzel für den in Abschnitt 11.4.1, Hintergrund 11.4.1.8, besprochenenAnsatz des einfachen exponentiell gewichteten gleitenden Durchschnittssteht. Die EWMA-Karte stellt eine Alternative zur X̄-Karte aus Hinter-grund 12.1.3.2 dar, d. h. sie ist geeignet, eine Änderung im Prozess-niveau µ0 festzustellen. Zur Kontrolle der Prozessstreuung dagegenmüssen wir weiterhin auf S- oder Moving-Range-Karte zurückgreifen,vgl. Hintergrund 12.1.3.12.

Hintergrund 12.1.5.1 ��

��

�� ����

��

��

?? !!

��

!!

���

Sei Xt,1, . . . , Xt,nt die zur Zeit t aufgenommene Teilstichprobe desProzesses vom Umfang nt. Zwar ist die EWMA-Karte in STATISTICAtatsächlich für beliebige nt implementiert, bei unserer Beschreibung derEWMA-Karte beschränken wir uns jedoch vereinfachend auf die Situationkonstanter Teilstichprobenumfänge nt = n, wobei auch n = 1 erlaubtist. Es bezeichne X̄t das zugehörige arithmetische Mittel, welches im Fallen = 1 gleich Xt ist. Im Zustand statistischer Kontrolle ist X̄t verteilt gemäßN(µ0,

σ02

n).

Als Kontrollstatistik betrachten wir nun, für gewähltes λ ∈ (0; 1),

Zt := (1 − λ) · Zt−1 + λ · X̄t, t ≥ 1, Z0 := µ0.

Dann besitzt auch Zt den Erwartungswert µ0, jedoch die Varianz

V [Zt] =σ2

0

n· λ

2 − λ·`

1 − (1 − λ)2t´ −→t→∞

σ20

n· λ

2 − λ.

Entsprechend konstruiert man in Phase II, wenn die Werte für µ0 und σ20

als bekannt angenommen werden, die EWMA-Karte mit k-σ-Grenzen wiefolgt:

UCLt = µ0 + k · σ0√n·q

λ2−λ

·`

1 − (1 − λ)2t´

,

Mittellinie = µ0,

LCLt = µ0 − k · σ0√n·q

λ2−λ

·`

1 − (1 − λ)2t´

.

In Phase I dagegen ersetzt man µ0 und σ0 durch die in Hintergrund 12.1.3.2diskutierten Schätzer.

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

12.1 Statistische Prozesskontrolle 339

Design einer EWMA-Karte: Da die Kontrollstatistik Zt nicht mehrnormalverteilt ist, ist die Wahl der symmetrischen k-σ-Grenzen wie auchdes konkreten Wertes von k durch andere Überlegungen zu rechtfertigen.Hierzu berechnet man approximativ ARLs für verschiedene Kombinationenvon (λ, k), und wählt dann solche Pärchen (λ, k) aus, für die sich gute ARL-Werte ergeben. Eine detaillierte Diskussion findet der Leser in Abschnitt8-2.2 bei Montgomery (2005), dort insbesondere Tabelle 8-10. Kurz gefasstlässt sich Folgendes sagen: Generell sollte λ zwischen 0,05 und 0,25gewählt werden, wobei kleine λ besser geeignet sind zur Entdeckung kleinerVerschiebungen des Prozessniveaus µ und umgekehrt. Für λ > 0,1 ist k = 3empfehlenswert, für λ ≤ 0,1 dagegen 2, 6 ≤ k ≤ 2, 8. (Montgomery, 2005,S. 411) ⋄

In Hintergrund 12.1.5.1 haben wir in der Rekursion von Zt als Para-meter λ gewählt, während wir in Hintergrund 11.4.1.8 α verwendethaben. Dies geschah nicht, um den Leser zu verwirren. Leider hatSTATISTICA in seiner Menüführung die Bezeichnung gewechselt. DieseRekursion jedenfalls, die ja die gesamte Prozessvergangenheit exponen-tiell gewichtet berücksichtigt, ist es, welche die EWMA-Karte zu einerKarte mit Gedächtnis macht.

��

��

�� ����

��

��

?? !!

��

!!

���Durchführung 12.1.5.2

Eine EWMA-Karte erstellt man in völliger Analogie zu Durch-führung 12.1.3.3, mit dem Unterschied, dass man nun

• EWMA X-quer & R-Karte wählt, um diese mit einer R-Karte zukombinieren, oder wenn n = 1 ist, oder

• EWMA X-quer & S-Karte wählt, um diese mit einer S-Karte zukombinieren, wobei n ≥ 2 sein muss.

Ferner muss man nun im Dialog Variablen für EWMA X-quer. . . imFeld Lambda Moving Average (. . . ) den Wert für λ eingeben. DenWert für k kann man erst anpassen, wenn man nachträglich dasEWMA-Menü erneut aktiviert. •

Bemerkung zu Durchführung 12.1.5.2.

��

��

�� ����

��

��

?? !!

��

!!

���

Standardmäßig gibt STATISTICA auch hier wieder Histogramme für dieEWMA-Karten mit aus, allerdings ist fraglich warum. Die einzelnen Zt sindnicht identisch normalverteilt, auf Grund der seriellen Abhängigkeit von (Zt)Tist seine Fähigkeit als Dichteschätzer ohnehin eingeschränkt.

Ferner bietet STATISTICA auch hier wieder die Überprüfung von Verlaufs-regeln an. Dies sollte man tunlichst unterlassen, da auf Grund der seriellenAbhängigkeit von (Zt)T diese ständig verletzt werden, was aber ganz normalist. �

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

340 12 Statistische Qualitätskontrolle und Six Sigma

02,1942,1952,1962,1972,1982,1992,2002,2012,2022,203

Histogr. gltd. Spannweiten

10 20 30 40 50 60

2,1979

2,2000

2,2021

Histogr. gltd. SpannweitenAbb. 12.13: EWMA-Karte zu Beispiel 12.1.5.3.

Beispiel 12.1.5.3

��

��

�� ����

��

��

?? !!

��

!!

���Setzen wir Beispiel 12.1.3.6 fort. Für die dortigen Fräsdaten (n = 1) inder Datei FraesenAb.sta sind die Werte µ0 = 2,20 und σ0 = 0,00491für den Kontrollzustand bekannt. Wir erstellen nun eine EWMA-Karte mit λ = 0,05, wobei wir entsprechend der Empfehlung vonMontgomery (2005) in Hintergrund 12.1.5.1 k = 2,7 wählen.

Das Resultat ist in Abbildung 12.13 wiedergegeben. Der Abwärts-trend, den wir schon in Beispiel 12.1.3.6 entdeckten, kommt hiernoch deutlicher zur Geltung. Die Kontrollgrenzen werden bereitsbei t = 45 verletzt, im Gegensatz zur Einzelwertkarte, wo dieserst bei t = 59 der Fall war. Somit scheint die EWMA-Karte klarüberlegen. Berücksichtigt man bei der Einzelwertkarte jedoch auchVerlaufsregeln, siehe Beispiel 12.1.3.9, was bei der EWMA-Kartenicht möglich ist, dann relativiert sich dieser Vorteil wieder, dennbereits zwischen t = 39 und t = 42 wird ein erstes kritisches Musterentdeckt. Da jedoch Verlaufsregeln schwerer manuell nachzuprüfensind, bleibt zumindest ein praktischer Vorteil auf Seiten der EWMA-Karte. �

Auch die Moving-Average-Karte wird, genau wie die EWMA-Karte,durch ein Glättungsverfahren der Zeitreihenanalyse motiviert, und zwardurch den einfachen gleitenden Durchschnitt, siehe Hintergrund 11.4.1.5.Hierzu muss man die Länge w des Fensters angeben, welches über dieProzessdaten gleitet, und als Kontrollstatistik wird entsprechend derMittelwert des Fensterinhaltes betrachtet. Somit besitzt auch diese Karteein Gedächtnis, in diesem Fall der Länge w − 1.

Hintergrund 12.1.5.4 ��

��

�� ����

��

��

?? !!

��

!!

���

Sei Xt,1, . . . , Xt,nt die zur Zeit t aufgenommene Teilstichprobe des Prozes-ses vom Umfang nt. Zwar ist die Moving-Average-Karte in STATISTICA

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

12.1 Statistische Prozesskontrolle 341

tatsächlich für beliebige nt implementiert, bei unserer Beschreibung derMoving-Average-Karte beschränken wir uns jedoch vereinfachend auf dieSituation konstanter Teilstichprobenumfänge nt = n, wobei auch n = 1erlaubt ist. Es bezeichne X̄t das zugehörige arithmetische Mittel, welchesim Falle n = 1 gleich Xt ist. Im Zustand statistischer Kontrolle ist X̄t

verteilt gemäß N(µ0,σ0

2

n).

Als Kontrollstatistik betrachten wir nun, für gewählte Fensterlänge w ∈ N,

Zt :=

(

1t· (X̄1 + . . . + X̄t), t < w,

1w· (X̄t−w+1 + . . . + X̄t), t ≥ w.

Dann ist Zt selbst ebenfalls normalverteilt, und zwar gemäß N(µ0,σ0

2

n·t ),

falls t < w, und gemäß N(µ0,σ0

2

n·w ), falls t ≥ w. Allerdings sind, genauwie bei der EWMA-Karte auch, die einzelnen Zt nun seriell abhängig, sodass eine Überprüfung von Verlaufsregeln wenig Sinn macht und auch dasHistogramm mit Vorsicht zu genießen ist.

In Phase II, wenn die Werte für µ0 und σ20 als bekannt angenommen

werden, konstruiert man die Moving-Average-Karte mit k-σ-Grenzen mitMittellinie bei µ0 und Kontrollgrenzen

UCLt =

(

µ0 + k · σ0√n·t , t < w,

µ0 + k · σ0√n·w , t ≥ w,

LCLt =

(

µ0 − k · σ0√n·t , t < w,

µ0 − k · σ0√n·w , t ≥ w.

In Phase I dagegen ersetzt man µ0 und σ0 durch die in Hintergrund 12.1.3.2diskutierten Schätzer.

Design einer Moving-Average-Karte: Da die Kontrollstatistik Zt

erneut normalverteilt ist, ist die Wahl der symmetrischen k-σ-Grenzengerechtfertigt, alternativ können auch quantilbasierte Grenzen konstruiertwerden. Bezüglich der Fensterlänge gilt, dass zur Entdeckung kleiner Shiftseher große Fensterlängen zu empfehlen sind, für große Shifts dagegen kleine.(Montgomery, 2005, S. 417) ⋄

Obwohl die Kontrollstatistik Zt der Moving-Average-Karte gegenüberjener der EWMA-Karte den Vorteil hat, dass im Kontrollzustand ihreexakte Verteilung von einfacherer Gestalt ist als die der EWMA-Statistik, wird in der Praxis die EWMA-Karte bevorzugt, wohl insbe-sondere wegen der leichteren Implementierung. Schließlich muss bei derEWMA-Karte nur ein Wert im Arbeitsspeicher verbleiben, und nichtw − 1 wie bei der Moving-Average-Karte.

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

342 12 Statistische Qualitätskontrolle und Six Sigma

02,1802,1852,1902,1952,2002,2052,2102,2152,220

Histogr. gltd. Spannweiten

10 20 30 40 50 60

2,1934

2,2000

2,2066

Histogr. gltd. SpannweitenAbb. 12.14: Moving-Average-Karte mit w = 5 zu Beispiel 12.1.5.6.

��

��

�� ����

��

��

?? !!

��

!!

��� Durchführung 12.1.5.5

Eine Moving-Average-Karte erstellt man in völliger Analogie zuDurchführung 12.1.3.3, mit dem Unterschied, dass man nun

• MA X-quer & R-Karte wählt, um diese mit einer R-Karte zukombinieren, oder wenn n = 1 ist, oder

• MA X-quer & S-Karte wählt, um diese mit einer S-Karte zukombinieren, wobei n ≥ 2 sein muss.

Ferner muss man nun im Dialog Variablen für MA X-quer. . . im FeldMoving Average Spanne den Wert für w eingeben. Den Wert für kkann man erst anpassen, wenn man nachträglich das Moving-Average-Menü erneut aktiviert. •

Bemerkung zu Durchführung 12.1.5.5.

��

��

�� ����

��

��

?? !!

��

!!

���

Erstellt man, bei gewählter Fensterlänge w, eine Moving-Average-Karte gemäßDurchführung 12.1.5.5, so werden, wie in Hintergrund 12.1.5.4 beschrieben,die Kontrollgrenzen korrekt berechnet und angegeben für alle t. Leider jedochwerden die Kontrollstatistiken nur für t ≥ w berechnet und aufgetragen. Somitist mit den bei STATISTICA implementierten Moving-Average-Karten eineKontrolle der ersten w − 1 Werte nicht möglich. �

Beispiel 12.1.5.6

��

��

�� ����

��

��

?? !!

��

!!

���Setzen wir Beispiel 12.1.3.6 bzw. 12.1.5.3 fort; es ist n = 1,µ0 = 2,20 und σ0 = 0,00491. Wir erstellen zwei Moving-Average-Karten mit diesen Vorgaben, einmal mit Fensterlänge w = 5, sieheAbbildung 12.14, dann mit w = 20, siehe Abbildung 12.15. Offenbar

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

12.1 Statistische Prozesskontrolle 343

02,1802,1852,1902,1952,2002,2052,2102,2152,220

Histogr. gltd. Spannweiten

10 20 30 40 50 60

2,19672,20002,2033

Histogr. gltd. SpannweitenAbb. 12.15: Moving-Average-Karte mit w = 20 zu Beispiel 12.1.5.6.

erkennt die Karte mit w = 20 den Abwärtstrend wesentlich früher,übrigens nicht so früh wie obige EWMA-Karte, siehe Beispiel 12.1.5.3.Jedoch erkauft man sich diesen Vorteil bei STATISTICA damit, dasssich die ersten 19 Werte jeglicher Kontrolle entziehen. �

Die CUSUM-Kontrollkarte9 wird motiviert insbesondere durch dieSchwäche der X̄- bzw. Einzelwertkarte beim Erkennen kleiner Verschie-bungen im Prozessniveau µ, zumindest wenn keine Verlaufsregelnberücksichtigt werden. Die grundlegende Idee hierbei ist, dass sich vielekleine Abweichungen zu einer großen addieren. Die Anwendung dertabellarischen CUSUM-Karte, wie sie bei STATISTICA implementiertist, beschränkt sich dabei auf einen Prozess mit Einzelwerten, d. h. wirbetrachten (Xt)T selbst, ohne dass wir Teilstichproben ziehen.

Hintergrund 12.1.5.7 ��

��

�� ����

��

��

?? !!

��

!!

���

Vom Prozess (Xt)T wird angenommen, dass er im Kontrollzustand un-abhängig und identisch verteilt ist mit Randverteilung N(µ0, σ0

2), sieheVoraussetzung 12.1.3.1. In Phase II, wenn die Werte für µ0 und σ2

0 alsbekannt angenommen werden, sind die Kontrollstatistiken Ct

+ und Ct−

definiert als

C+t = max

`

0 ; (Xt − µ0) − ǫ + C+t−1

´

, C+0 := 0,

C−t = min

`

0 ; (Xt − µ0) + ǫ + C−t−1

´

, C−0 := 0.

Zur Interpretation betrachten wir die Statistik Ct+ etwas ausführlicher:

Der Wert von Ct+ wächst gegenüber dem von Ct−1

+ immer dann an,wenn Xt um mehr als ǫ größer als µ0 ist. Um hierbei den Toleranz-parameter ǫ zu bestimmen, folgt STATISTICA einer Empfehlung vonMontgomery (2005) und erwartet die Vorgabe eines kritischen Shifts vomBetrage δ ·σ0, den es auf jeden Fall zu entdecken gilt; es ist dann ǫ := δ

2·σ0.

9Cumulated Sum.

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

344 12 Statistische Qualitätskontrolle und Six Sigma

Die tabellarische CUSUM-Karte wird nun wie folgt konstruiert: Man wähle

Mittellinie = 0, UCL = k · σ0, LCL = −k · σ0,

und trage zur Zeit t auf die entsprechend konstruierte Karte nun jeneder beiden Statistiken Ct

+ und Ct− auf, die stärker von der 0 abweicht.

Per Definition sind die aufgetragenen Kontrollstatistiken wieder seriellabhängig, so dass eine Überprüfung der Verlaufsregeln nicht sinnvoll ist,auch ein Histogramm ist wenig hilfreich. In Phase I ersetzt man µ0 und σ0

durch die in Hintergrund 12.1.3.2 diskutierten Schätzer.

Design einer CUSUM-Karte: Wenn durch äußere Gegebenheiten nichtanders erforderlich, ist bei der Wahl des kritischen Shifts ein Wert δ = 1,also ǫ = σ0

2, empfehlenswert. Bei den k-σ-Grenzen sollte k zwischen 4 und 5

gewählt werden. Diese Ratschläge beruhen auf ARL-Überlegungen, wie beider EWMA-Karte auch, siehe Hintergrund 12.1.5.1. (Montgomery, 2005,S. 395ff) ⋄

��

��

�� ����

��

��

?? !!

��

!!

��� Durchführung 12.1.5.8

Eine CUSUM-Karte erstellt man in völliger Analogie zu Durch-führung 12.1.3.3, mit dem Unterschied, dass man nun CUSUM-KarteEinzelwerte wählen muss, vorerst nur die Variable auswählt undOK klickt. Neben einer auf Schätzwerten basierenden CUSUM-Kartewird auch eine Moving-Range-Karte mit ausgegeben, siehe Hinter-grund 12.1.3.12.

Die Werte für δ, µ0, σ0 und k kann man erst anpassen, wenn mannachträglich das CUSUM -Menü erneut aktiviert. Ersteres gibt manauf der Karte Karten unter Entdecke Shift ab ein, die Übrigen wiegewohnt auf der Karte X (MA..) Einst.. •

Beispiel 12.1.5.9

��

��

�� ����

��

��

?? !!

��

!!

���Setzen wir die Beispiele 12.1.3.6, 12.1.5.3 und 12.1.5.6 fort; es ist µ0 =2,20 und σ0 = 0,00491. In Abbildung 12.16 ist eine CUSUM-Kartemit δ = 1 und k = 5 zu sehen; offenbar erkennt diese ab t = 45 denAbwärtstrend als kritisch. Die Sensibilität der CUSUM-Karte kannerhöht werden, indem man beispielsweise den Toleranzparameterverkleinert. Bei der CUSUM-Karte in Abbildung 12.17 wurde δ = 1

2und k = 5 gewählt, entsprechend wird der Abwärtstrend bereitsbei t = 41 erkannt. Es sollte aber beachtet werden, dass mansich eine erhöhte Sensibilität auch mit erhöhten Raten falscherAlarmmeldungen erkauft. �

Christian Weiß. Datenanalyse und Modellierung mit STATISTICA. Oldenbourg Wissenschaftsverlag 2006. ISBN 3-486-57959-2

12.1 Statistische Prozesskontrolle 345

0-0,10

-0,08

-0,06

-0,04

-0,02

0,00

0,02

0,04

Histogr. gltd. Spannweiten

10 20 30 40 50 60

-,02455

0,0000

,02455

Histogr. gltd. SpannweitenMoving R: ,00576 (,00554); Sigma: ,00435 (,00419); N: 1,Abb. 12.16: CUSUM-Karte mit δ = 1 und k = 5 zu Beispiel 12.1.5.9.

0-0,14-0,12-0,10-0,08-0,06-0,04-0,020,000,020,04

Histogr. gltd. Spannweiten

10 20 30 40 50 60

-,02455

0,0000

,02455

Histogr. gltd. SpannweitenMoving R: ,00576 (,00554); Sigma: ,00435 (,00419); N: 1,Abb. 12.17: CUSUM-Karte mit δ = 12

und k = 5 zu Beispiel 12.1.5.9.

11