Upload
phamthien
View
212
Download
0
Embed Size (px)
Citation preview
Manfred Kiihlmeyer
Statistische Auswertungsmethoden fiir Ingenieure
Springer-Verlag Berlin Heidelberg GmbH
Manfred Kühlmeyer
Statistische Auswertu ngsmethoden für Ingenieure mit Praxisbeispielen
Unter Mitarbeit von Claudia Kühlmeyer
Mit 55 Abbildungen
i Springer
Dipl.-Math. DrAng. MANFRED KÜHLMEYER Im Freitagsmoor 31 38518 Gifhorn
Dipl.-Chem. Dr. CLAUDIA KÜHLMEYER Cellerstr. 103 38518 Gifhorn
ISBN 978-3-642-62495-7
Die Deutsche Bibliothek - CIP-Einheitsaufnahme
Kühlmeyer, Manfred:
(VDI-Buch) ISBN 978-3-642-62495-7 ISBN 978-3-642-56776-6 (eBook) DOI 10.1007/978-3-642-56776-6 Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder Vervielfaltigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfaltigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes.
© Springer-Verlag Berlin Heidelberg 2001 Ursprünglich erschienen bei Springer-Verlag Berlin Heidelberg NewYork 2001
Softcover reprint of the hardcover 1 st edition 2001
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Buch berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, daß solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften.
Sollte in diesem Werk direkt oder indirekt auf Gesetze, Vorschriften oder Richtlinien (z.B. din, vdi, vde) Bezug genommen oder aus ihnen zitiert worden sein, so kann der Verlag keine Gewähr für die Richtigkeit, Vollständigkeit oder Aktualität übernehmen. Es empfiehlt sich, gegebenenfalls für die eigenen Arbeiten die vollständigen Vorschriften oder Richtlinien in der jeweils gültigen Fassung hinzuzuziehen.
Einbandentwurf: MEDIO GmbH, Berlin Satz: Camera ready-Vorlage vom Autor Gedruckt auf säurefreiem Papier SPIN: 10784177 62/3020/kk - 5 4 3 2 1 0
Vorwort
Das vorliegende Buch wendet sich sowohl an den im Beruf stehenden Praktiker, als auch an Studenten der Ingenieurwissenschaften an Fachhochschul en und Hochschulen, die ihre Versuchsergebnisse sinnvoll auswerten, beurteilen und darstellen mochten. Die dargestellten Methoden sind seit langem Vorlesungsgegenstand fUr Studenten der WerkstofIkunde und des Maschinenbaus an der Ruhr-Universitat Bochum.
Die Auswahl der statistischen Methoden beruht sowohl auf uber drei Jahrzehnten praktischer Anwendertatigkeit in der Industrie als auch ebenso langer Lehrtatigkeit an Universitaten und bei wissenschaftlichen Vereinigungen. Meist handelte es sich um praktische Fragestellungen aus der Grundstoffindustrie, der Werkzeugproduktion, der Hartmetall- und Magneterzeugung, der Medizintechnik und Werkstoflkunde bis hin zur Motoren- und Fahrzeugentwicklung. Auch Anwendungen in Medizin und Chemie, besonders in der Polymerchemie und der Elastomerentwicklung erbrachten interessante und manchmal unerwartete Ergebnisse, die zur fruchtbaren Weiterentwicklung beitrugen - eine vielseitige Palette von Anwendungen! Alle hier dargestellten Verfahren und Methoden wurden immer wieder verwendet und auf Praxisrelevanz uberpruft. Dabei erwiesen sich auch die einfachen graphischen Naherungsverfahren, wie etwa die verschiedenen Wahrscheinlichkeitsnetze, fur den Ingenieur als besonders nutzlich, da sie schnell einen Uberblick uber das Wahrscheinlichkeitsverhalten der Mefiwerte erlauben.
Ein vor einer praktischen Aufgabe stehender Ingenieur ist vorrangig am ,Xochrezept" eines mathematischen Verfahrens interessiert, meist schon aus Zeitgriinden. Ein beigefugtes durchgerechnetes Beispiel ist in der Regel hilfreich fUr die sichere formale Durchfuhrung des Verfahrens. Daher wurden bei nahezu jedem Verfahren ein Anwendungsfall aus der taglichen Praxis des Verfassers durchgerechnet. In einigen Hillen muBten MeBwerte aus Urheberrechtsgrunden geringfugig verandert werden, was dem zu veranschaulichenden Prinzip keinen Abbruch tut. Ein Beispiel sollte dabei nicht komplizierter sein als die zu illustrierende Methode. Dieser Gesichtspunkt wurde bei der Auswahl berucksichtigt. Allerdings verlangen die besonders interessanten Anwendungsfalle, die auch auf den ersten Blick uberraschende Erkenntnisse liefern, in der Regel meist ein tieferes technisches Vorwissen, so daB auf ihre Darstellwlg verzichtet werden mufite.
In der technischen Anwendungspraxis steht man haufig vor der Frage, ob und wie weit die formalen mathematischen Voraussetzungen erfullt sind und
VI Vorwort
welchen Effekt man bei Abweichungen erwarten kann. Oft mtissen Rechenergebnisse auf ihre technische Aussage hin interpretiert werden. Spatestens in solchen Fallen wird man sich fur die mathematischen Hintergriinde der Verfahren und damit die logischen Zusammenhange aus technischer Sicht interessieren. Sich dann die Beweise aus der Fachliteratur zu erarbeiten, scheitert oft schon an der unterschiedlichen Nomenklatur der Bticher, ganz abgesehen davon, daB sie sich meist an den Fachmathematiker wenden. Der Zeitdruck der taglichen Praxis bringt dann den Interessierten dazu, dies en Aufwand heber bleiben zu lassen, was auch nicht befriedigt. Daher wurden fur die meisten Verfahren einfache Beweise oder zumindest Beweisideen im Kleindruck beigefugt, sofern sie nicht zu urnstandlich und kompliziert sind. Dafur wurde dann auf einfach zu lesende Fachliteratur verwiesen. Der Leser kann die Beweise bei der ersten LektUre also getrost uberschlagen, diese Reserve aber jederzeit aktivieren.
In der Ingenieurpraxis treten meist parametrische Verfahren auf, wie etwa die auf der Normalverteilung beruhenden. In manchen Fallen sind aber entweder die n6tigen Voraussetzungen nicht erfullt oder fur die gerade vorliegende Verteilung hat man die entsprechenden Test- und Schatzverfahren nicht zur Verfugung. Sich dann in der Fachliteratur kundig zu machen, unterbleibt meist schon alleine aus den leidigen Zeitgrunden. Deshalb wurden hier zu allen ublichen Normalverteilungsverfahren verteilungsfreie Pendants dargestellt, meist auf Rangstatistiken basierend, die kaum trennschwacher sind als z.B. die besten Normalverteilungsverfahren - so sie anwendbar waren. Damit sollte der Ingenieur fur die meisten Anwendungsfalle der statistischen Versuchsauswertungen gerustet sein. Verfahren der ZuverHissigkeitsrechnung und der Qualitatskontrolle konnten hier allerdings nur gestreift werden. Ebenso mufiten die mehrdimensionalen Verfahren der Varianzanalyse und statistischen Versuchsplanung, sowie die Korrelations- und Regressionsrechnung unberucksichtigt bleiben.
Als mathematische Voraussetzungen fur das Verstandnis der Methoden und Beweise in diesem Buch ist Abiturwissen ausreichend, so daB Studenten und Absolventen von Fachhochschulen oder Universitaten keine Schwierigkeiten haben werden. Fur die Anwendung der Verfahren werden nur die Grundrechnungsarten einschliefilich Wurzelziehen ben6tigt, wie sie jeder wissenschaftliche Taschenrechner aufweist, der fur ein paar Mark zu erhalten ist und der meist schon die Berechnung von Mittelwert und Varianz eingebaut hat, so ist fur die Beweisfiihrung das Wissen urn die Prinzipien der Differential- und Integralrechnung giinstig. Aufierdem zeigen drei Jahrzehnte Erfahrung, dafi kaum jemals ein Anwender an den statistischen Methoden gescheitert ist, sondern immer nur an den technischen Sachproblemen, die nicht sorgfaltig genug analysiert und auf das Wesentliche abstrahiert wurden.
Als zusatzliche Hilfestellung fur den weniger mit der Materie Vertrauten wurde ein Wegweiser zu den haufigsten Fragestellungen der Grundlagen der angewandten Statistik vorangestellt. Er ist ahnlich den biologischen Bestim-
Vorwort VII
mungsschhisseln aufgebaut, und fuhrt erfahrungsgemiill rasch auf die passenden Methoden.
Das Buch wendet sich also an den Anwender und weniger an den Mathematiker. Daher mufiten in der Darstellungsweise Kompromisse eingegangen werden, die moglicherweise den einen oder anderen Fachmathematiker die Nase rumpfen lassen. VerbesserungsvorschHige werden dankbar angenommen. Das gilt auch fur Fehler, die sich eingeschlichen haben konnten, obwoh) der Verfasser und seine Tochter, die als Mitautorin die Methoden v. a. in der Polymerchemie im Rahmen von Diplomarbeit und Dissertation nutzte, sich ehrlich urn Fehlerfreiheit bemuht haben. Besonderer Dank gebuhrt den Herren Dipl.-Math. Christoph Kozub, Dipl.-Ing. Thomas Muller und Dipl.-Phys. Franz-Georg Neupert fur das aufwendige Korrekturlesen.
Dem Springer Verlag gebiihrt ebenso unser Dank fur die Bereitschaft Zur Veroffentlichung in der vorliegenden ansprechenden Form.
Gifuorn, August 2000 Manfred Kuhlmeyer Claudia Kuhlmeyer
Inhaltsverzeichnis
Seite 1 Einfiihrung........................................................................................... 1
1.1 Was ist Statistik? .............................................................................. 1 1.1.1 Statistik und Technometrie .................................................. 1 1.1.2 Bonmots tiber Statistik ......................................................... 2 1.1.3 Verschiedene Mittelwertsbegriffe ....................................... 3 1.1.4 Der Begriff der Streuung ..................................................... 7
1.2 Statistische Experimente und logische Hintergrtinde ................... 9 1.2.1 Allgemeines ......................................................................... 9 1.2.2 Modellhypothese und Schatzer ........................................... 10
Abstraktion auf das Wesentliche ......................................... 11 Schatzer und Schatzgenauigkeit .......................................... 13 MeBgenauigkeiten ...... ..... ............. ................... ........... ......... 14
1.3 AbriB der geschichtlichen Entwicklung ........................................ 14 1.3.1 Entwicklung des Begriffs der Wahrscheinlichkeit .............. 15 1.3.2 Abhangige und unabhangige Ereignisse ............................. 18 1.3.3 Der Begriff der Zufallsvariablen ......................................... 20 1.3.4 Entwicklung der Statistik .................................................... 21
2 Zufallsstichprobe und Grundgesamtheit .......................................... 25 2.1 Grafische Darstellung von Stichprobenergebnissen
und Zufallsvariablen ..................................................................... 25 2.2 Allgemeine Darstellung der Wahrscheinlichkeit .......................... 29 2.3 Statistische KenngroBen ............................................................... 34
2.3.1 Yom arithmetischen Mittel zum Erwartungswert ............. 34 2.3.1.1 DerBegriffderDichte ....................................................... 34 2.3.1.2 Der Erwartungswert ........................................................... 35 2.3.1.3 Der Varianzbegriff ............................................................. 36 2.3.1.4 Covarianz und Korrelationskoeffizient ............................. 40 2.3.2 Erganzungen zu den statistischen KenngroBen ................. 42
2.4 Einfache Funktionen von Zufallsvariablen ................................... 44 2.4.1 Linearkombination von Zufallsvariablen .......................... 45 2.4.2 Das Fehlerfortpflanzungsgesetz ........................................ 46 2.4.3 Die Verteilung der Stichprobenelemente einer geordneten
Stichprobe .......... .... ........................................................... 48
X Inhaltsverzeichnis
3 Haufig benutzte Verteilungen ............................................................ 53 3.1 Diskrete Verteilungen ................................................................... 53
3.1.1 Die diskrete Gleichverteilung ............................................... 53 3.1.2 Die hypergeometrische Verteilung ....................................... 54 3.1.3 Die Binomialverteilung ........................................................ 57 3.1.4 Die Poisson-Verteilung ........................................................ 61 3.1.5 Zusammenhiinge zwischen hypergeometrischer,
Binomial- und Poisson-Verteilung ....................................... 62 3.2 Kontinuierliche Verteilungen ....................................................... 65
3.2.1 Die Normalverteilung ........................................................... 66 3.2.1.1 Der Zentrale Grenzwertsatz ................................................. 67 3.2.1.2 Standardisierte Zufallsvariable ............................................ 69 3.2.1.3 Die 1-, 2- und 3-Sigma-Regeln ........................................... 71 3.2.1.4 Das GauBsche Wahrscheinlichkeitsnetz .............................. 71
Schatzen von Erwartungswert und Varianz im GauBschen Wahrscheinlichkeitsnetz .................................................. 75
Test auf Normalverteilung im GauBschen Wahrscheinlich-keitsnetz ........................................................................... 76
Vertrauensintervall fUr Quantilwerte im Normal-verteilungsnetz .. ....... ..... ...... ..... ........ ... ........ ... .................. 77
3.2.1.5 Die Sheppard-Korrektur bei klassierten Stichproben .......... 79 3.2.2 Die logarithmische Normalverteilung ................................. 79
Test auf logarithmische Normalverteilung im WN ............. 82 Dreiparametrige Lognormalverteilung ...... ............ ..... ......... 83
3.2.3 Die Weibull-Verteilung ....................................................... 84 Historisches ................ ....... ...... ..... ... ................ ..... ....... ..... ... 84 Heuristische Begriinclung cler Weibullverteilung ................ 84 Mathematische Grundlagen der zweiparametrigen Weibullverteilung ............................................................... 86
4 Statistische Schatz- und Testverfahren .... ..... ....... ..... ..... ..... ... ..... ...... 93 4.1 Allgemeines zu den Schatz- und Testverfahren ............................ 93
4.1.1 p- Quantile ........................................................................... 93 4.1.2 Der Zufallsstreubereich ....................................................... 94 4.1.3 Schatz- und Testverfahren ................................................... 95 4.1.3.1 Der Testfall .......................................................................... 96 4.1.3.2 Zufalls- und Vertrauensintervall ......................................... 98
4.2 Schatz- und Testverfahren bei diskreten Verteilungen ................. 99 4.2.1 Binomialverteilung .............................................................. 99 4.2.1.1 Vertrauensintervall fUr den Parameter p............................... 100 4.2.1.2 Testfall fUr den Parameter p ................................................ 103 4.2.2 Poissonverteilung ................................................................. 104 4.2.2.1 Vertrauensintervall fUr f.l ..................................................... 104 4.2.2.2 Test aufVertraglichkeit eines Stichprobenergebnisses
x mit einer mittleren Ereigniszahl f.l ................................... 107 4.2.2.3 Vergleich zweier Parameter f.ll und f.i.t. ....•.•..•.••...•••.•.•.••...... 108
Inhaltsverzeichnis
4.3 Schatz- und Testverfahren bei Normalverteilung ........................ . 4.3.1 Verteilung von Mittelwert und Standardabweichung
von Zufallsstichproben ........................................................ . 4.3.2 Die Verteilung des Mittelwerts einer Stichprobe bei
bekannter Standardabweichung - Der u-Test ..................... . 4.3.2.1 Die Teststatistik .................................................................. . 4.3.2.2 Der Ein-Stichproben-u-Test ............................................... . 4.3.2.3 Zufalls- und Vertrauensintervall ........................................ . 4.3.2.4 Gutefunktion eines Tests am Beispiel des u-Tests ............. . 4.3.2.5 Der Zwei-Stichproben-u-Test ............................................. . 4.3.3 Test- und Schatzverfahren fUr den Mittelwert einer
Stichprobe bei unbekannter Standardabweichung .............. . 4.3.3.1 Die Studentsche t-Verteilung ............................................. . 4.3.3.2 Der Ein-Stichproben-t-Test ................................................ . 4.3.3.3 Das Vertrauensintervall fUr f1 ............................................. . 4.3.3.4 Gutefunktion des Ein-Stichproben-t-Tests ......................... . 4.3.3.5 Der Ein-Stichproben-t-Test fur den Fall. daB die
Standardabweichung aus mehr Werten geschatzt werden kann als der Mittelwert .................................................... .
4.3.3.6 Der Zwei-Stichproben-t-Test ............................................. . 4.3.3.7 Gutefunktion des Zwei-Stichproben-t-Tests ...................... . 4.3.3.8 Verbundene Stichproben .................................................... . 4.3.4 Test- und Schatzverfahren fUr die Stichprobenstandard-
abweichung ....................................................................... . 4.3.4.1 Die i-Verteilung. Vertrauens- und Zufallsintervalle ........ . 4.3.4.2 Der i-Test aufVerschiedenheit einer Stichprobenstandard
abweichung s von einem hypothetischen Wert 0"0 ......•••••.
4.3.4.3 Gutefunktion des i-Tests .................................................. . 4.3.5 Vergleich zweier Varianzen aus normalverteilten Grund-
gesamtheiten ..................................................................... . 4.3.5.1 Die F-Verteilung. Mutungsintervall fUr das Varianz-
h··lt· 2/ 2 ver a nIS 0"1 0"2 ......••.....•..............................................
4.3.5.2 F-Test auf den Unterschied zwischen zwei Varianzen ...... . 4.3.5.3 Die Gutefunktion des F-Tests ............................................ . 4.3.6 Verg1eich von Varianzen mehrerer Normalverteilungen ... . 4.3.6.1 Der Bartlett-Test ................................................................. . 4.3.6.2 Der Cochran-Test ............................................................... . 4.3.7 Vergleich mehrerer Erwartungswerte von normalverteilten
Grundgesamtheiten mit gleicher Varianz ........................ . 4.3.8 Das AusreiBerproblem bei normalverteilten Kollektiven .. .
XI
109
109
114 115 116 118 119 124
128 128 128 130 131
132 135 137 138
140 140
144 146
148
148
150 151 153 153 154
155 158
XII Inhaltsverzeichnis
5 Grundlagen verteilungsfreier Test- und Schatzverfahren ............... 161 5.1 Allgemeines ................................................................... :.............. 161 5.2 Skalierungen ................................................................................. 163
Benennende oder Klassifikations-Skalierung ......... ..................... 163 Ordinale Skalierung ...................................................................... 164 Metrische oder messende Skalierung. Kardina1skalierung ........... 164 Rangskalierung ............................................................................. 165
5.3 Allgemeine Grundsatze der verteilungsfreien Verfahren ............. 165 5.3.1 Der Fall kontinuierlicher Verteilungen ............................... 165 5.3.2 Der Fall diskreter Verteilungen ........................................... 169
5.4 Giitekriterien von Schatzern und Tests ......................................... 170 Das Maximum-Likelihood-Prinzip ............................................... 170 Die relative Effizienz von Tests .................................................... 172 Konservative Tests ........................................................................ 172
6 Anpassungstests im Fall einer Stichprobe .. ............ .......... ................ 173 6.1 Anpassungstests mit genau spezifizierter Vergleichsverteilung... 173
6.1.1 Der i -Anpassungstest ........................................................ 174 6.1.2 Der Anpassungstest von Kolmogoroff-Smirnoff im Fall
einer Stichprobe .............. .......... ...... ............ ...................... 177 6.2 Anpassungstests mit nicht genau spezifizierter Verteilung .......... 183
6.2.1 Der i-Anpassungstest bei zusammengesetzter Null-hypothese ........................................................................... 184
Normalverteilung als zusammengesetzte Nullhypothese ... 186 Lognormalverteilung als zusammengesetzte Nullhypothese 188 Diskussion zum i-Anpassungstest .................................... 191
6.2.2 Der Kolmogoroff-Smirnoff Anpassungstest fUr zusammen-gesetzte NUllhypothesen bei einer Stichprobe ................... 194
6.2.2.1 Test auf Normalverteilung ................................................... 194 6.2.2.2 Test auf Lognormalverteilung ............................................. 197 6.2.2.3 Test auf Exponentialverteilung ........................................... 199
7 Weitere verteilungsfreie Test- und Schatzverfahren im Fall einer Stichprobe ......... ........................................................................... 203
7.1 Tests und Schatzverfahren fUr den Median einer Grund-gesamtheit ........ ............................................................................. 203
7.1.1 Der Binomialtest fUr den Median .............. ............ ............... 204 7.1.2 Mutungsintervall fUr den Median M(iJ ................................ 208 7.1.3 Der Wilcoxon-Vorzeichen-Rangtest .................................... 211
7.2 Test gegen Trend .......................................................................... 218 7.3 Test auf Zufalligkeit einer Stichprobe .......................................... 219 7.4 Die Stichprobenspannweite als Toleranzbereich .......................... 224 7.5 Die Ungleichungen von Tschebyscheffund Camp-Meidell ......... 227
8 Verteilungsfreie Verfahren im Fall zweier Stichproben .................. 229 8.1 Anpassungstests fiir zwei Stichproben ...... .................. ................. 229
Inhaltsverzeichnis XIII
8.1.1 Der l-Anpassungstest fUr zwei Stichproben ...................... 230 8.1.2 Der Kolmogoroff-Smirnoff-Anpassungstest fur zwei
unabhangige Stichproben ................................................... 231 8.2 Verteilungsfreie Tests auf Lagealternativen bei zwei Stich-
proben ......................................................................................... 235 8.2.1 Der Wilcoxon-Test auf Lagealternativen fUr zwei unab-
hangige Stichproben ........................................................... 235 8.2.2 Der Fall zweier verbundener Stichproben ........................... 242 8.2.2.1 Der Binomialtest auf Lagealternativen bei verbundenen
Stichproben . ...................................................................... 243 8.2.2.2 Anwendung des Wilcoxon-Vorzeichen-Rangtests auf
Lagealternativen bei zwei verbundenen Stichproben ........ 244 8.3 Test aufVerschiedenheit von Varianzen bei zwei Stichproben ... 246
8.3.1 Ein einfacher Test aufVariabilitatsunterschied bei zwei Stichproben ........................................................................ 246
8.3.2 Der Siegel-Tukey-Test auf Streuungsalternativen .............. 247 8.4 Alternativdaten bei zwei Stichproben ........................................... 253
8.4.1 Alternativdaten bei zwei unabhangigen Stichproben. Vier-Feldertafeln ......................................................................... 254
8.4.2 Alternativdaten bei zwei verbundenen Stichproben. McNemar-Test .................................................................... 259
9 Verteilungsfreie Verfahren bei m Stichproben ................................ 263 9.1 Allgemeine Uberlegungen ............................................................ 263 9.2 Ein Anpassungstest yom Kolmogoroff-Smirnoff-Typ fur
m unabhangige Stichproben. Conover-Test ................................ 265 9.3 Der Kruskal-Wallis-Test auf Lageunterschiede bei m unab-
hangigen Stichproben' ................................................................. 267 9.4 Lageunterschiede bei m verbundenen Stichproben;
Friedman Test' ............................................................................. 273 9.5 Der Meyer-Bahlburg-Test aufVariabiliUi.tsunterschiede bei m
unabhangigen Stichproben .... ................... .............................. ..... 281
10 Verteilungsfreie Korrelationsrechnung ............................................ 285 10.1 Allgemeine Hintergrunde ........................................................... 285 10.2 Spearmans Rangkorrelationskoeffizient .................................... 288 10.3 l-Test auf Unabhangigkeit; Kontingenztafeln ......................... 299
Al Wahrscheinlichkeitstheoretische Grundlagen ............................... 311 AI.1 Mengentheoretische Grundlagen der Wahrscheinlichkeits-
rechnung .................................................................................... 311 A1.2 Wahrscheinlichkeiten ................................................................. 315
, Zugleich verteilungsfreie einfache Varianzanalyse , Zugleich verteilungsfreie zweifaktorielle Varianzanalyse
XIV Inhaltsverzeichnis
A1.3 Bedingte Wahrscheinlichkeiten ................................................. 318 A1.4 Der Begriff der statistischen Unabhangigkeit ............................ 320 A1.5 Funktionen von Zufallsvariablen ............................................... 321
Al.5.1 Lineare Transformation ...................................................... 321 Al.5.2 Quadrat einer Zufallsvariablen ........................................... 322 A1.5.3 Allgemeine Funktion y = g(x) ............................................ 323
Al.6 Mehrdimensionale Verteilungen ................................................ 325 Al.6.1 Dichte. Summenfunktion und Randverteilungen ............... 325 Al.6.2 Bedingte Verteilungen ........................................................ 327 Al.6.3 Unabhangigkeit .................................................................. 329 A1.6.4 Funktionen mehrdimensionaler Verteilungen .................... 330
A1.7 Teststatistiken zur Normalverteilung ......................................... 332 Al.7.1 Die /-Verteilung ............................................................... 332 Al.7.2 Die t-Verteilung .................................................................. 336 A1.7.3 Die F-Verteilung ................................................................ 341
A1.8 Simulation .................................................................................. 344 A1.8.1 Prinzip der Monte-Carlo-Simulation .................................. 344 Al.8.2 Erzeugung von Zufallszahlen mit vorgegebener Verteilung 345
A2 Anhang fur Tabellen, Diagramme und Formulare ........................ 349 A2.1 Tabellen ...................................................................................... 350 A2.2 Diagramme ................................................................................. 375 A2.3 Formulare ................................................................................... 395
Literatur ..................................................................................................... 407
Stichwortverzeichnis ................................................................................. 411
In diesem Buch haufig benutzte Zeichen und Symbole
p, J.1 usw. Durch das 1\ werden Schatzer des betreffenden Parameters P, J.1
usw. gekennzeichet; vgl. S. 95. ! Zufallsvariablen werden durch Unterstreichen gekennzeichnet;
vgl. S. 30. x zur Zufallsvariablen ! gehOrige Zahl ( Realisation S. 30, Grenz-
wert S. 33 etc.). W(!...~ x) Wahrscheinlichkeit, daB die Zufallsvariable ! einen Wert :L~ x
annimmt; vgl. S. 31; 34. j{x), rp (y) Dichten der (kontinuierlichen) Zufallsvariablen! bzw.t ; S. 33f.
x F(x) = f f(x)dx = We! ~ x) Summenfunktion der Zufallsvariablen!; S. 33.
-00
pi= We! = xD Wahrscheinlichkeit, daB die (diskrete) Zufallsvariable ! den Wert Xi annimmt. Wir bezeichnen in Anlehnung an kontinuierliche Zufallsvariablen Pi auch als Dichte; S. 34.
n LXi = XI + x2 + ... + xn Summenbildung i=1
x F(x) = LPi = We! ~ X) Summenfunktion der diskreten Zufallsvariablen !;
i=O
vgl. S. 34. XI, X2, .•. ,Xn Zufallsstichprobe yom Umfang n; S. 30 x(1) ~ X(2) ~ ... ~ x(n) geordnete Stichprobe yom Umfang n ; S. 30 ni Anzahl Elemente in der i-ten Klasse (z.B. bei Histogramm,
i-Test); S. 26; 174f. hi absolute Haufigkeit in der Klasse i; S. 28; 174f. E(!) Erwartungswert von!; vgl. S. 26; 35; 38; 39; 68. Var(!) Varianz von!; vgl. S. 37; 68.
(J' = ~Var(x) Standardabweichung, meist im Zusammenhang mit Normalver
teilung verwendet; S. 38; 68f. M(!) Median der Zufallsvariablen! (Grundgesamtheit); S. 43; 203. Cov(! ,t) Covarianz von! und t ; S. 40.
XVI
B(xl n; p)
P(xl J.L) N(J.L; if)
x
s a
S = I-a fJ
Ho HI In Ig
Zeichen und Symbole
A
Summenfunktion der Binomialverteilung beim Stichprobenumfang n und (Prozent-) Parameter p ; S. 58.
Summenfunktion der Poissonverteilung mit Parameter J.L ; S. 62. Normalverteilung mit Parametern J.L und (J'(Erwartungswert J.L
und Varianz d; s. 67. Mittelwert der Stichprobe XI. X2, ••• ,xn , zugleich Schatzer fur den
Erwartungswert E(!) = J.L; x = jL ; vgl. S. 35; 42.
Schatzer fUr die Standardabweichung (J'; S = a; s. 43; 113; 140. Irrtumswahrscheinlichkeit eines Tests, Wahrscheinlichkeit fUr
Fehler 1. Art; S. 96; 97. Aussagesicherheit eines Tests; S. 96. Trennwahrscheinlichkeit eines Tests; (1- fJ)= Wahrscheinlich-
keit fUr Fehler 2. Art; S. 97. Nullhypothese; S. 96f. Gegenhypothese (Einshypothese); S. 96f. natUrlicher Logarithmus zur Basis e. Briggscher Logarithmus zur Basis 10.
Griechisches Alphabet
a Alpha N v Ny B fJ Beta .::, c; Xi
r r Gamma 0 0 Omikron A 8 Delta n 1£ Pi E 8 Epsilon p p Rho Z C; Zeta L: (J' Sigma H 17 Eta T , Tau e [) Theta Y v YpsiJon 1 Jota rp cp Phi K K Kappa X % Chi A A Lambda tp If Psi M J.L My n (j) Omega
Wegweiser zu den haufigsten Fragestellungen
Sticbprobe
stetige Verteilungen
1m statistischen Anwendungsfall werden in der Regel eine oder mehrere Stichproben gezogen. Handelt es sich bei einer Stichprobe XI, X2, ... , xn um Realisationen einer kontinuierlichen (=stetigen) Zufallsvariablen (Def. S. 33 unten) mit metrischer Skalierung (Def. S.l64), so kann es sich urn eine • Zufallsstichprobe (Def. S. 30 unten) handeln.
Wennja ~ 1 • Handelt es sich um eine Zeitreihe? ~Test auf
Trend etc. ~ 24 • Bestehen Zweifel an der gewollten ZufaIligkeit der
Stichprobe? ~ Test auf Zufalligkeit S. 219f. Falls die Zufalligkeit abgelehnt wird, ist die Stichprobe rur die Grundgesamtheit nicht reprasentativ. ~ Wirkliche Zufallsstichprobe ziehen!
• Sind die Daten ordinal (S. 164)?~ Verteilungsfreie Verfahren. ~ 17
• Sind die Daten sogar altemativ (gut!schlecht)?~21 Sind bereits eine oder mehrere Zufallsstichproben gezogen?
Ja ~ 1 Nein ~24
1 -1st die zugrundeliegende Grundgesamtheit (= Kollektiv, Population, Zufallsvariable)?
dem Typ nach bekannt, ~ 2 dem Typ nach unbekannt? ~ 3
XVIII Wegweiser zu den haufigsten Fragestellungen
Approximation empirischer Verteilungen durch bekannte stetige
2 eHandelt es sich um eine Normalverteilung? ~4
eHandelt es sich um eine Lognormalverteilung? ~12
eHandelt es sich um eine Weibull-Verteilung? ~14
e Andernfalls 3
3 e Man versuche moglichst zuerst mit Hilfe der (zeichnerisch einfachen) Wahrscheinlichkeitsnetze einen der unter 2 namentlich genannten Verteilungstypen als hinreichend gute Approximation festzulegen:
eNormalverteilung: ~ Wahrscheinlichkeitsnetz S. 71f. S. 76f., speziell ~ I-Anpassungstest S.184 und 186 f, ~ Lilliefors-Anpassungstest S. 194f
eLognormalverteilung: ~ Wahrscheinlichkeitsnetz S.82, ~ I -Anpassungstest besonders f groBe Stich
proben n > 50; S. 188f, ~ Kolmogoroff-Anpassungstest S. 197f
e Weibullverteilung: ~ Wahrscheinlichkeitsnetz S. 87 ~ I-Anpassungstest S. 184f e Exponentialverteilung ~ Wahrscheinlichkeitsnetz S. 87. ~ Kolmogoroff-Anpassungstest 199f
e Wird irgendeine andere genau spezifizierte stetige Verteilung vermutet? ~ I-Anpassungstest S. 174 oder ~ Kolmogoroff -Anpassungs-Test S. 177.
e 1st der Verteilungstyp keinem der hier genannten Verteilungstypen oder spezifizierten Ver
teilungen mit befriedigender Approximations giite zuzuordnen, empfiehlt es sich, zu vertei lungsfreien Methoden zu greifen. ~ 17
Normalverteilung
eine normalverteilte Stichprobe
CTbekannt
CTunbekannt
Wegweiser zu den haufigsten Fragestellungen XIX
4 eHandelt es sich urn eine Stichprobe? ~ 5 eHandelt es sich urn zwei Stichproben? ~ 10 eHandelt es sich urn mehr als zwei Stichproben?
~11
5 e 1st die Varianz Var(-!) = if oder Standardab-weichung CT bekannt? ~ 6
Andernfalls ~ 7
6 eWill man wissen, wie genau der Stichprobenmittelwert x den Erwartungswert E(-!) = Ji der Grundgesamtheit schiitzt? ~ Vertrauensintervall fUr Ji, S. 118, Formblatt B S. 398. eWill man wissen, ob Stichprobenmittelwert x zum hypothetischen Erwartungswert E(-!)=Ji der Grundgesamtheit paBt? ~ Ein-Stichproben-uTest S. 116f. Formel (4.26); Gutefunktion S. 119f.; Diagramme 11112 S. 389; Formblatt A im Anhang A2 S. 396.
7 eBerechnen des Stichprobenmittelwerts x und der Stichprobenstandardabweichung s gemafi (2.16) S. 38. elst eine Aussage uber die Schiitzgenauigkeit von Mittelwert und Standardabweichung gefragt?~8 elst ein Test fur Mittelwert und Standardab-weichung gefragt? ~9
8 elnteressiert die Genauigkeit der Schiitzung der Standardabweichung der Grundgesamtheit CT?
~ Vertrauensintervall fUr CT, (4.62), (4.63) S. 140f., Tabelle 9 S. 364, Formblatt F S. 403.
elnteressiert die Genauigkeit der Schiitzung des Erwartungswerts Ji der Grundgesamtheit? ~Vertrauensintervall fUr Ji (4.49) S. 130, Tabelle 9 S. 364, Formblatt B' S. 399.
9 eSoll die Stichprobenstandardabweichung s mit einer hypothetischen Standardabweichung Ob
verglichen werden?~ I-Test S. 144f., Gutefunktion S. 146, Formblatt E S. 402.
XX Wegweiser zu den haufigsten Fragestellungen
Zwei normalverteilte StichI)roben
.Sol1 der Stichprobenmittelwert x mit einem hypothetischen Erwartungswert f.lo verglichen werden?~ Ein-Stichproben-t-Test (4.47) S. 128f., Gutefunktion S. 131, Diagramme 13114
S. 391f., Formblatt A'S. 397.
10 .Sind die Standardabweichungen der beiden Grundgesamtheiten bekannt und sollen die Erwartungswerte auf Verschiedenheit getestet
werden? ~2-Stichproben-u-Test, (4.37) S. 124f. .Sind die Standardabweichungen der beiden Grundgesamtheiten nicht bekannt und sollcn sie auf Verschiedenheit getestet werden') ~ F-T cst (4.72) S. ISO, Giitefunktion S. ISIL Formblatt G aufS. 404 .
• Soll ein Vertrauensintervall fur den Quotienten der beiden Varianzen (=Varianzverhaltnis) an gegeben werden? ~ (4.70) S. 148f., Abb. 4.23 S. ISO, Formblatt H auf S. 40S . • Sollen die beiden Stichprobenmittelwerte auf Verschiedenheit getestet werden? .Wennja, handelt es sich um verbundene Stichproben? ~ S. 138f. • Oder handelt es sich lim unabhangige Stichproben:
.Sind beide Stichprobenvarianzen gleich (ggf. F-Test S. IS0f.), aber unbekannt? ~Zwei Stichproben-t-Test (4.S6) S. 13SL Giitefunktion S. 137 und Diagramme ISI16 S. 393L Formblatt C im Anhang A2 S. 401. .Ist nicht sicher, dan beide Stichprobenvari3i1l:cn gleich sind? ~ Wilcoxon-Test S. 23Sf.
.Handelt es sich um eine Stichprobe, bei der zu jedem Element 2 Beobachtungen existieren, etwa der Form (Xi, Yi) ,i= 1,2, ... ,n wld wird nach Abhangigkeiten zwischen den zugehOrigen Zufallsvariablen :r lUld 1: gefragt?
~ Korrelation bei Normalverteilung, Def. S. 40. ~ Verteilungsfreier Korrelationskoeffiziemt nach
Spearman S. 288 oder Kontingenztafeln S. 299f.
mehrere normalverteilte Stichproben
Lognormalverteilung
Wegweiser zu den haufigsten Fragestellungen XXI
~ Das ist eigentlieh die Domane der RegressionswId EinfluBgr6J3enreehnung, die hier nieht weiter behandelt werden, da das den Rahmen spreng en wiirde.
11 .Sollen mehrere Erwartungswerte aus Normalverteilungen darauf getestet werden, ob sieh nieht mindestens einer von den anderen Ullterscheidet?
~ einfache Varianzanalyse S. 155 (sofem gleiche Varianzen vorhanden), sonst
~ verteilungsfreier Kruskal-Wallis-Test S. 275f
• Sollen die Varianzen von m (m >2) Normaherteilungen darauflIin getestet werden, ob nieht mindestens eine sieh von den anderen unterscheidet?~ Bartlett- oder Cochran-Test S l53f oder bei Zweifel an der Normalverteilung \crteilungsfreier Meyer-Bahlburg-Test S. 281.
12 .Handelt es sieh um eine Stichprobe? ~ 13 .Handelt es sieh um 2 Stichproben? ~ 19 .Handelt es sich um m > 2 Stichproben? ~ 20
13 .Sollen die Parameter JL und 0" gesehatzt werden? ~S. 79f., speziell (3.34) S. 81 f.
.Sollen Tests auf Lagealtemativen gemacht werden? ~Mediantest (7.3) S. 205 oder (7.6) S. 207; . trelllscharfer Wilcoxon-VorzeiehenRang-Test S. 211, speziell S. 213 .
• Soll ein Vertrauensintervall fur den Median ermittelt werden? ~ S. 208 .
• Soll eine Sehatzgr6J3e fiir ein StreumaJ3 ermittelt werden')
~ Emlitteln von Parametem aus dem Wahrscheinliehkeitsnetz S. 82.
~ Stichprobenspannweite S. 224. ~ Ungleichungen von Tschebyscheff oder
Camp-Meidell S. 227.
XXII Wegweiser zu den haufigsten Fragestellungen
Weibull- oder Exponentialverteilung
.Sol1 auf eine Abweichung der Varianz (oder allg. Streuung) von einem hypothetischen Wert getestet werden, so erscheint ein Anpassungstests bei spezifizierten hypothetischen Parame tern j..Io und 0"0 vernunftig.
~I-Anpassungstest S. 174 (v. a. fur n > 50), ~ Ko1mogoroff-Smirnoff-Anpassunggstest
S.l77f (besonders im mittleren Datenbereich trellll
scharrer als der I-Test).
14 .Handelt es sich urn eine Stichprobe? .Handelt es sich um 2 Stichproben? .Handelt es sich urn m >2 Stichproben?
~15
~19
~20
15 .Sollen die Parameter T und b geschiitzt werden (bei Exponentia1vertei1ung nur 1) und parametrische Schiitzungen und Tests durchgefUhrt werden? ~ Weibullnetz S. 84f, speziell S. 88f.
.Andernfalls ~ 16
16 .Sollen parameterfreie Tests auf Lagealternativen gemacht werden? ~ Mediantest S. 204f. oder trennscharferer Wilcoxon-VorzeichenRang-Test S. 211, spezie1l213. .Soll ein Vertrauensintervall fur den Median
ermittelt werden? ~ S. 208 . • Sol1 eine Schiitzgr6fie fUr ein Streumafi enl1ittelt werden? ~ Stichprobenspannweite S. 224. ~ Ungleichungen von Tschebyscheff oder
Camp-Meidell S. 227 . • Sol1 auf eine Abweichung der Varianz (oder allgemeiner Streuung) von einem hypothetischen Wert (Variabilitiitsabweichung) getestet werden, so ist ein Anpassungstest bei spezifischen hypothetischen Parametern T und b sinnvo1l. ~ X2 -Anpassungstest S. 174f (fUr n >50), ~ Kolmogoroff-Smirnoff Anpassungtest
(v.a. fur n < 50) S. 177.
verteilungsfreie Verfahren
Verteilungsfreie Verfahren fUr eine Stichprobe
Wegweiser zu den haufigsten Fragestellungen XXllI
Sind eine oder mehrere Voraussetzungen fur die Anwendung der Normalverteilungsverfahren nicht erfullt oder zweifelhajt, verwende man besser die entsprechenden verteilungsfreien Verfahren.
17 e Handelt es sich urn eine Stichprobe? ~ 18 e Handelt es sich urn zwei Stichproben? ~ 19 eHandelt es sich urn m>2 zwei Stichproben?~20
18 eBesteht die Frage, ob die Stichprobe aus einer ganz bestimmten Verteilung stammt?
~I-Anpassungstest (n > 50; aUg. giiltig), S. 174f. ~ Kolmogoroff-Smirnoff-Anpassungstest (n <50;
stetige Verteilung) S. 177f.
eIst nach einer mittleren Tendenz (Lagecharakteristikum) gefragt?
eSchatzgenauigkeit ~ VertrauensintervaU fur den Median S. 208.
eTest gegen hypothetischen Wert: ~ Binomialtest fiir den Median S. 204f. ~ Wilcoxons Vorzeichen- Rangtest (stetige
Verteilung) S. 211f.
eIst nach einem StreumaB (Variabilitat) gefragt? eSchatzung~Stichprobenspannweite S. 224
~ Ungleichungen von Tschebyscheffund Camp-Meidell S. 227
eTestfragen~ Nur Anpassungstests praktisch sinnvoll. Genau spezifizierte Verteilung: (Kleine n) ~ I-Anpassungstest S. 174f. (GroBe n, stetige Verteilung)
~ Kolmogoroff-Test S. 177f. Nicht genau spezifizierte Verteilung: ~ I-Anpassungstest S. 184f.
XXIV Wegweiser zu den haufigsten Fragestellungen
verteilungsfreie Verfahren fUr zwei Stichproben
verteilungsfreie Verfahren fUr m> 2 Stichproben
19 -1st gefragt, ob die beiden Stichproben aus einer einzigen Verteilung stammen konnen? ~ Kolmogoroff-Smirnoff-2-Stichproben An
passungstest fUr stetige Vert. S. 23lf. ~ i-Anpassungstest (allg. Verteilungsannah
men) S. 230f.
-1st gefragt, ob die beiden Verteilungen, aus denen die beiden Stichproben stammen, sich hinsichtlich ihrer mittleren Lage unterscheiden (Lagealternativen)? ~ Wilcoxon-Test fUr zwei unabhangige Stichproben S. 235f. - 1st gefragt, ob die beiden Verteilungen, aus denen die beiden Stichproben stammen, sich hinsichtlich ihrer Streuung unterscheiden (Variabilitatsaltemativen)? ~ Siegel-Tukey-Test S. 247f.
20 -1st gefragt, ob die m (unabhang;gen) Stichproben aus einer einzigen Verteihmg stammen konnen? ~ Conover-Test S. 265f.
-1st gefragt, ob die beiden Verteilungen, aus denen die m (unabhang;gen) Stichproben stammen, sich hinsichtlich ihrer mittleren Lage unterscheiden (Lagealternativen)? ~ Kmskal
Wallis-Test, S. 267f. -1st gefragt, ob die beiden Verteilungen, aus denen die m (unabhangigen) Stichproben stammen, sich hinsichtlich ihrer Streuung unterscheiden (Variabilitatsaltemativen)? ~ Meyer-Bahlburg-Test S. 28If.
-Handelt es sich urn m verbundene Stichproben und ist nach Unterschieden in den mittleren Tendenzen (z.B. Mediane) gefragt, ahnlich wie bei zweifaktorieller Varianzanalyse? ~ Friedman-Test S. 273f.
diskrete Verteilungen
Binomialverteilung
Wegweiser zu den haufigsten Fragestellungen XXV
21 eDie Entscheidung, ob es sich um eine Hypergeometrische, Binomial- oder Poisson-Verteilung handeIt, wird auf Grund des zutreffenden Urnenmodells getroffen. Hypergeometrische Verteilung S. 56 Binomialverteilung S. 57 Poisson-Verteilung S. 61 Approximation dieser Verteilungen S. 62f.
Kann eine zutreffende hypergeometrische Verteilung nicht hinreichend gut approximiert werden, mussen mit Hilfe der Summenformel oder Tafeln der hypergeometrischen Verteilung Testschranken oder Vertrauensintervalle bestimmt werden. Siehe S. 54£. In der Regel fuhrt dies aber zu unbefriedigend wei ten Intervallen bzw. Grenzen.
e Liegt eine eine Binomialverteilung vor ~ 22 oder eine Poissonverteilwlg? ~ 23
eHandelt es sich um einen Test aufUnterschied zweier Stichproben mit binaren Daten wie "in Ordnung Idefekt" wId sind die Stich proben
eunabhangig, ~ Vierfeldertafel S. 254f., eabhangig (verbundene Stichproben)?
~ Mc. Nemar-Test S. 259. elst nach einem Zusanlluenhang oder einer Abhangigkeit der diskreten Versuchsergebnisse von einem (zumindest kategoriellen) Faktor gefragt? ~ Kontingenztafeln S. 299f.
22 elst nach einem Vertrauensbereich der relativen Haufigkeit p in der Grundgesamtheit gefragt? ~ S. 100, Diagramme 3 und 4 S. 380/381 oder
(Larson-) Diagramm 1 S. 376. e Wird nach einem Test gesucht, ob die relative
Hiiufigkeit p in der Grundgesamtheit sich von einem hypothetischen Wert po unterscheidet? ~ S. 103.
XXVI Wegweiser zu den haufigsten Fragestellungen
Poissonverteilung
Zufalligkeit einer Stichprobe, Trend, Korrelation
23 • 1st nach einem Vertrauensbereich der mittleren Anzahll1 an Ereignissen pro Beobachtungseinheit in der Grundgesamtheit gefragt? ~ S. 104f., Diagramme 5/6 aufS. 382f. oder
(Thorndike-) Diagramm 2 auf S. 378f. • Test aufVertraglichkeit eines Stichprobener
gebnisses, dafi x Fehler (Ereignisse) in der Beobachtungseinheit auftraten, mit einem hypothetischen Erwartungswert /lD. ~ S. 107f.
• Test zweier geschatzter Parameter Ii, und lic auf Gleicheit. ~ S. 108.
24 .Hier wird entweder iiberpruft, ob die Stich probe aus einer stetigen Verteilung eine Zufallsstichprobe sein kann. ~ Test auf Zufalligkeit, ~ S. 219f.
.Wird nach einem Test auf Trend gefragt? ~ S. 218 oder ~ Spearman's Korrelationskoeffizient S. 288f.
.Wird nach einem Test auf Zusammenhang einer stetigen GroBe mit einer anderen gefragt? ~ Spearmans Korrelationskoeffizient, S. 288f. ~ Kontingenztafel S. 299f. bei kategoriellem
MeBniveau.
Die Methoden der klassischen Varianz-, Korrelations- und Regressionsrechnung werden in diesem Buch nicht behandelt. Das wiirde den Rahmen sprengen.