3
Fresenius Zeitschrift fiir Fresenius Z Anal Chem (1988) 331:510-512 Springer-Verlag 1988 Nachweis systematischer Fehler durch gewichtete Regression Klaus Doerffel und Ralph Hebisch* Technische Hochschule ,,Carl Schorlemmer", Leuna-Merseburg, DDR-4200 Merseburg, Deutsche Demokratische Republik Detection of systematic errors by weighted regression Summary. Each analytical method is to be tested for the absence of systematic errors. This is usually done by Youden's regression model, which is limited to precise "given" values. Furthermore, weighted regression allows the detection of systematic errors even if the random error of the "given" values is not to be neglected. This is demonstrated by simulation experiments and by testing a new spectrometric method for the determination of platinum. It must be taken into account that statistical tests can give information only about the presence of systematic errors (and not about their absence). Accuracy must be seen as a qualitative characteristic feature (yes/no); accuracy can never be given as a quantitative measure (more/less). 1 Aufgabenstellung Systematische Fehler eines Analysenverfahrens werden nach Youden [1] nachgewiesen, indem man m Wertepaare xi; Yi (xi vorgegebene, fehlerlose Gehalte, yl gefundene Gehalte) ausgleicht nach y = a + bx. Ein signifikant yon Null ver- schiedenes Absolutglied a gilt als Nachweis eines konstanten systematischen Fehlers, ein signifikant yon Eins abweichen- der Regressionskoeffizient b wird als Nachweis eines linear verfinderlichen Fehlers angesehen. Ripley und Thomson [2] zeigten, dab die unkritische Anwendung dieses Regressions- modells - insbesondere bei fehlerhaften vorgegebenen Wer- ten xi - zu Fehlinterpretationen ffihrt. Sie schlagen deshalb die Anwendung einer gewichteten Regression vor. Eigene Untersuchungen zeigten, dab auch ein solches Modell nicht ohne kritische Diskussion der Daten einzusetzen ist. 2 Mathematisches Modell Bei Aufstellung der Regressionsgleichung sind die m Werte- paare xi; Yl (i = 1...m) entsprechend den Einzelvarianzen 2. 2 sx~, sr~ zu wichten. Diese Einzelvarianzen k6nnen entweder aus nj Mehrfachbestimmungen fiir jeden der m Gehalte xi bzw. yi gewonnen werden [3] oder die Sch/itzwerte der Vari- * Gegenwdrtige Adresse: Akademie der Wissenschaften der DDR, Zentralinstitut fiir physikalische Chemie, DDR-I199 Berlin, Deutsche Demokratische Republik Offprints requests to: K. Doerffel anzen sZi bzw. syZl miissen bekannt sein. Die Wichtungsfakto- ren erh/ilt man naeh 1 wi- 2 2 2" (1) sy, + bw sx~ Die gewichtete Regressionsrechnung liefert dann [4] ZX2Wi Zyiw i -- •XiW i Zxiyiwi aw = Swi Zx2wi - (Zxiwl) 2 (2) SWi SxiYiWi -- ,~XiWi Syiwi bw = Z, wi z~x2wi _ (~_~xiwi)2 (3) Yi - bwxi - aw : di (4) s2 _ Sx2wi S~wi a, W (m -- 2) [S, wi SxZwi -- (Sxiwl) 21 (5) z S, wiS,~wl Sb, w -- (m - 2) [~_.w i Sx2wi - (~xiwi) 2] " (6) Der zur Ermittlung der Wichtungsfaktoren (G1. (1)] not- wendige gewichtete Regressionskoeffizient b~ [G1. (3)] steht zunfichst nicht zur Verfiigung. Deshalb bestimmt man im ersten Schritt einen vorl/iufigen Wert b mittels ungewichteter Regression, der sich aus G1. (3) fiir w~ = I ergibt. Die Berech- nungder Wichtungsfaktoren und der Gr613en aw, bw, s.... Sb, w erfolgt dann iterativ. Ein Abbruch der Iteration erfolgt, wenn sich die berechneten gewichteten Regressionskoeffi- zienten bw(k) und b~(k + 1) aus zwei zwei aufeinanderfolgen- den Iterationen um weniger als ein vorgegebenes Abbruch- kriterium e unterscheiden. Die Signifikanz der berechneten Konstanten priift man nach la~,l ta = ~ t(P; f = m - 2) so, ~ (7) I1 -bwI tb -- - - ~-* t(P; f = m-- 2). Sb, w Entsprechend den allgemeinen Regeln ([5] S. 103) gilt ein systematischer Fehler als nachgewiesen (+) ffir P >_- 0,95. 3 lJberpriifung des Modells Es lag ein Datensatz vor (m = 10 Wertepaare mit 100 < x~; y~ < 1000) mit iiberlagerten Zufallsfehlern (Zufallszahlenge- nerierung) von ~2=1,1 und ~2=1,3 (Tabelle 1). Als systematische Fehler waren ay = 15 und by = 1,080 vorge- geben.

Nachweis systematischer Fehler durch gewichtete Regression

Embed Size (px)

Citation preview

Fresenius Zeitschrift fiir Fresenius Z Anal Chem (1988) 331:510-512

�9 Springer-Verlag 1988

Nachweis systematischer Fehler durch gewichtete Regression Klaus Doerffel und Ralph Hebisch* Technische Hochschule ,,Carl Schorlemmer", Leuna-Merseburg, DDR-4200 Merseburg, Deutsche Demokratische Republik

Detection of systematic errors by weighted regression

Summary. Each analytical method is to be tested for the absence of systematic errors. This is usually done by Youden's regression model, which is limited to precise "given" values. Furthermore, weighted regression allows the detection of systematic errors even if the random error of the "given" values is not to be neglected. This is demonstrated by simulation experiments and by testing a new spectrometric method for the determination of platinum.

It must be taken into account that statistical tests can give information only about the p r e s e n c e of systematic errors (and not about their absence). Accuracy must be seen as a qualitative characteristic feature (yes/no); accuracy can never be given as a quantitative measure (more/less).

1 Aufgabenstellung

Systematische Fehler eines Analysenverfahrens werden nach Youden [1] nachgewiesen, indem man m Wertepaare x i ; Yi (x i vorgegebene, fehlerlose Gehalte, yl gefundene Gehalte) ausgleicht nach y = a + bx . Ein signifikant yon Null ver- schiedenes Absolutglied a gilt als Nachweis eines konstanten systematischen Fehlers, ein signifikant yon Eins abweichen- der Regressionskoeffizient b wird als Nachweis eines linear verfinderlichen Fehlers angesehen. Ripley und Thomson [2] zeigten, dab die unkritische Anwendung dieses Regressions- modells - insbesondere bei fehlerhaften vorgegebenen Wer- ten xi - zu Fehlinterpretationen ffihrt. Sie schlagen deshalb die Anwendung einer gewichteten Regression vor. Eigene Untersuchungen zeigten, dab auch ein solches Modell nicht ohne kritische Diskussion der Daten einzusetzen ist.

2 Mathematisches Modell

Bei Aufstellung der Regressionsgleichung sind die m Werte- paare xi; Yl (i = 1.. .m) entsprechend den Einzelvarianzen

2 . 2 sx~, sr~ zu wichten. Diese Einzelvarianzen k6nnen entweder aus nj Mehrfachbestimmungen fiir jeden der m Gehalte x i bzw. y i gewonnen werden [3] oder die Sch/itzwerte der Vari-

* Gegenwdrtige Adresse: Akademie der Wissenschaften der DDR, Zentralinstitut fiir physikalische Chemie, DDR-I199 Berlin, Deutsche Demokratische Republik Offprints requests to: K. Doerffel

anzen sZi bzw. syZl miissen bekannt sein. Die Wichtungsfakto- ren erh/ilt man naeh

1 w i - 2 2 2 " (1)

sy, + bw sx~

Die gewichtete Regressionsrechnung liefert dann [4]

Z X 2 W i Z y i w i - - •X iW i Z x i y i w i

aw = S w i Z x 2 w i - (Zx iw l ) 2 (2)

S W i S x i Y i W i - - ,~XiWi S y i w i

b w = Z, w i z ~ x 2 w i _ (~_~xiwi)2 (3)

Yi - b w x i - a w : di (4)

s2 _ Sx2wi S ~ w i a, W (m -- 2) [S, wi S x Z w i - - ( S x i w l ) 21 (5)

z S, w iS ,~wl Sb, w --

(m - 2 ) [~_.w i S x 2 w i - ( ~ x i w i ) 2] " ( 6 )

Der zur Ermittlung der Wichtungsfaktoren (G1. (1)] not- wendige gewichtete Regressionskoeffizient b~ [G1. (3)] steht zunfichst nicht zur Verfiigung. Deshalb bestimmt man im ersten Schritt einen vorl/iufigen Wert b mittels ungewichteter Regression, der sich aus G1. (3) fiir w~ = I ergibt. Die Berech- nungder Wichtungsfaktoren und der Gr613en aw, bw, s . . . . Sb, w erfolgt dann iterativ. Ein Abbruch der Iteration erfolgt, wenn sich die berechneten gewichteten Regressionskoeffi- zienten bw(k) und b ~ ( k + 1) aus zwei zwei aufeinanderfolgen- den Iterationen um weniger als ein vorgegebenes Abbruch- kriterium e unterscheiden. Die Signifikanz der berechneten Konstanten priift man nach

la~,l ta = ~ t (P ; f = m - 2)

so, ~ (7) I1 - b w I

tb -- - - ~-* t (P ; f = m - - 2). Sb, w

Entsprechend den allgemeinen Regeln ([5] S. 103) gilt ein systematischer Fehler als nachgewiesen (+) ffir P >_- 0,95.

3 lJberpriifung des Modells

Es lag ein Datensatz vor (m = 10 Wertepaare mit 100 < x~; y~ < 1000) mit iiberlagerten Zufallsfehlern (Zufallszahlenge- nerierung) von ~2=1,1 und ~2=1,3 (Tabelle 1). Als systematische Fehler waren ay = 15 und by = 1,080 vorge- geben.

Tabelle 1. Durch Zufallszahlengenerierung erzeugte Daten

m x-Werte y-Werte

i x l X2 x S~ Yl Y2 y S~

1 101,0 103,0 102 2,00 112 ,1 113,9 113 1,62 2 184 ,8 185,2 185 0,08 230,8 231,2 231 0,08 3 294,3 293,7 294 0,18 3 4 6 , 1 345,9 346 0,02 4 404,1 405,9 405 1,62 428,8 431,2 430 2,88 5 504 ,8 507,2 506 2,88 557,8 558,2 558 0,08 6 617,9 620,1 619 2,42 638,7 641,3 640 3,38 7 675,6 676,4 676 0,32 767,7 768,3 768 0,13 8 786,1 785,9 786 0,02 8 9 4 , 1 893,9 894 0,02 9 900,1 901,9 901 1,62 972,0 974,0 973 2,00

10 992,8 993,2 993 0,08 1069,8 1072,2 1071 2,88

Tabelle 2. Einflul3 unterschiedlicher Abbruchkriterien auf Anzahl der Iterationsschritte und Parameter der Modellfunktion

Vorgegebenes Notwendige Abbruchkriterium Iterationen

Parameter der ermittelten Modellfunktion

a b

10 ~ n = 1 25,1278 1,1054 10 -2 n = 2 25,1666 1,1053 10 3 n = 2 25,1666 1,1053 10 -4 n = 2 25,1666 1,1053 10 -5 n = 3 25,1658 1,1053 10 6 n = 8 25,1642 1,1053 10 .7 n = 12 25,1641 1,1053

(Ausgangsfunktion y = 16,1l + 25,17 x aus ungewichteter Regres- sion)

Die iterative Bestimmung von aw und bw fiihrt bereits bei wenigen Cyclen zu den gewiinschten Resultaten. Eine wichtige Rolle spielt hierbei die gewfihlte Gr6ge des Ab- bruchkriteriums e (Tabelle 2). Bei der fiblichen analytischen Pr~izision [z. B. Relativstandardabweichung 10- 2 (_~ 1%)] ist ein Wert von e = 10-3 . . . 10-4 ausreichend. Ein weiteres Verringern dieses Wertes fiihrt zu einer unn6tigen Verl/inge- rung der Rechenzeit (sprunghafter Anstieg der Iterations- cyclen) ohne signifikante Verbesserung von aw und bw.

Mit Hilfe der gewichteten Regression liegen sich die vor- gegebenen systematischen Fehler signifikant mit P = 0,99 nachweisen (Tabelle 3, Z. 1), die ungewichtete Regression gestattete (wegen sx 4= 0) diesen Nachweis nicht.

Den beiden Datenserien wurden weiterhin Zufallsfehler verschiedener Art (konstante Absolutstandardabweichung, konstante Relativstandardabweichung) und verschiedener Gr613e iiberlagert. Diese Datenserien wurden in unterschied- licher Weise miteinander kombiniert (Tabelle 3, Z. 2 bis 8). Aus der Signifikanz (bzw. Nichtsignifikanz) des Nachweises der systematischen Fehler sind die folgenden Aussagen ab- zuleiten.

Die gewichtete Regression ist einzusetzen, wenn im MeB- bereich Xmi . . . . Xmax und y~,i . . . . Ymax die Absolutstandardab- weichung als konstant anzusehen ist. Optimale Bedingungen sind dann gegeben, wenn bei insgesamt niedrigem Zufalls- fehler s~ < sy ausffillt (Z. 2). Bei guter Prfizision der Analy- senverfahren ffir x und y erlaubt das Modell den Nachweis systematischer Fehler selbst im Falle sx ~ 2 sy (Z. 3), ein

511

Tabelle 3. Ergebnisse aus der gewichteten Regressionsrechnung, Signifikanzniveau P = 0,95 (+) bzw. P = 0,99 (+ +)

Lfd. sx sy n ta tb Nachweis Nr. von

a b

Priifung des Regressionsmodells 1 1,1 1,3 3 11,6 33,3 + + + +

ungewichtete Regression: 0,9 2,7 0 + 2 0,5 1,1 3 11,3 24,5 + + + + 3 1,1 0,5 3 3,3 8,6 + + + 4 1,1 1,8 3 1,4 3,4 0 + + 5 1,1 2,6 3 1,6 2,1 0 0

6 1,1 s2=0,011 4 0,3 2,0 0 0

7 Sx = 0,011 Y 1,1 4 0,03 0,2 0 0 X

8 sx=0,011 s y=0,011 4 0,03 0,l 0 0 x y

Verfahrensprfifung x y n t, tb Nachweis

v o n

a b

9 phot spektr 3 6,9 1,7 + + 0 10 Lsgn spektr 3 0,6 0,5 0 0 11 Lsgn phot 3 7,5 1,8 + + 0

hoher Zufallsfehler verhindert auch bei sonst guten Relatio- nen von s~ zu sy zuerst den Nachweis des konstanten Fehlers (Z. 4). Bei starkem ~berwiegen von sr gegeniiber s~ (Z. 5) liefert auch die gewichtete Regression aus dem Test [G1. (7)] keine Aussage mehr. Das Modell versagt vSllig, wenn in einer der beiden Serien (Z. 6, 7) oder in beiden Serien (Z. 8) der Relativfehler innerhalb des Mel3bereiches konstant bleibt. Die Erffillung der ffir das Modell wichtigen Voraus- setzung sx = const, und sy = const, ist mittels Bartlett-Test [5] zu prfifen.

4 Anwendung

Das Modell der gewichteten Regression wurde benutzt, um eine zeitsparende spektrometrische Bestimmung von Pt neben Ir (stabilisierter Gleichstromdauerbogen [6]) auf systematische Fehler zu prfifen (Tabelle 3, Z. 9. . . 11). Als Referenzmethode diente die durch Standard festgelegte pho- tometrische Bestimmung (H2PtC16). Die ffir die einzelnen Gehalte gemessenen Standardabweichungen zeigten keine Gehaltsabhfingigkeiten

[)(2ES = 1,46; Z2hot = 0 , 5 0 ; beide < ~2( /~ = 0 , 9 5 ; f = 4) = = 9,49].

Trotz bemerkenswert hoher Prfizision der spektrome- trischen Methode stellt das Problem wegen sy < Sx einen ffir den Nachweis systematischer Fehler ungfinstigen Fall dar.

Der unmittelbare Vergleich der photometrischen und der spektrometrischen Mel3serien (Abbruchkriterium e = 10 -4) ergab mit hoher Signifikanz den Nachweis eines konstanten systematischen Fehlers ffir die spektrometrische Bestim-

512

mung (Tabelle 3, Z. 9). Dieses unerwartete Resultat war An- laB, die beiden Methoden anhand sorgffiltig eingewogener Referenzproben zu vergleichen. Dabei zeigte sich die Rich- tigkeit der dutch die spektrometrische Bestimmung erhalte- nen Werte (Z. 10) [7].

Die bisher als fehlerfrei angesehene photometrische Standardmethode fiihrt dagegen zu systematisch verf/ilsch- ten Werten (konstanter Fehler). Als Ursache hierfiir wurde die unzureichende Abtrennung des Ir erkannt. Selbst in die- sem voraussetzungsgem/ig ungfinstigen Fall erlaubte die ge- wichtete Regression den Nachweis systematischer Fehler. Es ist fiir einen solchen Fehlernachweis jedoch stets die Abwesenheit der systematischen Fehler bei der Bezugsme- thode explizit zu sichern.

5 Zur Interpretation der Resultate

Mit Hilfe der Regressionsmethoden wird aug der Priifung der Konstanten a~--~ = 0 und b*-+b = 1 (gt, f) Erwartungs- werte) bei Signifikanz des Tests die Anwesenheit eines syste- matischen Fehlers nachgewiesen. Die Nichtsignifikanz des Tests ist nicht gleichzusetzen mit der Abwesenheit systemati- scher Fehler ([5] S. 103), sie sind vielmehr im Rahmen des Zufallsfehlers nicht nachweisbar. Es wird dann [als unab- h/ingiger Schritt z.B. ffir t ~ t (P, f )] angenommen, dab das

Analysenverfahren frei von systematischen Fehlern ist und dab es zu ,,richtigen" Analysenwerten fiihrt. Der Begriff ,,Richtigkeit" soll deshalb stets mit den Analysenwer ten ver- knfipft sein. Er gibt - entsprechend dem Ausfall des Tests - eine qualitative Ja/Nein-Entscheidung und kann nicht quan- tifiziert werden. Nur im Falle nicht zu beseitigender systema- tischer Fehler sind pr/izisierende Angaben zur Art, zur Gr6ge und zum Vorzeichen der ,,MiBweisung" zul/issig z. B. im Sinne der maximalen MeBunsicherheit [8].

References

1. Youden WJ (1947) Anal Chem/9:946-950 2. Ripley BD, Thompson M (1987) Analyst 112:377-381 3. Bubert H, Klockenk/impfer R (1983) Fresenius Z Anal Chem

316:186-193 4. Irvin J-A, Quickenden II (1983) J Chem Educ 60:711 -712 5. Doerffel K (1987) Statistik in der analytischen Chemie. VEB

Deutscher Verlag fiir Grundstoffindustrie, Leipzig 6. Doerffel K, Hebisch R, Rudolph D, Schmiedel J (1988) Chem

Tech 40:129-131 7. Hebisch R (1986) Dissertation TH Leuna-Merseburg, DDR 8. Ehrlich G, Friedrich K, Kucharowsk R, Stahlberg R (1984) Z

Chem 24: 204- 208

Eingegangen am 19. Januar 1988