3
37 9/2013 Sicherheit vor Über- und Unterdruck mit Knickstab-Umkehr- Berstscheiben von Rembe. Volle Querschnittsfreigabe ohne Fragmentation. Version für Clamp-Rohrverbindungen erhältlich. PALIWODA AG, 8703 Erlenbach Telefon 044 910 50 05, www.paliwoda.ch Für sichere Berstscheiben. R-UB FIRMEN BERICHTEN Ein einfacher Test beweist Produkt- und Methodenäquivalenz Zum Trost gibt’s den TOST! In der Entwicklung neuer analytischer Methoden, beim Laborvergleich oder in der Zulassung neuer Medikamen- te: Überall stellt sich die Frage, wie Äquivalenz zu einem Referenzsystem nachgewiesen werden kann. Hierzu verwendet man am besten den «TOST» – er basiert auf einem einfachen Konzept und vermeidet die Probleme, die ein simpler t-Test mit sich bringt. Stefanie Feiler und Philippe Solot 1 In der analytischen Methodenentwicklung besteht oft die Anforderung, dass die neue Methode äquivalente Ergebnisse zum be- stehenden «Goldstandard» liefern soll. Wenn verschiedene Labors Analysen bear- beiten, wird erwartet, dass die erhaltenen Ergebnisse vergleichbar sind. Bei einem neuen Therapeutikum muss gesichert sein, dass dieses nicht schlechter wirkt als der Vorgänger («non-inferiority»). Diese Fälle haben eines gemeinsam: Anstatt wie in der klassischen, vergleichenden Statistik nach signifikanten Unterschieden zu suchen, soll gerade gezeigt werden, dass keine wesent- lichen Unterschiede vorliegen. Doch wie kann man hier vorgehen? Die Falle Ein naheliegender Ansatz zum Vergleich zweier Messreihen (sog. Stichproben) ist, den üblichen statistischen t-Test anzuwen- den. Oft wird dabei argumentiert, dass sie vergleichbar (d.h. äquivalent) sind, wenn die- ser keinen signifikanten Unterschied aufzeigt. Leider ist dieser Ansatz so nicht korrekt, da statistische Tests von Natur aus asymmet- risch sind. Weist ein solcher Test einen Un- terschied nach, ist dieser tatsächlich vorhan- 1 Stefanie Feiler arbeitet als Senior Consultant in angewandter Statistik bei AICOS Technologies, Philippe Solot ist der Geschäftsführer. 24. - 27.09.13 Besuchen Sie uns in Basel: Halle 1.1 Stand C36 Effiziente Begleitheizungssysteme BARTEC Safe.t ® Technology BARTEC Engineering + Services AG [email protected] www.bartec.ch Frostschutz Temperaturerhaltung Beheizung Für Ihr individuelles Begleitheizungsprojekt finden Sie bei BARTEC eine große Anzahl an Heizbändern, patentierte Anschlusstechniken und vielfältige Regelungssysteme. Profitieren Sie vom Wissen und der Erfahrung unserer Experten aus über 35 Jahren. BARTEC, Ihr Partner für Elektrische Heizungen!

Zum Trost gibt’s den TOST! - aicos.com · man in der Literatur [1]. Varianten Wird an der gleichen Probe jeweils zweimal gemessen (z.B. wenn die Effekte zweier Medikamente auf die

Embed Size (px)

Citation preview

3 7

9 / 2 0 1 3

Sicherheit vor Über- und Unterdruck mit Knickstab-Umkehr-

Berstscheiben von Rembe. Volle Querschnittsfreigabe ohne Fragmentation. Version für Clamp-Rohrverbindungen erhältlich.

PALIWODA AG, 8703 Erlenbach Telefon 044 910 50 05, www.paliwoda.ch

Für sichere

Berstscheiben.

R-U

B

F I R M E N B E R I C H T E N

Ein einfacher Test beweist Produkt- und Methodenäquivalenz

Zum Trost gibt’s den TOST!In der Entwicklung neuer analytischer Methoden, beim Laborvergleich oder in der Zulassung neuer Medikamen-te: Überall stellt sich die Frage, wie Äquivalenz zu einem Referenzsystem nachgewiesen werden kann. Hierzu verwendet man am besten den «TOST» – er basiert auf einem einfachen Konzept und vermeidet die Probleme, die ein simpler t-Test mit sich bringt.

Stefanie Feiler

und Philippe Solot1

In der analytischen Methodenentwicklung besteht oft die Anforderung, dass die neue Methode äquivalente Ergebnisse zum be-stehenden «Goldstandard» liefern soll.

Wenn verschiedene Labors Analysen bear-beiten, wird erwartet, dass die erhaltenen Ergebnisse vergleichbar sind. Bei einem neuen Therapeutikum muss gesichert sein, dass dieses nicht schlechter wirkt als der Vorgänger («non-inferiority»). Diese Fälle haben eines gemeinsam: Anstatt wie in der klassischen, vergleichenden Statistik nach signifikanten Unterschieden zu suchen, soll gerade gezeigt werden, dass keine wesent-lichen Unterschiede vorliegen. Doch wie kann man hier vorgehen?

Die Falle

Ein naheliegender Ansatz zum Vergleich zweier Messreihen (sog. Stichproben) ist, den üblichen statistischen t-Test anzuwen-den. Oft wird dabei argumentiert, dass sie vergleichbar (d.h. äquivalent) sind, wenn die-ser keinen signifikanten Unterschied aufzeigt. Leider ist dieser Ansatz so nicht korrekt, da statistische Tests von Natur aus asymmet-risch sind. Weist ein solcher Test einen Un-terschied nach, ist dieser tatsächlich vorhan-

1 Stefanie Feiler arbeitet als Senior Consultant in angewandter Statistik bei AICOS Technologies, Philippe Solot ist der Geschäftsführer.

24. - 27.09.13

Besuchen Sie uns in Basel:

Halle 1.1 ! Stand C36

Effi ziente Begleitheizungssysteme

BARTEC Safe.t® Technology

BARTEC Engineering + Services AG [email protected] www.bartec.ch

Frostschutz Temperaturerhaltung Beheizung

Für Ihr individuelles Begleitheizungsprojekt fi nden Sie bei

BARTEC eine große Anzahl an Heizbändern, patentierte

Anschlusstechniken und vielfältige Regelungssysteme.

Profi tieren Sie vom Wissen und der Erfahrung unserer

Experten aus über 35 Jahren.

BARTEC, Ihr Partner für Elektrische Heizungen!

3 8

9 / 2 0 1 3

F I R M E N B E R I C H T E N

den, wobei die Irrtumswahrscheinlichkeit höchstens die vorgegebenen α=5% (sog. Fehler erster Art oder α-Fehler) beträgt. Der Umkehrschluss ist hingegen falsch: Kann kein Unterschied nachgewiesen werden, be-deutet dies nicht, dass Gleichheit bewiesen wäre. Dies ist der sog. Fehler zweiter Art (auch β-Fehler). Es kann durchaus sein, dass ein bestehender systematischer Unterschied einfach nicht erkannt wird, beispielsweise aufgrund einer zu kleinen Stichprobengrösse.Dieses Vorgehen ist daher nicht wirklich

befriedigend. Ausserdem kommt hinzu, dass es in der Praxis oft weniger wichtig ist, dass zwei Methoden exakt die gleichen Er-gebnisse liefern. Es genügt, dass die Resul-tate nicht mehr als eine tolerable Abwei-chung voneinander zeigen. Dafür sollte eine ausreichende Genauigkeit garantiert werden können.

Die Lösung: TOST

Äquivalenztests verfolgen einen anderen Ansatz. Es interessiert nur, ob die Ergebnis-se der beiden Messreihen für praktische Zwecke nahe genug beieinander liegen. Ein sehr einfaches Konzept hierfür ist der TOST («two one-sided t-tests»). Als Beispiel aus der Pharmazie kann der Anteil an frei-gesetztem Wirkstoff nach 30 Minuten Auf-lösungsdauer dienen, wenn das Original-präparat (R für «Referenz») und ein Generikum (N für «neu») verglichen wer-den. Dabei ist ein wichtiger Punkt, sinnvol-le Grenzen festzulegen, innerhalb derer die Ergebnisse als vergleichbar angesehen wer-den. Es könnte beispielsweise entschieden werden, dass eine Differenz in den Antei-len von weniger als 8 Prozentpunkten in der Praxis nicht relevant ist. Nun werden ausgehend von den beiden Messreihen ein (1-2α)-Konfidenzintervall für die Differenz der Mittelwerte MWN – MWR berechnet, wobei in der Regel α=5 % benutzt wird. In diesem Bereich liegt dann also die Diffe-renz zwischen den tatsächlichen (stichpro-benunabhängigen) Freisetzungsanteilen der beiden Produkte mit 90 % Wahrschein-lichkeit.Die Abbildung stellt die verschiedenen Möglichkeiten, wie das Gesamtergebnis

ausfallen kann, dar. Die Grenzen ± θ geben den maximalen Unterschied an, bei dem die Ergebnisse nach praktischen Gesichts-punkten noch als gleichwertig angesehen werden (in unserem Beispiel ± 8 Prozent-punkte). Liegt das Konfidenzintervall voll-ständig innerhalb dieser Grenzen, werden die Ergebnisse als äquivalent klassifiziert. Bei einer zu kleinen Stichprobengrösse tritt leicht die Situation auf, dass das Konfidenz-intervall diese Grenzen überschreitet (rote gestrichelte Linien in der Abbildung). Damit ist eindeutig, dass die gewünschte Präzisi-on nicht erreicht werden kann und die Er-gebnisse somit nicht äquivalent sind.

Als weitere, untergeordnete Information erfährt man, ob ein systematischer Unter-schied («Bias») zwischen den Ergebnissen völlig ausgeschlossen werden kann (Gleich-heit). Wenn das berechnete Konfidenzin-tervall für die Differenz der Mittelwerte die Null einschliesst, kann nicht widerlegt wer-den, dass die Produkte in der Tat gleiche Ergebnisse liefern, die sich ausschliesslich durch zufällige Messfehler unterscheiden. Liegt die Null ausserhalb des Konfidenzin-tervalls, bedeutet dies hingegen einen sta-tistisch signifikanten Unterschied mit einer Sicherheit von mindestens 90 %.

Die Formel

Die Benutzung des 90 %-Konfidenzinter-valls entspricht zwei einseitigen t-Tests auf Ungleichheit zu je α=5 %, daher der Name (TOST = «two one-sided t-tests»). Grösse-re Softwaretools stellen die Funktionalität direkt zur Verfügung; die Formel für das Konfidenzintervall lässt sich aber selbst in

Die Grenzen ± θ geben den maximalen Un-terschied an, bei dem die Ergebnisse nach praktischen Gesichtspunkten noch als ver-gleichbar angesehen werden. Liegt das Kon-fidenzintervall zur Gänze innerhalb dieser Grenzen, wird von Äquivalenz gesprochen. Schliesst das Konfidenzintervall die 0 ein, liegt Gleichheit vor. Es ergeben sich verschie-dene Situationen (von oben nach unten): (1) Äquivalenz & Gleichheit; (2+3) keine Äquiva-lenz, aber Gleichheit (rot gestrichelt: Konfi-denzintervall überschreitet Grenze, d.h. feh-lende Präzision); (4) Äquivalenz, aber keine Gleichheit (Differenz MWN – MWR signifikant von 0 verschieden); (5) weder Äquivalenz noch Gleichheit (rot gestrichelt).

ROTAVER Composites AG

!"#$#$%&'()*

+,-./.0123$4(5637

034 460 62 62

'''8)%$9:()8;7

Lagerbehälter Prozessbehälter Beschichtungen aus GFK

#'<##1=9>(

Das Rudolph Research Automatic Polarimeter Autopol V+:

!"#$%&'()!*)+#)$,$- !".)/01#2'()!3()14520&0#2#)1,$-!+)1!678)00) !9)0:;)1/%<(#-!=!>1,'/)1!?!>&0)$2#'()1,$- !@ABA!C&$,&. !C#0!6&.#D1&0#5$220&$+&1+ !E,..!FG!HEI!J&10!GG!@$201,4)$0!K)8).!H54L.#&$')

Das Polarimeter.Ilmac Basel

24.9 ... 27.9.2013

Halle 1.1 Stand D58

Das RudoAuto

!"#$%&' !".)/01 !9)0:;) !@ABA!C !C#0!6& !E,..!FH54L

Dr. Marino Müller AG!!MGNF!"--!OP!!3).!QRR!SMT!FS!FS;).'54)U4,)..)1&-V'(!(00LW??!;;;V4,)..)1&-V'(

4 0

9 / 2 0 1 3

Excel leicht berechnen. Eine Möglichkeit ist, die Lehrbuch-Formel für das Konfidenzin-tervall in Excel einzugeben. Anleitungen, wie man die Berechnungen einfach mit den t-Test-Funktionen aus Excel durchfüh-ren sowie p-Werte berechnen kann, findet man in der Literatur [1].

Varianten

Wird an der gleichen Probe jeweils zweimal gemessen (z.B. wenn die Effekte zweier Medikamente auf die Blutwerte ein und derselben Person getestet werden), liegt eine sog. gepaarte Stichprobe vor. Hier kann dann analog ein Konfidenzintervall für den Mittelwert der Differenzen verwendet werden. Ferner kann man Non-Inferiority nachweisen, indem ein verwandter einsei-tiger Ansatz benützt wird. Ebenso kann eine Variante des TOST angewendet wer-den, um das Verhältnis einer neuen Me-thode oder eines neuen Therapeutikums zu einer Referenz zu beurteilen [2]. Details zur maximal erreichbaren Genauigkeit und

zur Fallzahlplanung kann man in der Litera-tur nachlesen [3].

Fazit

Der TOST ist eine sehr vorteilhafte Alternati-ve zum t-Test, wenn Äquivalenz oder Non-Inferiority nachgewiesen werden soll. Er ver-meidet die Probleme, die beim t-Test dadurch entstehen, dass die Grösse des Fehlers zwei-ter Art im Allgemeinen nicht bekannt ist. Es sollte daher darauf geachtet werden, dass in den Situationen, in denen ein Äquivalenztest angebracht ist, auch ein solcher durchgeführt wird. Schliesslich ist das Konzept einfach ver-ständlich, sodass selbst Personen, die mit dieser Art von Tests nicht vertraut sind, die erhaltenen Ergebnisse einfach verstehen kön-nen. In der Praxis wird der schwierigere Teil eher darin bestehen, die Toleranzgrenzen sinnvoll begründet festzulegen.

Originalpublikationen

[1] Richter SJ, Richter C (2002). A Method for Determining Equivalence in Industrial

Applications. Quality Engineering 14:3, 375-380.[2] Walker E, Nowacki AS (2011). Under-standing Equivalence and Noninferiority Testing. J Gen Intern Med. 26(2):192–196. http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3019319/ [3] Limentani GB et al. (2005). Beyond the t-test: statistical equivalence testing. Anal. Chem. 77(11):221A-226A.Weitere Literatur zu dem Thema ist bei den Verfassern erhältlich.

Kontakt

Dr. Stefanie FeilerDr. Philippe SolotAICOS Technologies AGEfringerstrasse 32 CH-4057 BaselTelefon +41 (0)61 686 98 [email protected]

STATPLU

SPower

HV - mA

HV - kV

Overload

Reset

0I

0I

II

II = mA

Start

I = kV~

4

6

8

10

20

01

2

3

4

5

2,5

X-7966

I

II

Haben Sie Probleme mit

elektrostatischer Aufladung?

HAUG-Ionisationssysteme neutralisieren elektro-

statische Ladungen zuverlässig, hochwirksam

und individuell nach Ihrem Bedarf.

HAUG BIEL AG

Johann-Renfer-Strasse 60

Postfach

2500 Biel 6

Tel.: 032 / 344 96 96

Fax: 032 / 344 96 97

[email protected]

www.haug-ionisation.com

Wenn Sie es vor Spannung

nicht mehr aushalten.

ILMAC 2013

Halle 1.1

Stand D92

!"#$%&%'

Verdrängerpumpen mit 4-Kolben-

membran-Technologie für die

!"#$"%&'()*!&+',-+./01&*!2

,/)*!&+3,-')1#/&4

ibW– Behälterrührwerke

– Seitenrührwerke

!"#$%&'()'*+',+

– Containerrührwerke

!-./0+'1.+'2$/3).4+4

!5+.#/#'$)62./3)+'!+#37

ALMATEC-'83,689:;+2<'$40820+4!

FDA und ATEX-konform

!=('!>+4!?.4/$#@!.4!A)+2.+!

84>!B4>8/#'.+

ALMATECHNIK AGC+81D//6.!E

FG/H$3)

AC:IEJI!K+.4.41+4

L+6+MG4! NIJ!OJ!PQE!RS!RS

L+6+M$T! NIJ!OJ!PQE!RS!RP

.4MGU$62$#+3)4.,73)

***7$62$#+3)4.,73)

mpen m mit 4 4-Kololbeben-

nonologigie füfür didie

)+!84>4>!<.G.G#+3)3):

wewerkee

rkrke

,+,+

rwrwerkeke

/3).4+4+4

)+)+'!+#+#37

<'<'$408082020+4+4!

ononformrm

!.4!4!A)A)+2+2.+!

L+6+MG4 NIJ!OJ!PQE!RS!RS

Besuchen Sie unsHalle 1.0 Stand D14

24. – 27. 09. 2013 | Messe Basel

!"#

VeVerdrärä

memembmb

0)0)0)0)$'2$2$

4.4./3/3/3/3)+)+)+!B

F I R M E N B E R I C H T E N