Vergleich von Merkmalen in Flüssigchromatographie ... · Mathematik/Informatik Merkmale der Daten...

Preview:

Citation preview

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Vergleich von Merkmalen inFlussigchromatographie-

Massenspektrometrie-Daten

Kristian Bredies

4. November 2005

1 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Inhalt

1 Einleitung

2 Flussigchromatographie-MassenspektrometrieDas VerfahrenMerkmale der DatenAufgabe

3 Erste LosungsansatzeEin AlgorithmusAusblick

2 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Hintergrund

Kontakt mit dem Pharma-Unternehmen Roche durch ManfredNolte seit August/September 2005

Untersuchung von Substanzen auf bestimmteStoffwechselprodukte

Vorhandene Software unzureichend

Bessere Algorithmen notig, um “schwache Signale”, zuerkennen

3 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Hintergrund

Kontakt mit dem Pharma-Unternehmen Roche durch ManfredNolte seit August/September 2005

Untersuchung von Substanzen auf bestimmteStoffwechselprodukte

Vorhandene Software unzureichend

Bessere Algorithmen notig, um “schwache Signale”, zuerkennen

3 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Allgemeine Aufgabe

Gegeben:

Ein Gemisch von Substanzen in jeweils einer Blankprobe und einerInkubationsprobe zu verschiedenen Zeitpunkten.

Gesucht:

Die Substanzen, um die sich die Proben unterscheiden und derenquantitative Entwicklung in den jeweiligen Zeiten.

4 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Allgemeine Aufgabe

Gegeben:

Ein Gemisch von Substanzen in jeweils einer Blankprobe und einerInkubationsprobe zu verschiedenen Zeitpunkten.

Gesucht:

Die Substanzen, um die sich die Proben unterscheiden und derenquantitative Entwicklung in den jeweiligen Zeiten.

4 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Das Verfahren

Die untersuchten Substanzen werden mit einemFlussigchromatographie-Massenspektrometer (LC-MS) analysiert.

Inkubationsprobe

Blankprobe

In diesen Geraten wird Chromatographie und Massenspektrometriekombiniert.

5 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Das Verfahren

Die untersuchten Substanzen werden mit einemFlussigchromatographie-Massenspektrometer (LC-MS) analysiert.

Inkubationsprobe

Blankprobe

In diesen Geraten wird Chromatographie und Massenspektrometriekombiniert.

5 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Das Verfahren

Die untersuchten Substanzen werden mit einemFlussigchromatographie-Massenspektrometer (LC-MS) analysiert.

Inkubationsprobe

Blankprobe

In diesen Geraten wird Chromatographie und Massenspektrometriekombiniert.

5 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Das Verfahren

Die untersuchten Substanzen werden mit einemFlussigchromatographie-Massenspektrometer (LC-MS) analysiert.

Inkubationsprobe

Blankprobe

In diesen Geraten wird Chromatographie und Massenspektrometriekombiniert.

5 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Flussigchromatographie-Massenspektrometrie

Schematische Funktionsweise:

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

0.5

1

1.5

2x 10

6

6 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Flussigchromatographie-Massenspektrometrie

Schematische Funktionsweise:

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

0.5

1

1.5

2x 10

6

6 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Flussigchromatographie-Massenspektrometrie

Schematische Funktionsweise:

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

0.5

1

1.5

2x 10

6

6 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Flussigchromatographie-Massenspektrometrie

Schematische Funktionsweise:

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

0.5

1

1.5

2x 10

6

6 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Flussigchromatographie-Massenspektrometrie

Schematische Funktionsweise:

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

0.5

1

1.5

2x 10

6

6 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Flussigchromatographie-Massenspektrometrie

Schematische Funktionsweise:

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

0.5

1

1.5

2x 10

6

6 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Flussigchromatographie-Massenspektrometrie

Schematische Funktionsweise:

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

0.5

1

1.5

2x 10

6

6 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Flussigchromatographie-Massenspektrometrie

Schematische Funktionsweise:

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

0.5

1

1.5

2x 10

6

6 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Flussigchromatographie-Massenspektrometrie

Schematische Funktionsweise:

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3

4x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

1

2

3x 10

6

100 200 300 400 500 6000

0.5

1

1.5

2x 10

6

6 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Merkmale der Daten

Interessant sind Peaks, die exponentiell inder Masse und wie eine Gaußkurve in derZeit verlaufen.

Die Peaks konnen sich uberlappen.

Die Datensatze sind teilweise sehr starkverrauscht, etwa in der Großenordnungder kleinsten interessanten Merkmale.

444 446 448 450

15

15.2

15.4

15.6

445

450 15

15.5

2468

x 107

7 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Merkmale der Daten

Interessant sind Peaks, die exponentiell inder Masse und wie eine Gaußkurve in derZeit verlaufen.

Die Peaks konnen sich uberlappen.

Die Datensatze sind teilweise sehr starkverrauscht, etwa in der Großenordnungder kleinsten interessanten Merkmale.

540 545 550 555 560

10

10.2

10.4

10.6

10.8

11

11.2

7 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Merkmale der Daten

Interessant sind Peaks, die exponentiell inder Masse und wie eine Gaußkurve in derZeit verlaufen.

Die Peaks konnen sich uberlappen.

Die Datensatze sind teilweise sehr starkverrauscht, etwa in der Großenordnungder kleinsten interessanten Merkmale.

250 260 2709.5

10

10.5

11

7 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Merkmale der Daten

Die LC-MS-Daten sind durchsetzt vonunerwunschten Dauerpeaks in zeitlicherRichtung.

Verschiedene Datensatze konnenzueinander zeitlich verzerrt undverschoben sein.

Die Peakhohen schwanken zwischen 105

und 108.

130 140 150 160 1709

9.5

10

10.5

11

11.5

12

12.5

13

13.5

14

8 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Merkmale der Daten

Die LC-MS-Daten sind durchsetzt vonunerwunschten Dauerpeaks in zeitlicherRichtung.

Verschiedene Datensatze konnenzueinander zeitlich verzerrt undverschoben sein.

Die Peakhohen schwanken zwischen 105

und 108.

280 300 32011.6

11.8

12

12.2

12.4

12.6

280 300 32011.6

11.8

12

12.2

12.4

12.6

280 300 32011.6

11.8

12

12.2

12.4

12.6

8 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Merkmale der Daten

Die LC-MS-Daten sind durchsetzt vonunerwunschten Dauerpeaks in zeitlicherRichtung.

Verschiedene Datensatze konnenzueinander zeitlich verzerrt undverschoben sein.

Die Peakhohen schwanken zwischen 105

und 108.

280 300 32011.6

11.8

12

12.2

12.4

12.6

280 300 32011.6

11.8

12

12.2

12.4

12.6

280 300 32011.6

11.8

12

12.2

12.4

12.6

8 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Merkmale der Daten

Die LC-MS-Daten sind durchsetzt vonunerwunschten Dauerpeaks in zeitlicherRichtung.

Verschiedene Datensatze konnenzueinander zeitlich verzerrt undverschoben sein.

Die Peakhohen schwanken zwischen 105

und 108.

140 160 180 200

2468

10

x 106

140 160 180 2000

2

4

x 105

8 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Aufgabe der Bildverarbeitung

Gegeben:

Zu unterschiedlichen Zeitpunkten jeweils ein PaarLC-MS-Datensatze.

Gesucht:

1 Die Position und Hohe der interessanten Peaks in denjeweiligen Datensatzen.

2 Eine Zuordnung der gleichen Peaks in einem Datenpaar.

3 Eine Quantifizierung der zeitlichen Entwicklung derunterschiedlichen Peaks.

9 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Aufgabe der Bildverarbeitung

Gegeben:

Zu unterschiedlichen Zeitpunkten jeweils ein PaarLC-MS-Datensatze.

Gesucht:

1 Die Position und Hohe der interessanten Peaks in denjeweiligen Datensatzen.

2 Eine Zuordnung der gleichen Peaks in einem Datenpaar.

3 Eine Quantifizierung der zeitlichen Entwicklung derunterschiedlichen Peaks.

9 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Erste Losungsansatze

Mogliches Verfahren zur Erkennung der Peaks in einem Datensatz:

Algorithmus

1 Entfernen von Rauschen.

2 Erkennen und Entfernen der Dauerpeaks in Zeitrichtung(vertikale Streifen).

3 Detektion von lokalen Maxima.

10 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Details zum Algorithmus

Entrauschen

Faltungs-Filtern entfernt kleine Peakszu schnell.

Wavelet-Hardthresholding mitz.B. db2 erhalt kleine Peaks besser.

Artefakte konnen durch Abschneidennegativer Werte verringert werden.

460 480 500

14.5

15

15.5

16

16.5

17

460 480 500

14.5

15

15.5

16

16.5

17

11 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Details zum Algorithmus

Entrauschen

Faltungs-Filtern entfernt kleine Peakszu schnell.

Wavelet-Hardthresholding mitz.B. db2 erhalt kleine Peaks besser.

Artefakte konnen durch Abschneidennegativer Werte verringert werden.

460 480 500

14.5

15

15.5

16

16.5

17

460 480 500

14.5

15

15.5

16

16.5

17

11 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Details zum Algorithmus

Entrauschen

Faltungs-Filtern entfernt kleine Peakszu schnell.

Wavelet-Hardthresholding mitz.B. db2 erhalt kleine Peaks besser.

Artefakte konnen durch Abschneidennegativer Werte verringert werden.

460 480 500

14.5

15

15.5

16

16.5

17

460 480 500

14.5

15

15.5

16

16.5

17

11 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Details zum Algorithmus

Erkennen der Basislinie

Erosion mit vertikalemStrukturelement.

Bei voller vertikaler Linie entsteheneigene unerwunschte Strukturen.

Drei-Punkt-Element bietetakzeptablen Kompromiss.

150 160 170 180 19011

11.5

12

12.5

13

150 160 170 180 19011

11.5

12

12.5

13

12 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Details zum Algorithmus

Erkennen der Basislinie

Erosion mit vertikalemStrukturelement.

Bei voller vertikaler Linie entsteheneigene unerwunschte Strukturen.

Drei-Punkt-Element bietetakzeptablen Kompromiss.

150 160 170 180 19011

11.5

12

12.5

13

150 160 170 180 19011

11.5

12

12.5

13

12 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Details zum Algorithmus

Erkennen der Basislinie

Erosion mit vertikalemStrukturelement.

Bei voller vertikaler Linie entsteheneigene unerwunschte Strukturen.

Drei-Punkt-Element bietetakzeptablen Kompromiss.

150 160 170 180 19011

11.5

12

12.5

13

150 160 170 180 19011

11.5

12

12.5

13

12 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Details zum Algorithmus

Detektieren der Peaks

Betrachte nur Peaksuber einem gewissenSchwellwert.

Finde Peaks durchlokale Maxima.

13 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Details zum Algorithmus

Detektieren der Peaks

Betrachte nur Peaksuber einem gewissenSchwellwert.

Finde Peaks durchlokale Maxima.

13 / 14Einleitung LC-MS Erste Losungsansatze

Zentrum furTechnomathematik Vergleich von LC-MS-Daten

Fachbereich 03Mathematik/Informatik

Ausblick

Folgende Schritte sind noch notig:

Exakte Bestimmung der Position und Hohe eines Peaks.

Korrektur der Zeitverzerrung/-verschiebung zwischen zweiDatensatzen.

Betrachtung und Vergleich mehrerer Datenpaare.

14 / 14Einleitung LC-MS Erste Losungsansatze

Recommended