38
Docking von starren und flexiblen Proteinen Seminar Bioinformatik, „Theoretical Analysis of Protein- Protein Interactions” Präsentation von Andreas Schlicker ( [email protected] )

Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

Embed Size (px)

Citation preview

Page 1: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

Docking von starren und flexiblen Proteinen

Seminar Bioinformatik, „Theoretical Analysis of Protein-Protein Interactions”

Präsentation von Andreas Schlicker ([email protected])

Page 2: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

2

ÜbersichtÜbersicht

Molecular surface recognition:Molecular surface recognition: Docking von starren Proteinen und Docking von starren Proteinen und

Liganden mit Hilfe von Korrelation Liganden mit Hilfe von Korrelation geometrischer Eigenschaftengeometrischer Eigenschaften

Dead-End Elimination theorem (DEE):Dead-End Elimination theorem (DEE): Reduktion des Konformations-Suchraums Reduktion des Konformations-Suchraums

bei flexiblem Dockingbei flexiblem Docking Protein Docking mit flexiblen Protein Docking mit flexiblen

SeitenkettenSeitenketten

Page 3: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

3

Molecular surface Molecular surface recognitionrecognition Docking von Molekülen anhand Docking von Molekülen anhand

geometrischer Eigenschaftengeometrischer Eigenschaften Form von Interfaces im gebundenen Form von Interfaces im gebundenen

und freien Zustand häufig sehr ähnlichund freien Zustand häufig sehr ähnlich

Suche im 6-dimensionalen Rotations- Suche im 6-dimensionalen Rotations- und Translationsraumund Translationsraum

Page 4: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

4

Repräsentation der Repräsentation der MoleküleMoleküle

Projektion der Projektion der 3D-Koordinaten 3D-Koordinaten auf ein Gitterauf ein Gitter Gitterpunkt Gitterpunkt

innerhalb des innerhalb des Moleküls, wenn Moleküls, wenn Atomkern Atomkern innerhalb Radius innerhalb Radius r vorhandenr vorhanden

[1]

[1]

Page 5: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

5

Matching von Matching von Oberflächen (I)Oberflächen (I) Korrelation der geometrischen FormKorrelation der geometrischen Form

((αα, , ββ, , γγ) gibt die Verschiebung von ) gibt die Verschiebung von Molekül b in Bezug auf Molekül a anMolekül b in Bezug auf Molekül a an

[1]

Kein Kontakt Kein Kontakt Korrelation = 0 Korrelation = 0Kontakt Kontakt Korrelation > 0 Korrelation > 0

je besser der Kontakt, desto größer je besser der Kontakt, desto größer die Korrelationdie Korrelation

Page 6: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

6

Matching von Matching von Oberflächen (II)Oberflächen (II)

Problem: auch Überlappung liefert Problem: auch Überlappung liefert positive Korrelationpositive Korrelation

Lösung: Lösung: ρρ in Gleichung [2a] << 0 in Gleichung [2a] << 0 δδ in Gleichung [2b] > 0 in Gleichung [2b] > 0

Überlappung wird mit Überlappung wird mit

negativer Korrelation bestraftnegativer Korrelation bestraft

[1]

Page 7: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

7

Berechnung (I)Berechnung (I)

Direkte Berechnung der Korrelation Direkte Berechnung der Korrelation benötigt Zeit O(Nbenötigt Zeit O(N66)) Verwende Fourier Transformation Verwende Fourier Transformation

Korrelation wird durch Inverse Fourier-Transformation erhaltenKorrelation wird durch Inverse Fourier-Transformation erhalten

[1]

Benötigte Zeit liegt in Benötigte Zeit liegt in O(N³ln(N³))O(N³ln(N³))

Page 8: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

8

Berechnung (II)Berechnung (II)

Molekül a wird fixiert, Molekül b wird Molekül a wird fixiert, Molekül b wird in allen Orientierungen getestetin allen Orientierungen getestet

[1]

Page 9: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

9

ResultateResultate

Test mit 5 Komplexen, zwei Test mit 5 Komplexen, zwei Durchgänge mit unterschiedlichen Durchgänge mit unterschiedlichen Gitter-GrößenGitter-Größen

[1]

[1]

[1]

Page 10: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

10

Vor- und NachteileVor- und Nachteile

Vorteile:Vorteile: Schnelle BerechnungSchnelle Berechnung Meistens korrekte VorhersageMeistens korrekte Vorhersage Parameter sind universell einsetzbarParameter sind universell einsetzbar

Nachteile:Nachteile: Starre MoleküleStarre Moleküle Keine Berücksichtigung physiko-Keine Berücksichtigung physiko-

chemischer Eigenschaftenchemischer Eigenschaften

Page 11: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

11

Dead-End Elimination Dead-End Elimination TheoremTheorem Konformationsraum von Proteinen Konformationsraum von Proteinen

sehr groß, selbst bei Verwendung sehr groß, selbst bei Verwendung von Rotamer-Bibliothekenvon Rotamer-Bibliotheken

Systematische Suche nach der Systematische Suche nach der „global minimum energy „global minimum energy conformation“ (GMEC) praktisch conformation“ (GMEC) praktisch unmöglichunmöglich

Page 12: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

12

Energie einer Energie einer KonformationKonformation

Potentielle Energie eines Proteins:Potentielle Energie eines Proteins:

[2]

Page 13: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

13

„„Dead-Ending“ RotamereDead-Ending“ Rotamere

Rotamere, die in der GMEC nicht Rotamere, die in der GMEC nicht vorkommen könnenvorkommen können

Rotamer iRotamer irr kann nicht vorkommen, kann nicht vorkommen, wenn für ein Paar (iwenn für ein Paar (irr, i, itt) gilt:) gilt:

[2]

Page 14: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

14

Erweiterung auf Erweiterung auf RotamerpaareRotamerpaare Energie eines Rotamerpaares [iEnergie eines Rotamerpaares [irrjjss]]

Interaktionsenergie mit anderen RotamerenInteraktionsenergie mit anderen Rotameren

Rotamerpaar [iRotamerpaar [irrjjss] ist „dead-ending“, wenn gilt:] ist „dead-ending“, wenn gilt:

[2]

[2]

[2]

Page 15: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

15

AlgorithmusAlgorithmus Eliminiere alle Rotamere, die Eliminiere alle Rotamere, die

offensichtlich inkompatibel sindoffensichtlich inkompatibel sind Eliminiere „dead-ending“ Rotamere Eliminiere „dead-ending“ Rotamere

mit dem DEE Theoremmit dem DEE Theorem Wende DEE Theorem auf alle Wende DEE Theorem auf alle

Rotamerpaare an und markiere Rotamerpaare an und markiere „dead-ending“ Paare„dead-ending“ Paare

Iteriere, bis keine weiteren Rotamere Iteriere, bis keine weiteren Rotamere mehr entfallenmehr entfallen

Page 16: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

16

Resultate (I)Resultate (I) Test mit dem Insulin-DimerTest mit dem Insulin-Dimer

anfängliche Kombinationsmöglichkeiten: anfängliche Kombinationsmöglichkeiten: 2,7*102,7*107676

Nach 9 Iterationen: 7200 Nach 9 Iterationen: 7200 Modellierung des Modellierung des

Proteins liefert 55 Proteins liefert 55 richtig richtig vorhergesagte vorhergesagte ResiduenResiduen Verborgene Verborgene

Residuen werden Residuen werden mit 93% Genauigkeit mit 93% Genauigkeit vorhergesagtvorhergesagt

[2]

Page 17: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

17

Resultate (II)Resultate (II)

Blind-Test an Limulus polyphemus Blind-Test an Limulus polyphemus 194 Aminosäuren, wovon 71 % richtig 194 Aminosäuren, wovon 71 % richtig

vorhergesagt wurdenvorhergesagt wurden Viele Fehler durch falsche Salz- und Viele Fehler durch falsche Salz- und

Wasserstoffbrücken an exponierten Wasserstoffbrücken an exponierten GruppenGruppen

Page 18: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

18

Vor- und NachteileVor- und Nachteile

Vorteile:Vorteile: Schnelle Berechnung (Aufwand steigt „nur“ Schnelle Berechnung (Aufwand steigt „nur“

quadratisch mit Anzahl der Aminosäuren)quadratisch mit Anzahl der Aminosäuren) Starke Reduzierung des SuchraumsStarke Reduzierung des Suchraums

Nachteile:Nachteile: Ungenauigkeiten durch verwendete Ungenauigkeiten durch verwendete

EnergiefunktionEnergiefunktion Benötigt relativ genaues TemplateBenötigt relativ genaues Template Abhängig von der verwendeten Rotamer-Abhängig von der verwendeten Rotamer-

BibliothekBibliothek

Page 19: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

19

Protein Docking mit Protein Docking mit flexiblen Seitenkettenflexiblen Seitenketten

Docking von rigiden Strukturen keine Docking von rigiden Strukturen keine gute Lösunggute Lösung

Problem des exponentiellen Problem des exponentiellen Wachstums des Konformationsraums Wachstums des Konformationsraums bei flexiblen Seitenkettenbei flexiblen Seitenketten

Page 20: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

20

FlexibilitätFlexibilität

Alle Residuen flexibel behandeln sehr Alle Residuen flexibel behandeln sehr aufwändig selbst bei Verwendung aufwändig selbst bei Verwendung von Rotamer-Bibliothekenvon Rotamer-Bibliotheken Nur Interface-Residuen flexibelNur Interface-Residuen flexibel

Interface benötigtInterface benötigt

Rigides Docking zur Erzeugung von Rigides Docking zur Erzeugung von AnfangsstrukturenAnfangsstrukturen

Page 21: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

21

Rigides DockingRigides Docking

Verwendet geometrische und einfache Verwendet geometrische und einfache chemische Fitness Funktionenchemische Fitness Funktionen

Von den erzeugten Komplexstrukturen Von den erzeugten Komplexstrukturen wurden die 60 besten weiter verfolgtwurden die 60 besten weiter verfolgt Oft große Überlappung der Proteine und Oft große Überlappung der Proteine und

inkorrekt platzierte Seitenketteninkorrekt platzierte Seitenketten

Page 22: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

22

Bestimmung der Bestimmung der BindungsstelleBindungsstelle Residuen, die innerhalb 6 Å eines Residuen, die innerhalb 6 Å eines

Atoms des anderen Proteins liegen Atoms des anderen Proteins liegen

Seitenketten ohne Rotamere (CYS in Seitenketten ohne Rotamere (CYS in Disulfidbrücken, ALA, GLY) werden Disulfidbrücken, ALA, GLY) werden nicht berücksichtigtnicht berücksichtigt

Page 23: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

23

GMECGMEC

GMEC = Kombination der Rotamere, GMEC = Kombination der Rotamere, die die niedrigste Energie lieferndie die niedrigste Energie liefern

Anwendung des DEE-Theorems Anwendung des DEE-Theorems möglichmöglich

[3]

Page 24: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

24

Suche nach der GMECSuche nach der GMEC

Zwei Strategien:Zwei Strategien: Multi-Greedy MethodeMulti-Greedy Methode Branch-and-cut basierend auf einem ILPBranch-and-cut basierend auf einem ILP

Page 25: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

25

Multi-Greedy Methode Multi-Greedy Methode (I)(I) Aufbau eines Enumerations-Baumes Aufbau eines Enumerations-Baumes

mit möglichen Kombinationenmit möglichen Kombinationen

[3]

Page 26: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

26

Integer Linear Program Integer Linear Program (ILP)(ILP) Formulierung als Minimierungs-Problem Formulierung als Minimierungs-Problem

auf einem ungerichteten Graphenauf einem ungerichteten Graphen Knoten v für alle Rotamere, E(v) = EKnoten v für alle Rotamere, E(v) = Etpltpl

ir ir - E- Emaxmax

Kanten uv für Rotamer-Paare verschiedener Residuen, Kanten uv für Rotamer-Paare verschiedener Residuen,

E(uv) = EE(uv) = Epwpwir,js ir,js - E- Emaxmax

k-partiter Graph mit negativen Kanten- und k-partiter Graph mit negativen Kanten- und Knoten-GewichtenKnoten-Gewichten

GMEC entspricht Rotamer-Graph mit GMEC entspricht Rotamer-Graph mit minimalem Gewichtminimalem Gewicht

Page 27: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

27

ILP (II)ILP (II)

[3]

[3]

Page 28: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

28

Branch-and-cut Branch-and-cut

Lösen der Relaxation des ILPsLösen der Relaxation des ILPs Falls Lösung ā nicht optimal, suche Falls Lösung ā nicht optimal, suche

nach nach

fa <= ffa <= f00, die , die ā alsā als mögliche Lösung mögliche Lösung ausschließtausschließt

Falls keine Ungleichung gefunden Falls keine Ungleichung gefunden wird, aufsplitten in zwei wird, aufsplitten in zwei Unterprobleme Unterprobleme

Page 29: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

29

EnergieberechnungEnergieberechnung

Optimierung der GMEC mit AMBEROptimierung der GMEC mit AMBER Freie Bindungsenergie:Freie Bindungsenergie:

[3]

ΔΔGGESES: elektrostatischer Beitrag: elektrostatischer Beitrag ΔΔGGcavcav: freie Cavitäts-Energie in Wasser: freie Cavitäts-Energie in Wasser ΔΔGGconfconf: Änderung der Entropie: Änderung der Entropie ΔΔGGvdWvdW: Änderung der freien van-der-Waals : Änderung der freien van-der-Waals

EnergieEnergie

Page 30: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

30

Algorithmus (I)Algorithmus (I)

Generierung von Ausgangsstrukturen Generierung von Ausgangsstrukturen mit Hilfe von rigidem Docking mit Hilfe von rigidem Docking

Bestimmung der Aminosäuren am Bestimmung der Aminosäuren am InterfaceInterface Variation dieser Aminosäuren durch Variation dieser Aminosäuren durch

RotamereRotamere Iterative Anwendung des DEE Iterative Anwendung des DEE

Theorems zur Reduktion des Theorems zur Reduktion des KonformationsraumesKonformationsraumes

Page 31: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

31

Algorithmus (II)Algorithmus (II)

Finden der GMEC mit Hilfe der Finden der GMEC mit Hilfe der schnellen Heuristic bzw. des exakten schnellen Heuristic bzw. des exakten branch-and-cut Algorithmusbranch-and-cut Algorithmus

Optimierung der Molekülgeometrien Optimierung der Molekülgeometrien mit Hilfe eines Molekülmechanik mit Hilfe eines Molekülmechanik KraftfeldesKraftfeldes

Berechnung der freien Berechnung der freien BindungsenergieBindungsenergie

Page 32: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

32

Resultate (I)Resultate (I)

Test mit drei Protein Komplexen Test mit drei Protein Komplexen Anwendung des DEE ergibt große Anwendung des DEE ergibt große

VereinfachungVereinfachung

[3]

Page 33: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

33

Resultate (II)Resultate (II)

[3]

Page 34: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

34

Resultate (III)Resultate (III)

[3]

Page 35: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

35

Resultate (IV)Resultate (IV)

[3]

Page 36: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

36

Vor- und NachteileVor- und Nachteile

Vorteile:Vorteile: Heuristik liefert schnell gute Annäherung Heuristik liefert schnell gute Annäherung

an optimale Lösungan optimale Lösung Branch-and-cut liefert optimale RotamereBranch-and-cut liefert optimale Rotamere

Nachteile:Nachteile: Keine perfekte Trennung von guten und Keine perfekte Trennung von guten und

schlechten Ergebnissenschlechten Ergebnissen Ergebnisse stark von der Wahl des Ergebnisse stark von der Wahl des

Kraftfeldes abhängigKraftfeldes abhängig

Page 37: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

37

ZusammenfassungZusammenfassung

Rigides Docking nur erfolgreich, Rigides Docking nur erfolgreich, wenn native und Komplexstruktur wenn native und Komplexstruktur sehr ähnlich sindsehr ähnlich sind

Rigides Docking aber guter Rigides Docking aber guter Startpunkt für flexibles DockingStartpunkt für flexibles Docking

Dead-End elimination starke Dead-End elimination starke Vereinfachung bei flexiblem DockingVereinfachung bei flexiblem Docking

Page 38: Docking von starren und flexiblen Proteinen Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Präsentation von Andreas Schlicker

38

ReferenzenReferenzen

[1][1] Katchalski-Katzir, E., Shariv, I., et al., (1992) PNAS, 89, 2195-

2199. Molecular Surface Recognition: Determination of Geometric Fit between Proteins and their Ligands by Correlation Techniques

[2] Desmet, J., De Maeyer, M., Hazes, B., and Lasters, I., (1992) Nature, 356, 539-542. DEE Theorem and its Use in Protein DEE Theorem and its Use in Protein Side Chain Positioning Side Chain Positioning

[3] Althaus, E., Kohlbacher, O., Lenhof, H.-P., and Muller, P., [3] Althaus, E., Kohlbacher, O., Lenhof, H.-P., and Muller, P., (2002) J. Comput. Biol., 9, 597-612. A Combinatorial Approach (2002) J. Comput. Biol., 9, 597-612. A Combinatorial Approach to Protein Docking with Flexible Side Chainsto Protein Docking with Flexible Side Chains