Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
1
Chemieinformatik
Grundlagen der Chemieinformatik
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
2
Chemieinformatik
Organisation der Vorlesung
Mi., 10-12 c.t., Raum A 302
10 VorlesungstermineApril: 25.Mai: 02., 09., 16. Juni: 06., 13., 27.Juli: 04., 11., 18.
Keine Vorlesung am 23.5., 30.5., 20.06.
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
3
Chemieinformatik
Literatur
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
4
Chemieinformatik
Literatur
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
5
Chemieinformatik
Chemoinformatik
Chemoinformatics is mixing of information resources to transform data into information, and information into knowledge, for the intended purpose of making better decisions faster in the arena of drug lead identification and optimisation.
Frank Brown, Johnson and Johnson
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
6
Chemieinformatik
Chemoinformatik
Chemoinformatik (Chemieinformatik, Cheminformatic, Chemiinformatik)löst Problem in der Chemie mit Methoden der Informatik.
Johnny Gasteiger
Die Übergänge zur Bioinformatik sind fließend und weitgehend irrelevant.
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
7
Chemieinformatik Chemoinformatik: Supporting Reality
Das Foto zeigt den Steamcracker der BASF im Werk Ludwigshafen. In dieser Anlage wird Rohöl mit Dampf (steam) in die wichtigsten Rohprodukte für chemische Erzeugnisse aufgespalten (gecrackt).
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
8
Chemieinformatik
O
O
CH3
O
OH
Supramolekulare ChemieSupramolekulare Chemie PolymerchemiePolymerchemie
OrganometallchemieOrganometallchemie Anorganische ChemieAnorganische ChemieOrganische ChemieOrganische Chemie
BiochemieBiochemie
• Rkt.bedingungen Rkt.partner, Lösemittel Temperatur, Katalysator Arbeitsvorschrift etc.• Rkt.parameter Geschwind.konstante Gleichgew.konstante Übergangszustände Ausbeute etc.• Rkt.klassifizierung• Literatur, Patente
• 3D-Struktur Konformationen• Eigenschaften phys.-chemisch thermodynamisch spektroskopisch pharmakologisch ADME/Tox* ökologisch etc.• Registrier-Nr.• Literatur, Patente
Acetylsalicylsäure (AspirinTM)
ADME/Tox = Absorption Distribution Metabolism Excretion Toxicology
Klassische Chemie
O
OOH
OH
ONa
Cl
OH
COONa
OH
COOH
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
9
Chemieinformatik
O
O
CH3
O
OH
Phenolsynthese nach HOCKaus Cumol überAralkylhydroperoxid(säurekatalysierte Spaltung vonPeroxyverbindungen)
Acetylsalicylsäure (AspirinTM)
O
OOH
OH
ONa
Cl
OH
COONa
OH
COOH
Supramolekulare ChemieSupramolekulare Chemie PolymerchemiePolymerchemie
OrganometallchemieOrganometallchemie Anorganische ChemieAnorganische ChemieOrganische ChemieOrganische Chemie
BiochemieBiochemie
Klassische Chemie
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
10
Chemieinformatik
O
O
CH3
O
OH
KOLBE-SCHMITT-Synthese zur Carboxylierung von Phenolaten:Elektrophile aromatische Substitutionbei erhöhtem Druck und erhöhterTemperatur: Der aktivierte nukleophileAromat kann das elektrophile Kohlendioxid angreifen; durch Chelat-Mechanismus ist die ortho-Position bei der Reaktion bevorzugt
Acetylsalicylsäure (AspirinTM)
O
OOH
OH
ONa
Cl
OH
COONa
OH
COOH
Supramolekulare ChemieSupramolekulare Chemie PolymerchemiePolymerchemie
OrganometallchemieOrganometallchemie Anorganische ChemieAnorganische ChemieOrganische ChemieOrganische Chemie
BiochemieBiochemie
Klassische Chemie
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
11
Chemieinformatik
O
O
CH3
O
OH
Veresterung derHydroxylgruppe mitEssigsäure(Acetanhydrid)
Acetylsalicylsäure (AspirinTM)
O
OOH
OH
ONa
Cl
OH
COONa
OH
COOH
O
O O
Supramolekulare ChemieSupramolekulare Chemie PolymerchemiePolymerchemie
OrganometallchemieOrganometallchemie Anorganische ChemieAnorganische ChemieOrganische ChemieOrganische Chemie
BiochemieBiochemie
Klassische Chemie
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
12
Chemieinformatik
O
O
CH3
O
OH
Optimierung der Reaktionsführungim industriellen Maßstab (Tonnen)durch die Technische Chemie/Chemische Verfahrenstechnik
Acetylsalicylsäure (AspirinTM)
O
OOH
OH
ONa
Cl
OH
COONa
OH
COOH
Supramolekulare ChemieSupramolekulare Chemie PolymerchemiePolymerchemie
OrganometallchemieOrganometallchemie Anorganische ChemieAnorganische ChemieOrganische ChemieOrganische Chemie
BiochemieBiochemie
Klassische Chemie
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
13
Chemieinformatik
Chemoinformatik: Scope 1
•Kodierung Chemischer Strukturen•Kodierung Chemischer Reaktionen•Vorhersage Chemischer Reaktionen
• Geschwindigkeit und Gleichgewichtslage bei gegebenen Bedingung
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
14
Chemieinformatik
Chemoinformatik: A History
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
15
Chemieinformatik
Chemoinformatik: A History
Gold Silber Eisen Kupfer Blei Antimon Wismut
Erhitzen Auflösen Zerreiben Destillieren Sieben
Blut Milch Träne Flüssigkeit Schuppe Zahn Haar Feder Schwanz
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
16
Chemieinformatik
Chemoinformatik: A History
• Deutsch-russischer Chemiker (1838-1906)
• Veröffentlichte 1881 die erste Auflage seines „Handbuchs der Organischen Chemie“
• 4. Auflage (1918), danach Publikation in Ergänzungswerken
• Jede Serie eingeteilt in 27. Bände
• Einträge in das Handbuch sind substanzzentriert
Friedrich Konrad Beilstein
• Ende der 1980er wurde das Handbuch mit BMBF-Finanzierung in eine Datenbank überführt.
• Nach jahrelangem Rechtsstreit entwickelt nun Elsevier die Datenbank weiter.
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
17
Chemieinformatik
Chemoinformatik: A History
Friedrich Konrad Beilstein
• Ein Handbüchlein ...
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
18
Chemieinformatik
Chemoinformatik: A History
Friedrich Konrad Beilstein
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
19
Chemieinformatik
Chemoinformatik: A History
• Setzt Erkenntnisse zur Theorie der chemischen Bindung in eine systematische Klassifizierung organischer Verbindungen ein
•Acyclen Band 1-4
•Isocyclen Band 5-16
•Heterocyclen (1 O) Band 17/18
•Heterocyclen (2, 3, ... O) Band 19
•Heterocyclen (1 N) Band 20-22
•usw.
•Bei mehrfunktionellen Verbindungen gilt das Prinzip der spätesten Stelle
Friedrich Konrad Beilstein
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
20
Chemieinformatik
Chemoinformatik: A History
• Ein Beispiel: In welchem Band findet man den Registry-Eintrag von Aspirin?
Friedrich Konrad Beilstein
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
21
Chemieinformatik
Chemoinformatik: A History
Friedrich Konrad Beilstein
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
22
Chemieinformatik
Chemoinformatik: A History
Friedrich Konrad Beilstein
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
23
Chemieinformatik
Chemoinformatik: A History
• Ein Beispiel: In welchem Band findet man den Registry-Eintrag von Aspirin?
Friedrich Konrad Beilstein
• Isocyclus
• Derivat der Salicylsäure
• Funktionelle Gruppen der Salicylsäure:
•Hydroxygruppe
•Carboxygruppe
• Späteste Stelle: Band X
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
24
Chemieinformatik
O
O
CH3
O
OH
BiochemicalPathways
Acetylsalicylsäure (AspirinTM)
Netzwerk des biochemischen Wissens
O
OOH
OH
ONa
Cl
OH
COONa
OH
COOH
Supramolekulare ChemieSupramolekulare Chemie PolymerchemiePolymerchemie
OrganometallchemieOrganometallchemie Anorganische ChemieAnorganische ChemieOrganische ChemieOrganische Chemie
BiochemieBiochemie
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
25
Chemieinformatik
Netzwerk des biochemischen Wissens
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
26
Chemieinformatik
Netzwerk des biochemischen Wissens
Acetylsalicylsäure (AspirinTM)
Cyclooxigenase-(COX-1/COX-
2)-Inhibitor
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
27
Chemieinformatik
„Superaspirin“ (COX-2 Inhibitors)
Researchers have made a new aspirin-like compound that promises to provide the same pain relief as aspirin, but without upset stomachs or the risk of kidney damage. The compound ... may also help reduce the risk of certain cancers and Alzheimer's disease.
This new "superaspirin" is one of about a dozen new compounds being developed that soothe aching joints by blocking the activity of an enzyme called COX-2, which helps promote inflammation, pain, and fevers. The problem with all aspirin and nonsteroidal anti-inflammatory drugs (NSAIDs) is that they also interfere with the activity of the COX-1 enzyme, which helps protect stomach lining and kidneys. Thus pharmaceutical companies have been eager to find drugs that target only COX-2, particularly since epidemiological data and now laboratory studies indicate the long-term use of these drugs can protect against colon cancer and Alzheimer's disease.
NSAIDs prevent both COX enzymes from turning arachidonic acid from the cell membrane into prostaglandin hormones; COX-2 inhibitors are choosier.
At least two companies, Monsanto Corp. in St. Louis, Missouri, and Merck and Co., based in Whitehouse Station, New Jersey, have tested COX-2 inhibitors in people and hope to be marketing their new superaspirin next year. "Eventually all those [NSAID] molecules on the market will become dinosaurs," predicts Philip Portoghese, a medicinal chemist at the University of Minnesota in Minneapolis.
(ScienceNow, 21 May 1998)
Altering its chemistry makes the new COX-2 inhibitor (right) more selective than aspirin (left).
Netzwerk des biochemischen Wissens
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
28
Chemieinformatik
Netzwerk des biochemischen Wissens
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
29
Chemieinformatik
Bioinformatik – Chemoinformatik
Wissen/Modellierung
Chemische Synthese
(Substanzbibliothek)
Target (Protein etc.)DNA / mRNA
OH ON OH O
N
ON
NH
O
ON
NH
Btx
Ctx
StoffwechselKomplexes, nichtlineares,
dynamisches System
Funktion
WirkstoffAgonist/Antagonist/Inhibitor
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
30
Chemieinformatik
Wachstum GenBank
Quelle: http://www.ncbi.nlm.nih.gov/Genbank/genbankstats.html
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
31
Chemieinformatik
Wachstum SwissProt
Quelle: http://us.expasy.org/sprot/relnotes/relstat.html
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
32
Chemieinformatik
Wachstum Protein-Data-Bank (PDB)
Quelle: http://www.rcsb.org/pdb/holdings.html
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
33
Chemieinformatik
Cambridge Structural Database (CSD)
Quellen: http://www.ccdc.cam.ac.uk/prods/csd/csd.html
und http://www.ccdc.cam.ac.uk/products/csd/statistics/
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
34
Chemieinformatik
Chemical Abstract Service (CAS)
Quelle: http://www.cas.org/cgi-bin/regreport.pl
„Daily updates to the CAplusSM database, adding more than 4,000 records each day totaling more than 23 million currently“
Quelle: http://www.cas.org/casdb.html
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
35
Chemieinformatik
• Das menschliche Genom enthält O(10O(1099) (genauer: 3 ) (genauer: 3 Milliarden) Milliarden) DNA-Basenpaare
• Es gibt etwa O(10O(1044)) (genauer: etwa 30.000)(genauer: etwa 30.000) menschliche Gene und O(10O(1055)) (genauer: über 100.000) (genauer: über 100.000) menschliche Proteine (durch alternatives Splicing, posttranslationale Modifikationen etc.)
• In der Pharmaforschung wird die Anzahl der molekularen Targets (Wirkorte für Pharmaka wie Enzyme, Ionenkanäle, Rezeptoren, Hormone, Growth Factors, Nuclear Receptors,
DNA, RNA etc.) mit O(10O(1033)) (genauer: etwa 3.000 bis (genauer: etwa 3.000 bis 10.000) 10.000) abgeschätzt, davon sind bisher weniger als 10-20% bekannt
• Die Komplexität und das Verständnis des biochemischen Stoffwechsels sind erst in Ansätzen untersucht bzw. verstanden
Das biologische Faktenwissen „explodiert“Das biologische Faktenwissen „explodiert“
O(...) = Größenordnung
Netzwerk des biochemischen Wissens
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
36
Chemieinformatik
• Es gibt gegenwärtig O(10O(1077 = 10 Millionen) = 10 Millionen) bekannte chemische Verbindungen und chemische Reaktionen
• Es gibt gegenwärtig O(10O(1077 = 10 Millionen) = 10 Millionen) bekannte chemisch-wissenschaftliche* Publikationen bzw. erteilte Patente
• Jährlich kommen O(10O(1066 = 1 Millionen) = 1 Millionen) neue chemische Verbindungen/chemische Reaktionen dazu (alle 30 Sekunden30 Sekunden eine Verbindung/Reaktion)
• Jährlich kommen O(10O(1066 = 1 Millionen) = 1 Millionen) neue chemisch-wissenschaftliche* Publikationen bzw. erteilte Patente dazu (alle 30 Sekunden30 Sekunden eine Publikation/Patent)
(Quantität Quantität bedeutet dabei nicht unbedingt QualitätQualität)
Das chemische Substanz-/Faktenwissen Das chemische Substanz-/Faktenwissen „explodiert“ ...„explodiert“ ...
(exponentielles Wachstum = Verdopplung etwa alle 10 Jahre)(exponentielles Wachstum = Verdopplung etwa alle 10 Jahre)
O(...) = Größenordnung
* wissenschaftlich = durch Review(s) als wissenschaftlich qualifiziert
Netzwerk des biochemischen Wissens
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
37
Chemieinformatik
„„Unendlich großer“ Raum der theoretisch möglichen SubstanzenUnendlich großer“ Raum der theoretisch möglichen Substanzen
Raum der bereits synthetisierten SubstanzenRaum der bereits synthetisierten Substanzen
Reduktionsfaktor „fast“ unendlich (d.h. die Zahl der theoretisch möglichen Substanzen übersteigt die O(107) synthetisierten Substanzen „dramatisch“)
Raum der in Datenbanken dokumentierten SubstanzenRaum der in Datenbanken dokumentierten Substanzen
vergleichsweise gute Übereinstimmung (CAS-Registry (Chemical Abstracts Service), World Patents Index (WPI, Derwent), Beilstein, Gmelin etc.) mit dem ...
Raum der experimentell bestimmten SubstanzeigenschaftenRaum der experimentell bestimmten Substanzeigenschaften
„erheblicher“ Reduktionsfaktor, die Bestimmung von Eigenschaften ist vom Interesse an der jeweiligen Substanz abhängig - z.B. beträgt die Anzahl der gemessenen Spektren „nur“ O(105), die Anzahl der experimentell bestimmten chemischen 3D-(Röntgen-)Strukturen ebenfalls „nur“ O(105), d.h. sie liegen um gut 2 Zehnerpotenzen niedriger als die Zahl der synthetisierten Substanzen!
Raum der in Datenbanken dokumentierten SubstanzeigenschaftenRaum der in Datenbanken dokumentierten Substanzeigenschaften
„erheblicher“ Reduktionsfaktor - riesige „weiße Flecken“
Netzwerk des biochemischen Wissens
Es gibt schätzungsweise allein 3×1062 Moleküle mit einem Molekulargewicht kleiner 500 aus H, C, O, N, S, P und Halogenen, die unter gewöhnlichen Bedingungen stabil sind
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
38
Chemieinformatik
Theorie
O
O
CH3
O
OH
O
H3C CH3
HC(CH3)2
OOHCH3
H3C
OH
ONa
Cl
OHCOONa
OHCOOH
Supramolekulare ChemieSupramolekulare Chemie PolymerchemiePolymerchemie
OrganometallchemieOrganometallchemie Anorganische ChemieAnorganische ChemieOrganische ChemieOrganische Chemie
BiochemieBiochemie
• Rkt.bedingungen Rkt.partner, Lösemittel Temperatur, Katalysator Arbeitsvorschrift etc.• Rkt.parameter Geschwind.konstante Gleichgew.konstante Übergangszustände Ausbeute etc.• Rkt.klassifizierung• Literatur, Patente
• 3D-Struktur• Konformationen• Eigenschaften phys.-chemisch thermodynamisch spektroskopisch pharmakologisch ADME/Tox ökologisch etc.• Registrier-Nr.• Literatur, Patente
Experiment – Praxis – Erfahrung
Oktettregel, 18-Elektronenregel, Induktions-/Mesomerie-Konzepte, Oktettregel, 18-Elektronenregel, Induktions-/Mesomerie-Konzepte, HSAB-Konzept, VSEPR-Modell, WOODWARD-HOFFMANN- Regeln, HSAB-Konzept, VSEPR-Modell, WOODWARD-HOFFMANN- Regeln, Prinzip der größten Sauerstoffdichte bei DIELS-ALDER-Reaktionen, Prinzip der größten Sauerstoffdichte bei DIELS-ALDER-Reaktionen, BREDTsche Regel (keine Eliminierung hin zum Brückenkohlenstoff bei BREDTsche Regel (keine Eliminierung hin zum Brückenkohlenstoff bei überbrückten Bicyclen) etc.überbrückten Bicyclen) etc.
Theoretisches Fundament: Quantentheorie Theoretisches Fundament: Quantentheorie (Relativitätstheorie)(Relativitätstheorie)
Acetylsalicylsäure (AspirinTM)
Netzwerk des biochemischen Wissens
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
39
Chemieinformatik
• Sternstunde der der menschlichen KulturSternstunde der der menschlichen Kultur
• Hoffnung und Dämpfer für die PraxisHoffnung und Dämpfer für die Praxis
„Die fundamentalen physikalischen Gesetze für eine mathematische Theorie eines großen Teils der Physik und für die gesamte Chemie sind damit vollständig bekannt. Die Schwierigkeit ist nur, daß die Anwendung dieser Gesetze zu Gleichungen führt, welche für eine Lösung zu kompliziert sind.“
Paul A. M. Dirac (1929)
zitiert nachHans Primas, „Kann Chemie auf Physik reduziert werden?“, Chemie in unserer Zeit, 19. Jahrgang 1985, Nr. 4, S. 109Original: P. A. M. Dirac, „Quantum mechanics of many-electron systems“, Proc. Roy. Soc. London A 123 (1929), page 713
Das theoretische Fundament
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
40
Chemieinformatik
Klassische PhysikKlassische Physik
QuantentheorieQuantentheorie
Wasserstoff-(H2)-MolekülMikroskopisches molekular-mechanisches System aus 2 Protonen mit Masse mp und positiver elektrischer Elementarladung und 2 Elektronen mit Masse me und negativer elektrischer Elementarladung
Die wirkende Kraft F zwischen den elektrisch geladenen Teilchen ist die Coulombkraft
amF =
Ψ=Ψ EHZeitunabhängige Schrödinger-
Gleichung
Ψ=Ψ EH
Die Wellen(eigen)funktionen Ψ und die Energieeigenwerte E enthalten die vollständige* Information über das betrachtete molekulare System
(beschreiben alle Moleküleleigenschaften wie den Gleichgewichtskernabstand, die Bindungsdissoziationsenergie etc.)
* bei präziser Betrachtung nicht korrekt, da es sich um eine nichtrelativistische Betrachtung handelt, die den Teilchenspin vernachlässigt
++ ++
--
--
Bei klassisch-physikalischer Betrachtung würden die Elektronen unter Abgabe elektromagnetischer Strahlung spiralförmig in die Kerne stürzen: Es gäbe keine chemische Bindung und das Molekül wäre instabil (was der Realität fundamental widerspricht!)
Das theoretische Fundament
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
41
Chemieinformatik
RRProton Proton
aaProton Proton
bb
Elektron Elektron 11
Elektron Elektron 22
rr1a1a rr1b1b
rr2b2brr2a2a
rr1212
( )
∂∂+
∂∂+
∂∂≡∇
++−−−−+∇+∇−= 2
2
2
2
2
22
1222110
222
21 mit
11111142
ˆzyxRrrrrr
em
Hbabae
BO πε
Bestimmung der Bestimmung der Ψ Ψ und und E E für das Wasserstoff-für das Wasserstoff-(H(H22)-Molekül)-Molekül
... welche für eine Lösung zu kompliziert sind.“... welche für eine Lösung zu kompliziert sind.“
„„... daß die Anwendung dieser Gesetze zu Gleichungen führt, ... daß die Anwendung dieser Gesetze zu Gleichungen führt, ... ...
Ψ=Ψ EH
Bei der angegebenen Gleichung handelt es sich bereits um eine Näherung, nämlich die sogenannte BORN-OPPENHEIMER-Näherung (die aber in der Praxis eine sehr gute Näherung darstellt, da ein Proton 1836 mal so schwer ist wie ein Elektron)
Das theoretische Fundament
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
42
Chemieinformatik
Wie kann das „explodierende“ biologisch-chemische Substanz- und Faktenwissen bewältigt und nutzbar gemacht werden?Menschliche Gehirne und Bücherregale sind endlich Menschliche Gehirne und Bücherregale sind endlich ......
Gibt es alternative Möglichkeiten zur Lösung der äußerst komplizierten theoretischen (Differential-)Gleichungen?Die analytischen Lösungsmöglichkeiten sind äußerst Die analytischen Lösungsmöglichkeiten sind äußerst begrenzt ...begrenzt ...
Keine positiven Antworten bis Keine positiven Antworten bis etwa 1960 ...etwa 1960 ...
Große Probleme ...
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
43
Chemieinformatik
Wie kann das „explodierende“ biologisch-chemische Substanz- und Faktenwissen bewältigt und nutzbar gemacht werden?Antwort: Durch computergestützte biologisch-Antwort: Durch computergestützte biologisch-chemische Informationssysteme, deren Leistung chemische Informationssysteme, deren Leistung ebenfalls „explodiert“ ...ebenfalls „explodiert“ ...
Gibt es alternative Möglichkeiten zur Lösung der äußerst komplizierten theoretischen (Differential-)Gleichungen?Antwort: Ja, nämlich spezielle computergestützte Antwort: Ja, nämlich spezielle computergestützte iterativ-algorithmische Näherungsverfahren ...iterativ-algorithmische Näherungsverfahren ...
Positive Antworten ab etwa 1960 ...Positive Antworten ab etwa 1960 ...
... Große Lösungen
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
44
Chemieinformatik
Arsenal von Näherungsverfahren - AusschnittArsenal von Näherungsverfahren - Ausschnitt
Semiempirische MethodenSemiempirische Methoden
KraftfeldmethodenKraftfeldmethoden
DFT-MethodenDFT-Methoden
ab-initio-Methodenab-initio-Methoden
10.00010.000
1.0001.000
100100
< 100< 100
NN22
NN33
> N> N1.51.5
> N> N44
Anzahl Anzahl Atome des Atome des
molekularen molekularen SystemsSystems
Zunahme des Zunahme des RechenaufwandsRechenaufwands
• NDDO (Neglect of Diatomic Differential Overlap) MNDO (Modified Neglect of Diatomic Overlap) AM1 (Austin Model 1) PM3 (Parametric Method 3)• INDO (Intermediate Neglect of Differential Overlap)• MINDO (Modified Intermediate Neglect of Differential Overlap)• CNDO (Complete Neglect of Differential Overlap)• Extended Hückel Theory
• Hartree-Fock-Self-consistent Field (HF-SCF) + Elektronen-Korrelation: Configuration Interaction (CI), Many Body Perturbation Theory (MBPT), Coupled Cluster (CC)
„Revival“ der Theorie
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
45
Chemieinformatik
Information Revolution
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
46
Chemieinformatik
Jahr 1950Jahr 1950
Jahr 2020Jahr 2020
„Rache der Atome an den Bits“
Quantentheoretische „0.1 mm“-Grenze der heutigen IC-Technologie erreicht, aber Spintronics, Quantencomputer ...
Jahr 2005Jahr 2005
Mooresches Gesetz (Gordon Moore, Mitbegründer der Fa. Intel, 1965)
ZeitZeit
„„C
om
pu
terl
eis
tun
gC
om
pu
terl
eis
tun
g““
1 24
8
16
32
18 Monat
e
18 Monat
e
18 Monat
e
18 Monat
e
18 Monat
e
18 Monat
e
Information Revolution
Zunahme der „Leistungsfähigkeit“ von Computern von 1950 bis 2005 um einen Faktor von etwa
137 Milliarden1 Sekunde (2005) = 4360 Jahre (1950)
Gültigkeit des Mooreschen Gesetzes, d.h. weitere Zunahme der Computerleistung um etwa
Faktor 10001 Sekunde (2020) = 17 Minuten (2005)
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
47
Chemieinformatik
• Die Mikroprozessor („Wegwerf-Chips“) in Grußkarten für wenige € (Jahr 2000), die beim Öffnen „Musik“ spielen, sind leistungsfähiger als alle NASA-Computer zusammen, die das Mondlandungsprogramm gesteuert haben
• Die Computerleistung beinhaltet auch die Größe der Speichermedien: Früher (1985) lag der RAM im kByte-Bereich (z.B. Commodore C64 mit 64 kByte Hauptspeicher), heute (Jahr 2000) im MByte-Bereich (Desktop-PC mit 256 MByte Hauptspeicher), demnächst im GByte-Bereich etc.
• Auch Festplatten zeigen diese Entwicklung: Früher (1985, C64) einige MByte (20-100 MByte), heute (Jahr 2000) einige Dutzend GByte, demnächst einige 100 GByte bis einige TByte
Computerleistung & Mooresches GesetzComputerleistung & Mooresches GesetzGordon Moore, Mitbegründer der Fa. Intel, 1965Gordon Moore, Mitbegründer der Fa. Intel, 1965
Information Revolution
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
48
Chemieinformatik
Arsenal von Näherungsverfahren - AusschnittArsenal von Näherungsverfahren - Ausschnitt
Semiempirische MethodenSemiempirische Methoden
KraftfeldmethodenKraftfeldmethoden
DFT-MethodenDFT-Methoden
ab-initio-Methodenab-initio-Methoden
10.00010.000
1.0001.000
100100
< 100< 100
NN22
NN33
> N> N1.51.5
> N> N44
1.000.0001.000.000
20.00020.000
> 10.000> 10.000
< 1.000< 1.000
Anzahl Anzahl Atome des Atome des
molekularen molekularen SystemsSystems
Zunahme Zunahme des des
RechenaufwRechenaufwandsands
GrößenordnuGrößenordnung Anzahl ng Anzahl Atome im Atome im Jahr 2020Jahr 2020
• NDDO (Neglect of Diatomic Differential Overlap) MNDO (Modified Neglect of Diatomic Overlap) AM1 (Austin Model 1) PM3 (Parametric Method 3)• INDO (Intermediate Neglect of Differential Overlap)• MINDO (Modified Intermediate Neglect of Differential Overlap)• CNDO (Complete Neglect of Differential Overlap)• Extended Hückel Theory
• Hartree-Fock-Self-consistent Field (HF-SCF) + Elektronen-Korrelation: Configuration Interaction (CI), Many Body Perturbation Theory (MBPT), Coupled Cluster (CC)
Basis für die Schätzung ist das MOOREsche Gesetz:
Steigerung der Computerleistung um
Faktor 10.000 bis zum Jahr 2020
„Revival“ der Theorie
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
49
Chemieinformatik
The Chemistry Development Kit (CDK)
Facts:
• Open source Java library for structural chemo- and bioinformatics with a clear object-oriented design
• 30-40 developers world-wide
• 87.000 lines of (non-comment) code
• 9.400 methods
• 930 classes plus 255 JUnit test classes
• Used as a library in more than 20 academic and industrial projects
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
50
Chemieinformatik
The Chemistry Development Kit (CDK)
•I/O (CML, MDL Molfile/SDFile,PDB, INChI, ...)
•SMILES Parsing and Canonical Generation
Input/Output
•Structure-Diagram-Layout (SDG)•2D Rendering•3D Rendering
Visualization
•3D Model-Builder •Atom-Typing•Force-Field•Representation of BiomolecularStructures
Modeling
•Isomorphism detection•Maximum-Common-Substructure Searches
•SMARTS- and Substructure searches•Ring searches (Smallest Set of Smallest Rings, All Rings)
•Aromaticity detection
Chemical Graphs
•Deterministic Isomer generator•Stochastic Structure Generators via
- Simulated Annealing- Genetic Algorithms
Structure Generation
•Fingerprinting•Gasteiger-Charges•> 50 QSAR-Descriptors•NMR-Prediction
- via HOSE-Codes- SVMs
Properties
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
51
Chemieinformatik
The Chemistry Development Kit (CDK)
•Verfügbar unter http://cdk.sf.net
•Build support für Ant und Eclipse
•Beispiele für Verwendung in den Test-Klassen.
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
52
Chemieinformatik
Who is who in Chemoinformatics
•Unilever Center for Molecular Informatics, Cambridge (Murray-Rust, Glenn)
•Computer-Chemie-Centrum, Erlangen (Gasteiger, Clark)
•Beilstein Endowed Chair, Frankfurt (Schneider)
•Sheffield University (Willet)
•Indiana Universtiy (Wiggins, Wild)
•Universität Hamburg (Rarey)
•Wendy Warr & Associates (www.warr.com)
•Fachgruppe Chemie-Information-Computer
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
53
Chemieinformatik
Chemoinformatics: Conferences
•German Conference on Chemoinformatics (http://www.gcc-cic.de)
•Nordwijkerhout Conference (ICCS)
•Sheffield Conference
•ACS National Meetings
PD Dr. Christoph Steinbeck
Folienentwurf: Christoph Steinbeck,
Achim Zielesny
54
Chemieinformatik
Chemoinformatik: Ausblick
• Einführung
• Kodierung Chemischer Strukturen
• Visualisierung
• Ringsuchen und Aromatizität
• Substruktursuchen/MCSS
• Deskriptorberechnungen und QSAR
• Strukturgeneratoren
• Automatische Strukturaufklärung
• Datenbanken
• Reaktionen