Modul 6a (Strukturnormalisierung)

Preview:

Citation preview

Modul 6a

Strukturnormalisierungund -kanonisierung

Wozu überhaupt?

N

O-

O

H

H+

N N

N N

Anfrage

Eingabe

N

O

O

H

H

Ausgabe

?Struktur DB

N

O-

O

H

H+

N N

N N

Eingabe

N

O

O

H

H

NormalisierungKanonisierungRegistrierung

NormalisierungKanonisierungRegistrierung

Anfrage Ausgabe

N

O

O

H

H

Wozu überhaupt?

Struktur DB

Einige Eingabestrukturen

N

O

O

H

H

N

O

O

H

a

b

c

N

O-

O

H

H+

Normalisierung I

N

O

O

H

H

N

O

O

H

a

b

c

N

O-

O

H

H+

N

O

O

H

N

O

O

H

H

N

O

O

H

a

b

c

N

O-

O

H

H+

N

O

O

H

H

Normalisierung II

Normalisierung III

N

O

O

H

H

N

O

O

H

a

b

c

N

O-

O

H

H+

N

O

O

H

H

N

O

O

H

H

N

O

O

H

H

N

O

O

H

H

N

O

O

H

H

N

O

O

H

a

b

c

N

O-

O

H

H+

Normalisierung

N

O

O

H

H

N

O

O

H

H

N

O

O

H

H

N

O

O

H

a

b

c

N

O-

O

H

H+

N

O

O

H

H1

2

64

7

5

10

8

9

3

11

12

1314

1516

18

1917

20

21

Kanonisierung

N

O

O

H

H

N

O

O

H

H

N

O

O

H

a

b

c

N

O-

O

H

H+

N

O

O

H

H1

2

64

7

5

10

8

9

3

11

12

1314

1516

18

1917

20

21

N

O

O

H

H

1

2

3

4

5 6

87 9

10

11

12 1314

15

16

17

18

19

21

20

Kanonisierung

N

O

O

H

H

1

2

6 4

7

5

10

89

3

1113

14

15 16

19

17

--

--

12

18

N

O

O

H

H

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

1718

19

--

--

N

O

O

H

H

N

O

O

H

H

N

O

O

H

a

b

c

N

O-

O

H

H+

N

O

O

H

H1

2

64

7

5

10

8

9

3

11

12

1314

1516

18

1917

20

21

N

O

O

H

H

1

2

3

4

5 6

87 9

10

11

12 1314

15

16

17

18

19

21

20

Kanonisierung

N

O

O

H

H

1

2

4

5

6

7

8

9

10

11

12

13

14

15

16

1718

19

--

--

1O=8,2O-8,3N#5, ... ,16[R]-17, ...

1O=8,2O-8,3N#5, ... ,16[R]-17, ...

1O=8,2O-8,3N#5, ... ,16[S]-17, ...

a

b

c

Identisch

N

O

O

H

H

1

2

6 4

7

5

10

89

3

1113

14

15 16

19

17

--

--

12

18

N

O

O

H

H

1 3 12

1

2

3

4

5

6

7

8

9 10

11

12

13

14

15 16

17

1819

--

--

Neu

Linearisierung und Registrierung

Normalisierung: Ausgewählte Probleme

• Behandlung metallorganischer Verbindungen– Ladungsausgleich– Valenzzustände von Metallen– Behandlung anorganischer Fragmente

• Funktionale Gruppen– Z.B. Nitro-, Carbonyl-, ...

• Aromatizität– Benzoide Systeme– Planare Stickstoffe

• Stereochemie– R,S und E/Z Systeme– Chiralität bei Mesomeren

Beispiel Aromatizität

Das Problem

Der Begriff ist im Detail nicht eindeutig definiert

• Geruch ist „aromatisch“– Wer entscheidet das?

• Ringstrom vorhanden– Wer misst das?

• Reaktivität herabgesetzt– Unter welchen Bedingungen?

• Hückel-Regel

Die Hückel-Regel

IUPAC Definition

Monozyklische planare, sp2-hybridisierte Systeme mit (4n + 2) π-Elektronen sind aromatisch für n = 0, 1, 2, 3, 4, 5.

IUPAC Definition

Monozyklische planare, sp2-hybridisierte Systeme mit (4n + 2) π-Elektronen sind aromatisch für n = 0, 1, 2, 3, 4, 5.

Cyclopropenyl Kation(n = 0)

+ -

Cyclopentadienyl Anion(n = 1)

Benzol(n = 1)

Beispiel Aromatizität

• Geruch ist „aromatisch“– Wer entscheidet das?

• Ringstrom vorhanden– Wer misst das?

• Reaktivität herabgesetzt– Unter welchen Bedingungen?

• Hückel-Regel– Was ist mit Polyzyklischen Verbindungen?

• Resonanzenergiegewinn– Wie berechnet man das?

Beispiele für Aromatizität

=?

=?

=?

• Finde alle Kekule-Muster

• Zähle jeden konjugierten Ring und berechne den Resonanzenergieeffekt RE dieses Rings

RE = Rn bei Hückel-Ring (4n+2 π-Elektronen)

RE = Qn bei Anti-Hückel-Ring (4n π-Elektronen)

• Berechne Randic-Aromatizitätsindex A:

Der Randic-Algorithmus

)4RE()24RE()4RE()24RE(

nn

nnA

−+

++=

Beispiel Naphtalin

4 Ringe mit 6 π-Elektronen (R1)2 Ringe mit 10 π-Elektronen (R2)

3 Kekule-Patterns

RE(4n+2) = ( 4 x R1 + 2 x R2 ) / 3RE(4n+2) = ( 4 x 0.87 eV + 2 x 0.25 eV ) / 3RE(4n+2) = 1.33 eV

RE(4n) = 0

Randic-Aromatzitätsindex = 1.0

(1)

(2)

(3)

Beispiele für Aromatizität

=

=

=

RE = ( 8R2 + 2R3 + 2Q3 ) / 4RE = 0.47 eVA = 0.76

RE = ( 4R1 + 2R2 ) / 3RE = 1.33 eVA = 1.0

RE = 0.20 eVA = 0.345

Grenzen des Randic-Algorithmus

N N

N N

RE = ( 2R1 + 2R4 + 4Q2 + 4Q3 ) / 4RE = -0.15 eVA = -0.14

• Wie bewertet man Heteroatome?• Was ist mit sp2-Stickstoffen?

Ist dieser Ring nicht doch aromatisch?

Kanonisierung

Ziel:

Eindeutige Nummerierung der Atome einer chemischen Struktur in 2D-Darstellung.

Trivialer Ansatz:

• Erzeuge alle Nummerierungen, linearisiere die Darstellung (z.B. mittels SMILES Notation), sortiere lexikografisch und nimm die erste Nummerierung.

Anwendung: „Wiswesser Line Notation“

Nachteil: Sehr aufwändig

Die meisten Methoden, die heute im Einsatz sind, schränken die zu Anzahl der Nummerierungen auf eine klar definierte Weise stark ein, bevor ein lexikografischen Vergleich stattfindet.

Kanonisierung: Morgan-Algorithmus

• Betrachtung des normalisierten Strukturdiagramms als mathematischer Graph. Atome sind Ecken, Bindungen sind Kanten.

• Der Algorithmus ist zweigeteilt: 1) Im ersten Schritt werden Äquivalenzklassen gebildet und

jede Ecke einer Äquivalenzklasse zugeordnet.

2) Die Äquivalenzklassen werden sortiert und die Ecken anhand dieser Sortierung eindeutig nummeriert. Hier können chemische Eigenschaften ( z.B. Bindungsordnung, Ordnungszahlen, etc. ) als Sortierkriterium eingebaut werden.

Morgan-Algorithmus: Äquivalenzklassen I

1) initialisiere jede Ecke mit dem „Konnektivitätswert“ 1

2) Zähle die Anzahl C verschiedener „Äquivalenzklassen“.

N

N

O1

1

1

1

1

1

1

1

11

1

1

1

C = 1 Äquivalenzklasse

N

N

O1

1

1

1

1

1

1

1

1

1

1

1

1

Morgan-Algorithmus: Äquivalenzklassen II

3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.

1 1

3

2

2

2

2

3

23

3

1

1

Morgan-Algorithmus: Äquivalenzklassen II

4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)

Cneu = 3 Äquivalenzklassen:1 (4x)2 (5x)3 (4x)N

N

O1

1

3

2

2

2

2

3

23

3

1

1

Morgan-Algorithmus: Äquivalenzklassen II

5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Cneu = 3 Äquivalenzklassen:1 (4x)2 (5x)3 (4x)N

N

O1

1

3

2

2

2

2

3

23

3

1

1

Morgan-Algorithmus: Äquivalenzklassen II

3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.

4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)

5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Cneu = 3 Äquivalenzklassen:3 (4x)5 (6x)6 (3x)N

N

O3

3

5

5

5

5

5

6

66

5

3

3

N

N

O5

5

13

10

10

11

11

16

1214

12

6

5

Morgan-Algorithmus: Äquivalenzklassen II

3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.

4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)

5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Cneu = 8 Äquivalenzklassen:5 (3x)6 (1x)10 (2x)11 (2x)12 (2x)13 (1x)14 (1x)16 (1x)

Morgan-Algorithmus: Äquivalenzklassen II

3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.

4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)

5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

13

12

25

24

24

26

26

3430

30

24

14

12

Cneu = 8 Äquivalenzklassen:12 (2x)13 (1x)14 (1x)24 (2x)25 (1x)26 (2x)30 (2x)34 (1x)

N

N

O

Cneu = 10 Äquivalenzklassen:

Morgan-Algorithmus: Äquivalenzklassen II

3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.

4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)

5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

25

24

61

51

51

58

58

8264

68

54

30

24

58 (2x)61 (1x)64 (1x)68 (1x)82 (1x)

24 (2x)25 (1x)30 (1x)51 (2x)54 (1x)

N

N

O

Morgan-Algorithmus: Äquivalenzklassen II

3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.

4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)

5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Cneu = 10 Äquivalenzklassen:

61

54

127

119

119

133

133

180150

148

116

68

54

127 (1x)133 (2x)148 (1x)150 (1x)180 (1x)

54 (2x)61 (1x)68 (1x)116 (1x)119 (2x)

N

N

O

3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.

4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)

5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Morgan-Algorithmus: Äquivalenzklassen II

Cneu = 9 Äquivalenzklassen:

127

116

299

260

260

299

299

416328

334

256

148

116

299 (3x)328 (1x)334 (1x)416 (1x)

116 (2x)127 (1x)148 (1x)256 (1x)260 (2x)

N

N

O

N

N

O

Morgan-Algorithmus: Nummerierung

6) Setze Konnektivitätswerte auf vorletzte Äquivalenzklassen.

7) Starte Nummerierung bei noch nicht nummerierter Ecke mit maximalem Konnektivitätswert.

61

54

127

119

119

133

133

180

150148

116

68

54

1

Morgan-Algorithmus: Nummerierung

8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten Nachbarn.

9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern.

N

N

O61

54

127

119

119

133

133

180

150148

116

68

54

12

Morgan-Algorithmus: Nummerierung

8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten Nachbarn.

9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern. Für Nachbaratome mit gleichem Konnektivitätswert können Bindungsordnungen und Ordnungszahlen zur Gewichtung verwendet werden.

N

N

O61

54

127

119

119

133

133

180

150148

116

68

54

12

Morgan-Algorithmus: Nummerierung

8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten Nachbarn.

9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern. Für Nachbaratome mit gleichem Konnektivitätswert können Bindungsordnungen und Ordnungszahlen zur Gewichtung verwendet werden.

N

N

O61

54

127

119

119

133

133

180

150148

116

68

54

12

Morgan-Algorithmus: Nummerierung

8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten Nachbarn.

9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern. Für Nachbaratome mit gleichem Konnektivitätswert können Bindungsordnungen und Ordnungszahlen zur Gewichtung verwendet werden. Bei bleibender Gleichheit werden beide alternativen nummeriert und nach lexikographischer Sortierung die erste gewählt.

N

N

O61

54

127

119

119

133

133

180

150148

116

68

54

12

4/3

3/4

Morgan-Algorithmus: Nummerierung

8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten Nachbarn.

9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern. Für Nachbaratome mit gleichem Konnektivitätswert können Bindungsordnungen und Ordnungszahlen zur Gewichtung verwendet werden. Bei bleibender Gleichheit werden beide alternativen nummeriert und nach lexikographischer Sortierung die erste gewählt.

10) Weiter bei (8) bis alle Ecken nummeriert sind

N

N

O61

54

127

119

119

133

133

180

150148

116

68

54

12

4/3

3/4

5

6/7

7/6

8

9

1011

1213

Ausgewählte Literatur

AromatizitätM. Randic

Aromaticity and conjugation

J. Amer. Chem. Soc. 99 (1977) 444-450

KanonisierungH. L. Morgan

The Generation of a Unique Machine Description for ChemicalStructures - A Technique Developed at Chemical AbstractsService

J. Chem. Doc. 5 (1965) 107-113

Recommended