modul 6a (strukturnormalisierung)
TRANSCRIPT
Modul 6a
Strukturnormalisierungund -kanonisierung
Wozu überhaupt?
N
O-
O
H
H+
N N
N N
Anfrage
Eingabe
N
O
O
H
H
Ausgabe
?Struktur DB
N
O-
O
H
H+
N N
N N
Eingabe
N
O
O
H
H
NormalisierungKanonisierungRegistrierung
NormalisierungKanonisierungRegistrierung
Anfrage Ausgabe
N
O
O
H
H
Wozu überhaupt?
Struktur DB
Einige Eingabestrukturen
N
O
O
H
H
N
O
O
H
a
b
c
N
O-
O
H
H+
Normalisierung I
N
O
O
H
H
N
O
O
H
a
b
c
N
O-
O
H
H+
N
O
O
H
N
O
O
H
H
N
O
O
H
a
b
c
N
O-
O
H
H+
N
O
O
H
H
Normalisierung II
Normalisierung III
N
O
O
H
H
N
O
O
H
a
b
c
N
O-
O
H
H+
N
O
O
H
H
N
O
O
H
H
N
O
O
H
H
N
O
O
H
H
N
O
O
H
H
N
O
O
H
a
b
c
N
O-
O
H
H+
Normalisierung
N
O
O
H
H
N
O
O
H
H
N
O
O
H
H
N
O
O
H
a
b
c
N
O-
O
H
H+
N
O
O
H
H1
2
64
7
5
10
8
9
3
11
12
1314
1516
18
1917
20
21
Kanonisierung
N
O
O
H
H
N
O
O
H
H
N
O
O
H
a
b
c
N
O-
O
H
H+
N
O
O
H
H1
2
64
7
5
10
8
9
3
11
12
1314
1516
18
1917
20
21
N
O
O
H
H
1
2
3
4
5 6
87 9
10
11
12 1314
15
16
17
18
19
21
20
Kanonisierung
N
O
O
H
H
1
2
6 4
7
5
10
89
3
1113
14
15 16
19
17
--
--
12
18
N
O
O
H
H
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1718
19
--
--
N
O
O
H
H
N
O
O
H
H
N
O
O
H
a
b
c
N
O-
O
H
H+
N
O
O
H
H1
2
64
7
5
10
8
9
3
11
12
1314
1516
18
1917
20
21
N
O
O
H
H
1
2
3
4
5 6
87 9
10
11
12 1314
15
16
17
18
19
21
20
Kanonisierung
N
O
O
H
H
1
2
4
5
6
7
8
9
10
11
12
13
14
15
16
1718
19
--
--
1O=8,2O-8,3N#5, ... ,16[R]-17, ...
1O=8,2O-8,3N#5, ... ,16[R]-17, ...
1O=8,2O-8,3N#5, ... ,16[S]-17, ...
a
b
c
Identisch
N
O
O
H
H
1
2
6 4
7
5
10
89
3
1113
14
15 16
19
17
--
--
12
18
N
O
O
H
H
1 3 12
1
2
3
4
5
6
7
8
9 10
11
12
13
14
15 16
17
1819
--
--
Neu
Linearisierung und Registrierung
Normalisierung: Ausgewählte Probleme
• Behandlung metallorganischer Verbindungen– Ladungsausgleich– Valenzzustände von Metallen– Behandlung anorganischer Fragmente
• Funktionale Gruppen– Z.B. Nitro-, Carbonyl-, ...
• Aromatizität– Benzoide Systeme– Planare Stickstoffe
• Stereochemie– R,S und E/Z Systeme– Chiralität bei Mesomeren
Beispiel Aromatizität
Das Problem
Der Begriff ist im Detail nicht eindeutig definiert
• Geruch ist „aromatisch“– Wer entscheidet das?
• Ringstrom vorhanden– Wer misst das?
• Reaktivität herabgesetzt– Unter welchen Bedingungen?
• Hückel-Regel
Die Hückel-Regel
IUPAC Definition
Monozyklische planare, sp2-hybridisierte Systeme mit (4n + 2) π-Elektronen sind aromatisch für n = 0, 1, 2, 3, 4, 5.
IUPAC Definition
Monozyklische planare, sp2-hybridisierte Systeme mit (4n + 2) π-Elektronen sind aromatisch für n = 0, 1, 2, 3, 4, 5.
Cyclopropenyl Kation(n = 0)
+ -
Cyclopentadienyl Anion(n = 1)
Benzol(n = 1)
Beispiel Aromatizität
• Geruch ist „aromatisch“– Wer entscheidet das?
• Ringstrom vorhanden– Wer misst das?
• Reaktivität herabgesetzt– Unter welchen Bedingungen?
• Hückel-Regel– Was ist mit Polyzyklischen Verbindungen?
• Resonanzenergiegewinn– Wie berechnet man das?
Beispiele für Aromatizität
=?
=?
=?
• Finde alle Kekule-Muster
• Zähle jeden konjugierten Ring und berechne den Resonanzenergieeffekt RE dieses Rings
RE = Rn bei Hückel-Ring (4n+2 π-Elektronen)
RE = Qn bei Anti-Hückel-Ring (4n π-Elektronen)
• Berechne Randic-Aromatizitätsindex A:
Der Randic-Algorithmus
)4RE()24RE()4RE()24RE(
nn
nnA
−+
++=
Beispiel Naphtalin
4 Ringe mit 6 π-Elektronen (R1)2 Ringe mit 10 π-Elektronen (R2)
3 Kekule-Patterns
RE(4n+2) = ( 4 x R1 + 2 x R2 ) / 3RE(4n+2) = ( 4 x 0.87 eV + 2 x 0.25 eV ) / 3RE(4n+2) = 1.33 eV
RE(4n) = 0
Randic-Aromatzitätsindex = 1.0
(1)
(2)
(3)
Beispiele für Aromatizität
=
=
=
RE = ( 8R2 + 2R3 + 2Q3 ) / 4RE = 0.47 eVA = 0.76
RE = ( 4R1 + 2R2 ) / 3RE = 1.33 eVA = 1.0
RE = 0.20 eVA = 0.345
Grenzen des Randic-Algorithmus
N N
N N
RE = ( 2R1 + 2R4 + 4Q2 + 4Q3 ) / 4RE = -0.15 eVA = -0.14
• Wie bewertet man Heteroatome?• Was ist mit sp2-Stickstoffen?
Ist dieser Ring nicht doch aromatisch?
Kanonisierung
Ziel:
Eindeutige Nummerierung der Atome einer chemischen Struktur in 2D-Darstellung.
Trivialer Ansatz:
• Erzeuge alle Nummerierungen, linearisiere die Darstellung (z.B. mittels SMILES Notation), sortiere lexikografisch und nimm die erste Nummerierung.
Anwendung: „Wiswesser Line Notation“
Nachteil: Sehr aufwändig
Die meisten Methoden, die heute im Einsatz sind, schränken die zu Anzahl der Nummerierungen auf eine klar definierte Weise stark ein, bevor ein lexikografischen Vergleich stattfindet.
Kanonisierung: Morgan-Algorithmus
• Betrachtung des normalisierten Strukturdiagramms als mathematischer Graph. Atome sind Ecken, Bindungen sind Kanten.
• Der Algorithmus ist zweigeteilt: 1) Im ersten Schritt werden Äquivalenzklassen gebildet und
jede Ecke einer Äquivalenzklasse zugeordnet.
2) Die Äquivalenzklassen werden sortiert und die Ecken anhand dieser Sortierung eindeutig nummeriert. Hier können chemische Eigenschaften ( z.B. Bindungsordnung, Ordnungszahlen, etc. ) als Sortierkriterium eingebaut werden.
Morgan-Algorithmus: Äquivalenzklassen I
1) initialisiere jede Ecke mit dem „Konnektivitätswert“ 1
2) Zähle die Anzahl C verschiedener „Äquivalenzklassen“.
N
N
O1
1
1
1
1
1
1
1
11
1
1
1
C = 1 Äquivalenzklasse
N
N
O1
1
1
1
1
1
1
1
1
1
1
1
1
Morgan-Algorithmus: Äquivalenzklassen II
3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.
1 1
3
2
2
2
2
3
23
3
1
1
Morgan-Algorithmus: Äquivalenzklassen II
4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)
Cneu = 3 Äquivalenzklassen:1 (4x)2 (5x)3 (4x)N
N
O1
1
3
2
2
2
2
3
23
3
1
1
Morgan-Algorithmus: Äquivalenzklassen II
5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)
Cneu = 3 Äquivalenzklassen:1 (4x)2 (5x)3 (4x)N
N
O1
1
3
2
2
2
2
3
23
3
1
1
Morgan-Algorithmus: Äquivalenzklassen II
3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.
4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)
5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)
Cneu = 3 Äquivalenzklassen:3 (4x)5 (6x)6 (3x)N
N
O3
3
5
5
5
5
5
6
66
5
3
3
N
N
O5
5
13
10
10
11
11
16
1214
12
6
5
Morgan-Algorithmus: Äquivalenzklassen II
3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.
4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)
5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)
Cneu = 8 Äquivalenzklassen:5 (3x)6 (1x)10 (2x)11 (2x)12 (2x)13 (1x)14 (1x)16 (1x)
Morgan-Algorithmus: Äquivalenzklassen II
3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.
4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)
5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)
13
12
25
24
24
26
26
3430
30
24
14
12
Cneu = 8 Äquivalenzklassen:12 (2x)13 (1x)14 (1x)24 (2x)25 (1x)26 (2x)30 (2x)34 (1x)
N
N
O
Cneu = 10 Äquivalenzklassen:
Morgan-Algorithmus: Äquivalenzklassen II
3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.
4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)
5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)
25
24
61
51
51
58
58
8264
68
54
30
24
58 (2x)61 (1x)64 (1x)68 (1x)82 (1x)
24 (2x)25 (1x)30 (1x)51 (2x)54 (1x)
N
N
O
Morgan-Algorithmus: Äquivalenzklassen II
3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.
4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)
5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)
Cneu = 10 Äquivalenzklassen:
61
54
127
119
119
133
133
180150
148
116
68
54
127 (1x)133 (2x)148 (1x)150 (1x)180 (1x)
54 (2x)61 (1x)68 (1x)116 (1x)119 (2x)
N
N
O
3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.
4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)
5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)
Morgan-Algorithmus: Äquivalenzklassen II
Cneu = 9 Äquivalenzklassen:
127
116
299
260
260
299
299
416328
334
256
148
116
299 (3x)328 (1x)334 (1x)416 (1x)
116 (2x)127 (1x)148 (1x)256 (1x)260 (2x)
N
N
O
N
N
O
Morgan-Algorithmus: Nummerierung
6) Setze Konnektivitätswerte auf vorletzte Äquivalenzklassen.
7) Starte Nummerierung bei noch nicht nummerierter Ecke mit maximalem Konnektivitätswert.
61
54
127
119
119
133
133
180
150148
116
68
54
1
Morgan-Algorithmus: Nummerierung
8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten Nachbarn.
9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern.
N
N
O61
54
127
119
119
133
133
180
150148
116
68
54
12
Morgan-Algorithmus: Nummerierung
8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten Nachbarn.
9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern. Für Nachbaratome mit gleichem Konnektivitätswert können Bindungsordnungen und Ordnungszahlen zur Gewichtung verwendet werden.
N
N
O61
54
127
119
119
133
133
180
150148
116
68
54
12
Morgan-Algorithmus: Nummerierung
8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten Nachbarn.
9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern. Für Nachbaratome mit gleichem Konnektivitätswert können Bindungsordnungen und Ordnungszahlen zur Gewichtung verwendet werden.
N
N
O61
54
127
119
119
133
133
180
150148
116
68
54
12
Morgan-Algorithmus: Nummerierung
8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten Nachbarn.
9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern. Für Nachbaratome mit gleichem Konnektivitätswert können Bindungsordnungen und Ordnungszahlen zur Gewichtung verwendet werden. Bei bleibender Gleichheit werden beide alternativen nummeriert und nach lexikographischer Sortierung die erste gewählt.
N
N
O61
54
127
119
119
133
133
180
150148
116
68
54
12
4/3
3/4
Morgan-Algorithmus: Nummerierung
8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten Nachbarn.
9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern. Für Nachbaratome mit gleichem Konnektivitätswert können Bindungsordnungen und Ordnungszahlen zur Gewichtung verwendet werden. Bei bleibender Gleichheit werden beide alternativen nummeriert und nach lexikographischer Sortierung die erste gewählt.
10) Weiter bei (8) bis alle Ecken nummeriert sind
N
N
O61
54
127
119
119
133
133
180
150148
116
68
54
12
4/3
3/4
5
6/7
7/6
8
9
1011
1213
Ausgewählte Literatur
AromatizitätM. Randic
Aromaticity and conjugation
J. Amer. Chem. Soc. 99 (1977) 444-450
KanonisierungH. L. Morgan
The Generation of a Unique Machine Description for ChemicalStructures - A Technique Developed at Chemical AbstractsService
J. Chem. Doc. 5 (1965) 107-113