modul 6a (strukturnormalisierung)

40
Modul 6a Strukturnormalisierung und -kanonisierung

Upload: api-19755462

Post on 13-Jun-2015

34 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Modul 6a (Strukturnormalisierung)

Modul 6a

Strukturnormalisierungund -kanonisierung

Page 2: Modul 6a (Strukturnormalisierung)

Wozu überhaupt?

N

O-

O

H

H+

N N

N N

Anfrage

Eingabe

N

O

O

H

H

Ausgabe

?Struktur DB

Page 3: Modul 6a (Strukturnormalisierung)

N

O-

O

H

H+

N N

N N

Eingabe

N

O

O

H

H

NormalisierungKanonisierungRegistrierung

NormalisierungKanonisierungRegistrierung

Anfrage Ausgabe

N

O

O

H

H

Wozu überhaupt?

Struktur DB

Page 4: Modul 6a (Strukturnormalisierung)

Einige Eingabestrukturen

N

O

O

H

H

N

O

O

H

a

b

c

N

O-

O

H

H+

Page 5: Modul 6a (Strukturnormalisierung)

Normalisierung I

N

O

O

H

H

N

O

O

H

a

b

c

N

O-

O

H

H+

N

O

O

H

Page 6: Modul 6a (Strukturnormalisierung)

N

O

O

H

H

N

O

O

H

a

b

c

N

O-

O

H

H+

N

O

O

H

H

Normalisierung II

Page 7: Modul 6a (Strukturnormalisierung)

Normalisierung III

N

O

O

H

H

N

O

O

H

a

b

c

N

O-

O

H

H+

N

O

O

H

H

Page 8: Modul 6a (Strukturnormalisierung)

N

O

O

H

H

N

O

O

H

H

N

O

O

H

H

N

O

O

H

H

N

O

O

H

a

b

c

N

O-

O

H

H+

Normalisierung

Page 9: Modul 6a (Strukturnormalisierung)

N

O

O

H

H

N

O

O

H

H

N

O

O

H

H

N

O

O

H

a

b

c

N

O-

O

H

H+

N

O

O

H

H1

2

64

7

5

10

8

9

3

11

12

1314

1516

18

1917

20

21

Kanonisierung

Page 10: Modul 6a (Strukturnormalisierung)

N

O

O

H

H

N

O

O

H

H

N

O

O

H

a

b

c

N

O-

O

H

H+

N

O

O

H

H1

2

64

7

5

10

8

9

3

11

12

1314

1516

18

1917

20

21

N

O

O

H

H

1

2

3

4

5 6

87 9

10

11

12 1314

15

16

17

18

19

21

20

Kanonisierung

Page 11: Modul 6a (Strukturnormalisierung)

N

O

O

H

H

1

2

6 4

7

5

10

89

3

1113

14

15 16

19

17

--

--

12

18

N

O

O

H

H

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

1718

19

--

--

N

O

O

H

H

N

O

O

H

H

N

O

O

H

a

b

c

N

O-

O

H

H+

N

O

O

H

H1

2

64

7

5

10

8

9

3

11

12

1314

1516

18

1917

20

21

N

O

O

H

H

1

2

3

4

5 6

87 9

10

11

12 1314

15

16

17

18

19

21

20

Kanonisierung

Page 12: Modul 6a (Strukturnormalisierung)

N

O

O

H

H

1

2

4

5

6

7

8

9

10

11

12

13

14

15

16

1718

19

--

--

1O=8,2O-8,3N#5, ... ,16[R]-17, ...

1O=8,2O-8,3N#5, ... ,16[R]-17, ...

1O=8,2O-8,3N#5, ... ,16[S]-17, ...

a

b

c

Identisch

N

O

O

H

H

1

2

6 4

7

5

10

89

3

1113

14

15 16

19

17

--

--

12

18

N

O

O

H

H

1 3 12

1

2

3

4

5

6

7

8

9 10

11

12

13

14

15 16

17

1819

--

--

Neu

Linearisierung und Registrierung

Page 13: Modul 6a (Strukturnormalisierung)

Normalisierung: Ausgewählte Probleme

• Behandlung metallorganischer Verbindungen– Ladungsausgleich– Valenzzustände von Metallen– Behandlung anorganischer Fragmente

• Funktionale Gruppen– Z.B. Nitro-, Carbonyl-, ...

• Aromatizität– Benzoide Systeme– Planare Stickstoffe

• Stereochemie– R,S und E/Z Systeme– Chiralität bei Mesomeren

Page 14: Modul 6a (Strukturnormalisierung)

Beispiel Aromatizität

Das Problem

Der Begriff ist im Detail nicht eindeutig definiert

• Geruch ist „aromatisch“– Wer entscheidet das?

• Ringstrom vorhanden– Wer misst das?

• Reaktivität herabgesetzt– Unter welchen Bedingungen?

• Hückel-Regel

Page 15: Modul 6a (Strukturnormalisierung)

Die Hückel-Regel

IUPAC Definition

Monozyklische planare, sp2-hybridisierte Systeme mit (4n + 2) π-Elektronen sind aromatisch für n = 0, 1, 2, 3, 4, 5.

IUPAC Definition

Monozyklische planare, sp2-hybridisierte Systeme mit (4n + 2) π-Elektronen sind aromatisch für n = 0, 1, 2, 3, 4, 5.

Cyclopropenyl Kation(n = 0)

+ -

Cyclopentadienyl Anion(n = 1)

Benzol(n = 1)

Page 16: Modul 6a (Strukturnormalisierung)

Beispiel Aromatizität

• Geruch ist „aromatisch“– Wer entscheidet das?

• Ringstrom vorhanden– Wer misst das?

• Reaktivität herabgesetzt– Unter welchen Bedingungen?

• Hückel-Regel– Was ist mit Polyzyklischen Verbindungen?

• Resonanzenergiegewinn– Wie berechnet man das?

Page 17: Modul 6a (Strukturnormalisierung)

Beispiele für Aromatizität

=?

=?

=?

Page 18: Modul 6a (Strukturnormalisierung)

• Finde alle Kekule-Muster

• Zähle jeden konjugierten Ring und berechne den Resonanzenergieeffekt RE dieses Rings

RE = Rn bei Hückel-Ring (4n+2 π-Elektronen)

RE = Qn bei Anti-Hückel-Ring (4n π-Elektronen)

• Berechne Randic-Aromatizitätsindex A:

Der Randic-Algorithmus

)4RE()24RE()4RE()24RE(

nn

nnA

−+

++=

Page 19: Modul 6a (Strukturnormalisierung)

Beispiel Naphtalin

4 Ringe mit 6 π-Elektronen (R1)2 Ringe mit 10 π-Elektronen (R2)

3 Kekule-Patterns

RE(4n+2) = ( 4 x R1 + 2 x R2 ) / 3RE(4n+2) = ( 4 x 0.87 eV + 2 x 0.25 eV ) / 3RE(4n+2) = 1.33 eV

RE(4n) = 0

Randic-Aromatzitätsindex = 1.0

(1)

(2)

(3)

Page 20: Modul 6a (Strukturnormalisierung)

Beispiele für Aromatizität

=

=

=

RE = ( 8R2 + 2R3 + 2Q3 ) / 4RE = 0.47 eVA = 0.76

RE = ( 4R1 + 2R2 ) / 3RE = 1.33 eVA = 1.0

RE = 0.20 eVA = 0.345

Page 21: Modul 6a (Strukturnormalisierung)

Grenzen des Randic-Algorithmus

N N

N N

RE = ( 2R1 + 2R4 + 4Q2 + 4Q3 ) / 4RE = -0.15 eVA = -0.14

• Wie bewertet man Heteroatome?• Was ist mit sp2-Stickstoffen?

Ist dieser Ring nicht doch aromatisch?

Page 22: Modul 6a (Strukturnormalisierung)

Kanonisierung

Ziel:

Eindeutige Nummerierung der Atome einer chemischen Struktur in 2D-Darstellung.

Trivialer Ansatz:

• Erzeuge alle Nummerierungen, linearisiere die Darstellung (z.B. mittels SMILES Notation), sortiere lexikografisch und nimm die erste Nummerierung.

Anwendung: „Wiswesser Line Notation“

Nachteil: Sehr aufwändig

Die meisten Methoden, die heute im Einsatz sind, schränken die zu Anzahl der Nummerierungen auf eine klar definierte Weise stark ein, bevor ein lexikografischen Vergleich stattfindet.

Page 23: Modul 6a (Strukturnormalisierung)

Kanonisierung: Morgan-Algorithmus

• Betrachtung des normalisierten Strukturdiagramms als mathematischer Graph. Atome sind Ecken, Bindungen sind Kanten.

• Der Algorithmus ist zweigeteilt: 1) Im ersten Schritt werden Äquivalenzklassen gebildet und

jede Ecke einer Äquivalenzklasse zugeordnet.

2) Die Äquivalenzklassen werden sortiert und die Ecken anhand dieser Sortierung eindeutig nummeriert. Hier können chemische Eigenschaften ( z.B. Bindungsordnung, Ordnungszahlen, etc. ) als Sortierkriterium eingebaut werden.

Page 24: Modul 6a (Strukturnormalisierung)

Morgan-Algorithmus: Äquivalenzklassen I

1) initialisiere jede Ecke mit dem „Konnektivitätswert“ 1

2) Zähle die Anzahl C verschiedener „Äquivalenzklassen“.

N

N

O1

1

1

1

1

1

1

1

11

1

1

1

C = 1 Äquivalenzklasse

Page 25: Modul 6a (Strukturnormalisierung)

N

N

O1

1

1

1

1

1

1

1

1

1

1

1

1

Morgan-Algorithmus: Äquivalenzklassen II

3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.

1 1

3

2

2

2

2

3

23

3

1

1

Page 26: Modul 6a (Strukturnormalisierung)

Morgan-Algorithmus: Äquivalenzklassen II

4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)

Cneu = 3 Äquivalenzklassen:1 (4x)2 (5x)3 (4x)N

N

O1

1

3

2

2

2

2

3

23

3

1

1

Page 27: Modul 6a (Strukturnormalisierung)

Morgan-Algorithmus: Äquivalenzklassen II

5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Cneu = 3 Äquivalenzklassen:1 (4x)2 (5x)3 (4x)N

N

O1

1

3

2

2

2

2

3

23

3

1

1

Page 28: Modul 6a (Strukturnormalisierung)

Morgan-Algorithmus: Äquivalenzklassen II

3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.

4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)

5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Cneu = 3 Äquivalenzklassen:3 (4x)5 (6x)6 (3x)N

N

O3

3

5

5

5

5

5

6

66

5

3

3

Page 29: Modul 6a (Strukturnormalisierung)

N

N

O5

5

13

10

10

11

11

16

1214

12

6

5

Morgan-Algorithmus: Äquivalenzklassen II

3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.

4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)

5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Cneu = 8 Äquivalenzklassen:5 (3x)6 (1x)10 (2x)11 (2x)12 (2x)13 (1x)14 (1x)16 (1x)

Page 30: Modul 6a (Strukturnormalisierung)

Morgan-Algorithmus: Äquivalenzklassen II

3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.

4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)

5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

13

12

25

24

24

26

26

3430

30

24

14

12

Cneu = 8 Äquivalenzklassen:12 (2x)13 (1x)14 (1x)24 (2x)25 (1x)26 (2x)30 (2x)34 (1x)

N

N

O

Page 31: Modul 6a (Strukturnormalisierung)

Cneu = 10 Äquivalenzklassen:

Morgan-Algorithmus: Äquivalenzklassen II

3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.

4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)

5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

25

24

61

51

51

58

58

8264

68

54

30

24

58 (2x)61 (1x)64 (1x)68 (1x)82 (1x)

24 (2x)25 (1x)30 (1x)51 (2x)54 (1x)

N

N

O

Page 32: Modul 6a (Strukturnormalisierung)

Morgan-Algorithmus: Äquivalenzklassen II

3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.

4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)

5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Cneu = 10 Äquivalenzklassen:

61

54

127

119

119

133

133

180150

148

116

68

54

127 (1x)133 (2x)148 (1x)150 (1x)180 (1x)

54 (2x)61 (1x)68 (1x)116 (1x)119 (2x)

N

N

O

Page 33: Modul 6a (Strukturnormalisierung)

3) Weise jeder Ecke die Summe der Konnektivitäts-werte ihrer direkten Nachbarn zu.

4) Ermittle die Anzahl Cneu verschiedener „Äquivalenzklassen“ (wie Schritt 2)

5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Morgan-Algorithmus: Äquivalenzklassen II

Cneu = 9 Äquivalenzklassen:

127

116

299

260

260

299

299

416328

334

256

148

116

299 (3x)328 (1x)334 (1x)416 (1x)

116 (2x)127 (1x)148 (1x)256 (1x)260 (2x)

N

N

O

Page 34: Modul 6a (Strukturnormalisierung)

N

N

O

Morgan-Algorithmus: Nummerierung

6) Setze Konnektivitätswerte auf vorletzte Äquivalenzklassen.

7) Starte Nummerierung bei noch nicht nummerierter Ecke mit maximalem Konnektivitätswert.

61

54

127

119

119

133

133

180

150148

116

68

54

1

Page 35: Modul 6a (Strukturnormalisierung)

Morgan-Algorithmus: Nummerierung

8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten Nachbarn.

9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern.

N

N

O61

54

127

119

119

133

133

180

150148

116

68

54

12

Page 36: Modul 6a (Strukturnormalisierung)

Morgan-Algorithmus: Nummerierung

8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten Nachbarn.

9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern. Für Nachbaratome mit gleichem Konnektivitätswert können Bindungsordnungen und Ordnungszahlen zur Gewichtung verwendet werden.

N

N

O61

54

127

119

119

133

133

180

150148

116

68

54

12

Page 37: Modul 6a (Strukturnormalisierung)

Morgan-Algorithmus: Nummerierung

8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten Nachbarn.

9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern. Für Nachbaratome mit gleichem Konnektivitätswert können Bindungsordnungen und Ordnungszahlen zur Gewichtung verwendet werden.

N

N

O61

54

127

119

119

133

133

180

150148

116

68

54

12

Page 38: Modul 6a (Strukturnormalisierung)

Morgan-Algorithmus: Nummerierung

8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten Nachbarn.

9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern. Für Nachbaratome mit gleichem Konnektivitätswert können Bindungsordnungen und Ordnungszahlen zur Gewichtung verwendet werden. Bei bleibender Gleichheit werden beide alternativen nummeriert und nach lexikographischer Sortierung die erste gewählt.

N

N

O61

54

127

119

119

133

133

180

150148

116

68

54

12

4/3

3/4

Page 39: Modul 6a (Strukturnormalisierung)

Morgan-Algorithmus: Nummerierung

8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten Nachbarn.

9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern. Für Nachbaratome mit gleichem Konnektivitätswert können Bindungsordnungen und Ordnungszahlen zur Gewichtung verwendet werden. Bei bleibender Gleichheit werden beide alternativen nummeriert und nach lexikographischer Sortierung die erste gewählt.

10) Weiter bei (8) bis alle Ecken nummeriert sind

N

N

O61

54

127

119

119

133

133

180

150148

116

68

54

12

4/3

3/4

5

6/7

7/6

8

9

1011

1213

Page 40: Modul 6a (Strukturnormalisierung)

Ausgewählte Literatur

AromatizitätM. Randic

Aromaticity and conjugation

J. Amer. Chem. Soc. 99 (1977) 444-450

KanonisierungH. L. Morgan

The Generation of a Unique Machine Description for ChemicalStructures - A Technique Developed at Chemical AbstractsService

J. Chem. Doc. 5 (1965) 107-113