laskennallinen kemia ja molekyylimallinnus - luentomoniste

Laskennallinen kemia

ja molekyylimallinnus

Jari Sinkkonen

Turun yliopisto, Kemian laitos

2008

2

ESIPUHE

Nykyään monet käyttäjäystävälliset molekyylimallinnusohjelmistot sekä alati kasvavat laskentaresurssit ovattuoneet laskennallisen kemian lähemmäs ”tavallista” kemistiä, ja ala ei ole enää pelkästään teoreetikkojenmystinen temmellyskenttä, jonne asiaan vihkiytymättömillä ei ole mitään asiaa. Näin ollen onkintodennäköistä, että tulevaisuudessa niin alalla kuin alalla työskentelevä kemisti joutuu tekemisiinjonkinlaisten laskennollisten menetelmien kanssa.

Tämän kurssin tarkoituksena on antaa yleiskuva siitä minkälaisia ovat tavallisimmat laskennallisetmenetelmät, joita kemiassa eteentulevissa ongelmissa yleisimmin käytetään. Kurssin tarkoituksena on myösantaa se tausta, joihin käsiteltävät menetelmät perustuvat. Tämä on oleellista, koska menetelmät lähespoikkeuksetta perustuvat joihinkin oletuksiin ja likimääräistyksiin. Ilman tietoa siitä, mihin käytettymenetelmä perustuu, on suuri todennäköisyys valita tarkasteltavana olevaan kemialliseen ongelmaansopimaton menetelmä ja tällöin laskuista saatujen tulosten luotettavuus on mitätön.

Laskennallisen kemian ja molekyylimallinnuksen maailma on täynnä erilaisia lyhenteitä ja omaa jargoniaan,kuten AMBER, PM3, HF-SCF, B3LYP/6-31G* jne. Tavoitteena on, että tämän kurssin jälkeen nuo edellämainitut ja monet muutkin ovat tuttuja, mikä helpottaa huomattavasti perehtymistä alan kirjallisuuteenmahdollisissa myöhemmin eteentulevissa tehtävissä. Lisäksi tällä kurssilla tullaan tutustumaan joihinkinyleisiin mallinnusohjelmistoihin.

Tämän monisteen tarkoituksena on kattaa kurssilla käsiteltävä teoria. Luennoilla käsitellään teoriaakäytännön esimerkkien kera. Moniste saattaa vaikuttaa pelottavan matemaattiselta. Tämänkaltaisen kurssinvaikeutena on se, että monissa menetelmissä taustalla oleva teoria on melko haastavaa matemaattisesti. Olenyrittänyt laatia kurssin siten, että vain aivan oleellisimmat yhtälöt on otettu mukaan ja niiden käytännönmerkitys on pyritty selittämään sanallisesti mahdollisimman hyvin.

Moniste pohjautuu pääasiassa seuraaviin kirjoihin:

Essentials of Computational Chemistry, Theories and Models. Christopher J. Cramer, by John Wiley & SonsLtd, 2002. (Eräs alan ”raamatuista”. Melko kattava ja matemaattisesti kohtuullisen haastava.)

Molecular Modelling for Beginners. Alan Hinchliffe, by John Wiley & Sons Ltd, 2003. (Pehmeämpi laskulaskennalliseen kemiaan. Melko matemaattinen tämäkin, mutta lähtee selvästi alemmalta tasolta. Tämänkirjan jälkeen on helpompi lukea esimerkiksi em. Cramerin kirjaa.)

Computational Chemistry, A Practical Guide for Applying Techniques to Real World Problems. DavidYoung, by John Wiley & Sons Ltd, 2001. (Ei matemaattinen kirja, joka tarkastelee asioita käytännönkannalta. Sisältää paljon hyödyllistä käytännöntietoa, kuten eri ohjelmistojen ja menetelmien vertailua.)

Koska tämä kurssi luennoidaan nyt vasta toista kertaa, on todennäköistä, että monisteesta löytyy edelleenkinvihreitä ja epätäsmällisyyksiä. Pyydänkin huomauttamaan minulle niistä. Haluan kiittää myös FT HenriKivelää useista parannusehdotuksista tähän vuoden 2008 versioon. Kaikenlainen opiskelijapalaute kurssistaon edelleen erittäin tervetullutta. Tavoitteena on, että kurssin seuraavat ”iteraatiot” olisivat aina edellistälähempänä optimia.

Jari Sinkkonen

3

SISÄLTÖ

1. JOHDANTO 42. MOLEKYYLIN GEOMETRIA 7 2.1 PDB-tiedosto 7

2.2 Z-matriisi 83. POTENTIAALIENERGIAPINTA 104. MOLEKYYLIMEKANIIKKA 12 4.1 Potentiaalienergiatermit 12 4.2 Tavallisimmat voimakentät 175. OPTIMOINTIALGORITMEISTA 196. MOLEKYYLIORBITAALITEORIAA 22 6.1 Aaltofunktiot ja operaattorit 22 6.2 Hamiltonin operaattori 23 6.3 Variaatioperiaate 25 6.4 Bornin ja Oppenheimerin approksimaatio 26 6.5 LCAO-lähestymistapa 27 6.6 Sekulaarideterminantti 28 6.7 Hartree-tulo ja Hartreen Hamiltonin operaattori 30 6.8 Elektronin spin ja antisymmetrisyys 32 6.9 Slaterin determinantti 33 6.10 Hartree-Fock SCF-menetelmä 357. SEMIEMPIIRISET MENETELMÄT 39 7.1 Hückelin teoria 40 7.2 Laajennettu Hückelin teoria 42 7.3 CNDO formalismi 43 7.4 INDO formalismit 45 7.5 NDDO formalismit 45 7.6 Semiempiiriset menetelmät ja SAR 468. AB INITIO –MENETELMÄT 48 8.1 Kantajoukot 48 8.2 Open-shell –systeemit 56 8.3 Huomioita laskenta-ajoista 57 8.4 Ab initio HF-teorian antamat tulokset 579. ELEKTRONIKORRELAATIO 58 9.1 Configuration interaction 60 9.2 Coupled cluster 60 9.3 Multiconfiguration SCF 61 9.4 Møller-Plesset häiriöteoria 6110. TIHEYSFUNKTIONAALITEORIA 62 10.1 Tiheysfunktionaaliteorian ensiaskeleita 63 10.2 Hohenbergin ja Kohnin teoreemat 65 10.3 Kohn Shamin tiheysfunktionaaliteoria 67 10.4 Vaihto-korrelaatiofunktionaalit 68 10.5 Huomioita DFT-menetelmistä 7111. MOLEKYYLISIMULAATIOMENETELMIÄ 73 11.1 Faasiavaruus ja trajektori 74 11.2 Molekyylidynamiikka 75 11.3 Monte Carlo 77 11.4 Molekyylisimulaatioiden sovelluskohteita 79LIITTEET

1. Laskennallisessa kemiassa käytetyt suureet ja yksiköt2. Laskennallisten menetelmien tulosten vertailua

4

1. JOHDANTO

Tällä kurssilla perehdytään laskennalliseen kemiaan ja molekyylimallinnukseen. Aluksi onkin syytä

selvittää mitä nuo sanat itseasiassa tarkoittavat.

Tavallisesti käytetään nimitystä teoreettinen kemia kemiasta, jossa pyritään asioiden

matemaattiseen käsittelyyn. Tämä on ns. kynän ja paperin äärellä tapahtuvaa yhtälöiden pyörittelyä.

Kun jokin kemiallinen asia on saatu kuvattua matemaattisilla yhtälöillä niin hyvin, että varsinaiset

laskelmat voidaan suorittaa tietokoneella, puhutaan laskennallisesta kemiasta. Laskennallinen

kemia (computational chemistry) siis tarkoittaa tietokoneen käyttöä kemiallisten laskelmien

apuneuvona.

Kemia, kuten useat muutkin tieteenalat, käyttää asioiden kuvaamiseen erilaisia malleja. Mallit

voivat olla kvalitatiivisia tai kvantitatiivisia. Esimerkkinä mallista voidaan ajatella jo lukiosta tuttua

Bohrin atomimallia. Nils Bohr esitti vuonna 1913 uuden mallin atomin rakenteesta. Malli sisälsi

mm. oletuksen, että elektronit kiertävät atomiydintä tietyillä määrätyillä ympyräradoilla. Bohrin

atomimallin avulla pystyttiin laskemaan vetyatomin spektri, mutta se antoi virheellisiä tuloksia, jos

tarkasteltavassa systeemissä oli useampia elektroneja kuin yksi. Koska Bohrin atomimalli perustuu

määrättyihin matemaattisiin postulaatteihin, voidaan sitä ajatella kvantitatiivisena mallina.

Esimerkki kvalitatiivisesta mallista on vaikkapa orgaanisesta kemiasta tuttu Lewisin tapa piirtää

elektroneja ja kemiallisia sidoksia.

Mallien tarkoituksena on helpottaa jonkin asian kuvaamista ja ymmärtämistä. Malli ei kuitenkaan

yleensä ole eksakti ja täydellinen tapa kuvata kyseistä asiaa. Täten onkin erittäin tärkeää ymmärtää

mitkä ovat mallin oletukset, toisin sanoen mitä mallilla voidaan kuvata, mitä rajoituksia sillä on

sekä kuinka luotettavia ovat mallin antamat tulokset.

Esimerkiksi edellä mainittu Bohrin atomimalli sopii edelleenkin hyvin kuvaamaan vetyatomia ja

antaa kokeellisten mittausten kanssa yhteneviä tuloksia. Mutta on syytä tiedostaa, että

monimutkaisempiin tapauksiin se on riittämätön. Samoin esimerkiksi Lewisin tavassa piirtää

atomien välinen kaksoissidos, on tärkeää ymmärtää, että kyseiset sidokset eivät ole samanlaiset,

vaan toinen on ns. - ja toinen ns. -sidos. Itseasiassa, jos tarkkoja ollaan, on sidosten ja

5

orbitaalienkin kuvaaminen vain malli, joka helpottaa kvanttimekaanisten tuloksien

havainnollistamista.

Molekyylimalli siis tarkoittaa tapaa kuvata molekyyliä. Molekyyliä voidaan mallintaa

useammallakin eri tavalla. Molekyylit voidaan ajatella koostuvan kovista palloista (ytimet) ja niitä

yhdistävistä jousista (sidokset). Tällaiseen klassiseen mekaniikkaan perustuvaan malliin

pohjautuvat molekyylimekaniikkamenetelmät.

Semiempiiriset, ab initio (lat. alusta, perusteista) ja tiheysfunktionaaliteoreettiset (DFT, density

functional theory) menetelmät puolestaan perustuvat kvanttimekaniikkaan. Kvanttimekaniikka on

matemaattinen teoria, jonka ei ole koskaan havaittu antavan ristiriitaisia tuloksia kokeellisten

tulosten kanssa. Kvanttimekaniikka on siis ainakin toistaiseksi täydellisin tapa kuvata atomitason

systeemejä. Kvanttimekaniikan huonona puolena on ainoastaan se, että Schrödingerin yhtälön

ratkaiseminen monimutkaisemmille systeemeille, kuten molekyyleille (poikkeuksena pienin

mahdollinen molekyyli H2+, joka sisältää vain yhden elektronin) ei ole mahdollista eksaktisti, vaan

on tyydyttävä likimääräisiin menetelmiin. Täten koko molekyylimallinnus perustuukin erilaisiin

likiarvomenetelmiin. Jotkin menetelmät käyttävät hyvinkin karkeita approksimaatioita, kun taas

jotkin tulevat toimeen mahdollisimman pienillä likimääräistävillä oletuksilla. Näiden

likimääräistysten ja tulosten luotettavuuden välinen yhteys on syytä ymmärtää.

Miksi sitten ei laskuja tehdä aina parhaalla mahdollisella, lievimmät oletukset sisältävällä

menetelmällä? Tähän on syynä käytettävissä oleva laskentateho. Vaikka tietokoneiden suorituskyky

onkin kehittynyt huimasti viime vuosikymmeninä, ei edelleenkään eikä varmasti

lähitulevaisuudessakaan ole käytännössä mahdollista esimerkiksi mallintaa suuria biomokyylejä

kuten proteiineja korkeatasoisilla ab initio –menetelmillä. Laskennallisessa kemiassa onkin tapana

puhua mikä on minkäkin menetelmän hinta. Tämä tarkoittaa kuinka paljon laskentatehoa mikäkin

menetelmä kuluttaa. Laskenta-aikaa mitataan yleensä ns. CPU-yksiköissä (central processing unit).

Ennen laskennallisen kemian soveltamista tiettyyn ongelmaan onkin syytä miettiä kuinka tarkkoja

tuloksia tarvitsee ja kuinka paljon laskenta-aikaa on käytettävissä, jotta pystyisi valitsemaan

ongelman ratkaisuun sopivan ja järkevän menetelmän.

Mitä kaikkea voidaan laskea? Usein ollaan kiinnostuneita tietyn rakenteen energiasta. Jos meillä on

olemassa rakenne, sille voidaan tehdä ns. single-point energy calculation, joka laskee kyseisen

rakenteen energian tyhjiössä ja 0 K lämpötilassa. Haluttaessa energia voidaan laskea myös jossain

6

tietyssä lämpötilassa ja paineessa, jotka vastaavat esimerkiksi mittauksissa tai synteesissä käytettyjä

olosuhteita. Tavallisesti rakenne, jonka energia halutaan selvittää, täytyy ensin määrittää. Tämä

tarkoittaa energeettisesti optimaalisen rakenteen etsimistä. Tätä geometriaoptimointia käsitellään

tarkemmin luvussa 3. Rakenteen ja energian lisäksi voidaan laskea myös monia rakenteelle

ominaisia kemiallisia ominaisuuksia. Näitä ovat mm. termodynaamisten tilanfunktioiden (entalpia,

Gibbsin energia jne.) arvot, spektroskooppiset suureet (kuten NMR-siirtymät ja kytkentävakiot,

rotaatio- ja vibraatiospektrit, esim IR ja UV-Vis) ja elektroniaffiniteetit ja ionisaatiopotentiaalit.

Lisäksi laskennallisesti voidaan selvittää myös rakenteen ominaisuuksia, jotka eivät ole

kokeellisesti mitattavissa. Tällainen on esimerkiksi sidoksen kertaluku. Usein sidokset eivät ole

todellisuudessa täysin esim. yksinkertaisia tai kaksoissidoksia. Yksinkertainen sidos saattaa omata

jossain määrin myös kaksoissidosluonnetta. Tämänkaltainen informaatio on hyödyllistä esimerkiksi

yhdisteen reaktiivisuuden kannalta.

Mihin laskennallisesti saatuja tuloksia voidaan hyödyntää? Eräs tapa on ennen uutta synteesiä

laskea onko suunniteltu tuote energeettisesti järkevä ja onko sillä jotain tiettyjä haluttuja

ominaisuuksia. Uuden synteesin kehittäminen voi vaatia kuukausien työn, joka saattaisi mennä

hukkaan, jos tuotetta ei synnykään tai se ei ole ominaisuuksiltaan halutunlainen. Toinen tapa on

hyödyntää laskettuja tuloksia kokeellisten tuloksien rinnalla. Näin voidaan tutkia esimerkiksi

spektroskooppisia ominaisuuksia ja isomeriatasapainoja. Esim. NMR-spektreissä saatetaan havaita

keskiarvoiset signaalit kahden nopeasti toisikseen vaihtuvan konformeerin välillä. Laskennallisesti

voidaan laskea kullekin konformaatiolle NMR-spektrit ja energiat erikseen ja päätellä näistä

tasapainosuhde kokeellisesti havaitussa spektrissä.

Tällä kurssilla käsitellään aluksi yleisiä asioita kuten molekyylin rakenteen esittämistä ja

potentiaalienergiapinnan käsitettä. Tämän jälkeen tarkastellaan klassista molekyylimekaniikkaa.

Seuraavaksi on paikallaan luoda pieni katsaus kvanttimekaniikkaan ja molekyyliorbitaaliteoriaan,

joka on lähtokohtana myöhempiin lukuihin, joissa käsitellään ensin semiempiirisiä ja sitten ab initio

ja DFT-menetelmiä. Kurssin loppuosassa tarkastellaan lyhyesti molekyylidynamiikkaa sekä muita

laskennallisesti mielenkiintoisia aiheita kuten konformaatioanalyysia. Aivan lopuksi luodaan

katsaus laskennallisen kemian työkaluihin ja tutkimukseen Suomessa.

7

2. MOLEKYYLIN GEOMETRIA

Jotta molekyyliä voidaan jollain tapaa mallintaa tietokoneellisesti, on sen kolmiulotteinen rakenne

pystyttävä kertomaan tietokoneelle. Molekyylin rakenne voidaan esittää usealla eri tavalla ja

monilla ohjelmilla onkin omat tiedostomuotonsa, joissa ne rakenteen ymmärtävät. Tässä esitetään

kaksi tavallisinta ja eniten käytettyä tiedostomuotoa. Ensimmäisenä esitetään ns. Brookhaven PDB-

tiedoston (Protein Data Bank) rakenne ja tämän jälkeen esimerkiksi Gaussian-ohjelmassa

tavallisimmin käytetty Z-matriisi-tiedostomuoto.

2.1. PDB-tiedosto

Brookhaven protein data bank PDB on ilmainen internet-tietokanta, johon on kerätty

makromolekyylien, kuten proteiinien, kolmiulotteisia rakenteita (jos haluat lisätietoa, kirjoita

googleen esim. PDB ja wikipedia). Tietokannassa on kokeellisesti määritettyjen molekyylien

rakenteita PDB-tiedostomuotoisina (samasta muodosta käytetään toisinaan myös lyhennettä .ent).

Samaa tiedostomuotoa voidaan toki käyttää muunlaistenkin molekyylien kuin suurten

biomolekyylien esittämiseen. PDB-muoto on hyvin yleinen ja paljon käytetty tiedostomuoto.

Esimerkiksi Gaussian ja HyperChem ja monet muutkin mallinnusohjelmistot osaavat lukea tätä

muotoa ja tallentaa rakenteen tässä muodossa.

PDB-tiedostossa rakenne esitetään yksinkertaisesti tavallisessa karteesisessa koordinaatistossa.

Koordinaatiston origon paikka on mielivaltainen. Tiedostossa esitetään aluksi kunkin atomin

numero, tyyppi ja koordinaatit. Tämän jälkeen kerrotaan ns. konnektiivisuudet, eli mikä atomi on

sitoutunut minkäkin kanssa.

Esimerkkinä on esitetty etanolin rakenne (kuva 2.1) HyperChemillä tallennetussa ent-muodossa

(esimerkki 2.1).

Kuva 2.1. Etanolin CH3CH2OH kolmiulotteinen rakenne.

8

HETATM 1 C 1 -1.258 0.467 0.003HETATM 2 C 2 -0.184 -0.642 -0.026HETATM 3 O 3 1.122 -0.053 0.014HETATM 4 H 4 -1.153 1.106 -0.875HETATM 5 H 5 -1.142 1.071 0.904HETATM 6 H 6 -2.252 0.016 0.001HETATM 7 H 7 -0.295 -1.229 -0.940HETATM 8 H 8 -0.317 -1.296 0.839HETATM 9 H 9 1.754 -0.804 0.002CONECT 1 2 4 5 6CONECT 2 1 3 7 8CONECT 3 2 9CONECT 4 1CONECT 5 1CONECT 6 1CONECT 7 2CONECT 8 2CONECT 9 3END

Esimerkki 2.1. Etanolin rakenne PDB-tiedostomuodossa. Esimerkiksi atomi 1 on hiili, jossa on kiinni toinenhiili ja kolme vetyä, eli tällöin sen on oltava etanolin CH3-hiili.

2.2. Z-matriisi

Toinen yleisimmin käytetyistä tavoista antaa rakenne on Z-matriisi. Esimerkiksi Gaussian käyttää

oletusarvoisesti Z-matriisia molekyylin geometrian kuvaamiseen. Z-matriisi rakentuu hieman

samaan tapaan miten molekyyli voidaan ajatella piirrettävän kynällä paperille. Aluksi aloitetaan

jostain atomista, tämän jälkeen seuraava atomi on tietynpituisella sidoksella kiinni aloitusatomissa.

Kolmas atomi taas on tietynlaisen sidoksen päässä toisesta atomista ja muodostaa tietyn kulman

atomien 1-2-3 välille. Neljäs puolestaan voidaan määritellä sidospituudella, sidoskulmalla ja torsio-

eli diedrikulmalla edellisiin nähden. Nämä kolme suuretta määrittävät aina seuraavan atomin

paikan. Esimerkkinä 2.2. on esitetty etanolin rakenne Z-matriisina.

C H 1 B1 H 1 B2 2 A1 H 1 B3 2 A2 3 D1 C 1 B4 4 A3 2 D2 H 5 B5 1 A4 4 D3 H 5 B6 1 A5 4 D4 O 5 B7 1 A6 4 D5 H 8 B8 5 A7 1 D6

B1 1.07000000 B2 1.07000000 B3 1.07000000 B4 1.54000000 B5 1.07000000

9

B6 1.07000000 B7 1.43000000 B8 0.96000000 A1 109.47122063 A2 109.47122063 A3 109.47122063 A4 109.47122063 A5 109.47122063 A6 109.47122063 A7 109.47122063 D1 -120.00000000 D2 120.00000000 D3 60.00000000 D4 -60.00000000 D5 180.00000000 D6 -180.00000000

1 2 1.0 3 1.0 4 1.0 5 1.0 2 3 4 5 6 1.0 7 1.0 8 1.0 6 7 8 9 1.0 9

Esimerkki 2.2. Etanolin rakenne Z-matriisina. Ensimmäisellä rivillä on aloituskohtana hiiliatomi, jotaajatellaan numeroksi 1. Seuraavalla rivillä on atomi 2, joka on H. Se on kiinni atomissa 1 sidospituudella B1.Kolmannella rivillä on atomi 3, joka on kiinni atomissa 1 sidospituudella B2 ja muodostaa atomin 2 kanssakulman A1. Esimerkiksi rivillä 6 on atomi 6, joka on H. Se on kiinni hiilessä 5 sidospituudella B5,muodostaa sidoskulman B5 atomien H6-C5-C1 välille ja torsiokulman H6-C5-C1-H4 välille. Tämän jälkeenon annettu lista siitä kuinka suuri mikäkin sidospituus, sidoskulma ja torsiokulma on. Lopuksi on annettu ns.konnektiivisuudet. Esimerkiksi ensimmäisellä rivillä on kerrottu, että atomissa 1 on kiinni atomit 2, 3, 4 ja 5,kukin yksinkertaisella sidoksella (1.0).

Etanoli-molekyyli muodostuu kaikkiaan yhdeksästä atomista. Kun tarkastellaan sen Z-matriisia

(esimerkki 2.2), huomataan sen koostuvan kahdeksasta sidospituudesta, seitsemästä sidoskulmasta

ja kuudesta torsiokulmasta, eli yhteensä 21 parametrista. Yleisesti ottaen N-atomisen molekyylin

kuvaamiseen tarvitaan 3N 6 parametria, kun N > 2. Ensimmäisen atomin paikka oletetaan

kiinnitetyksi, toisen kuvaamiseen tarvitaan vain yksi sidospituus ja kolmannen yksi sidospituus ja –

kulma. Tämän jälkeen jokaiseen lisäatomiin tarvitaan kolme uutta parametria. Täten em. tuloksen 6

tulee kolmen ensimmäisen atomin tuottamasta vähennyksestä.

Tarkastelemalla edellisen kappaleen PDB-tiedostoa, huomataan siinä olevan 27 parametria. Tämä

johtuu siitä, että origon paikka ja molekyylin asento oletettiin mielivaltaiseksi. Jos origo

oletettaisiin esimerkiksi ensimmäisen atomin paikaksi ja toisen atomin sijaitsevan x-akselin

10

suunnassa ja kolmannen xy-tasossa, voitaisi myös karteesisista koordinateista vähentää kuusi

kappaletta ja päädyttäisiin samaan 3N 6 lukemaan.

N-atomisella molekyylillä sanotaan olevan 3N 6 vapausastetta. Vapausasteen käsite on tärkeä

muun muassa spektroskopiassa. N-atomisella epälineaarisella molekyylillä on täsmälleen 3N 6

värähtelyvapausastetta ja täten yhtä monta erilaista normaalivärähtelymallia.

3. POTENTIAALIENERGIAPINTA

Tavallinen laskennallisen kemian ongelma on löytää energeettisesti edullisin avaruudellinen

rakenne annetulle molekyylille. Tämä tarkoittaa molekyylin potentiaalienergian minimin etsimistä.

Kuten edellä mainittiin, N-atomisen molekyylin kuvaamiseen tarvitaan 3N 6 koordinaattia. Tällöin

myös potentiaalienergia on 3N 6:n muuttujan funktio. Esimerkiksi etanolin potentiaalienergia on

tällöin 21:n muuttujan funktio. Potentiaalienergiaa voidaan ajatella ”21-ulotteisena hyperpintana”.

Usein ollaan kuitenkin kiinnostuneita jonkin tai joidenkin tiettyjen koordinaattien muutosten

vaikutuksesta rakenteen potentiaalienergiaan. Tällöin voidaan tarkastella potentiaalienergiaa tämän

tai näiden koordinaattien funktiona.

Tarkastellaan yksinkertaisena esimerkkinä 1,2-dikloorietaania CH2Cl CH2Cl ja sen

potentiaalienergiaa Cl Cl torsiokulman funktiona. Tällöin potentiaalienergiapinta on

pinnan sijasta pelkkä käyrä. Kyseisellä molekyylillä potentiaalienergia on maksimissaan, kun

torsiokulma on 0° tai 360°. Potentiaalienergialla on kolme minimiä, joista kahdessa Cl-atomit ovat

syn-asemassa ( = 60° ja 300°) ja yhdessä anti-asemassa ( = 180°) keskenään. Jälkimmäisessä

tapauksessa Cl-atomit ovat vastakkaisilla puolilla ja molekyylin potentiaalienergia on minimissään.

Edellisissä tilanteissa potentiaalienergiakäyrässä on minimi, mutta energia on anti-aseman energiaa

korkeampi. Energiaminimiä, jossa potentiaalienergia saavuttaa pienimmän arvonsa, kutsutaan

globaaliksi minimiksi. Muita energiaminimejä, joissa potentiaalienergia on suurempi kuin

globaalissa minimissä, sanotaan lokaaleiksi minimeiksi. 1,2-dikloorietaanilla on siis em.

torsiokulman suhteen kolme minimiä, joista anti-aseman minimi muodostaa energeettisesti

pysyvimmän rakenteen ja on globaali minimi.

11

Tilanne muuttuu hieman hankalammaksi, kun muuttuvia koordinaatteja on enemmän kuin yksi.

Tarkastellaan seuraavaksi kuvien avulla minkälaisia ominaisuuksia voi energiapinnalla olla kahden

koordinaatin systeemissä. Kuvassa 3.1. on esitetty vasemmalla potentiaalienergiapinnan minimi.

Oikealla puolella on sen sijaan esitetty ns. satulapiste. Satulapiste on potentiaalienergiapinnan piste,

joka on maksimi joidenkin koordinaattien suunnassa, mutta minimi muiden suunnassa.

Kuva 3.1. Vasemmalla energiaminimi ja oikealla satulapiste.

Kuvassa 3.2 on puolestaan esitetty kemian kannalta mielenkiintoinen ja realistinen tilanne, joka

voisi vastata sellaisen molekyylin potentiaalienergiapintaa, jossa molekyylillä on kaksi

avaruudellista konformaatiota, jotka voivat muuttua toisikseen tietyn energiavallin ylitettyään. Eli

potentiaalienergiapinnalla on kaksi minimiä, joista toinen on globaali ja toinen lokaali minimi.

Minimien välissä on satulapiste. Satulapisteen merkitys kemian kannalta onkin, että se ilmaisee

transitiotilan rakenteen ja sitä vastaavan energian. Satulapisteen kautta kulkee pienimmän

energiavallin ylittävä tie minimien välillä.

Kuva 3.2. Potentiaalienergiapinta, jossa on esitetty kaksi minimiä (globaali ja lokaali) ja niitä yhdistäväsatulapiste. Molemmissa kuvissa on sama pinta, vain eri suunnista katsottuna.

12

4. MOLEKYYLIMEKANIIKKA

Yksinkertaisin tapa ajatella molekyyliä on kuvitella sen koostuvat kovista palloista (ytimet), jotka

ovat liittyneet jousilla (sidokset) toisiinsa. Tämänkaltaista systeemiä pystytään kuvaamaan klassisen

mekaniikan keinoin ja vältytään raskailta kvanttimekaanisilta laskelmilta. Tämän vuoksi

molekyylimekaniikan laskut ovat hyvin nopeita verrattuna myöhemmin esitettäviin menetelmiin.

Nopeutensa puolesta molekyylimekaniikka sopii hyvin suurien molekyylien mallinnukseen. Myös

pienempiä molekyylejä mallinnettaessa molekyylimekaniikka on hyvä ja nopea menetelmä

alustavaan rakenteen määrittämiseen. Molekyylimekaniikan avulla saatua rakennetta voidaan

käyttää lähtörakenteena raskaammille laskuille ja säästää näin niiden vaatimien iteraatioiden

määrää.

Molekyylimekaniikan ajatuksena on laatia ns. voimakenttä, joka koostuu useista

potentiaalienergiatermeistä, joista kukin liittyy tiettyyn molekyylin ominaisuuteen, kuten

sidospituuksiin tai ytimien ja elektronien väliseen sähköstaattiseen vuorovaikutukseen.

Voimakentän termit sisältävät useita parametreja, jotka voidaan määrittää kokeellisesti tunnettujen

molekyylien avulla. Tällöin on mahdollista parametrisoida voimakenttä esimerkiksi juuri tietyn

tyyppisille molekyyleille, jolloin menetelmä saattaa antaa erittäin hyviä tuloksia samankaltaisille

rakenteille, mutta epäonnistua täysin muille. Erilaiset molekyylimekaniikkamenetelmät ovatkin vain

hieman toisistaan poikkeavia voimakenttälausekkeita erilaisine parametrisointeineen. Seuraavassa

tarkastellaan mitä kaikkea voimakenttälausekkeissa huomioidaan ja minkälaisista osista

tavallisimmat niistä koostuvat. Tämän jälkeen tarkastellaan muutamaa tunnetuinta voimakenttää ja

niiden oletuksia sekä soveltuvuuskohteita.

4.1. Potentiaalienergiatermit

Sidosten venytysvärähtelyt

Tarkastellaan kahden atomin välistä sidospituutta r. Sidospituudella on olemassa tietty arvo req,

jolla potentiaalienergia U(r) saavuttaa minimin. Oletetaan, että energian nollataso on valittu niin,

että U(req) = 0. Jos U(r) ja sen kaikki derivaatat ovat jatkuvia funktioita, kuten käytännössä ovat,

voidaan U(r) lausua matemaattisesti Taylorin sarjakehitelmän avulla:

U(r) = U(req) + ...)(!3

1)(!2

1)( 3eq3

32

eq2

2

eq eqeqeqrr

drUdrr

drUdrr

drdU

rrrrrr (4.1)

Koska U(req) oletetaan energian nollatasoksi, on sarjakehitelmän ensimmäinen termi siis 0. Lisäksi

myös kehitelmän toinen termi on 0, koska U(req) on potentiaalienergiakäyrän minimi, ts. derivaatan

13

nollakohta. Tällöin yksinkertaisin tapa approksimoida sidoksen venytysvärähtelyjä on ottaa

huomioon vain kehitelmän kolmas (toista kertalukua oleva) termi ja olettaa korkeamman kertaluvun

termit mitättömän pieniksi. Jos oletetaan, että tarkastellaan atomien A ja B välistä sidosta, voidaan

kehitelmää (4.1) kuvata yhtälöllä

U(rAB) =21 kAB(rAB rAB,eq)2, (4.2)

missä U(r):n toista derivaattaa kohdassa r = req on merkitty k:lla. Vakiota k kutsutaan voimavakioksi

ja se vastaa harmonisen värähtelijän jousivakiota. Yhtälö (4.2) onkin sama kuin mekaniikasta tuttu

Hooken laki harmoniselle värähtelijälle. Yhtälön (4.2) mukainen potentiaalienergia on siis

muodoltaan paraabeli, jonka minimi on kohdassa r = req. Paraabeli ei kuitenkaan ole kemiallisessa

mielessä järkevä kuvaamaan potentiaalienergiaa kun r kasvaa, sillä se antaa tulokseksi U(r) ,

kun r . Eli kemiallisia sidoksia ei pystytä ”katkaisemaan” lainkaan. Tämä voidaan korjata

lisäämällä U:n lausekkeen myös kehitelmän kolmannen asteen termi. Kolmannen asteen termin

voimavakiota kutsutaan epäharmoniseksi voimavakioksi ja se on negatiivinen. Kolmannen

kertaluvun termi tuottaa näin ollen tietyn maksimiarvon U(r):lle. Sen mukaan ottaminen tuottaa

kuitenkin uuden ongelman, sillä nyt U(r) , kun r . Tämä siis tarkoittaa, että

energeettisesti suotuisin tilanne saavutetaan kun kaikki sidokset ovat täysin dissosioituneet, mikä ei

kemiallisesti ole tietenkään järkevä tulos. Tämä ongelma voidaan jälleen korjata lisäämällä

lausekkeeseen kehitelmän neljännenkin kertaluvun termi. Tällaista neljännen asteen

potentiaalienergiaa kuvaavaa käyrää käytetään useissa käytännön voimakenttälausekkeissa, kuten

orgaanisessa kemiassa yleisesti käytetyssä MM3 voimakentässä. Toisaalta jotkin

voimakenttälausekkeet huomioivat vain kaavan (4.2) mukaisen harmonisen potentiaalienergian.

Nämä voimakentät ovat suunniteltu suurien biomolekyylien mallintamiseen, jolloin pitäytyminen

yksinkertaisimmassa mahdollisessa voimakentässä nopeuttaa laskuja huomattavasti.

Tässä yhteydessä on syytä mainita myös ns. Morsen potentiaalienergiafunktio. Kyseisen funktion

muoto vastaa paremmin kokeellisesti havaittua potentiaalienergiakäyrää kuin em. neljännen

kertaluvun polynomilauseke. Morsen potentiaali on muodoltaan seuraavankaltainen:

U(rAB) = DAB [ )( eqAB,AB1 - rrABe ]2, (4.3)

missä DAB on sidoksen dissosiaatioenergia ja AB kokeellinen sovitusparametri. Kaavan (4.3)

mukaista energialauseketta käytetään laajalti mm. spektroskopiassa, mutta laskennallisesti se ei ole

kovin hyvä, sillä eksponenttifunktion laskeminen on laskentatehollisesti huomattavasti kalliimpaa

kuin polynomifunktion.

14

Sidoskulmat

Voimakenttien sidoskulmista aiheutuva potentiaalienergia kuvataan tavallisesti samoin Taylorin

sarjakehitelmän avulla kuten sidoksetkin edellä. Kehitelmän (4.1) mukainen lauseke atomien A, B

ja C väliselle sidoskulmalle BC voidaan kirjoittaa muotoon

U( BC) =21 [ )2(

ABCk + )3(ABCk ( BC BC,eq) + )4(

ABCk ( BC BC,eq)2 + ... ]

( BC BC,eq)2, (4.4)

missä derivaatat on merkitty voimavakioilla. Käytetystä voimakentästä riippuu kuinka monenteen

kertalukuun asti termejä laskuihin otetaan mukaan. Esimerkiksi edellä mainittu MM3 huomioi

termejä aina kuudenteen kertalukuun saakka. Suurien biomolekyylien laskuihin painotetut

menetelmät huomioivat yleensä selvästi vähemmän termejä ja voivat katkaista lausekkeen jo toisen

kertaluvun termin kohdalta.

Torsiokulmat

Kun ajatellaan Z-matriisin konstruointia, ensimmäistä kahta atomia A ja B kohti tarvitaan

parametriksi ainoastaan sidospituus rAB. Kolmannen atomin C mukaan ottaminen tuo parametriksi

myös sidoskulman BC. Neljännen atomin D paikka voidaan määritellä torsiokulman ABCD avulla.

Torsiokulma ja sen merkki määritellään kuten kuvassa 4.1 on esitetty.

< 0

> 0

A

B

C

D

< 0

> 0

A

B

C

D

< 0

> 0

A

B

C

D

< 0

> 0

A

B

C

D

Kuva 4.1. Torsiokulman ja sen merkin määritelmä. Esim. tässä ABCD 90° = +270°. Kulma atomienlukusuunnassa myötäpäivään on siis positiivinen ja vastapäivään negatiivinen. Huomaa, että tulos on samakatsotaan sitä sitten tason etu- tai takapuolelta.

Koska torsiokulma on jaksollinen (0° = 360° jne.), on myös torsiokulmista aiheutuva

potentiaalienergian lausekekin jaksollinen. Jaksollisia funktioita voidaan kuvata matemaattisesti

polynomilausekkeiden sijasta ns. Fourier-sarjojen avulla, jotka ovat jaksollisia. Taylorin

15

polynomikehitelmää vastaava Fourier-sarjalauseke torsiokulman potentiaalienergialle U( ABCD)

voidaan esittää muodossa

U( ABCD) =21

jjV ABCD, [ )cos()1(1 ABCD,ABCD

1j

j j ]. (4.5)

Yhtälössä (4.5) j kuvaa lausekkeen jaksollisuutta. Esimerkiksi kun j = 2, kosinilauseke tekee kaksi

jaksoa, kun ABCD muuttuu nollasta 360 asteeseen. Jaksollisuus vastaa Fourier-sarjassa tavallaan

polynomilausekkeiden kertalukua. Vj,ABCD kuvaa jaksollisuuden j omaavan termin voimakkuutta,

amplitudia. Kosinilausekkeessa oleva lisätermi j,ABCD on ns. faasitermi. Faasitermit ja amplitudit

ovat voimakenttälausekkeelle ominaisia kokeellisesti määritettyjä parametreja. Usein

kolmejaksoiseen termiin asti ulottuva summaus antaa hyviä tuloksia kokeellisiin verrattuna.

Esimerkiksi n-butaanilla havaitaan hyvä sopusointu kokeellisten tulosten kanssa.

Torsiokulmia käsitellessä on syytä huomioida myös tilanne, joka voi syntyä, kun tiettyyn atomiin

on liittynyt kolme muuta atomia, jotka eivät ole sitoutuneet keskenään. Esimerkki tällaisesta

rakenteesta on formaldehydi HCOH. Formaldehydin rakenne voidaan silti kuvata torsiokulman

avulla, vaikka varsinaista todellista torsiokulmaa ei kemiallisessa mielessä olekaan. Matemaattisesti

rakenteen potentiaalienergia voidaan kuitenkin kuvata kaavan (4.5) mukaisesti kuten tavallisillakin

torsiokulmilla. Tämä on esimerkki ns. epäaidosta torsiosta (improper torsion).

Van der Waalsin voimat

Varsinaisten geometristen ominaisuuksien lisäksi voimakenttälausekkeissa on otettava huomioon

muitakin atomien välisiä vuorovaikutuksia. Yksi näistä on van der Waalsin voimat. Tarkastellaan

atomeita A ja B, jotka eivät ole sitoutuneet toisiinsa. Jos atomit ovat kaukana toisistaan ne eivät

vaikuta merkittävästi toisiinsa. Tilanne muuttuu, kun atomit tuodaan lähemmäs toisiaan. Tällöin

atomeita alkaa vetää puoleensa ns. van der Waalsin voimat, kuten indusoituneet dipoli-dipoli

vuorovaikutukset. Tällaisten vuorovaikutusten on havaittu olevan kääntäen verrannollinen atomien

etäisyyden kuudenteen potenssiin. Atomit eivät kuitenkaan voi lähestyä äärettömästi toisiaan, sillä

tietyllä etäisyydellä niitä ympäröivät elektroniset vuorovaikutukset estävät lähestymisen. Tällöin

toisiinsa sitoutuneiden atomien potentiaalienergiaa voidaan kuvata kuvan 4.2 mukaisella käyrällä.

Energia on nolla, kun atomit ovat kaukana toisistaan. van der Waalsin voimat vetävät atomeja

toisiinsa ja energia saavuttaa tietyn minimin, jonka jälkeen elektroniset hylkimisvoimat aiheuttavat

energiakäyrään jyrkän vallin.

16

r(AB)

Pote

ntia

alie

nerg

ia

Kuva 4.2. Potentiaalienergian käyttäytyminen toisiinsa sitoutumattomien atomien A ja B välisen etäisyydenfunktiona. Kuvan käyrä on piirretty käyttäen yhtälön (4.6) mukaista Lennard-Jonesin potentiaalia.

Potentiaalienergiaa voidaan tässä tapauksessa kuvata ns. Lennard-Jonesin potentiaalin mukaisesti

yhtälöllä

U(rAB) =6

AB

AB12AB

AB

rb

ra . (4.6)

Parametrit a ja b ovat ominaisia vakioita atomeille A ja B. Yhtälössä (4.6) jälkimmäisen termin

kuudes potenssi tulee dipoli-dipoli vuorovaikutusten etäisyysriippuvuudesta, sen sijaan

ensimmäisen termin 12. potenssia ei ole johdettavissa teoriasta, vaan se on valittu, koska se kuvaa

havaittua potentiaalia riittävän hyvin. Oleellisin syy valinnalle on laskennallinen etu. Ensinnäkin

potenssitermi on edullisempi laskea kuin esimerkiksi logaritminen, eksponenttinen tai

neliöjuurellinen termi. Lisäksi juuri 12. potenssi on helppo laskea, koska yhtälössä joudutaan

laskemaan kuudes potenssi. Tällöin 12. potenssi saadaan vain kertomalla kuudes potenssi itsellään,

mikä on laskennallisesti halpa operaatio. Tällöin 12. potenssi on edullisempi laskettava kuin

esimerkiksi 11. potenssi. Koska laskennallisissa menetelmissä yhtälön (4.6) kaltaisia termejä tulee

laskettua hyvin useita, tulevat pienetkin ajansäästöt merkittäviksi laskujen kokonaiskestoa ajatellen.

Sähköstaattiset vuorovaikutukset

Useat voimakentät ottavat huomioon atomien välisen elektronegatiivisuuseron. Tämä voidaan

huomioida samankaltaisella lausekkeella kuten kahden varautuneen (varaus Q) hiukkasen välinen

vuorovaikutus

U(rAB) =AB

BA

041

rQQ

. (4.7)

Erimerkkisille varauksille energia on siis negatiivinen (puoleensa vetävä) ja saman merkkisille

positiivinen (hylkivä).

17

Ristitermit

Aiemmin esitetyt sidospituudet, sidoskulmat ja torsiokulmat eivät ole täysin riippumattomia

toisistaan. Tietyissä kemiallisissa tilanteissa tämä riippuvuus korostuu. Esimerkiksi amideilla C=O

ja C N sidokset eivät ole puhtaasti kaksin- ja yksinkertaisia sidoksia vaan -konjugoituneita ja

sisältävät molemmat osittaista kaksoissidosluonnetta. Ristitermit voidaan huomioida yhtälön (4.8)

kaltaisilla lisätermeillä:

U(rAB, BC) =21 kAB,ABC(rAB rAB,eq)( BC BC,eq), (4.8)

missä voimavakion kAB,ABC suuruus kuvastaa ristitermin vaikutusta.

4.2. Tavallisimmat voimakentät

Erilaisten mallinnusohjelmistojen käyttämät molekyylimekaniikkamenetelmät perustuvat siis

potentiaalienergialausekkeen (voimakentän) minimien etsimiseen. Voimakentän lausekkeissa on

otettu huomioon edellä esitetyt termit ja lisäksi joitain muita mahdollisia lisätekijöitä kuten

esimerkiksi vetysitoutuminen. Yleisesti ottaen potentiaalienergian lauseke sisältää tarkasteltavan

rakenteen vapausasteiden mukaisen määrän (3N 6, kun molekyylissä N atomia) optimoitavia

koordinaatteja (optimointia käsitellään lyhyesti seuraavassa luvussa) ja on muotoa

U(kok.) = U(sidokset) + U(sidoskulmat) + U(torsiokulmat) + U(Van der Waals)

+ U(sähköstaattiset) + U(ristitermit) + U(muut). (4.9)

Molekyylimekaniikkamenetelmien nimistö on jossain määrin sekava. Usein menetelmien kehittäjät

eivät muuta menetelmän nimeä päivittäessään voimakenttäparametrejaan. Tällain on vaikea seurata

mitä voimakenttää minkäkin niminen menetelmä milloinkin käyttää. Esimerkiksi menetelmästä

MM3 on olemassa useita eri vuosina tehtyjä versioita. Usein näkee käytettävän esimerkiksi

nimitystä MM3(96) kertomaan, että kyseessä on voimakenttä, joka on päivitetty vuonna 1996.

Lisävaikeutena on se, että mallinnusohjelmistoihin sisällytetyt molekyylimekaniikkamenetelmät

voivat olla nimeltään samoja kuin jokin toinen, mutta hieman ehkä muokattu ohjelmistoon

sopivaksi, kuten HyperChemin molekyylimekaniikkamenetelmä MM+. Vielä tämän lisäksi

menetelmällä ja ohjelmistolla voi olla jopa sama nimi, kuten AMBER. Nykyään AMBER on

molekyylimallinnusohjelmisto, joka sisältää monia erilaisia voimakenttiä, joista yksi on nimeltään

myös AMBER. Taulukossa 4.1 on esitetty muutamia tavallisimmin käytettyjä

molekyylimekaniikkamenetelmiä ja niiden erityispiirteitä.

18

Taulukko 4.1. Yleisimpiä molekyylimekaniikkamenetelmiä ja niiden ominaisuuksia.Nimi Soveltuvuus Ominaisuuksia

DREIDING Orgaaniset ja bio-orgaanisetmolekyylit

Yleiskäyttöinen. Vanhahko, nykyään käytetään uudempiamenetelmiä. Sidosvärähtelyt voidaan mallintaa Morsenpotentiaalin avulla.

MM1 Hiilivedyt Ensimmäisiä menetelmiä (1976). Soveltuu vainhiilivedyille. Ei huomioi sähköstaattisia vuorovaikutuksia.Ei juurikaan käytetä nykyään, koska on parannettujaversioita.

MM2 Hiilivedyt Parannettu versio MM1:stä. Käytössä nykyäänkin. MMXja MM+ ovat muokattuja versioita MM2:sta.

MM3 Orgaaniset molekyylit Edelleen kehitetty versio MM2:sta. Luultavasti käytetyinmolekyylimekaniikka menetelmä tavallisille pienehköilleorgaanisille yhdisteille.

MMFF Orgaaniset molekyylit Merck Molecular Force Field. Yleiskäyttöinen ja melkouusi (1996) orgaanisen kemian voimakenttä. Kehitettyalunperin pääasiassa molekyylidynamiikkasimulointeihin,mutta toimii hyvin geometriaoptimoinneissakin.

AMBER Proteiinit ja nukleiinihapot Assisted Model Building with Energy Refinement.Parametrisoitu proteiineille ja nukleiinihapoille. Ottaahuomioon mm. liuottimen ja vetysitoutumisen. Ei huomioiristitermejä. Tulokset hyviä proteiineille janukleiinihapoille, mutta epäluotettava muunlaisillemolekyyleille.

CHARMM Biomolekyylit Chemistry at HARvard Macromolecular Mechanics.Yleisesti käytetty biomolekyylien voimakenttä. MenetelmäCHARMm on muuten sama kuin edellinen, mutta onkaupallinen ohjelma.

OPLS Biomolekyylit,orgaaniset liuottimet

Optimized Potentials for Liquid Simulation. Parametrisoituorgaanisille liuottimille. Käytetään myös biomolekyylienmolekyylidynamiikkamallinnuksessa.

SHAPES Siirtymämetalliyhdisteet Epäorgaanisten yhdisteiden mallinnus on usein hankalaa jatulosten luotettavuuden suhteen on syytä olla varovainen.

Mietittäessä molekyylimekaniikan soveltamista johonkin tiettyyn kemian ongelmaan, tulee mieleen

kaksi kysymystä: mikä olisi paras menetelmä omaan ongelmaani ja kuinka luotettavia tulokset ovat.

Ensimmäiseen kysymykseen vastaus on, että paras menetelmä on se, joka on parametrisoitu

samankaltaisille yhdisteille, kun tutkimasi yhdiste, tai muuten osoittautunut hyväksi menetelmäksi

samankaltaisten yhdisteiden tutkimuksessa aikaisemmin kirjallisuuden perusteella. Tavallisten

pienehköjen orgaanisten molekyylien mallintamiseen suositeltavimpia ovat MM2, MM3 ja MMFF

voimakentät. Biomolekyyleillä valinta kohdistuu yleensä joko AMBER:iin tai CHARMM:iin.

19

Epäorgaanisten yhdisteiden mallintamiseen on valitettavan harvoja menetelmiä. Usein voimakenttä

täytyy olla parametrisoitu esimerkiksi juuri tietylle metallille. Molekyylimekaniikkatulosten

luotettavuuden suhteen on syytä olla varovainen. Juuri samankaltaisille yhdisteille, kun

parametrisoinnissa käytetyt, tulokset saattavat olla erittäinkin hyviä. Kuitenkin uudentyyppisille

yhdisteille on tuloksiin suhtauduttava varauksella ja niitä olisi hyvä päästä vertaamaan kokeellisten

tulosten kanssa.

Nykyään molekyylimekaniikkamenetelmiä käytetään nopeutensa vuoksi pääasiassa suurien

biomolekyylien mallinnuksessa. Toinen molekyylimekaniikan tavallisimmista käyttötarkoituksista

on molekyylidynamiikkasimuloinnit, joissa menetelmän nopeus on myös oleellista.

Molekyylidynamiikkaa käsitellään lyhyesti kurssin loppupuolella. Pienemmille molekyyleille

molekyylimekaniikkaa voi käyttää nopeana kvalitatiivisena apuna visualisoimaan rakennetta.

Lisäksi molekyylimekaniikan avulla voi nopeasti rakentaa lähtörakenteita raskaammille

kvanttimekaanisille mallinnusmenetelmille.

5. OPTIMOINTIALGORITMEISTA

Tässä luvussa kuvataan lyhyesti minkälaisilla periaatteilla potentiaalienergiakäyriltä ja -pinnoilta

löydetään halutut minimikohdat. Funktioiden optimointi ja ääriarvojen etsiminen on kokonainen

matematiikan osa-alue ja tässä yhteydessä ei ole tarkoitus alkaa käymään läpi erilaisia algoritmejä.

Tarkoituksena on lähinnä antaa kuva siitä minkätyyppisiin menetelmiin algoritmit voidaan jaotella

ja mitkä ovat niiden hyvät ja huonot puolet molekyylimallinnuksen kannalta. Kuten edellä on

mainittu, N-atomisella molekyylillä tarvitaan p = 3N 6 koordinaattia kuvaamaan sen rakenne.

Oletetaan, että nämä koordinaatit ovat q1, q2, ..., qp. Tällöin molekyylin rakenne voidaan kuvata

vektorilla q = (q1, q2, ..., qp)T. (Huom. Lihavoidut suureet viittaavat vektoriin.) Kyseinen vektori siis

määrittää yksikäsitteisen pisteen potentiaalienergiapinnalla. Jotta optimointimenetelmät voitaisi

jakaa tietyntyyppisiin, on syytä ensin selvittää mitä tarkoitetaan potentiaalienergian gradientilla g =

grad U ja sen Hessen matriisilla eli Hessiaanilla:

20

pq

qq

...2

1

q , g =

pqU

qUqU

...2

1

ja H =

2

2

1

2

1

2

21

2

..............................

......

pp

p

qU

qqU

qqU

qU

. (5.1)

Molekyylin potentiaalienergia riippuu siis paikasta potentiaalienergiapinnalla, eli U = U(q). Pistettä,

jossa U:n gradientti g = 0, kutsutaan stationaariseksi pisteeksi. Tavallisen yhden muuttujan funktion

gradientti on sama kuin derivaatta. Gradientin nollakohdista löydetään potentiaalienergiapinnan

minimit ja maksimit. Useampiulotteisessa tapauksessa gradientin nollakohta voi olla myös

satulapiste. Stationaarisen pisteen laatu voidaan selvittää laskemalla Hessen matriisin ominaisarvot.

Jos kaikki ominaisarvot ovat positiivisia, on kyseessä minimi, ja vastaavasti, jos kaikki ovat

negatiivisia, niin maksimi. (Huomaa, että tässäkin erikoistapauksena on tuttu yhdenmuuttujan

tilanne, jossa toisen derivaatan merkin perusteella pystytään päättelemään ääriarvon laatu.) Muussa

tapauksessa kyseessä on satulapiste. Kemian kannalta mielenkiintoisimpia satulapisteitä ovat ne,

joissa piste on minimi kaikissa muissa suunnissa paitsi maksimi yhdessä. Tämä tarkoittaa, että

ominaisarvoista tasan yksi on negatiivinen ja muut positiivisia. Tällainen satulapiste kuvaa

kemiassa transitiotilaa.

Seuraavassa on esitetty kolme tapaa, joihin erilaiset optimointimenetelmät voidaan luokitella.

Menetelmät, jotka eivät käytä gradientteja

Potentiaalienergiaminimin voi löytää yksinkertaisesti esimerkiksi niin, että potentiaalienergiapinta

ajatellaan verkoksi pisteitä. Valitaan jokin aloituspiste ja lasketaan U ko. pisteessä. Tämän jälkeen

lasketaan U tämän viereisissä pisteissä ja valitaan niistä pienimmän energian antava piste uudeksi

lähtöpisteeksi. Tällä tavoin päädytään ennemmin tai myöhemmin minimipisteeseen. Toinen tapa on

valita jokin alkupiste ja etsiä minimi koordinaatti kerrallaan. Kun kaikkia koordinaatteja

optimoidaan syklisesti vuorotellen, päädytään lopulta minimiin. Tämänkaltaisten menetelmien

etuna on se, että vältytään gradienttien ja Hessen matriisien laskemiselta, mikä säästää laskenta-

aikaa. Toisaalta menetelmien heikkoutena on, että ne saattavat lähestyä minimiä hitaasti, joten

optimointisyklejä saattaa tulla runsaasti.

21

Ensimmäisen kertaluvun menetelmät

Nämä menetelmät ovat sellaisia, jotka ottavat huomioon myös U:n gradientin. Eräs havainnollinen

tällainen menetelmä on ns. jyrkimmän laskeutumisen (steepest descent) menetelmä. Siinä oletetaan

jokin alkupiste, jossa lasketaan U. Tämän jälkeen jokaisen atomin paikkaa muutetaan hieman x-, y-

ja z-suunnassa ja lasketaan U uudelleen näissä alkupisteen ympäristöön kuuluvissa pisteissä. Se

missä pisteessä U vähenee eniten, otetaan uudeksi lähtöpisteeksi. Menetelmä etsii siis jyrkimmän

tien alas kohti minimiä. Tällöin optimointisyklien määrä on huomattavasti pienempi kuin edellisissä

menetelmissä. Tosin haittana on, että joka pisteessä täytyy tehdä lukuisia laskuja. Muita

ensimmäisen kertaluvun menetelmiä ovat ns. konjugaattigradienttimenetelmät. Tällainen on mm.

Polak-Ribière algoritmi, joka esim. HyperChemissä on oletusalgoritmina.

Toisen kertaluvun menetelmät

Nämä menetelmät käyttävät laskuissaan paitsi gradientteja myös Hessen matriisia. Tällaisia

menetelmiä ovat mm. Newton Raphson sekä Fletcher Powell algoritmit. Näistä ensin mainittu on

moniulotteinen yleistys lukiostakin tutusta (?) menetelmästä etsiä nollakohtia yhden muuttujan

funktioille. Yhteistä toisen kertaluvun menetelmille on, että niissä ns. iteraatiosyklien määrä jää

melko vähäiseksi, koska algoritmi löytää minimin tehokkaasti vähillä askeleilla. Kuitenkin Hessen

matriisin laskeminen jokaisessa pisteessä saattaa olla laskennallisesti raskas tehtävä.

Sopivimman algoritmin valitseminen riippuu monesta seikasta, mutta joitain yleissääntöjä voidaan

kuitenkin antaa. Laskettaessa suuria molekyylejä molekyylimekaniikkamenetelmien avulla,

potentiaalienergialausekkeissa saattaa olla erittäin monta termiä. Tällöin Hessen matriisin

muodostaminen on raskas tehtävä johtuen matriisin suuresta dimensiosta. Tavallisimmin

molekyylimekaniikkalaskuissa suurilla molekyyleillä käytetäänkin ensimmäisen kertaluvun

algoritmeja. Yleensä ne ovat selkeästi nopeampia ja tehokkaampia kuin menetelmät, jotka eivät

käytä gradientteja lainkaan.

Pienemmillä molekyyleillä Hessen matriisi ei ole niin raskas laskennallisesti ja esimerkiksi

Newton Raphson on laajalti käytetty menetelmä. Kyseisen menetelmän yhtenä heikkoutena on, että

sen lähtötilanne täytyy olla jo kohtuullisen lähellä optimia. Usein onkin järkevämpää optimoida

muutama sykli ensin esimerkiksi steepest descent –menetelmällä ja vaihtaa tämän jälkeen

Newton Raphsoniin. Kvanttimekaanisissa menetelmissä on yleensä laskennallisesti edullista päästä

minimiin niin vähin iteraatiosyklein kuin mahdollista. Nämä menetelmät käyttävätkin yleisimmin

22

toisen kertaluvun algoritmeja. Kvanttimekaanisiin menetelmiin paneudutaankin seuraavissa

luvuissa tarkemmin.

6. MOLEKYYLIORBITAALITEORIAA

Seuraavissa luvuissa käsiteltävien semi-empiiristen, ab initio ja tiheysfunktionaaliteoreettisten

menetelmien ymmärtämiseksi, on syytä käydä läpi ensin joitakin kvanttimekaniikan perusasioita ja

termejä. Tämän jälkeen käsitellään molekyyliorbitaali(MO)teoriaa. Käsittelyn ideana on miettiä

mitä asioita täytyy ottaa huomioon, jos halutaan kuvata molekyylejä kvanttimekaanisin menetelmin.

Molekyylien kuvaaminen on selvästi hankalampi tehtävä kuin atomien.

6.1. Aaltofunktiot ja operaattorit

Tähän asti olemme käsitelleet mikroskooppisia systeemejämme, molekyylejä, klassisen fysiikan

tarjoamilla makroskooppisille systeemeille paremmin sopivilla menetelmillä. Mikroskooppisessa

maailmassa tilanne on kuitenkin erilainen. Kvanttimekaniikan voidaan ajatella alkaneen vuonna

1900, jolloin Max Planck selitti mustan kappaleen säteilyn niin, että säteily koostui pienistä

diskreeteistä energiakvanteista. Myöhemmin havaittiin paitsi säteilyn myös esimerkiksi atomien

elektronisten energioiden olevan kvantittuneet. Tästä on seurauksena, että esimerkiksi

vibraatiospektreissä havaitaan vain tiettyjä diskreettejä energioita vastaavia siirtymiä. Huomattiin,

että säteilyllä onkin myös hiukkasluonne ja lisäksi, että myös materialla on aaltoluonne.

Mikroskooppisen maailman uudet ilmiöt saivat aikaan kokonaan uuden fysiikan teorian,

kvanttimekaniikan, joka kehitettiin nopeassa tahdissa 1920-1930 lukujen vaihteessa.

Kvanttimekaniikka tarjoaa avaimet mikromaailman, kuten molekyylien, ominaisuuksien

selvittämiseen, ja ainakaan tähän mennessä minkään kvanttimekaniikan tuloksen ei ole havaittu

olevan ristiriidassa kokeellisten mittausten kanssa.

Kvanttimekaniikan keskeisimpiä käsitteitä ovat aaltofunktiot ja operaattorit. Kemiallisen systeemin

tilaa kuvataan aaltofunktiolla (toisinaan käytetään myös nimitystä tilavektori). Operaattori on

matemaattinen objekti, joka nimensä omaisesti operoi aaltofunktioon. Yleisesti operaattorin

operoidessa funktioon, saadaan tuloksena uusi funktio. Jos operaattorin operoidessa tiettyyn

aaltofunktioon saadaan tulokseksi vakiokerrointa vaille sama funktio, kutsutaan tätä kerrointa

23

operaattorin ominaisarvoksi ja operoitua aaltofunktiota ominaisfunktioksi. Tämä voidaan yleisesti

kuvata yhtälöllä

A a . (6.1)

Edellisessä yhtälössä A on operaattori (operaattorit merkitään tavallisesti isolla kirjaimella),

operaattorin ominaisfunktio ja a sitä vastaava ominaisarvo. Yhtälö (6.1) tulkitaan

kvanttimekaniikassa usein matriisiyhtälöksi siten, että operaattoria A vastaa jokin n x n matriisi ja

ajatellaan n-riviseksi pystyvektoriksi (tästä nimitys tilavektori). Ominaisarvo a on sitä vastoin

tavallinen luku, skalaari.

Yhtälön (6.1) merkitys on se, että kvanttimekaniikassa fysikaalista suuretta vastaa tietty operaattori

ja operaattorin ominaisarvot vastaavat kyseisen suureen mahdollisia mittausarvoja. Aaltofunktiota

itsessään on hankalaa havainnollistaa, mutta aaltofunktion tulolla kompleksikonjugaattinsa

kanssa on selkeä käytännön merkitys, sillä se kuvaa todennäköisyystiheyttä. Kvanttikemian

kannalta oleelliset aaltofunktiot ovat reaalisia, joten kompleksikonjugointi ei vaikuta niihin. Tällöin

siis suure = 2 kuvaa todennäköisyystiheyttä. Esimerkiksi elektronin aaltofunktion neliö

kuvastaa todennäköisyyttä löytää elektroni tietystä paikasta. Lisäksi kvanttikemian operaattorit ovat

ns. Hermiittisiä (tai itseadjungoituja), mistä on seurauksena, että ominaisarvot ovat reaalilukuja.

Aaltofunktiota itseään on vaikea kuvata käytännössä. Erään ajattelutavan tarjoaa Cramerin kirja:

”From this very formal presentation, the nature of can hardly be called anything but mysterious.

Indeed, perhaps the best description of at this point is that it is an oracle when queried with

questions by an operator, it returns answers.”

6.2. Hamiltonin operaattori

Operaattoria, jonka ominaisarvoina saadaan systeemin mahdolliset energiat, kutsutaan Hamiltonin

operaattoriksi. Hamiltonin operaattorin ominaisarvoyhtälö voidaan siis kirjoittaa muodossa

H E , (6.2)

missä H on Hamiltonin operaattori ja E systeemin energia, kun se on ominaistilassa . Yhtälöä

(6.2) kutsutaan Schrödingerin yhtälöksi. Hamiltonin operaattorin muodosta riippuu onko

Schrödingerin yhtälö ratkaistavissa vai ei. Hamiltonin operaattorin lausekkeessa huomioidaan

kaikki systeemin energiaan vaikuttavat tekijät. Kun tarkastellaan molekyyliä, johon ei vaikuta

mitkään ulkoiset tekijät (kuten ulkoinen sähkö- tai magneettikenttä tai suhteellisuusteoreettiset

vaikutukset), on Hamiltonin operaattori muotoa

24

H = i

iem

22

2 kk

km2

2

2 041

i k ik

k

rZe 2

+04

1ji ijre2

+04

1lk kl

lk

rZZe2

.

(6.3)

Indeksit i ja j käyvät läpi kaikki molekyylin sisältämät elektronit ja k ja l ytimet, on Planckin

vakio jaettuna 2 :llä, me on elektronin ja mk ytimen k massa, 0 on tyhjiön permittiivisyys, e on

alkeisvaraus, Z on atomin järjestysluku, rab on partikkelien (elektroni tai ydin) a ja b välinen

etäisyys ja 2 (nabla toiseen) on Laplacen operaattori, joka karteesisissa koordinaateissa on muotoa

2i =

2

2

ix+

2

2

iy+

2

2

iz. (6.4)

Lausekkeen (6.3) mukaan aaltofunktio on siis 3n koordinaatin funktio, missä n on elektronien ja

ytimien yhteenlaskettu lukumäärä ja kolme tulee siitä, että partikkelin paikkaa kuvaamaan tarvitaan

x-, y- ja z-koordinaatti.

Vaikka Hamiltonin operaattorin lauseke (6.3) saattaakin näyttää pitkältä ja monimutkaiselta, se

koostuu helposti ymmärrettävissä olevista osista. Kvanttimekaniikassa liike-energiaa esitetään

operaattorilla T, joka on muotoa

T = 22

2m. (6.5)

Hamiltonin operaattorin kaksi ensimmäistä termiä sisältävät siis elektronien sekä ytimien liike-

energian. Loput kolme termiä esittävät potentiaalienergiaa. Ensimmäinen näistä on elektronien ja

ytimien välisestä sähköisestä vetovoimasta aiheutuva. Lausekkeen (6.3) neljäs termi koostuu

elektronien ja viides ytimien välisestä sähköisestä hylkimisestä aiheutuvasta potentiaalienergiasta.

Summalausekkeessa esiintyvät i < j ja k < l tulevat siitä, että summassa laskettaisiin kutakin

hiukkasparia vastaava termi vain kertaalleen.

Hamiltonin operaattorille on yleensä useita erilaisia aaltofunktioita i (energioilla Ei), jotka

toteuttavat ominaisarvoyhtälön (6.2). Nämä funktiot voidaan valita niin, että ne ovat sekä

ortogonaalisia että normitettuja (=ortonormeerattuja) eli

ijji dr , (6.6)

missä ij on ns. Kroeneckerin delta (=1, kun i = j, ja 0, kun i j) ja integraalin dr on 3n-ulotteisen

avaruuden tilavuuselementti. Edellisessä lausekkeessa ortogonaalisuus tarkoittaa sitä, että integraali

on nolla, kun aaltofunktiot ovat erit, ja normeeraus sitä, että kunkin aaltofunktion neliön integraali

on yksi.

25

Nyt ominaisarvoyhtälöä ja edellistä tulosta hyväksi käyttäen saadaan

ijjjijjjiji EdEdEd rrr . (6.7)

Tämä tulos on hyvin tärkeä, sillä se kertoo, että laskemalla yhtälön (6.7) mukaisia integraalin arvoja

saadaan tulokseksi molekyylin mahdolliset energiat. Tosin sitä ennen täytyy tietää tarkemmin

minkälaisia aaltofunktiot ovat.

6.3. Variaatioperiaate

Edellisen kappaleen mukaan molekyylin energia pystytään siis periaatteessa laskemaan, jos

aaltofunktio tunnetaan. Siihen miten aaltofunktio sitten löydetään, keskitytään tässä luvussa.

Oletetaan, että on jokin mielivaltainen funktio. Edelleen voidaan olettaa, että pystymme

lausumaan :n joidenkin ominaisarvoyhtälön (6.2) täyttävien ortonormeerattujen kantafunktioiden

i lineaarikombinaationa, eli voimme kirjoittaa

=i

iic , (6.8)

jossa kertoimet ci ovat joitain tuntemattomia lukuja. Myös kantafunktiot ovat tuntemattomia

funktioita. Lisäksi voidaan olettaa, että on ortonormeerattu. Tällöin yhtälöiden (6.6) ja (6.8)

perusteella voidaan kirjoittaa

rr dccdj

jji

ii2 = rdcc ji

i,jji

=ji

jicc,

ij =i

ic2 = 1, (6.9)

missä viimeinen yhtäsuuruus seuraa :n ortonormeerauksesta. Vastaavalla tavalla voidaan

yhtälöiden (6.7) ja (6.8) perusteella kirjoittaa

rr dcHcdHj

jji

ii )()( = rdHcc jii,j

ji

=ji

jicc,

Ej ij =i

ic2 Ei. (6.10)

Tämän tuloksen käytännön merkitys on siinä, että tilaa vastaava energia voidaan lausua

kantafunktioiden kertoimien ja niiden yksittäisten energioiden avulla. Seuraavaksi oletetaan, että

energioiden Ei joukossa on olemassa alhaisin energia ja merkitään tätä E0. Huom: se, että alin

energia on olemassa, on eräs kvanttimekaniikan ominaisuuksista. Nyt kahdesta edellisestä

tuloksesta yhdistämällä saadaan

rdH E0 rd2 =i

ic2 (Ei E0) 0, (6.11)

26

missä viimeinen summalauseke on suurempi tai yhtäsuuri kuin nolla, koska 2ic 0 ja Ei E0 0.

Tällöin siis

rr

ddH

2 E0. (6.12)

Tätä tulosta kutsutaan variaatioperiaatteeksi ja sillä on erittäin tärkeitä seurauksia. Periaate kertoo,

että laskemalla yhtälön vasemmanpuoleinen integraali, saadaan aina suurempi lukema kuin

systeemin perustilaa kuvaava matalin mahdollinen energia. Se tarjoaa menetelmän, jolla arvioida

likimääräisen aaltofunktion hyvyyttä. Voimme aluksi ”arvata” jonkin lähtökohtaisen aaltofunktion

ja ryhtyä sitten parantelemaan eli optimoimaan tätä ”arvausfunktiota” siten, että yhtälön (6.12)

vasemman puolen integraalille saataisiin mahdollisimman pieni arvo. Lisäksi on syytä huomata, että

tulos (6.12) ei ole riippuvainen siitä millaisia kantafunktiot i ovat ja miten ne on valittu, eli

voimme konstruoida arvausfunktion millä tahansa haluamallamme tavalla ja lähteä sitten

variaatioperiaatteen mukaan optimoimaan parasta mahdollista, matalimman energian tilaa kuvaavaa

aaltofunktiota. Seuraavana tehtävänä onkin käsitellä sitä, minkälainen olisi järkevä ja hyvä

arvausfunktio matalimman energian tilalle. Sitä ennen käsitellään kuitenkin eräs laskuja

huomattavasti nopeuttava yksinkertaistus.

6.4. Bornin ja Oppenheimerin approksimaatio

Tähän asti olemme käsitelleet monen hiukkasen molekyylisysteemiä teoreettisen abstraktisti.

Tosiasiassa tarkkaa aaltofunktiota molekyylille on erittäin vaikeaa laatia. Tähän on syynä lähinnä

Hamiltonin operaattorin (6.3) potentiaalitermit, sillä niiden mukaan mikään hiukkanen (elektroni tai

ydin) ei liiku riippumattomasti muista, vaan päinvastoin jokainen hiukkanen kokee kaikkien muiden

hiukkasten veto/poistovoiman. Tätä kutsutaan usein korrelaatioksi kvanttimekaniikassa. Jotta

tilannetta saataisiin yksinkertaistettua, oletetaan ns. Bornin ja Oppenheimerin approksimaatio

pitäväksi.

Voidaan olettaa, että molekyylissä ytimet liikkuvat paljon hitaammin kuin elektronit. Tämä oletus

on järkevä, sillä protonin ja neutronin massat ovat n. 1800-kertaisia elektronin massaan nähden, ja

lausekkeen (6.5) mukaisesti massa on liike-energiatermissä nimittäjänä. Tällöin voidaan ajatella,

että ytimien liikkuessa uuteen sijaintiin, elektronit asettuvat saman tien uudelleen ytimien sijainnin

aiheuttaman potentiaalikentän mukaisesti. Näin ollen ytimien ja elektronien liike voidaan käsitellä

erillisinä ja elektronien energiat voidaan laskea ajatellen ytimet kiinnitettyinä paikallaan olevaksi

verkostoksi. Tätä oletusta kutsutaan Bornin ja Oppenheimerin approksimaatioksi. Jos ytimien

27

paikka oletetaan kiinnitetyksi, niiden liike-energiatermi on nolla, ja ytimien välinen hylkimistermi

saa jonkin tietyn vakioarvon ydinten paikkojen geometriasta riippuen. Tällöin yhtälön (6.3)

mukainen täydellinen Hamiltonin operaattori pelkistyy ns. elektroniseksi Hamiltonin operaattoriksi

Hel = i

iem

22

2 041

i k ik

k

rZe2

+04

1ji ijre2

(6.13)

ja Schrödingerin yhtälön

Hel el Eel el (6.14)

ratkaisuna saadaan ns. elektroninen aaltofunktio ja energia. Jokaista ydinten muodostamaa

systeemiä kohti on olemassa elektroninen aaltofunktio el, joka riippuu siis vain elektronien

koordinaateista. Yleensä keskitytään käytännössä ratkaisemaan vain elektronista Schrödingerin

yhtälöä (6.14).

Bornin ja Oppenheimerin approksimaatio on melko lievä ja yleensä hyvin oikeutettu. Tavallaan se

on lähtökohtana jo sille, että yleensä voidaan puhua mm. potentiaalienergiapinnoista (vrt. luku 3).

Potentiaalienergiapintojen avulla on esitetty nimenomaan elektroninen energia ydinten

koordinaattien funktiona. Jatkossa tullaan keskittymään ainoastaan elektroniseen Hamiltonin

operaattoriin, aaltofunktioon ja energiaan eikä alaindeksiä ’el’ enää erikseen merkitä.

6.5. LCAO-lähestymistapa

Edellä oleva Hamiltonin operaattorin muoto (6.13) on jo huomattavasti mukavampi kuin

alkuperäinen (6.3). Lauseke (6.13) sisältää kuitenkin erään laskennallisesti hyvin ongelmallisen

termin, nimittäin elektronien välisen korrelaation. Tähän termiin palataan myöhemmin, mutta

tarkastellaan seuraavaksi yksinkertaistettua tilannetta, jossa systeemimme koostuu ainoastaan

yhdestä elektronista. Tällöin yhtälön (6.13) viimeinen eli elektronikorrelaatiotermi voidaan jättää

pois.

Variaatioperiaatteen mukaan, voimme rakentaa lähtökohtaisen aaltofunktion kuten haluamme ja

tämän jälkeen arvioida funktion ”hyvyyttä” yhtälön (6.12) avulla; mitä pienempi tulos, sen parempi.

Mikä olisi sitten järkevä tapa valita lähtökohtainen aaltofunktio? Matematiikassa on usein tapana

esittää mielivaltainen funktio joidenkin kantafunktioiden avulla. Tällaiseksi kantajoukoksi (basis

set) on järkevää valita funktioita, jotka ovat laskennallisesti miellyttäviä ja yksinkertaisia.

Esimerkiksi molekyylimekaniikassa torsiokulmia kuvattiin Fourier-sarjoilla. Siinä mielivaltainen

28

torsionaalista energiaa kuvaava funktio kuvattiin kosinitermeistä koostuvien kantafunktioiden

avulla.

Tällä hetkellä tarkasteltavana on siis vain yhden elektronin systeemit. Jos myös ytimiä olisi vain

yksi, tilanne olisikin suoraviivainen, sillä voisimme eksaktisti ratkaista Schrödingerin yhtälön ja

saada tuloksena kaipaamamme aaltofunktiot. Tuloksena olisi tällöin aiemmista kursseista tutut

vetyatomin ratkaisuna saadut funktiot eli atomiorbitaalit 1s, 2s, 2p, 3s, 3p, 3d jne. Koska nämä ovat

tunnettuja funktioita, on luonnollista ottaa lähtökohdaksi, että voisimme kuvata myös molekyylien

aaltofunktioita näiden atomisten aaltofunktioiden avulla. Näin ollen voimme valita lähtökohtaiseksi

molekyylin aaltofunktioksi lineaarikombinaation atomien aaltofunktioista i eli

=N

iiia

1, (6.15)

missä on kuvattu N:stä atomien aaltofunktiosta i muodostetun kantajoukon avulla (kukin i

kertoimella ai painotettuna). Tätä molekyylin aaltofunktion esitystapaa kutsutaan LCAO-

lähestymistavaksi (Linear Combination of Atomic Orbitals). Tässä on syytä korostaa, että yhtälön

(6.15) mukainen esitystapa on puhtaasti matemaattinen. Onkin parempi ajatella atomiorbitaaleja

tässä yhteydessä ainoastaan joinakin funktioina, joiden avulla voidaan kuvata koko molekyylin

aaltofunktiota. Eli sanoilla orbitaali ja funktio on tässä sama merkitys.

Koska aaltofunktion neliöllä kuvataan todennäköisyystiheyttä, voidaan ajatella, että tämä

käsittelemämme elektroninen aaltofunktio on eräänlainen kartta, joka kertoo mistäpäin

todennäköisimmin elektronin molekyylissä löydämme. Täten valitsemiemme kantafunktioiden on

oltava sellaisia, että ne sallivat elektronin kulkea sinne missä niiden suuri todennäköisyys on

energeettisesti optimaalisinta. Elektronitiheyskartta (ja siis molekyyliorbitaali) voidaan laatia

useammallakin tavalla kantafunktioista. Esimerkiksi kemiallisesti on intuitiivista puhua hiilen sp-

hybridisoituneista C H molekyyliorbitaaleista. Kyseisen kaltainen molekyyliorbitaali voidaan

rakentaa yhtä hyvin käyttämällä pelkästään esimerkiksi atomien pallosymmetrisiä s-orbitaaleja.

Täten yhtälön (6.15) atomiorbitaalien ja niiden kertoimien kemiallisen tulkinnan kanssa on syytä

olla varovainen.

6.6. Sekulaarideterminantti

Seuraavaksi ryhdytään soveltamaan kappaleessa 6.3 esitettyä variaatioperiaatetta LCAO-periaatteen

mukaiseen molekyyliseen arvausfunktioon. Sijoittamalla yhtälön (6.15) molekyylin aaltofunktio

variaatioperiaatteen lausekkeeseen (6.12) saadaan

29

E =ij

jiji

ijji

ji

jiji

ji

jiji

ji

N

jjj

N

iii

jjj

iii

Saa

Haa

daa

dHaa

daa

daHa

,

,

,

,

))((

)()(

r

r

r

r, (6.16)

missä on lopuksi käytetty osoittajan ja nimittäjän integraaleille merkintää Hij ja Sij. Yhtälöissä (6.9)

ja (6.10) käytettyjä ortonormaalisuusominaisuuksia ei voi tässä yhteydessä käyttää, sillä

atomiorbitaaleista muodostuva kantajoukko ei ole ortonormaali. Edellä merkittyjä integraaleja

kutsutaan nimillä resonanssi-integraali (Hij, resonance integral) ja peittointegraali (Sij, overlap

integral). Jälkimmäisellä on selkeä fysikaalinen merkitys, sillä se kuvaa sitä missä määrin kaksi

kantafunktiota peittävät toisiaan. Resonanssi-integraalilla ei ole niin selvää intuitiivista merkitystä,

paitsi tapauksessa jossa i=j, jolloin se kuvastaa energiaa, joka elektronilla on kyseisellä

atomiorbitaalilla.

Variaatioperiaatteen mukaan todellista yhden elektronin systeemin perustilan energiaa lähestytään,

mitä pienempiä ovat yhtälön (6.16) avulla lasketut energiat. Em. yhtälössä vapaina muuttujina ovat

kertoimet ai. Täten pienimmän energian antavat kertoimet löydetään ehdosta

kaE

k

0 (6.17)

eli energian osittaisderivaatat jokaisen kertoimen suhteen täytyy olla nollia. Kun yhtälöä (6.16)

derivoidaan kertoimien suhteen saadaan laskuoperaatioiden jälkeen tulokseksiN

ikikii kESHa

10)( . (6.18)

Tämä tulos kertoo, että meillä on N kappaletta yhtälöitä (k kulkee yhdestä N:ään) ja kussakin

yhtälössä on N kappaletta tuntemattomia (ai kertoimet). Lineaarialgebran mukaisesti tällaiselle

yhtälöryhmälle saadaan nollasta eroava ratkaisu silloin ja vain silloin kun tuntemattomien

kertoimista muodostetun determinantin arvo on nolla, eli tässä tapauksessa saadaan

0

2211

2222222121

1112121111

NNNNNNNN

NN

NN

ESHESHESH

ESHESHESHESHESHESH

. (6.19)

Tätä determinanttia kutsutaan sekulaarideterminantiksi. Determinantin ratkaisuksi saadaan joukko

(N kappaletta) energia-arvoja Ej, joista jotkin saattavat olla samoja eli ns. degeneroituneita. Kullekin

energia-arvolle voidaan ratkaista kertoimet aij yhtälön (6.18) mukaan. Alimmalle energia-arvolle Ej

(ja parametreille aij) saadaan optimaalisin aaltofunktio, joka on kantafunktioidensa avulla

lausuttavissa siis muodossa

30

j =N

iiija

1. (6.20)

Systeemin alimman energian mukainen aaltofunktio eli molekyyliorbitaali kuvaa siis systeemin

perustilaa. Korkeamman energian molekyyliorbitaalit kuvaavat puolestaan virittyneitä tiloja.

Kootusti tämän kappaleen tuloksena voidaan sanoa, että optimaalinen yhden elektronin aaltofunktio

molekyylille saadaan seuraavalla proseduurilla:

1. Valitaan N kantafunktiota.

2. Lasketaan resonanssi- ja peittointegraalit Hij ja Sij (N2 kappaletta).

3. Muodostetaan sekulaarideterminantti ja ratkaistaan N kappaletta juuria Ej.

4. Ratkaistaan kertoimet aij yhtälöstä (6.18) kullekin Ej-arvolle ja sitä kautta MO:t.

Huomionarvoista on, että tällä proseduurilla saadut MO:t ovat keskenään ortogonaalisia.

6.7. Hartree-tulo ja Hartreen Hamiltonin operaattori

Edellä käsiteltiin systeemiä, jossa on vain yksi elektroni ja löydettiin ko. systeemille menetelmä

optimaalisen molekyyliorbitaalin määrittämiseksi. Tarkastellaan seuraavaksi systeemiä, joka

koostuu useammasta elektronista, mutta jätetään edelleen elektronikorrelaatiotermi huomiotta.

Tällöin molekyylin Hamiltonin operaattori H voidaan separoida erillisiin yhden elektronin

Hamiltonin operaattoreihin hi, eli

H =N

iih

1, (6.21)

missä

hi = 2

21

i

M

k ik

k

rZ

1. (6.22)

Em. yhtälöissä N on elektronien ja M ytimien lukumäärä. Huomaa myös, että tässä yhteydessä (jos

vertaat yhtälöön 6.13) on siirrytty käyttämään ns. atomisia yksiköitä. Laskennallisessa kemiassa

käytetään usein atomisia yksiköitä, joissa suurin osa vakioista valitaan ykköseksi, jolloin niitä ei

tarvitse kantaa mukana yhtälöissä. Yleisimmät yksiköt vastaavine SI-järjestelmän arvoineen on

koottu Liitteenä 1 olevaan taulukkoon.

Yhden elektronin Hamiltonin operaattoreiden täytyy toteuttaa vastaava yhden elektronin

Schrödingerin yhtälö

hi i = i i. (6.23)

31

Separoituvalle Hamiltonin operaattorille monen elektronin aaltofunktio (merkitään HP) saadaan

yhden elektronin aaltofunktioiden tulosta, ns. Hartree-tulosta (Hartree-product). Tämä nähdään

seuraavalla laskulla:

H HP = NH 21 = N

N

iih 21

1

= Nh 211 )( + Nh )( 221 + … + )(21 NNh

= N211 )( + N)( 221 + … + )(21 NN

= N

N

ii 21

1=

N

ii

1HP. (6.24)

Monen elektronin Hamiltonin operaattorin ominaisfunktioksi saadaan siis Hartree-tulo, eli

yksittäisten elektronien aaltofunktioiden tulo, ja vastaavaksi ominaisarvoksi yksittäisten elektronien

ominaisarvojen summa. Huomaa myös, että jos yksittäisten elektronien aaltofunktiot ovat

normeerattuja, niin samoin on myös niiden tulo.

Kuten edellä mainittiin, elektronien välinen hylkimistermi jätettiin edelleen huomiotta. Voidaan silti

miettiä kuinka hyvä em. Hartree-tulon aaltofunktio olisi, jos laskisimme sitä käyttäen energian

oikealla Hamiltonin operaattorilla (6.13), joka siis huomioi myös elektronikorrelaation. Tämä

tarkoittaa sitä, että haluaisimme löytää aaltofunktiot, jotka minimoivat energian odotusarvon eli

suureen

< HP H HP> = rdH HPHP . (6.25)

Edellä integraali on merkitty ns. Diracin merkintätavalla. Variaatiolaskennan keinoin saadaan tästä

minimointitehtävästä mielenkiintoinen tulos, jonka mukaan jokainen tällainen energian minimoiva

aaltofunktio i on tietyn operaattorin (Hartreen Hamiltonin operaattorin) hi ominaisfunktio, missä

hi = 2

21

i

M

k ik

k

rZ

1 + Vi{j}, (6.26)

jossa viimeinen termi sisältää vuorovaikutuspotentiaalin kaikkien niiden toisten elektronien kanssa,

jotka ovat orbitaalilla j, ja voidaan laskea kaavalla

Vi{j}=ij

jij

j drr

. (6.27)

Viimeisen kaavan j on elektroniin j liittyvä varaustiheys (eli todennäköisyystiheys). Täten kaavan

(6.26) viimeinen termi on muodoltaan aivan samanlainen kuin keskimmäinenkin; ainoana erona on,

että ytimet on ajateltu pistemäisinä varauksina, kun taas elektroneilla on jatkuva varausjakauma,

jolloin integrointi koko avaruuden yli on tarpeellinen. Potentiaalin lausekkeessa on huomattavaa se,

32

että se sisältää keskimääräisen repulsiivisen vaikutuksen, jonka yksi elektroni kokee. Koska

todennäköisyystiheys i = i2, on tilanne kuitenkin ongelmallinen. Tarkoituksenahan on siis

laskea optimaalinen aaltofunktio kaavan (6.26) antaman Hamiltonin operaattorin avulla, mutta nyt

Hamilton itsessään jo sisältää kyseisen funktion, joten herää kysymys miten voimme käyttää

kyseistä operaattoria ennen kuin edes tiedämme mikä se on?

Tähän ongelmaan kehitti ratkaisun Hartree jo vuonna 1928. Ratkaisu kulkee ns. itseytyvän kentän

menetelmän nimellä (SCF, self-consistent field). Ideana on, että aluksi arvataan aaltofunktiot

kaikille molekyyliorbitaaleille (Hartree käsitteli näin atomiorbitaaleja) ja käytetään näitä funktioita

Hartreen Hamiltonin operaattoreiden hi muodostamiseen. Kun näin saatujen operaattoreiden avulla

ratkaistaan Schrödingerin yhtälö (6.23), saadaan tuloksena joukko uusia aaltofunktioita, jotka mitä

todennäköisimmin eroavat aluksi arvatuista. Tämän jälkeen näitä uusia, oletettavasti parempia,

aaltofunktioita käytetään uusien Hamiltonin operaattoreiden muodostamiseen, jonka jälkeen näillä

uusilla operaattoreilla ratkaistaan taas uudet aaltofunktiot. Näin jatketaan iteratiivisesti kunnes

Schrödingerin yhtälöstä saadut uudet aaltofunktiot eivät enää eroa operaattoreissa käytetyistä

edellisen syklin aaltofunktioista. Tätä prosessia kutsutaan SCF-menetelmäksi.

Nyt olemme päässeet molekyyliorbitaalien kuvaamisessa jo huomattavan pitkälle. Seuraavaksi

voidaankin kysyä miten monen elektronin tapauksessa elektronit käytännössä sijoitetaan

molekyyliorbitaaleilleen? Jotta tähän kysymykseen voisi vastata, täytyy ottaa käsittelyyn myös

suure, joka on tähän asti sivuutettu kokonaan nimittäin elektronin spin.

6.8. Elektronin spin ja antisymmetrisyys

Kaikilla elektroneilla on karakteristinen spinkvanttiluku. Elektronin spinin aaltofunktio on ns.

spinoperaattorin Sz ominaisfunktio. Operaattorilla Sz on vain kaksi ominaisarvoa (±½ ) ja niitä

vastaavat aaltofunktiot ovat ortonormaaleja ja niitä merkitään tyypillisesti kreikkalaisilla kirjaimilla

ja . Elektronin spin seuraa luonnollisella tavalla relativistisesta kvanttiteoriasta, eli siitä kun

Einsteinin suhteellisuusteoria otetaan huomioon kvanttimekaniikan yhtälöissä. Tämän havainnon

teki ensimmäisenä Paul Dirac. Toinen relativistisen käsittelyn tuoma seuraus kvanttimekaniikkaan

on ns. Paulin kieltosääntö, joka kertoo, että molekyylin kahdella elektronilla ei voi olla täsmälleen

samat kvanttiluvut. Edellisissä luvuissa saatu molekyyliorbitaali määrää kaikki muut kvanttiluvut

(pää-, sivu- ja magneettinen kvanttiluku) paitsi spinin, joten Paulin kieltosäännöstä seuraa, että

yhdellä orbitaalilla voi olla täten korkeintaan kaksi elektronia ja niillä on vastakkaiset spinit. Tällöin

33

voisimme kirjoittaa Hartree-tulon mukaisen aaltofunktion kahdelle elektronille esimerkiksi

muodossa

HP = )2()2()1()1( ba . (6.28)

Tässä tapauksessa HP kuvaa ns. triplettitilaa, eli sellaista tilaa, jossa kahden elektronin spinit ovat

samansuuntaiset (molemmilla ). Esityksessä a b, koska muuten elektroneilla 1 ja 2 olisi samat

kvanttiluvut. Lisäksi aaltofunktiot a ja b oletetaan ortonormaaleiksi.

Edellä mainittu aaltofunktio on tähänastisen tietomme perusteella järkevästi konstruoitu. Siinä on

vikana ainoastaan se, että se on fundamentaalisesti mahdoton. Edellä mainittu Paulin kieltosääntö

on nimittäin vain erikoistapaus yleisemmästä relativistisen kvanttimekaniikan tuloksesta:

antisymmetrisyysperiaatteesta. Elektronit ovat fermioneja (ns. spin-½ hiukkasia) ja fermionien

täytyy kvanttiteorian mukaan olla antisymmetrisiä minkä tahansa paikka- ja spinkoordinaatin

vaihdon suhteen. Tämä ehto voidaan kirjoittaa matemaattisesti muotoon

(q1(1), q2(2),..., qi(i),..., qj(j),... qN(N))

= (q1(1), q2(2),..., qj(i),..., qi(j),... qN(N)). (6.29)

Tuloksessa siis tarkastellaan N elektronin systeemiä, jota kutakin kuvaa paikka- ja

spinkoordinaateista muodostuva q-vektori. Jos vaihdamme jotkin koordinaatit, täytyy aaltofunktion

vaihtaa merkkiään.

Kun tarkastellaan yhtälön (6.28) mukaista aaltofunktiota, huomataan välittömästi, että se ei ole

antisymmetrinen. Pienellä muokkauksella siitä saadaan kuitenkin antisymmetrinen, nimittäin jos

kirjoitamme

HP = )1()1()2()2()2()2()1()1(2

1baba . (6.30)

Neliöjuurikerroin eteen tulee normeerauksesta (Laskutehtävä: tarkista, että HP on todellakin

antisymmetrinen ja normeerattu!).

6.9. Slaterin determinantti

Edellisen lausekkeen (6.30) mukainen aaltofunktio voidaan kirjoittaa matemaattisesti myös

determinantin muodossa

HP =)2()2()2()2()1()1()1()1(

21

ba

ba . (6.31)

34

Antisymmetrisyysperiaate vastaa siis tässä kirjoitusmuodossa sitä, että vaihdettaessa determinantin

kaksi riviä keskenään, merkki muuttuu; ja näinhän determinantin laskusäännöt osoittavatkin. Tätä

kirjoitustapaa ja determinanttia kutsutaan Slaterin determinantiksi. Yleisesti Slaterin determinantin

mukainen aaltofunktio voidaan kirjoittaa muodossa

SD =

)()()(

)2()2()2()1()1()1(

!1

21

21

21

NNNN

N

N

N

. (6.32)

Edellisessä on oletettu N elektronia, ja merkintä tarkoittaa ns. spinorbitaalia eli

molekyyliorbitaalin ja spin-aaltofunktion tuloa. Slaterin determinanteilla on tiettyjä mielenkiintoisia

ominaisuuksia. Huomionarvoista on se, että kukin elektroni esiintyy kertaalleen jokaisella spin-

orbitaalilla. Tämä kuvastaa kvanttimekaniikan erästä perusoletusta, jonka mukaan hiukkasia ei

voida erottaa toisistaan, eli kaikki elektronit ovat ”samanlaisia”.

Mielenkiintoinen tulos saadaan, kun lasketaan elektronien välisestä repulsiosta aiheutuva kaavan

(6.25) kaltainen integraali Slaterin aaltofunktiota (6.30) käyttäen:

2211SD12

SD

1 ddddr

rr

= 2211

22

12

22 )2()2(1)1()1(21 dddd

r ba rr

2211

2

12

2 )2()2()2(1)1()1()1(2 ddddr abba rr

+ 2211

22

12

22 )1()1(1)2()2( ddddr ba rr

= 21

2

12

2 )2(1)1(21 rr dd

r ba

2112

)2()2(1)1()1(2 rr ddr abba

+ 21

2

12

2 )1(1)2( rr ddr ba

= ababbaab Jddr

J 2112

)2()2(1)1()1(221 rr

= Jab Kab. (6.33)

35

Tuloksen termiä Jab kutsutaan ns. Coulombiseksi integraaliksi, sillä se kuvaa tavallista klassisen

mekaniikan mukaista kahden elektronin välistä hylkimisvoimaa. Jälkimmäistä Kab taas kutsutaan

ns. vaihtointegraaliksi, joka esittää kahden elektronin välistä vaihtovuorovaikutusta, joka on

kvanttimekaaninen ilmiö, jolla ei ole klassista vastinetta. Laskelman (6.33) tulos kertoo, että

todennäköisyys löytää kaksi elektronia lähellä toisiaan samansuuntaisilla spineillä pienenee

energiatermillä Kab. Sanotaan, että ns. Fermi-aukko ympäröi kutakin elektronia. Kyseinen ilmiö on

ominainen samansuuntaisille spineille. Jos vastaava laskelma tehtäisiin aaltofunktiolle, joka

sisältäisi spinit (1) ja (2), huomattaisiin (Tarkista!), että tuloksena saadaan vain Jab.

6.10. Hartree-Fock SCF-menetelmä

Fock oli ensimmäinen, joka käsitteli Hartreen SCF-teoriaa käyttäen aaltofunktioina Slaterin

determinantin mukaisia funktioita. Yhtälöä (6.26) vastaavana tuloksena yhden elektronin Fockin

operaattori fi voidaan lausua muodossa

fi = 2

21

i

M

k ik

k

rZ

1 + Vi

HF{j}, (6.34)

missä viimeinen potentiaalitermi on nyt muotoa 2Ji Ki, joka vastaa edellisessä luvussa kuvattuja

integraaleja. Kerroin 2 tulee siitä, että termejä Jab ja Kab summatessa (vrt. yht. 6.27)

samansuuntaisille spineille tulee tulokseksi Jab Kab ja erisuuntaisille pelkkä Jab.

Kuuluisat Hartree-Fockin yhtälöt voidaan esittää siten muodossa

fi i = i i, (6.35)

joka koostuu siis yhden elektronin Schrödingerin yhtälöistä spinorbitaaleille, kun operaattorina on

Fockin operaattori.

Nyt voidaan näiden tulosten valossa käsitellä tilannetta kappaleen 6.6. sekulaarideterminantti-

menetelmän mukaisesti. Kuten em. luvussa, voimme kirjoittaa sekulaariyhtälön Fockin operaattorin

avulla muotoon

0

2211

2222222121

1112121111

NNNNNNNN

NN

NN

ESFESFESF

ESFESFESFESFESFESF

, (6.36)

missä erona aiempaan on ainoastaan, että resonanssi-integraalit on nyt korvattu integraaleilla Fij.

Peittointegraalit ovat edelleen samat kuin aiemmin. Vuonna 1951 Roothan esitti tärkeän julkaisun,

36

jossa käsiteltiin HF-laskelmien käytännön suorittamista kantajoukon avulla matriisiyhtälöin. Edellä

olevassa lausekkeessa F:t voidaan käsittää matriisielementteinä ja ne voidaan kirjoittaa muodossa

F =ytimet

k kk P

rZ )(

21)(1

21 2 , (6.37)

missä kreikkalaisin kirjaimin on indeksoitu kantafunktioita (erotukseksi siitä, että tavalliset indeksit

viittaavat orbitaaleihin). Edellisen kaavan merkinnät tarkoittavat integraaleja

< A > = rdA (6.38)

ja

( ) = )2()1()2()2(1)1()1(12

rr ddr

. (6.39)

Jälkimmäistä integraalia kutsutaan ns. neljän indeksin integraaliksi (four-index integral). Kaavojen

integraaleille käytetään myös nimityksiä yhden elektronin (6.38) ja kahden elektronin (6.39)

integraalit. Jälkimmäisiä painottavat kertoimet P muodostavat ns. tiheysmatriisin. Tiheysmatriisi

kuvaa sitä missä määrin tietyt yksittäiset kantafunktiot vaikuttavat monen elektronin aaltofunktioon

ja kuinka energeettisesti merkittäviä Coulombiset ja vaihtointegraalit ovat. Tiheysmatriisin alkiot

saadaan kaavasta

P = 2 i

miehitetty

iiaa , (6.40)

missä a-kertoimet määrittävät kantafunktion vaikutuksen suuruuden (vrt. LCAO-periaate)

molekyyliorbitaaliin i. Aaltofunktioiden määrittäminen kantafunktioiden avulla on nyt samanlainen

prosessi kuten kuvattu sivulla 30. Sekulaarideterminantista ratkaistaan energia-arvot, joiden avulla

lasketaan kantafunktioiden kertoimet. Mutta nyt sekulaarideterminantin ratkaisemiseen tarvittava

tiheysmatriisi koostuu jo kertoimista, jotka on tarkoitus ratkaista. Tämä paradoksaalinen tilanne

pystytään hoitamaan kuten sivulla 32, eli itseytyvän kentän menetelmällä (SCF). Aluksi voidaan

arvata tiheysmatriisi ja käyttää sitä sekulaariyhtälön ratkaisemiseen. Tämän jälkeen ratkaistaan a-

kertoimet, joista muodostetaan uusi tiheysmatriisi. HF-SCF menetelmä on esitetty kaaviomaisesti

kuvassa 6.1.

Tässä esitetty HF-teoria on rakenteellisesti varsin kaunis. Sillä on kuitenkin tiettyjä kemiallisia ja

käytännöllisiä rajoituksia. Kemiallisesti suurin ongelma on Fock-operaattorin yhden elektronin

luonne, eli se ottaa elektronikorrelaation muihin elektroneihin huomioon ainoastaan

keskimääräistyneenä. Voidaan tietysti kysyä kuinka hyvä tämä approksimaatio on, ja asiaan

palataankin myöhemmin elektronikorrelaatio-luvussa. Käytännön kannalta HF-teoriassa on

37

ongelmana laskujen kesto. Laskujen kesto on paljolti seurausta neljän indeksin integraalien

laskemisen raskaudesta. Jos kantafunktioina käytetään LCAO-periaatteen mukaisia funktioita, on

niiden integraalit ratkaistava numeerisesti, mikä on työlästä laskennallisesti. Lisäksi näiden

integraalien määrä on masentavan suuri. Koska jokainen indeksi käy läpi kaikki kantafunktiot, tulee

neljän indeksin integraaleja laskettavaksi kaikkiaan N4 kappaletta, missä N on kantafunktioiden

lukumäärä. Täten käytännössä ei pystytä käyttämään niin suuria kantajoukkoja, jotka laskutulosten

tarkkuuden kannalta olisivat parhaita.

Kuva 6.1. Kaaviokuva HF-SCF-proseduurista. Jos molekyylin geometriaa ei optimoida, on kyseessä ns.single-point calculation eli energian laskeminen tietylle rakenteelle. Muuten prosessi koostuu sekä SCF- ettägeometrianoptimointisykleistä.

Tästä tilanteesta voidaan jatkaa periaatteessa kahdella tavalla. Ensimmäinen suunta on se, että

otetaan mukaan lisäapproksimaatioita joidenkin kokeellisten parametrien muodossa. Ts.

Valitse kantajoukko.

Valitse lähtörakenteen geometria.

Laske peittointegraalit sekä kaavojen6.38 ja 6.39 mukaiset integraalit.

Arvaa tiheysmatriisi P(0).

Muodosta ja ratkaise Hartree-Fock sekulaariyhtälö 6.36.

Muodosta uusi tiheysmatriisia-kertoimista.

Onko uusi tiheysmatriisi P(n)

riittävän samanlainen kuinedellinen P(n-1)?

Optimoi molekyylin geometria?

Toteuttaako geometriaoptimointikriteerit?

Valitse uusi geometriaoptimointialgoritmin mukaisesti.

Ilmoita tulos.

Korvaa P(n-1) P(n):llä.

kyllä

ei

kyllää

kyllä eiei

38

parametrisoidaan osittain yhtälöitä, jotta saadaan laskuja nopeutettua. Tällaisia semiempiirisiä

menetelmiä käsitellään seuraavassa luvussa. Toinen suuntaus on pitää HF-teoriaa askeleena kohti

eksaktia Schrödingerin yhtälön ratkaisua. Periaatteessa, jos kantajoukkoa pystyttäisiin laajentamaan

äärettömän suureksi saataisi määritettyä energia, joka eroaisi todellisesta ainoastaan

elektronikorrelaation vaikutuksen verran. Elektronikorrelaatioksi kutsutaan tässä yhteydessä yleensä

termiä, joka erottaa ns. oikean elektronien välisen vuorovaikutuksen siitä hieman virheellisestä

tuloksesta, joka syntyy kun käsittelemme elektronien vaikutusta toisiinsa keskiarvoittuneena. Täten

on kehitetty menetelmiä, joilla päästäisiin tähän HF-rajaan (HF limit) ilman lisäapproksimaatioita.

Näitä menetelmiä kutsutaan ab initio –menetelmiksi ja niihin tutustutaan paremmin luvussa 8.

Tähän loppuun vielä lyhyesti kertauksena mitä tässä luvussa itseasiassa saavutettiin. Lähtökohtana

oli ongelma, miten saadaan määritettyä molekyyliorbitaalit eli Hamiltonin operaattorin

ominaisfunktiot molekyylille, joka koostuu useista ytimistä ja elektroneista. Koska kyseistä

ongelmaa ei voi ratkaista suoraan Schrödingerin yhtälöstä, johdettiin variaatioperiaate, joka antaa

tavan lähestyä oikeaa ratkaisua. Tämän jälkeen teimme Bornin ja Oppenheimerin approksimaation,

jonka jälkeen saimme menetelmän yhden elektronin sisältämän systeemin ratkaisemiseen LCAO-

periaatteen mukaisesti. Tästä jatkettiin Hartreen mukaisella oletuksella, että elektroneita voidaan

kuvata yhden elektronin operaattoreilla. Hartree-tulo antoi keinon löytää molekyylin aaltofunktion

SCF-menetelmän avulla. Hartree-tulon mukainen aaltofunktio ei kuitenkaan täyttänyt relativistisen

kvanttimekaniikan antisymmetrisyysperiaatetta. Tämän vuoksi aaltofunktiot esitettiinkin em.

periaatetta noudattavina Slaterin determinantteina. Kun Slaterin determinantteja käytetään Hartreen

mukaisiin yhtälöihin, päädytään Hartree-Fockin teoriaan. Lopputuloksena saatava HF-SCF-

menetelmä tarjoaa periaatteessa elektronikorrelaatiota vaille eksaktin ratkaisun Schrödingerin

yhtälöön (sikäli kun Bornin ja Oppenheimerin approksimaatio oletetaan oikeutetuksi). Tämän luvun

tulokset muodostavat lähtökohdan seuraaville luvuille.

39

7. SEMIEMPIIRISET MENETELMÄT

Edellisessä luvussa päädyttiin lopuksi Hartree-Fockin teoriaan, joka fysikaaliselta ja

matemaattiselta rakenteeltaan on varsin vaikuttava, mutta omaa kuitenkin käytännön heikkouksia.

Suurin ongelma teoriassa on laskujen raskaus, mikä on lähinnä seurausta suuresta määrästä ns.

neljän indeksin integraaleja (6.39) ja iteratiivisesta (SCF) lähestymistavasta. Ilmeisesti yksi keino

nopeuttaa laskuja olisi approksimoida näitä integraaleja jollain tavoin ja yrittää saada niiden

lukumäärää pienemmäksi. Tällaisia approksimaatioita voisi kutsua numeerisiksi approksimaatioiksi.

Lisäksi voidaan tehdä ns. kemiallisia approksimaatioita (chemically virtuous approximations),

joiden tarkoituksena on yksinkertaistaa ja jopa parantaa laskutuloksia. Useat näistä

approksimaatioista käsittävät jonkinlaisten kokeellisten parametrien huomioimista laskuissa. Tästä

syystä menetelmiä kutsutaankin semiempiirisiksi (puolikokeellisiksi) menetelmiksi.

Ennen menetelmiin perehtymistä kannattaa hieman miettiä tulosta, joka edellisessä luvussa saatiin.

On syytä huomioida, että saatu kahden tai useamman elektronin HF-aaltofunktio ei ole alkuperäisen

Schrödingerin yhtälön (ks. yhtälöt 6.13 ja 6.14) ratkaisu, vaan yhtälön, jossa elektronien vaikutus

käsitellään siten millä tavoin kukin yksittäinen elektroni (kullakin elektronilla on oma yhden

elektronin Fockin operaattorinsa) näkee toiset elektronit. Tällöin HF-energia on aina suurempi kuin

mitä yhtälön 6.14 mukainen ”eksakti” energia olisi (variaatioperiaate). Mutta kuinka suuri on tämä

elektronikorrelaatiotermin vaikutus? Tarkastellaan yksinkertaista kahden elektronin systeemiä:

helium-atomia. Tälle saadaan ns. HF-rajan mukaiseksi energiaksi 2,86168 hartreeta.

Kirjallisuuden mukaan eksakti energia heliumille on 2,90372 hartreeta, joten elektronikorrelaation

suuruus tässä tapauksessa on 0,04204 hartreeta mikä ei näissä yksiköissä näytä pahalta, mutta on

tutummissa yksiköissä noin 110 kJ mol 1. Ja tämä on siis vain helium-atomille. Suuremmille

atomeille ja molekyyleille voidaan olettaa lukeman olevan vielä paljon suurempi.

Ensisilmäyksellä tämä on järkyttävä havainto. Jos mietitään esimerkiksi Gibbsin energian

riippuvuutta tasapainovakiosta ( G = RT lnK), niin voidaan helposti laskea, että tasapainovakion

muuttuminen kymmenkertaiseksi 298 K:ssä aiheuttaa 5,7 kJ mol 1 suuruisen Gibbsin energian

muutoksen systeemiin. Samanlainen muutos tulee aktivaatioenergiaan, jos kemiallisen reaktion

nopeus muuttuu kymmenkertaiseksi. Näihin verrattuna elektronikorrelaation suuruus on järkyttävän

suuri. Voidaankin kysyä mitä HF-teorialla voidaan ylipäätään laskea. Michael Dewar, joka on

semiempiiristen menetelmien johtavia kehittäjiä, onkin verrannut tilannetta seuraavaan esimerkkiin:

40

”It is like weighing the captain of a ship by first weighing the ship with the captain on board, then

weighing the ship without her, and then taking the difference.” Eli mittausten/laskujen virherajat

ovat niin suuret, että mittaustulos hukkuu niihin.

Myöhemmin tullaan huomaamaan, että tilanne ei ole niin paha kuin miltä se näyttää. Virheet, jotka

elektronikorrelaation huomioimattomuus aiheuttaa kumoavat yleensä toisensa ja HF-tuloksia

voidaan oikeasti käyttää. Mutta tässä semiempiiristen menetelmien yhteydessä on huomattavaa, että

kemiallisten approksimaatioiden tekeminen voi joissain tapauksissa jopa parantaa tulosten

tarkkuutta puhtaisiin HF-menetelmiin verrattuna.

Seuraavaksi tarkastellaan menetelmiä pääasiassa niiden kehittämisjärjestyksessä. Aluksi lähinnä

havainnollisuutensa vuoksi tarkastellaan Hückelin teoriaa, jolla ei nykyään ole suurtakaan

käytännön merkitystä. Lopuksi tullaan uusimpiin ja nykyään eniten käytettyihin menetelmiin kuten

PM3 ja AM1.

7.1. Hückelin teoria

Tarkastellaan edellisen luvun LCAO-periaatteen soveltamista molekyyliorbitaaleihin Erich

Hückelin 1930-luvulla kehittämän teorian mukaisesti. Käsittelykohteina Hückelillä olivat

ainoastaan tasomaiset aromaattiset ja tyydyttymättömät hiilivedyt. Jotta sivulla 30 esitetyt neljä

vaihetta saataisi yksinkertaisesti suoritettua, Hückel teki seuraavat oletukset:

a) Kantajoukko muodostetaan ainoastaan samansuuntaisista hiilien 2p-orbitaaleista (koska

Hückel oli kiinnostunut tasomaisisa -systeemeistä). Näitä orbitaaleja on yksi per atomi.

b) Peittointegraalit määritetään tavalla: Sij = ij, eli 2p-funktiot ovat ortonormeeratut.

c) Hii = = metyyliradikaalin ionisaatioenergia (oletettuna negatiivisena lukuna). Tämän on

tarkoitus vastata miehittyneen 2p-orbitaalin energiaa sp2-tyyppisessä hiiliatomissa.

d) Hij = kun i ja j ovat vierekkäisiä hiiliatomeja. Tässä vastaa stabiloivaa energiaa

(negatiivinen), joka on -sidoksilla kahteen irralliseen p-orbitaaliin nähden (Kuva 7.1).

e) Hij = 0, kun i ja j ovat kauempana toisistaan.

41

90o

E = E E = 2Ep

Kuva 7.1. -sidoksen stabiloiva vaikutus kahteen irralliseen p-orbitaaliin nähden. E = 2Ep E = 2 .Huomaa, että tällöin siis = Ep ja E = 2 + 2 .

Nyt voimme esimerkkinä käsitellä allyylisysteemiä Hückelin MO-teorian mukaisesti. Systeemi

koostuu kolmesta hiilestä (ks. kuva 7.2) ja täten siis kantajoukko kolmesta 2p-orbitaalista, jotka

voidaan numeroida kuten kuvassa 7.2. Nyt yhtälön (6.19) mukainen sekulaarideterminantti ja -

yhtälö voidaan kirjoittaa edellisten oletusten mukaan yksinkertaisesti muotoon

EE

E

0

0= 0 (7.1)

Tämä kolmannen asteen yhtälö voidaan helposti ratkaista (suorita laskut!) ja tulokseksi saadaan

kolme juurta:

E = + 2 , ja 2 . (7.2)

Näistä ensimmäinen on matalinta energiaa vastaava energia (koska ja negatiivisia). Sitä

vastaavan molekyyliorbitaalin kantafunktioiden kertoimet a1, a2 ja a3 saadaan ratkaistua

yhtälöryhmästä (6.18). Tulokseksi saadaan (tee laskut!) a1 = a3 ja a2 = 2 a1. Jos halutaan, että

aaltofunktio on normeerattu, saadaan ehdosta (6.9) ratkaistua, että a1 = ½ jne. ja tällöin aaltofunktio

siis muotoa

3211 21

22

21 ppp . (7.3)

Tämä alinta energiaa vastaava ns. bonding-orbitaali on havainnollistettu kuvassa 7.2. Jos vastaavat

laskut tehtäisiin korkeammille energia-arvoille, saataisiin kertoimiksi (eikun laskemaan!) ja sitä

kautta ns. non-bonding ( 2) ja antibonding ( 3) orbitaaleiksi

3212 220

22 ppp (7.4)

ja

3213 21

22

21 ppp . (7.5)

42

CC

CHH

H

H H

1 32

E

+ 2½

- 2½

Kuva 7.2. Hückelin molekyyliorbitaalit allyylisysteemille. Molekyyliorbitaalit koostuvat paperin tasoonnähden kohtisuorassa olevista p-atomiorbitaaleista. Esitetty orbitaalien miehitys vastaa allyylikationia. Esim.yksi lisäelektroni orbitaalille 2 vastaisi allyyliradikaalia.

Hückelin teorian mukainen esitys voidaan käsittää semiempiiriseksi siinä mielessä, että se sisältää

laskuja helpottavia approksimaatioita ja lisäksi ja ovat kokeellisia parametreja. Seuraavaksi

esitetään tästä hieman laajennettu versio.

7.2. Laajennettu Hückelin teoria

Kuten edellä on tullut ilmi, vaatii N:n kantafunktion systeemin ratkaiseminen sellaisen

sekulaarideterminantin ratkaisemista, jossa on N riviä. Laajennettu Hückelin malli pitää sisällään

kaksi erityisen tärkeää oletusta. Ensinnäkin se olettaa, että kaikki sisempien kuorien elektronit

jätetään huomiotta ja vain valenssielektronit huomioidaan. Eli siis oletetaan, että ulkokuorien

elektronit määräävät molekyylien ominaisuudet. Kaikki modernit semiempiiriset menetelmät tekevät

tämän oletuksen.

Toinen oletus on, että nämä valenssiorbitaalit voidaan esittää ns. STO (Slater-type orbital)

funktioina eli Slaterin tyyppisinä orbitaaleina. (Huom. Älä sekoita tätä käsitettä Slaterin

determinanttiin ja sen mukaiseen aaltofunktioon.). STO-funktiot voidaan esittää yleisesti kaavalla

),()!2(

)2(),,,;,,( 1

21

21

ml

rn

n

Yern

mlnr , (7.4)

43

missä etummainen vakiotermi tulee normeerauksesta, eksponentti riippuu atomista (valitaan

Slaterin kehittämien sääntöjen mukaan), n, m ja l ovat kvanttilukuja, Ylm palloharmoninen

kulmamuuttujien funktio ja r määrää ns. radiaalisen osan (vrt. Y ja r vetyatomin orbitaalien

ratkaisuissa). Nämä orbitaalit muistuttavat muodoltaan vetyatomin ratkaisuina saatavia

atomiorbitaaleja. Mm. kulmaosa on sama ja säde r on eksponentiaalisesti laskeva, mikä on järkevää

kemiallisesti. Lisäksi STO-funktioilla on ominaisuus, joka tekee ne hyvin käyttökelpoisiksi, sillä

niiden peittointegraalit Sij atomien välisen etäisyyden suhteen ovat suoraan laskettavissa eikä niitä

tarvitse näinollen approksimoida Kroeneckerin deltalla.

Diagonaaliset resonanssi-integraalit Hii käsitellään kuten Hückelin teoriassa, eli ne vastaavat

elektronien ionisaatiopotentiaaleja kyseisellä valenssiorbitaalilla. Ei-diagonaaliset resonanssi-

integraalit puolestaan approksimoidaan diagonaalisten ja peittointegraalien avulla. Nämä voidaan

esittää Wolfsbergin ja Helmholzin ehdottamalla kaavalla:

Hij = 21 Cij (Hii + Hjj) Sij, (7.5)

missä Cij on kokeellinen vakio. Näin em. oletuksien mukaan voidaan rakentaa

sekulaarideterminantti ja ratkaisemalla se saadaan energiat ja molekyyliorbitaalit. Koska

matriisielementit Hij ja Sij eivät riipu molekyyliorbitaaleista, voidaan orbitaalit laskea suoraan ilman

aikaa vievää iteratiivista SCF-sykliä. Nämä ominaisuudet tekevät laajennetun Hückelin teorian

mukaiset laskut hyvin nopeiksi, mutta monet ja hyvin karkeat approksimaatiot heikentävät laskujen

tarkkuutta. Tietyntyyppisiin ongelmiin menetelmää käytetään kuitenkin yhä näinäkin päivinä.

Menetelmää voidaan käyttää esimerkiksi rakenteeltaan massiivisten orgaanisten polymeerien

tutkimukseen.

7.3. CNDO formalismi

Edellämainituissa Hückelin menetelmissä ei huomioitu elektronin spiniä. Myöskään SCF-

iteraatiosyklejä ei Hückelin menetelmissä tarvittu. Seuraavaksi otetaan lähtökohdaksi luvun 6

lopputuloksena saatu HF-SCF-teoria ja käsitellään tilannetta Fockin matriisin (6.37) valossa.

CNDO (complete neglect of differential overlap) menetelmän kehitti Pople tutkimusryhmineen

vuonna 1965. CNDO-menetelmä käsittää seuraavat yksinkertaistukset:

a) Kantajoukko esitetään STO-funktioiden avulla vain valenssiorbitaaleille kuten laajennetussa

Hückelin menetelmässäkin. CNDO:ssa käsitellään vain s ja p orbitaaleja.

b) Peittointegraalit määritetään tavalla: Sij = ij.

44

c) Neljän indeksin integraalit (6.39) esitetään muodossa ( ) = ( ), mikä

tarkoittaa sitä, että vain identtiset orbitaalit antavat nollasta eroavia integraaleja kullekin

atomille ja kaikki ne integraalit, jotka kuvaavat eri kantafunktioiden välistä peittoa häviävät.

Tästä tulee myös nimitys CNDO.

d) Jäljelle jääneet kahden elektronin integraalit lasketaan kaavasta ( ) = AB, missä ja

ovat atomien A ja B kantafunktioita ja AB on kokeellinen parametri, joka voidaan laskea

atomien A ja B ionisaatiopotentiaalien ja elektroniaffiniteettien avulla.

e) Yhden elektronin integraalien diagonaalielementit saadaan kaavasta:

k k

k

rZ2

21 = IP

kkZZk k

Z A)(A

. (7.6)

Hieman hankalannäköisestä muodostaan huolimatta, yhtälöstä (7.6) riittää todeta tässä

yhteydessä vain se, että kyseiset integraalit saadaan siis kokeellisista parametreista. Z on

ytimen varausluku, IP ionisaatioenergia ja AB edellä mainittu kokeellinen parametri.

f) Ns. off-diagonaalielementit saadaan puolestaan kaavalla:

k k

k

rZ2

21 =

2)( BA S

, (7.7)

missä on jälleen kokeellinen parametri. Tässä kuvattu peittomatriisi puolestaan lasketaan

käyttäen STO-funktioita eikä approksimoida nollaksi tai ykköseksi kuten kohdassa b.

Vaikka CNDO-formalismi saattaakin vaikuttaa monimutkaiselta, se on kuitenkin karkea

yksinkertaistus HF-teoriasta. Ensinnäkin kohta c rajaa neljän indeksin integraalien määrän N4:stä

N2:een. Lisäksi kyseiset integraalit lasketaan algebrallisten kaavojen avulla, mikä on laskennallisesti

erittäin nopeaa. Samoin CNDO:ssa yhden elektronin integraalit saadaan pelkistä algebrallisista

lausekkeista.

Kemiallisessa mielessä rajuin yksinkertaistus CNDO-menetelmässä on, että elektronien välistä

repulsiota edustavat kahden elektronin integraalit oletetaan vain atomin tyypistä riippuviksi.

Esimerkiksi hiilelle käytetään aina samaa arvoa CC riippumatta siitä minkälainen on orbitaalien

tyyppi (esim. s tai p) tai orientaatio (esim. vapaat elektroniparit). Ensimmäistä ongelmaa voidaan

pitää ns. yhden keskuksen ongelmana, sillä se liittyy tietyn atomin ympärillä oleviin elektronisiin

vuorovaikutuksiin. Jälkimmäistä taas voidaan ajatella kahden keskuksen ongelmaksi. Esimerkkinä

vapaan elektroniparin vaikutus hydratsiinien rotaatioon.

45

7.4. INDO formalismit

Yhden keskuksen ongelmat CNDO-menetelmässä korjataan osittain INDO (intermediate neglect of

differential overlap) menetelmässä. Ko. menetelmässä annetaan kahden elektronin integraaleille

useampia mahdollisia lukuarvoja riippuen orbitaalityypistä. INDO-menetelmä on edelleen

tarkkuudeltaan melko vaatimaton varsinkin geometrian optimoinnissa. Mutta jos optimoitu

geometria on jo olemassa, INDO on osittautunut antavan hyviä tuloksia spektroskooppisille

ominaisuuksille, sillä esimerkiksi värähtelytaajuudet riippuvat pääasiassa tietyn atomin

ympäristöstä. Esimerkiksi vuonna 1973 esitetty malli INDO/S on parametrisoitu nimenomaan

spektroskooppisista parametreista ja antaa melko hyviä tuloksia aina yksinkertaisista orgaanisista

yhdisteistä siirtymämetalleihinkin. Koska myös INDO/S on hyvin nopea laskennallisesti, voidaan

sitä käyttää suurille biomolekyyleillekin.

Suuri edistysaskel semiempiiristen menetelmien käytössa tapahtui, kun jo aiemmin mainittu

Michael Dewar vuonna 1975 esitti ns. MINDO/3 mallin. (third-generation modified INDO).

Dewarin lähtökohta menetelmän kehittämiselle oli sen yleispätevyys monentyyppisille lähinnä

orgaanisille yhdisteille. Lisäksi hänen parametrisointi-ideologiansa oli enemmän matemaattinen

kuin kemiallinen. Hän käsitteli esimerkiksi STO-funktioiden -eksponentteja vain matemaattisina

parametreina, joita voi muokata niin kauan kuin ne vain säilyvät fysikaalisesti realistisina.

Aikanaan MINDO-malli syrjäytti tarkkuudellaan monet aiemmat, mutta nykyään on jälleen

kehittyneempiäkin yleisluontoisia malleja tarjolla, joten MINDO:n käyttö on vähäistä.

7.5. NDDO formalismit

Kun INDO-menetelmässä korjattiin CNDO:n puutteita yhden keskuksen tilanteissa, pyritään

NDDO (neglect of diatomic differential overlap) menetelmässä vastaavaan kahden keskuksen

ongelmien osalta. NDDO-menetelmä huomioi minkälaisia orbitaalikombinaatioita kaksi keskusta

voivat saada. Esim. yhdestä s- ja kolmesta (x, y ja z) p-orbitaalista voidaan muodostaa 10 erilaista

kahden orbitaalin kombinaatiota, josta seuraa 102 = 100 erilaista kahden elektronin integraalia. Jos

tarkasteluissa otetaan mukaan vielä d-orbitaalit, on integraaleja jo 2025. Vaikka määrä saattaakin

näyttää suurelta, se on silti hyvin pieni verrattuna siihen, että lasketaan kaikki mahdolliset

integraalit, kuten tehtäisiin HF-teoriassa. Nykyään yleisimmin käytetyt semiempiiriset menetelmät

ovat luonteeltaan NDDO-menetelmiä.

46

Ensimmäinen NDDO-menetelmä oli vuonna 1977 Dewarin kehittämä MNDO (modified neglect of

differential overlap) atomeista C, H, O ja N koostuville molekyyleille. Nykyisin ko. malli on

parametrisoitu lähes kaikille ensimmäisten jaksojen alkuaineille ja muutamille metalleillekin.

Lisäksi MNDO-malli lisää myös ytimien välisestä repulsiosta aiheutuvan termin SCF-energiaan

(vrt. Bornin ja Oppenheimerin approksimaatio). MNDO-mallia näkee käytettävän jonkin verran

vieläkin kemian alan kirjallisuudessa.

Dewarin seuraava parannus oli AM1 (Austin model 1, hän työskenteli tuohon aikaan Texasin

yliopistossa Austinissa) vuonna 1985. AM1 on muokattu versio MNDO:sta, jossa mm. ytimien

välinen repulsiotermin muotoa on parannettu. Lisäksi AM1:ssa on pyritty ottamaan huomioon

vetysitoutuminen. Nykyaikaisista semiempiirisistä menetelmistä AM1 on toinen yleisesti tänä

päivänä käytetyistä menetelmistä.

Toinen nykyään pääasiassa käytetty semiempiirinen menetelmä on PM3 (parametrized model 3).

Menetelmän kehitti James Stewart (joka oli Dewarin laboratoriossa mukana kehittämässä mm.

AM1-menetelmää, mutta lähti sittemmin itsenäiseksi tutkijaksi) vuonna 1989. Hänen

lähtökohtanaan oli parantaa AM1-mallissa havaittuja puutteita. Kaikenkaikkiaan PM3-malli antaa

keskimäärin hieman parempia tuloksia kuin AM1. Kummallakin mallilla on omat vahvuutensa ja

heikkoutensa, mutta yleiskäyttöisyytensä vuoksi ne ovat käyttökelpoisimmat tällä hetkellä olemassa

olevista semiempiirisistä menetelmistä.

Semiempiirisiä menetelmiä kehitetään yhä. Uudempia malleja ovat mm. vuonna 1992 esitetty

MNDO/d, joka huomioi d-orbitaalit. Tarkasteltaessa mm. metalleja sisältäviä yhdisteitä MNDO/d

on tarkkuudeltaan ylivoimainen edellisiin verrattuna. MNDO-mallista on olemassa myös versio

MNDOC, joka puolestaan ottaa huomioon myös elektronikorrelaation. Koska todennäköisesti

lähitulevaisuudessakaan ei suurille biomolekyyleille pystytä laskuja tekemään esim. HF-teorian

mukaisesti, on semiempiiristen menetelmien kehitystyö edelleenkin tärkeää ja sitä tehdään koko

ajan. Lisäksi nykyään on keskitytty kehittämään menetelmiä, jotka liikkuisivat tietyssä mielessä

jossain semiempiiristen ja puhtaasti teoreettisten välimaastossa. Tällainen on esimerkiksi SAM1

(semi-ab initio method 1).

7.6. Semiempiiriset menetelmät ja SAR

Käsitellään lopuksi esimerkinomaisesti yksi tapa käyttää semiempiirisiä menetelmiä käytännön

tutkimuksissa. Eräs viimeaikoina huomiota erityisesti lääketeollisuudessa saanut tutkimusala on ns.

47

SAR, joka tulee sanoista structure-activity relationship. SAR:n ideana on selvittää minkälaiset

rakenteelliset tekijät vaikuttavat molekyylin (tyypillisesti farmakologiseen) aktiivisuuteen. SAR-

laskelmat tarkoittavat yleensä suurta joukkoa usein lineaarisia yhtälöitä, joissa rakenteen aktiivisuus

on esitetty erilaisten molekyylin rakenteeseen liittyvien muuttujien funktiona. Tällaisia muuttujia

voivat olla esimerkiksi molekyylimassa, dipolimomentti, höyrynpaine, pintailmiöihin liittyvät

suureet ja erilaiset geometriset tekijät. Kun tällainen yhtälöjoukko on ratkaistu ja ns. SAR on

käytettävissä, sen avulla voidaan ennustaa erilaisten rakenteiden aktiivisuuksia. Kun rakenne-

aktiivisuustekijöitä pystytään määrittämään kvantitatiivisesti, puhutaan QSAR-menetelmästä

(quantitative SAR).

Esimerkiksi lääkeyhtiöllä saattaa olla tietokannassaan valmistamilleen yhdisteille suuri joukko

molekyylien kokeellisia ominaisuuksia, joiden pohjalta voidaan laatia rakenne-aktiivisuusyhteyksiä.

Tällöin voidaan periaatteessa syntetisoida uusi molekyyli, mitata sen kokeellisia parametreja ja

ennustaa SAR:n avulla molekyylin farmakologinen aktiivisuus. Huomattavasti helpompaa olisi, jos

syntetisoinnin sijasta voisimmekin laskea uudelle molekyylille tarvittavat parametrit ja tällöin

edelleen ennustaa aktiivisuuden ilman, että sitä tarvitsee kokeellisesti valmistaa. Tällöin voisimme

kartoittaa minkälaisien molekyylien synteesien käytännön tekemiseen kannattaa todella panostaa.

Tällaiseen molekyylien ominaisuuksien kartoitukseen semiempiiriset menetelmät sopivat hyvin

nopeutensa ansiosta. Kun rakenteen geometria on optimoitu, voidaan sen jälkeen melko helposti

laskea sille myös muita suureita, joita voidaan käyttää SAR:ssa.

Jotta tulisi jonkinlainen mielikuva minkälaisista suuruusluokista ajan ja molekyylimäärien suhteen

tällaisissa tutkimuksissa puhutaan, niin esimerkiksi vuonna 1998 julkaistiin tutkimus, jossa

optimoitiin geometriat AM1-menetelmällä 53000 yhdisteelle 14 tunnissa, kun käytettävissä oli

senaikainen 128 prosessorista koostuva supertietokone. Tällainen nopeus on mahdollista

kvanttimekaanisista menetelmistä vain semiempiirisille menetelmille.

48

8. AB INITIO –MENETELMÄT

Luvussa 6 esitetyn Hartree-Fockin teorian perusolettamuksena oli keskeiskentän oletus, eli se että

elektroni kokee kaikki muut elektronit keskimääräisenä kenttänä. Kuten aiemmin on tullut jo

mainittua, oletus aiheuttaa oikeaan eksaktiin energiaan elektronikorrelaation suuruisen virheen.

Tässä luvussa käsitellään menetelmiä, jotka hyväksyvät elektronikorrelaatiosta aiheutuvan virheen,

mutta pyrkivät muuten mahdollisimman täydelliseen ja puhtaan kvanttimekaaniseen käsittelyyn; eli

pyrkivät HF-rajaan, jolloin poikkeama eksaktista Schrödingerin yhtälön antamasta energiasta olisi

tarkalleen elektronikorrelaation suuruinen: Ekorr = E EHF (E on eksakti oikea energia ja EHF HF-

rajan energia). Tällaisia menetelmiä kutsutaan ab initio –menetelmiksi. Nimi tulee latinasta ja

voidaan kääntää ”alusta alkaen”.

Vaikka semiempiirisien menetelmien käsittelyn yhteydessä mainittiinkin elektronikorrelaation

vaikutuksen olevan hyvin suuri, voidaan ab initio –menetelmiä silti käyttää melko luotettavasti

samankaltaisien systeemien, kuten esimerkiksi konformaatioiden, energiaeron määrittämiseen.

Tällöin elektronikorrelaation suuruuden oletetaan olevan samansuuruinen molemmille systeemeille.

Lisäksi menetelmillä pystytään laskemaan hyvin muita suureita kuin energiaa.

HF-rajaan pääsyn esteenä on yleensä kantajoukko (basis set), jonka avulla aaltofunktio oletetaan

lausuttavaksi. Jos käytettävissä olisi äärettömän suuri kantajoukko, voitaisi aaltofunktio ”sovittaa”

täydellisesti kantafunktioihin ja tällöin HF-raja saavutetaan. Käytännössä äärettömän suuruinen

kantajoukko on kuitenkin mahdoton. Täten ab initio –menetelmien käyttö on paljolti HF-SCF-

teorian mukaisen aaltofunktion ratkaisemista jonkin tietyn kantajoukon funktiona. Seuraavaksi

käsitelläänkin niitä kantajoukkoja, joita ab initio –menetelmät tavallisimmin käyttävät. Nämä samat

kantajoukot soveltuvat myös myöhemmin esiin tulevien, kuten tiheysfunktionaaliteoreettisten,

menetelmien käyttöön ja ovat hyvin keskeinen osa nykyaikaista laskennallista kemiaa.

8.1. Kantajoukot

Kun pohditaan kantajoukon tehokkuutta tai hyvyyttä, on kiinnitettävä huomiota lähinnä kolmeen

asiaan. Ensinnäkin, koska ab initio –menetelmissä ei tehdä lisäoletuksia neljän indeksin integraalien

(6.39) suhteen, kantajoukon suuruus eli kantafunktioiden lukumäärä N on tärkeä tekijä. Näitä neljän

indeksin integraaleitahan oli N4 kappaletta. Joten mahdollisimman pieni kantajoukko kuulostaa

houkuttelevimmalta. Toinen laskunopeuteen vaikuttava seikka on kuinka nopeasti em. integraalit

49

pystytään laskemaan. Yleisesti ottaen, jos integraalit joudutaan laskemaan numeerisesti (jotain

numeerista algoritmia käyttäen), laskeminen on huomattavasti hitaampaa kuin jos ne pystyttäisiin

laskemaan algebrallisesti (jolloin tarkat arvot voidaan laskea suoraan integroiduista lausekkeista).

Täten suurempikin kantajoukko voi olla nopeampi kuin pieni, jos sen kantafunktiot ovat helpommin

integroitavissa. Kolmantena huomioitavana asiana on, että kantafunktiot ovat kemiallisesti järkevän

mallisia. Tämä tarkoittaa esimerkiksi sitä, että ne ovat atomeja lähellä amplitudiltaan suuria ja

häviävät kohti nollaa etäisyyden kasvaessa, eli ne vastaavat käyttäytymiseltään elektronin

todennäköisyystiheyttä. Näiden kolmen ehdon optimaalinen toteuttaminen on kantafunktioiden

kehityksen lähtökohta.

STO-funktiot

Slaterin tyyppiset orbitaalit (STO) esitettiin laajennetun Hückelin teorian yhteydessä yhtälöllä (7.4).

Näillä on se kemiallisesti miellyttävä ominaisuus, että ne vastaavat hyvin läheisesti vedyn

atomiorbitaaleja. Ab initio HF-teoriassa niillä on kuitenkin oleellinen heikkous, sillä niiden neljän

indeksin integraaleille ei ole olemassa yleistä analyyttistä ratkaisua, vaan ne joudutaan laskemaan

numeerisesti. Tämä rajoittaa STO-funktioiden käyttöä suuremmilla molekyyleillä huomattavasti.

GTO-funktiot

Vuonna 1950 esitettiin vaihtoehtoinen kantafunktiojoukko STO-funktioille. Jos STO-funktiota

halutaan muokata siten, että niiden neljän indeksin integraalit olisivat laskettavissa analyyttisesti,

riittää korvata eksponenttifunktion r neliöllään r2. Tämä muuttaa funktion muodon vastaamaan

Gaussin kellokäyrän muotoa ja näitä funktioita kutsutaankin Gaussin tyyppisiksi orbitaaleiksi

(GTO, Gaussian-type orbitals). Atomikeskeiset GTO-funktiot voidaan kuvata karteesisessa (x,y,z)

koordinaatistossa yleisesti kaavalla

)(21

43

222

)!2()!2()!2(!!!)8(2),,,;,,( zyxkji

kji

ezyxkjikjikjizyx . (8.1)

Ylläolevassa lausekkeessa vakio määrää Gaussin funktion leveyden. Jos on suuri,

eksponenttifunktio pienenee nopeasti kohti nollaa ja on ns. kompakti. Jos taas on pieni, funktio

häviää hitaasti ja sillä voidaan kuvata kaukana atomista tapahtuvia vuorovaikutuksia. Tällaista

funktiota sanotaan diffuusiksi. Indeksit i, j ja k ovat ei-negatiivisia kokonaislukuja ja vastaavat

oikeiden atomiorbitaalien kvanttilukuja karteesisessa mielessä. Erityisesti kun i = j = k = 0, vastaava

GTO on pallosymmetrinen ja sitä kutsutaankin s-tyypin GTO:ksi. Tilanteessa, jossa jokin indeksi

on yksi ja muut nollia, saadaan GTO-funktio, joka on symmetrinen x- y- tai z-akselin suhteen

50

(riippuen siitä mikä indekseistä on yksi: esim jos se on i, niin silloin x-akselin suhteen). Nämä

vastaavat p-atomiorbitaaleja ja niitä kutsutaan p-tyypin GTO:iksi.

Jos indeksien summa on kaksi, funktioita kutsutaan d-tyypin GTO:iksi. On kuitenkin huomion

arvoista se, että tällaisia kombinaatioita on kuusi, joista saadaan mahdollisiksi termeiksi yhtälössä

(8.1) x2, y2, z2, xy, xz ja yz. Näitä funktioita kutsutaan karteesisiksi d-funktioiksi. Kuitenkin

Schrödingerin yhtälössä vetyatomille saadaan vain viisi d-orbitaalia, jotka yleensä ilmoitetaan

muodossa xy, xz, yz, x2 y2 ja 3z2 r2. Näistä kaksi viimeistä ovat lineaarikombinaatioita

karteesisista d-funktioista. Jotkin gaussiaaniset kantajoukot käyttävät d-funktioina kuutta ja jotkin

viittä funktiota. Tämä on hyvä huomioida kantajoukkoja käytettäessä. Kun indeksien summa

kasvaa, puhutaan f-funktioista jne. Tällöin myös lukumääräerot karteesisten ja vetyatomin

ratkaisuista peräisin olevien funktioiden välillä kasvavat.

Sovitetut Gaussin funktiot

Vaikka GTO-funktiot ovatkin laskennallisesti miellyttäviä, niillä on kuitenkin tiettyjä huonoja

ominaisuuksia. Eräs suurimmista huolenaiheista on funktioiden muoto: kun GTO-funktiot ovat

tasaisia ja derivoituvia kaikkialla, on aidoissa vetyatomin orbitaaleissa sitävastoin derivaatan

epäjatkuvuuskohta. Lisäksi Gaussin funktioiden toisen asteen eksponentiaalinen vaimeneminen on

liian nopeaa atomiorbitaaleihin verrattuna. Tällöin siis elektronin löytämistodennäköisyys pienenee

liian nopeasti etäisyyden funktiona.

Jotta löydetään optimaalinen ratkaisu niin laskentatehollisesti kuin funktioiden kemiallisen muodon

mielessäkin, käytetään tavallisimmin tapaa, jossa oikean mallisia STO-funktioita pyritään

kuvaamaan mahdollisimman hyvin helposti laskettavilla GTO-funktioilla. Toisin sanoen ei käytetä

yksittäisiä GTO-funktioita, vaan näistä muodostettuja lineaarikombinaatioita, jotka sovitetaan

vastaamaan STO-funktioiden muotoa mahdollisimman hyvin. Tällaisia funktioita kutsutaan

sovitetuiksi (tai kontrahoiduiksi) Gaussin funktioiksi (contracted Gaussian functions). Yksittäisiä

GTO-funktioita kutsutaan puolestaan primitiivisiksi Gaussin funktioiksi (primitive Gaussians).

Sovitettu Gaussin funktio voidaan esittää primitiivi-Gaussien avulla muodossa

),,,;,,(),,,;,,(1

kjizyxckjizyx a

M

aa , (8.2)

51

missä kertoimet c valitaan niin, että summafunktion muoto vastaa parhaiten STO-funktioiden

muotoa ja niin, että siitä tulee normitettu. On huomattavaa, että termi on eri kaikissa

primitiiveissä. M on primitiivifunktioiden lukumäärä.

Mikä olisi sopiva määrä primitiivifunktioita kuvaamaan STO-funktiota riittävän hyvin? Hehre,

Stewart ja Pople ovat vuonna 1969 tutkineet erikokoisten kantajoukkojen tehokkuutta ja päätyivät

tulokseen, että kolmen primitiivifunktion käyttäminen on optimaalisinta. Suurempi määrä kuvaisi

tarkemmin STO-funktioita, mutta olisi laskennallisesti jo huomattavan raskas. Tällaisia kolmesta

primitiivistä muodostuneita Gaussin sovitettuja kantafunktioita kutsutaan STO-3G kantajoukoksi

(yleisesti STO-MG).

Nimitys STO-3G on selkeä siinä mielessä, että se kertoo miten sovitus on tehty. Varsinkin

vanhemmassa kirjallisuudessa käytetään toisenlaista nimeämistapaa kantafunktioille. Em. STO-3G

vedyille olisi tällä tavalla kirjoitettuna (3s)/[1s]. Kaarisulkulauseke kertoo kuinka monta ja minkä

tyyppisiä primitiivifunktiota on käytetty ja hakasulkulauseke sovitettujen funktioiden lukumäärän ja

tyypin. Jos tarkastellaan myös jaksollisen järjestelmän toisen jakson alkuaineita, STO-3G esitetään

muodossa (6s3p/3s)/[2s1p/1s]. Esimerkiksi litium vaatisi tällöin kolme kappaletta 1s-, 2s- sekä 2p-

primitiivejä, eli yhteensä 6s3p. Näistä muodostetaan yksi 1s, 2s ja 2p sovitettu funktio. Nämä on

erotettu vedyn vastaavista kenoviivalla /.

Single- , Multiple- , ja Split-valenssi

Edellä mainittu STO-3G kantajoukko on esimerkki ns. single- kantajoukosta. Tämä tarkoittaa, että

kutakin orbitaalia kuvataan vain yhdellä sovitetulla Gaussin funktiolla. Esim. H ja He kuvataan

tällöin yhdellä 1s-funktiolla. Toisen jakson alkuaineille Li-Ne on käytössä 5 funktiota: 1s, 2s, 2px,

2py ja 2pz. Kolmannelle jaksolle (Na-Ar) on näiden lisäksi vielä 3s, 3px, 3py ja 3pz eli kaikkiaan 9

funktiota, jne. Tämä on minimimäärä, joka tarvitaan kantajoukoksi. Tällaista kantajoukkoa

kutsutaan myös minimaaliseksi kantajoukoksi.

Tällainen kantafunktioiden lukumäärä on kuitenkin hyvin pieni, kun ajatellaan, että HF-rajalle

pääsy vaatisi ääretöntä kantajoukkoa. Eräs tapa lisätä kantajoukon ”joustavuutta” on dekontrahoida

sitä. Sen sijaan että käyttäisimme yhtä sovitettua Gaussin funktiota, joka on koostunut kolmesta

primitiivistä, voimmekin käyttää esimerkiksi kahta sovitettua Gaussin funktiota, joista toinen

koostuu kahdesta primitiivistä ja toinen vain yhdestä primitiivistä. Molemmissa tapauksissa kanta

52

siis koostuisi kaikkiaan kolmesta primitiivistä, mutta sovitettuja Gaussin funktioita, joita käytetään

yhtälön (6.15) mukaisessa molekyylin aaltofunktion lineaarikombinaatiolausekkeessa, olisi

ensimmäisessä tapauksessa yksi ja toisessa kaksi. Herää kysymys mitä hyötyä tästä on? Hyöty tulee

siitä, että saamme lisää joustavuutta todellisen molekyyliorbitaalin kuvaamiseen, sillä em.

käsittelyssä sekulaarideterminantin koko kasvaa. Varsinaisten integroitavien kantafunktioiden,

primitiivigaussiaanien, lukumäärä pysyy edelleen samana, joten laskenta-aika ei oleellisesti pitene.

Kantajoukkoa, jossa on kaksi funktiota kuvaamassa kutakin atomiorbitaalia kutsutaan double-

kantajoukoksi. Jos funktioita on kolme, puhutaan triple- kantajoukosta jne. Kirjain zeta ( ) tulee

siitä, että atomiorbitaalia kuvaavassa STO-funktion lausekkeessa eksponenttina on tapana käyttää

symbolia , kuten yhtälössä (7.4) on esitetty.

Sovitetut kantafunktiot siis sovitetaan vastaamaan mahdollisimman hyvin STO-funktiota, joka

vastaa muodoltaa LCAO-approksimaation mukaista vetyatomin atomiorbitaalia. Jos sovitettua

funktiota käytetään sen sijaan molekyylin aaltofunktion esittämiseen, ei yhdelle sovitetulle

funktiolle voida antaa kuin yksi kerroin yhtälön (6.15) mukaisessa lausekkeessa. Tällöin on siis

mahdollisimman hyvän molekyyliorbitaalin kuvaamisen kannalta edullisempaa käyttää

dekontrahoituja funktioita.

Lisäksi tällä kontrahoitujen/dekontrahoitujen funktioiden käyttötavalla on se merkittävä

ominaisuus, että jokaista orbitaalia ei tarvitse välttämättä kuvata samalla tavalla. Tarkastellaan

esimerkiksi happiatomia. Sille voitaisiin optimoida vaikkapa kolmesta primitiivistä muodostuva

sovitettu Gaussin funktio, joka vastaisi mahdollisimman hyvin 1s-atomiorbitaalia esittävää STO-

funktiota. Jos tarkastelisimme jotakin happea sisältävää molekyyliä, löytäisimme

molekyyliorbitaalin, joka vastaa hyvin läheisesti sovitetulla Gaussin funktiolla esitettyä 1s-

atomiorbitaalia. Tämä johtuu siitä, että molekyylien kemialliset ominaisuudet, kuten atomien väliset

sitoutumiset, ovat pääasiassa riippuvaisia valenssi- eli ulkokuoren elektroneista ja siis

valenssiorbitaaleista (valence orbitals). Tällöin on siis laskennallisesti aivan turhaa tuhlata suurinta

osaa laskuajasta sisempien kuorien orbitaalien (core orbitals) laskemiseen, jos ne ovat aina lähes

samanlaiset. Järkevämpää on panostaa valenssiorbitaalien mahdollisimman hyvään kuvaamiseen.

Tämän voimme tehdä käyttämällä ns. split-valenssi (split-valence tai valence-multiple- )

kantajoukkoa, jossa käytämme erityyppistä kantajoukkoa sisä- ja valenssiorbitaaleille.

53

Yleensä riittää kun kuvataan sisäorbitaaleja yhdellä sovitetulla Gaussin funktiolla, joka tavallisesti

koostuu kolmesta tai kuudesta primitiivistä. Valenssiorbitaalien kuvaamiseen taas käytetään usein

dekontrahoituja funktioita, jotka tavallisimmin koostuvat kukin yhdestä tai kolmesta primitiivistä.

Tällaisia split-valenssi kantajoukkoja ovat (kemian alan kirjallisuudessa erittäin tunnetut) Poplen

kantajoukot kuten: 3-21G, 6-21G, 4-31G, 6-31G ja 6-311G. Kantajoukon nimi kertoo

kontraktiotavan. Ensimmäinen numero kertoo kuinka monesta primitiivistä koostuvia sovitettuja

Gaussin funktioita käytetään sisäorbitaaleille. Väliviivan jälkeiset numerot kertovat kuinka monesta

primitiivistä koostuu kukin sovitettu Gaussin funktio valenssiorbitaaleille. Jos näitä numeroita on

kaksi, tarkoittaa se, että valenssiorbitaaleja kuvataan kahdella sovitetulla funktiolla ja koko

kantajoukkoa kutsutaan tällöin valence-double- -kantajoukoksi. Jos näitä numeroita on kolme

kappaletta, puhutaan valence-triple- -kantajoukosta.

Sovitetuille Gaussin funktioille esitettiin myös toinen merkintätapa. Samaa tapaa voidaan käyttää

tässäkin. Esimerkiksi haluttaessa laskea vesi-molekyyli, 6-311G kantajoukko olisi toisella tavalla

kirjoitettuna (11s5p/5s)/[4s3p/3s]. Merkintä 6-311 siis kertoo, että sisäorbitaaleja kuvataan yhdellä

sovitetulla funktiolla, joka koostuu kuudesta primitiivistä (huom. sisäorbitaaleja on vain hapen 1s).

Valenssiorbitaaleja kuvataan kolmella sovitetulla funktiolla, joista yksi koostuu kolmesta

primitiivistä ja muut ovat vain yksittäisiä primitiivifunktioita. Tällöin siis esim. hapen kuvaamiseen

tarvitaan 11 s-primitiiviä (6 1s-primitiiviä + 3 + 1 + 1 2s-primitiiviä) ja 5 p-primitiiviä (3 + 1 + 1).

Näistä muodostetaan 4 sovitettua s-funktiota (1s + 3 kpl 2s) ja 3 sovitettua p-funktiota.

Miten näissä multiple- - ja split-valenssi kantajoukoissa sitten valitaan GTO-funktioiden kertoimet

lineaarikombinaatiota muodostettaessa sekä eksponenttitermi ? Koska kantajoukko ei ole enää

minimaalinen, ei sitä voida suoraan sovittaa STO-funktioon. Pople ryhmineen käytti ongelmaan

joukkoa testimolekyylejä ja sovitti variaatiolaskennan keinoin kertoimet ja eksponentin vastaamaan

parasta mahdollista tulosta testijoukon molekyyliorbitaaleille. Valenssikuorien koostuessa

useammasta sovitetusta funktiosta (esim. 311), kuvataan kolmesta primitiivistä koostuvalla

funktiolla yleensä valenssiorbitaalien ”sisempiä osia”, joissa elektronitiheys on suurin. Näillä siis

eksponentti , joka kuvaa eksponenttitermin leveyttä, on suuri. Korjaukset valenssikuorien

”ulompiin osiin”, tehdään yleensä vain yksittäisistä primitiiveistä muodostuvilla funktioilla (311-

tapauksessa kahdella). Näissä eksponentti , on pienempi, eli Gaussin funktio on ”diffuusimpi”.

54

Poplen kantajoukoista vielä sellainen huomio, että ne ovat ns. segmentoituja, mikä tarkoittaa, että

esim. 2s- ja 3s-kantafunktioissa ei käytetä samoja primitiivifunktioita (segmented contraction).

Tämä päteen kaikkiin eri pääkuoren, mutta saman kulmaosan sisältäviin orbitaaleihin. Toinen tapa

on ns. Raffanettin tapa käyttää yleistä sovitusta (general contraction). Tässä käytetään tiettyä

joukkoa samoja primitiivejä jokaisessa sovitetussa kantafunktiossa, mutta ne esiintyvät kussakin eri

kertoimilla. Tällä tavalla saavutetaan tiettyjä etuja esim. integraalien laskentatehokkuudessa.

Samoja primitiivejä sisältävät integraalit riittää laskea vain kertaalleen ja ne voidaan tallettaa ja

hakea uudelleen käyttöön kun niitä tarvitaan uudelleen. Tällaisia split-valenssikantajoukkoja ovat

ns. Dunningin kantajoukot kuten cc-pVDZ ja cc-pVTZ jne. Kantajoukkojen nimessä cc tulee

sanoista correlation-consistent, joka tarkoittaa, että kantajoukon eksponentit ja kertoimet ovat

optimoitu käyttäen laskelmia, jotka huomioivat myös elektronikorrelaation. Loppuosan pVDZ tulee

sanoista polarized Valence Double Zeta. Eli tässä tapauksessa valenssiorbitaalit kuvataan double-

zeta kontraktiolla. Polarisaatiofunktioihin puolestaan perehdytään seuraavaksi.

Polarisaatiofunktiot

Vaikka edellisissä luvuissa on puhuttu paljon STO-funktioista ja niiden vastaavuudesta

atomiorbitaalien kanssa, on syytä muistaa, että atomiorbitaalit ovat vain malli, jolla ajattelemme

pystyvämme kuvaamaan molekyyliorbitaaleja. Molekyyliorbitaalien mallintaminen

atomiorbitaaleilla ei aina kuitenkaan anna oikean muotoisia molekyyliorbitaaleja. Tarkastellaan

esimerkiksi ammoniakkia NH3. Sen tiedetään olevan rakenteeltaan pyramidimainen, jossa voi

tapahtua ns. typpi-inversio, jossa pyramidi muuttuu toiseksi (tässä tapauksessa samanlaiseksi)

pyramidiksi. Tämä muutos tapahtuu tasomaisen rakenteen kautta, jota voidaan ajatella muutoksen

transitiotilaksi. Kuitenkin HF-laskut käyttäen s- ja p-funktioita kantafunktioina ennustaa tasomaisen

rakenteen olevan minimienergiarakenne.

Ongelmana em. tapauksessa on, että laskelmat käyttäen atomikeskisiä s- ja p-funktioita eivät anna

molekyylin aaltofunktiolle riittävästi ”joustavuutta” kuvaamaan pyramidista rakennetta. Molekyylit

vaativat usein siis enemmän joustavuutta tai liikkumavaraa aaltofunktionsa kuvaamiseen kuin mitä

s- ja p-atomiorbitaaleista muodostuvat kantafunktiot tarjoavat. Tätä liikkumavaraa voidaan antaa

lisäämällä kantajoukkoon ns. polarisaatiofunktioita. Tavallisesti tämä tehdään käyttämällä

polarisaatiofunktioina pykälää korkeamman sivukvanttiluvun omaavia funktioita kuin atomi

itsessään edellyttäisi. Eli suomeksi sanottuna hiilelle ja muille toisen jakson alkuaineille käytetään

alunperin tarvittavien p-funktioiden lisäksi polaarisaatiofunktioina d-funktioita. Vedylle s-

funktioiden lisäksi käytetään p-funktioita. Tämä lisää kantajoukon joustavuutta kuvata

55

monimutkainen molekyyliorbitaali huomattavasti. (Toinen mahdollisuus olisi käyttöää funktioita,

jotka eivät ole atomikeskisiä. Gaussiaaniset tällaiset ovat ns. FLOGO (floating Gaussian orbital)

funktioita, mutta ne eivät ole laskennallisesti yhtä tehokkaita kuin atomikeskiset).

Polarisaatiofunktioita käytetään nykyään laskuissa lähes poikkeuksetta. Ne merkitään Poplen

kantajoukkoihin tähdellä *. Esimerkiksi kantajoukko 6-31G* tarkoittaa, että d-funktioita käytetään

”polarisoimaan” 6-31G:n p-funktioita. Jos kantajoukossa on myös toinen tähti, tarkoittaa se, että p-

funktioita (s-funktioiden lisäksi) on käytetty vedylle ja heliumille, esim. 6-311G**. Yleisesti

polarisaatiofunktioille käytetään myös vaihtoehtoisia merkintöjä * = (d) ja ** = (d,p). Tällöin esim.

6-31G** = 6-31G(d,p).

Dunningin kantajoukoissa käytetään taas hieman erityyppistä systeemiä. On huomattu, että

polarisaatiofunktioilla saavutetaan tietty optimaalinen tehokkuus dekontraktiosysteemistä riippuen.

Esimerkiksi double- kantajoukolle lisätään yleensä d-funktiot jokaiselle raskaalle atomille (=atomi,

joka ei ole H tai He) ja p-funktiot vedylle. Triple- kantajoukolle puolestaan lisätään yksi joukko f-

funktioita ja kaksi d-funktioita raskaille atomeille sekä yksi joukko d-funktioita ja kaksi p-funktioita

vedylle. Tätä polarisaatiofunktiosysteemiä käytetään kantajoukoissa cc-pVnZ, missä n = 2 (D),

3(T), 4(Q), 5, 6, jne. Esim raskaille atomeille kantajoukossa cc-pV6Z käytetään yhtä i-funktiota,

kahta h-funktiota, kolmea g-funktiota, neljää f-funktiota ja viittä d-funktiota. Tämän lisäksi kun

valenssifunktioita on vielä kuusi s- ja p-funktiota sekä sisäkuorien elektroneja vastaavat funktiot,

niin saadaan yhteensä 140 kantafunktiota kuvaamaan kutakin toisen jakson atomia. On

sanomattakin selvää, että tällaisilla kantajoukoilla laskut ovat hyvin raskaita.

Jos Poplen kantajoukoissakin halutaan (kuten nykyään usein tehdään) käyttää useampia

polarisaatiofunktioita, kirjoitetaan ne tähden sijasta näkyviin sulkulausekkeeseen. Eli tällöin esim.

6-31G* = 6-31G(d). Tällä systeemillä on helppo ilmaista useammat polarisaatiofunktiot, esim. 6-

31G(3d2fg,2pd), joka tarkoittaa, että raskaille atomeille on lisätty kolme d-, kaksi f- ja yksi g-

funktio.

Diffuusiofunktiot

Anioneilla tai elektronegatiivisilla atomeilla elektronien varaustiheys ulottuu tavanomaista

kauemmas atomista. GTO-funktiot kuitenkin vaimenevat etäisyyden kasvaessa kohti nollaa edellä

esitetyillä kantajoukoilla ei pystytä kuvaamaan tilannetta riittävän hyvin kaukana atomista.

Tällaisen tilanteen korjaamiseen käytetään ns. diffuusiofunktioita. Diffuusiofunktiot ovat tavallisesti

56

GTO-tyypin funktioita, joiden eksponentti on paljon pienempi (nyrkkisääntönä noin neljäsosa

pienimmästä kantajoukon :sta) kuin muilla kantajoukon GTO-funktioilla. Tällöin GTO-funktion

muoto siis levenee ja se tuo lisää joustavuutta kantajoukkoon kuvaamaan varaustiheyttä kaukana

atomista. Sanotaan, että kantajoukko on augmentoitu (augmented) diffuusiofunktioilla. Tämä

merkitään Poplen kantajoukkoihin plus-merkillä. Esim. 6-31+G(d) tarkoittaa, että raskaat atomit on

augmentoitu yhdellä s- ja yhdellä p-funktiojoukolla. Toinen plus-merkki tarkoittaa diffuusien s-

funktioiden lisäämistä vedyille, esim 6-311++G(3df,2pd).

Dunningin kantajoukoissa cc-pVnZ diffuusiofunktiot merkitään etuliitteellä aug-. Näissä

diffuusiofunktiot lisätään kullekin sivukvanttiluvun kuvaamalle orbitaalille. Esimerkiksi merkintä

aug-cc-pVTZ tarkoittaa, että diffuusiofunktiot on lisätty raskaiden atomien f-, d-, p- ja s-funktioille

sekä kevyiden atomien d-, p- ja s-funktioille.

Erityisesti laskettaessa happamuuksia ja elektroniaffiniteettejä diffuusiofunktiot ovat

välttämättömiä. Esimerkiksi vetyfluoridin happamuus lisääntyy energiatermein ( G = RT lnK)

noin 180 kJ mol 1, kun käytetään kantajoukkoa 6-31+G(d) kantajoukon 6-31G(d) sijasta.

8.2. Open-shell -systeemit

Vaikkei asiaa ole erikseen korostetukaan, luvun 6 molekyyliorbitaaliteoreettinen käsittely on tehty

olettaen molekyyliorbitaalit pareittain miehitetyiksi, eli kullakin orbitaalilla on joko nolla tai kaksi

elektronia. Tällaista systeemiä sanotaan closed-shell -systeemiksi. Luvun 6 käsittely pätee kaikille

”tavallisille” molekyyleille. On kuitenkin poikkeuksia, joissa molekyyleillä on parittomasti

miehitettyjä orbitaaleja, esimerkiksi radikaalit. Tällaisia molekyylejä, joissa on yhden elektronin

sisältävä orbitaali, kutsutaan open-shell -systeemeiksi.

Luvun 6 HF-teoriaa kutsutaan rajoitetuksi Hartree-Fock (RHF, restricted HF) teoriaksi. Esimerkiksi

radikaalien käsittelyssä on käytettävä tästä muokattuja teorioita. Ensimmäinen on ns. rajoitettu

open-shell HF-teoria eli ROHF-teoria. Tämä teoria ei kuitenkaan käsittele spiniä oikein ja antaa

ristiriitaisia tuloksia mm. kokeellisien elektronin spinresonanssimittauksien kanssa. HF-teoriaa

voidaan muokata myös siten, että käsitellään parittoman elektronin spinit täysin erillisinä toisistaan.

Käsittely johtaa hieman erilaiseen Fockin matriisiin ja ns. rajoittamattomaan (unrestricted) HF-

teoriaan eli UHF-teoriaan. Tällä kurssilla ei mennä UHF-teoriaan sen syvemmin. Tarkoituksena oli

57

tuoda esiin, että kaikkiin tapauksiin käsittelemämme HF-teoria ei sovellu. Esimerkiksi NMR:stä

tuttujen J-kytkentävakioiden laskuissa on käytettävä UHF-teoriaa. UHF-teoria kaksinkertaistaa

laskenta-ajat HF-teoriaan verrattuna.

8.3. Huomioita laskenta-ajoista

Toistaiseksi on korostettu sitä, että ab initio HF-teoria skaalautuu muodollisesti N4:ään, eli neljän

indeksin integraaleja tulee laskettavaksi N4 kappaletta, missä N on kantajoukon koko. Usein tilanne

ei ole kuitenkaan aivan näin paha, vaan laskentaa voidaan tehostaa.

Aiemmin oli tapana laskea tarpeelliset integraalit, tallentaa ne tietokoneelle ja käyttää niitä aina

tarvittaessa, sillä useita Fockin matriisin integraaleista tarvitaan useaan otteeseen. Nykyaikaiset

tietokoneprosessorit ovat kuitenkin niin nopeita, että on laskentatehollisesti kannattavampaa laskea

jokainen integraali sitä mukaa kun se tulee vastaan, vaikka sama integraali olisi laskettu jo aiemmin.

Toisinsanoen integraalien tuloksia ei kannata tallentaa lainkaan, koska tallennus on hitaampaa kuin

uudelleenlaskeminen. Tällaista laskentatapaa kutsutaan suoraksi SCF:ksi (direct SCF).

Eräs laskuja oleellisesti nopeuttava seikka on se, että integraalien suuruuksille voidaan laskea

yläraja hyvinkin nopeasti. Tällöin esimerkiksi neljän indeksin integraaleille voidaan asettaa jokin

tietty raja, jonka jälkeen integraalia ei enää lasketa tarkasti, vaan se arvioidaan tasan nollaksi.

Suurissa molekyyleissä on tällaisia integraaleja hyvin paljon, sillä jos kantafunktiot ovat kaukana

toisistaan on helppo kuvitella integraalin olevan erittäin pieni.

Laskenta-aikaa HF-teoreettisessa geometriaoptimoinnissa pienentää huomattavasti se, että rakenne

on alustavasti optimoitu jo kohtuullisen hyväksi jollakin kevyemmällä menetelmällä, esim.

molekyylimekaniikan tai semiempiiristen menetelmien avulla. Lisäksi molekyylin mahdollinen

symmetria, otettaessa se huomioon, saattaa nopeuttaa laskenta-aikaa hyvinkin paljon, koska se

rajoittaa molekyylin vapausasteiden lukumäärää.

8.4. Ab initio HF-teorian antamat tulokset

Seuraavassa lyhyesti ab initio HF-teorian antamien tulosten luotettavuudesta. Kattavampi vertailu

eri menetelmien tarkkuudesta tehdään, kun DFT-menetelmät on esitetty luvussa 10.

58

Energetiikka

Kuten aiemmin mainittu, HF-teorian energia-arvot ovat lähtökohtaisesti virheellisiä johtuen

elektronikorrelaation osuudesta. Tämän vuoksi HF-energioita voidaan käyttää vain energioiden

vertailuun samankaltaisilla systeemeillä kuten konformeereillä.

Reaktioille, joissa elektronien lukumäärä muuttuu, energia-arvot eivät ole vertailukelpoisia. Myös

reaktioille, joissa sidostyypit oleellisesti muuttuvat HF-menetelmien energiat eivät anna kovinkaan

luotettavia tuloksia. Esimerkiksi ilmakehässä tapahtuvalle reaktiolle: CO + HO· H· + CO2 on

kokeellisesti saatu reaktioentalpiaksi 96 kJ mol 1. HF-teoria antaa eri kantajoukoilla seuraavat

tulokset: STO-3G: +143 kJ mol 1, 3-21G: +13 kJ mol 1, 6-31G(d,p): 24 kJ mol 1, joten tuloksia ei

voi pitää kovinkaan hyvinä.

Tilanne kuitenkin paranee, kun vertaillaan konformationaalisia energioita. Esimerkiksi 1995

suoritetussa tutkimuksessa 35 orgaanisen yhdisteen konformaatiotasapainon energioissa havaittiin

keskimääräiseksi virheeksi HF/6-31+G(d,p) menetelmällä 2,5 kJ mol 1, mikä on jo melko pieni.

Vastaavan suuruusluokan keskimääräisiä virheitä on havaittu myös HF/6-31G(d)-menetelmällä.

Tarkasteltaessa glukoosin konformaatioita havaitaan HF/cc-pVDZ-menetelmän antavan oikein

hyviä tuloksia keskivirheen ollessa n. 0,4 kJ mol 1.

Geometria

HF-menetelmät antavat melko hyviä minimienergiarakenteita jo melko pienilläkin kantajoukoilla.

HF/cc-pVDZ-menetelmän keskimääräisiksi virheiksi on arvioitu raskaiden atomien sidospituuksissa

n. 0,03 Å, vedyn ja raskaan atomin sidospituudessa n. 0,015 Å ja sidoskulmissa n. 1,5°. Myös

torsiokulmille saadaan hyvin ennustettuja arvoja.

9. ELEKTRONIKORRELAATIO

Aiemmissa luvuissa on viitattu useaan otteeseen elektronikorrelaatioon ja siihen, että HF-teoria ei

huomioi elektronikorrelaatiota. Elektronikorrelaatioksi kutsutaan siis sitä energiaeroa, joka on

eksaktin Schrödingerin yhtälön antaman energian ja HF-rajan (eli HF-teorian mukaisen energian

äärettömällä kantajoukolla) energian välillä (vrt. s. 48). HF-teoria aiheuttaa virhettä yhden

elektronin operaattorin luonteensa johdosta. Varsinainen Hamiltonin operaattori on ns. monen

59

elektronin operaattori, mutta HF-teoriassa käytetty Fockin operaattori on yhden elektronin

operaattori, jossa elektronien vuorovaikutus muihin perustuu siihen miten elektroni kokee muiden

elektronien synnyttämän keskimääräisen sähkökentän.

Mistä elektronikorrelaatio pääasiassa aiheutuu? Mikä on se virhe, jonka HF-teorian keskimääräisen

kentän oletus aiheuttaa? Virhettä voi olla periaatteessa kahdenlaista. Yleisin virhe aiheutuu ns.

dynaamisesta elektronikorrelaatiosta, mikä tarkoittaa, että HF-teoria ei huomioi elektronien liikettä

toisiinsa nähden. Elektronit ovat jatkuvassa liikkeessä ja niiden liikkeeseen vaikuttaa jokaisen toisen

elektronin liikkuminen. Tämän lisäksi virhettä voi syntyä epä-dynaamisesta elektronikorrelaatiosta.

Tällainen tilanne tapahtuu, jos molekyylillä on kaksi sellaista molekyyliorbitaalia, jotka ovat

energialtaan hyvin samanlaisia (degeneroituja) ja sellaisia, että niille pitäisi vielä sijoittaa kaksi

elektronia (eli energialtaan korkeimpia miehitettyjä orbitaaleja). Tällöin lähtemällä liikkeelle

Slaterin determinantin mukaisesta aaltofunktiosta HF-SCF laskelmalla päädytään jompaan kumpaan

näistä orbitaaleista.

Miten elektronikorrelaatio voidaan sitten huomioida laskuissa? On luonnollinen tapa ajatella, että

paremmin eksaktia aaltofunktiota kuvaava aaltofunktio pystyttäisiin rakentamaan (jälleen kerran)

lineaarikombinaatiosta. Koska Slaterin determinantti on HF-teorian mukaan osoittautunut melko

hyväksi lähtökohdaksi molekyylin aaltofunktion kuvaamiseen, voi ajatella vielä paremman

aaltofunktion olevan sellainen, joka koostuu useista determinanteista eli toisinsanoen on muotoa

= c0 HF + c1 1 + c2 2 + ..., (9.1)

missä ensimmäinen determinantti on HF-teorian mukainen Slaterin determinantti ja toiset jotain

muita determinantteja. On osoittautunut, että jos elektronikorrelaatio on dynaaminen, kaavan (9.1)

mukaisessa kehitelmässä HF-osaa vastaava kerroin c0 on huomattavasti suurempi kuin muut ci:t.

Degeneroituneiden energioiden tapauksessa saadaan useampia likimäärin yhtäsuuria c-kertoimia.

Seuraavaksi käsitellään lyhyesti muutamia yleisimpiä elektronikorrelaatiomenetelmiä ja niiden

perusideoita. Käsittely on kvalitatiivinen, sillä elektronikorrelaatiomenetelmien teoria on

matemaattisesti melko monimutkainen ja menee yli tämän kurssin tarkoituksen.

Elektronikorrelaatiomenetelmiä ei ole kuitenkaan syytä sivuuttaa, sillä ne ovat nykypäivinä

tarkimpia, joskin myös raskaimpia, olemassaolevia menetelmiä molekyylimallinnuksessa.

60

9.1. Configuration interaction

Ensimmäisenä esitetään ns. configuration interaction (konfiguraatiovuorovaikutus) eli CI-

menetelmä. Siinä molekyylin aaltofunktio esitetään lausekkeen (9.1) kaltaisesti muodossa

CI = a0 HF +. .mieh

i

virt

r

ri

ria +

. .mieh

ji

virt

sr

rsij

rsija + ..., (9.2)

missä i ja j ovat miehitettyjä orbitaaleja ja r ja s ns. virtuaalisia orbitaaleja (= virittyneitä tiloja =

virittyneitä Slaterin determinantteja). Ensimmäinen summatermi sisältää kaikki yksinkertaisesti

virittyneet (single excitations) tilat, toinen kaikki kaksinkertaisesti virittyneet (double excitations)

jne. On osoitettu, että yhtälön (9.2) mukainen molekyyliorbitaali on eksakti ratkaisu Schrödingerin

yhtälöön, jos kaikki mahdolliset virittyneet tilat otetaan huomioon, ja laskuissa käytetään ääretöntä

kantajoukkoa. Menetelmää, jossa otetaan huomioon kaikki erilaiset tavat eli konfiguraatiot, joilla

elektronit voivat olla virittyneet, sanotaan ns. full-CI-menetelmäksi. Eli full-CI-menetelmä

äärettömällä kantajoukolla antaa siis eksaktin ratkaisun. Valitettavasti se ei ole vain laskennallisesti

mahdollinen. Mahdolliset elektronien konfiguraatiot saadaan kaavalla

Nkonf = )!1()!()!1(!)!1(!

mnmnmmnn , (9.3)

missä n on kantafunktioiden lukumäärä ja m elektroniparien lukumäärä. Esimerkiksi, jos ajatellaan

käytettävän 6-311G** kantajoukkoa bentseenille, saadaan m = 21 ja n = 144. Tämä antaa

konfiguraatioiden määräksi n. 5 · 1050, joten full-CI-lasku on käytännössä täysin mahdoton. Yhtälön

(9.2) mukainen summa on siis katkaistava. Ns. CIS-menetelmä (CI Singles) ottaa huomioon vain

kertaalleen virittyneet tilat eli ensimmäisen summalausekkeen. Jos huomioon otetaan molemmat

summalausekkeet, saadaan menetelmä CISD (CI Singles and Doubles). Saman periaatteen

mukaisesti saadaan esim. neljä ensimmäistä summatermiä huomioiva menetelmä CISDTQ tai

menetelmä, joka huomioi pelkästään toisen summalausekkeen CID.

9.2. Coupled Cluster

Coupled cluster –menetelmä perustuu ajatukseen, että molekyylin aaltofunktio voidaan kirjoittaa

muodossa

CC = exp(T) HF, (9.4)

missä T on ns. klusterioperaattori ja koostuu summasta T1 + T2 + ... +Tn, jossa n on elektronien

lukumäärä. Operaattorin eksponenttifunktio ajatellaan tässä muodostuvan eksponenttifunktion

sarjakehitelmän avulla (sillä matemaattisesti operaattori eksponenttina ei ole mitenkään itsestään

selvä käsite...). Operaattori T muuttaa miehitettyjä orbitaaleja virtuaalisiksi orbitaaleiksi.

Esimerkiksi T1 tekee kaikki yksinkertaisesti virittyneet muutokset (singly excited, kuten edelläkin),

61

T2 kaksinkertaisesti virittyneet jne. Täten siis esimerkiksi operaattori T2 operoi aaltofunktioon

tavalla

T2 HF =. .mieh

ji

virt

sr

rsij

rsijt , (9.5)

mikä vastaa CI-menetelmän doubles-summaa. Selvitettävänä tässä on siis kertoimet t. Vastaavalla

tavalla kuin edellä, otetaan summaoperaattoriin T mukaan yleensä vain muutamia alkupään

operaattoreita ja päädytään menetelmiin kuten CCSD tai CCSDT jne.

9.3. Multiconfiguration SCF

Tämä ns. MCSCF-menetelmä on samantapainen kuin CI-menetelmä. CI-menetelmän eräs ongelma

on, että HF-SCF-menetelmä kuvaa hyvin miehitettyjä orbitaaleja, mutta ei virtuaalisia orbitaaleja.

MCSCF-menetelmässä käytetään SCF-menetelmää kaavan (9.1) mukaiseen summalausekkeeseen,

jossa aaltofunktio on esitetty Slaterin determinattien lineaarikombinaationa. Tällainen

”moniulotteinen” iteraatiomenetelmä vaatii käyttäjältä varovaisuutta ja perehtyneisyyttä, sillä

iteraatiossa saatetaan usein päätyä kemiallisesti epätodellisiin minimeihin ja ne on kyettävä

erottamaan oikeista minimeistä.

9.4. Møller-Plesset häiriöteoria

Viimeisenä elektronikorrelaatiomenetelmänä esitetään ns. Møller-Plesset eli MP-menetelmä.

Fysiikassa on usein tapana esittää jokin ilmiö, joka on melko pieni varsinaiseen suureeseen

verrattuna ns. häiriönä. Häiriöteoria (perturbation theory) on yleinen matemaattinen teoria, jota

voidaan soveltaa moniin tilanteisiin. Møller ja Plesset esittivät miten elektronikorrelaation osuus

voidaan ajatella häiriötermiksi HF-teorian mukaisen Hamiltonin operaattorin rinnalla. Toisinsanoen

he lähtivät liikkeelle oletuksesta, että Schrödingerin yhtälön mukainen eksakti Hamiltonin

operaattori voidaan esittää muodossa

H = H0 + H1, (9.6)

missä jälkimmäinen termi on ns. häiriötermi. Häiriöteoriassa on ominaisuutena, että häiriö voidaan

käsitellä tietyn kertaluvun häiriönä. Mitä suurempi on kertaluku, sitä tarkempi on tulos, mutta laskut

muuttuvat aina monimutkaisemmiksi. Sovellettaessa häiriöteoriaa HF-teoriaan osoittautuu

ensimmäisen kertaluvun häiriöteoreettinen käsittely antavan identtisen tuloksen HF-teorian kanssa.

Toisen kertaluvun häiriöteoreettista käsittelyä kutsutaan MP2-menetelmäksi, kolmannen MP3 jne.

Häiriöteorian kertaluvun kasvaessa kasvaa myös vaadittava laskenta-aika. Kun HF-teoria

skaalautuu kantafunktioiden määrän suhteen neljänteen potenssiin, on vastaava luku MP2-

menetelmässä 5, MP3-menetelmässä 6 jne, joten laskelmat pitenevät joka askeleella kertaluvulla.

62

MPn-teorian antamien energioiden on havaittu suppenevan kohti tiettyä arvoa kun n kasvaa, mutta

ei ole todistettu onko tuo arvo todellinen Schrödingerin yhtälön mukainen eksakti energia.

Yleisesti ottaen voidaan sanoa, että elektronikorrelaatiomenetelmät antavat parempia tuloksia kuin

pelkkä HF-SCF-teoria. Haittana on, että elektronikorrelaatiomenetelmät ovat laskennallisesti hyvin

raskaita. Seuraava likimääräinen järjestys kuvaa menetelmien raskautta:

HF < MP2 ~ MP3 ~ CCD < CISD < CCSD < MP4 < CCSDT.

Eräs tapa saavuttaa HF-teoriaa parempia tuloksia joutumatta kuitenkaan hyvin raskaisiin laskuihin

on käyttää elektronien tiheysfunktionaaliteoriaa. Tähän nykyään suurinta suosiota laskennallisessa

kemiassa nauttivaan menetelmään perehdymme seuraavaksi.

10. TIHEYSFUNKTIONAALITEORIA

Cramerin kirja aloittaa tiheysfunktionaaliteoriasta kertovan luvun lauseella:”What a strange and

complicated beast a wave function is.” Kuten aiemmin on todettu, aaltofunktio on vaikeasti

havainnollistettavissa oleva funktio, jota on hankalaa ajatella intuitiivisesti. Lisäksi aaltofunktio on

hyvin monen muuttujan funktio, sillä Bornin ja Oppenheimerin mukainen elektroninen aaltofunktio

riippuu systeemin kunkin elektronin paikasta ja spinistä. Aaltofunktio on siis itseasiassa 4N

muuttujan funktio, missä N on systeemin elektonien lukumäärä, joka suuremmissa molekyyleissä ei

ole aivan pieni luku. Lisäksi aaltofunktion dimensio on vähintäänkin erikoinen, sillä aaltofunktion

neliöhän kuvaa tunnetusti todennäköisyystiheyttä, eli todennäköisyyttä per tilavuusyksikkö, esim

m3. Tästä voidaan päätellä, että aaltofunktion yksikkö on m 3/2. Voidaankin oikeutetusti kysyä, eikö

olisi jotain hieman konkreettisempaa ja yksinkertaisempaa suuretta, jonka avulla voisimme

määrittää systeemin energian ja sitä kautta systeemin muut halutut ominaisuudet?

Vastaus edelliseen kysymykseen on myönteinen. Tällainen suure on elektronitiheys , joka kuvaa

nimensä mukaisesti elektronien määrää tilavuusyksikössä. Tällöin elektronitiheys on molekyylin

koosta sekä atomien ja elektronien lukumäärästä riippumatta aina ainoastaan kolmen muuttujan (=

paikan) funktio, eli = (x,y,z) = (r). Lisäksi elektronitiheys on paljon helpommin

havainnollistettavissa oleva suure kuin aaltofunktio. Elektronitiheys voidaan määrittää jopa

kokeellisesti röntgendiffraktiomittausten avulla.

63

Se, että elektronitiheys on sellainen suure, jonka avulla voimme lausua systeemin energian, ei ole

mitenkään itsestään selvää. Schrödingerin yhtälön mukaisesti energia saadaan Hamiltonin

operaattorin ominaisarvona. Tällöin voidaan ajatella, että jos voimme rakentaa Hamiltonin

operaattorin elektronitiheyden avulla, pystymme määrittämään myös energian. Kun mietitään mitä

tietoja tarvitaan Hamiltonin operaattorin (ks. yhtälö 6.13) kirjoittamiseksi, on tunnettava ainoastaan

ytimien paikat ja varaukset sekä elektronien lukumäärä. Viimeisin saadaan lausuttua

elektronitiheyden avulla helposti, sillä elektronien kokonaismäärä on luonnollisesti elektronien

tiheyden integraali koko avaruuden yli:

N = rr d)( . (10.1)

Lisäksi ytimien paikat on helposti saatavissa elektronitiheydestä, sillä ne vastaavat

elektronitiheyden lokaaleja maksimikohtia (negatiiviset elektronit ovat mielellään positiivisen

ytimen lähistöllä). Tällöin jää pohdittavaksi vielä ytimien varaus. Voidaan kuitenkin osoittaa, että

)(2)(

0AA

rA

A rZrr

A

, (10.2)

missä ZA on ytimen A varausluku ja rA radiaalinen etäisyys ytimestä A. on puolestaan

keskimääräinen säteittäinen varaustiheys. Lausekkeen matemaattista muotoa oleellisempaa on tässä

yhteydessä se, että ytimien kohdalla elektronitiheys sisältää tietoa ytimien varauksista. Tällöin siis

elektronitiheyden avulla pystytään määrittämään kaikki ne suureet, jotka tarvitaan Hamiltonin

operaattorin kirjoittamiseksi. Tämä ei vielä sinänsä auta millään tavalla tilannettamme, sillä se, että

kirjoittaisimme Hamiltonin operaattorin elektronitiheyden avulla johtaisi edelleen tekemisiin

Schrödingerin yhtälön ja aaltofunktion kanssa, mitä haluaisimme lähtökohtaisesti välttää. Oleellinen

tulos on se, että elektronitiheys näyttäisi olevan suure, jota kannattaa miettiä paremminkin, koska se

on yksinkertainen ja sen avulla päästään periaatteessa kiinni molekyylin energiaan Hamiltonin

operaattorin kautta.

Seuraavaksi alamme miettiä miten saisimme energian lausuttua elektronitiheyden avulla. Toisin

sanoen etsimme lauseketta E, joka riippuu elektronitiheydestä ja antaa tuloksena systeemin

energian. Tämä merkitään yleensä tavalla:

E [ (r)] = molekyylin energia. (10.3)

Matematiikassa funktio on otus, joka muuttaa jonkin tavallisen luvun toiseksi luvuksi (esimerkiksi

sini). Operaattori on puolestaan sellainen, joka muuttaa funktioita toisiksi funktioiksi (esimerkiksi

derivointi). Lausekkeen (10.3) E ei ole näistä kumpaakaan, sillä se muuttaa funktion

(elektronitiheyden) tavalliseksi luvuksi (energiaksi). Matemaattisesti tällaista veijaria kutsutaan

64

funktionaaliksi ja se merkitään kaavan (10.3) tavoin hakasulkulausekkeena. Tästä tulee nimi

tiheysfunktionaaliteoria eli DFT (density functional theory). Toisinsanoen alamme siis seuraavaksi

miettiä minkälainen tiheysfunktionaali antaisi meille molekyylin energian.

10.1. Tiheysfunktionaaliteorian ensiaskeleita

Energia voidaan jakaa liike-energiaksi (T) ja potentiaalienergiaksi (V), eli E = T + V. Jos aluksi

ajatellaan molekyyliä klassisen mekaniikan mukaisesti, voidaan potentiaalienergia lausua helposti

elektronitiheyden avulla kaavoilla

Vne[ (r)] =ytimet

k k

k dZ rrrr

)( (10.4)

ja

Vee[ (r)] =21

2121

21 )()( rrrr

rr dd , (10.5)

missä ensimmäinen termi kuvaa ytimien ja elektronien välistä vetovoimaa ja jälkimmäinen

elektronien välistä hylkimisvoimaa. Elektronien lausekkeissa tarvitaan integraalit, koska

elektronitiheys on jatkuva funktio. Ytimillä riittää summa, koska ytimet ajatellaan kiinnitetyksi

”verkostoksi”. Jälkimmäisen termin kerroin ½ tulee siitä, ettei elektronien hylkimisvoimaa

laskettaisi kahteen kertaan (vrt. esim. yhtälö 6.3).

Liike-energia on potentiaalienergiaa hankalammin lausuttavissa (r):n avulla. Ensimmäisen

yrityksen kuvata liike-energiaa tekivät Thomas ja Fermi jo vuonna 1927. (Onkin huomattavaa, että

elektronitiheyden käyttöä energian määritykseen käsiteltiin jo samoihin aikoihin kun

kvanttimekaniikan kehitys oli kuumimmillaan.) Thomas ja Fermi tarkastelivat kuvitteellista ainetta,

”jelliumia”, joka sisältää äärettömän määrän elektroneja. Elektronit liikkuvat äärettömässä

tilavuudessa, jossa on tasaisesti jakautunut positiivinen varaus (eli positiivinen varaus ei ole

keskittynyt erillisiin hiukkasiin, ytimiin, kuten tavallisesti). ”Jelliumia” kutsutaan myös tasaiseksi

elektronikaasuksi (uniform electron gas). He johtivat kyseiselle aineelle fermionien statististisen

mekaniikan avulla liike-energian lausekkeeksi

Tueg[ (r)] = rr d35

32

2 )()3(103 . (10.6)

Tätä lauseketta em. potentiaalienergialausekkeiden kera voidaan pitää ensimmäisenä

tiheysfunktionaaliteoreettisena menetelmänä. Niissä energia on lausuttu puhtaasti elektronitiheyden

avulla ilman minkäänlaista yhteyttä aaltofunktioon. Thomas Fermi –yhtälöillä on tässä lähinnä

historiallinen merkitys. Kemian kannalta yhtälöt ovat aivan liian karkeat kuvaamaan molekyyliä;

65

itseasiassa niistä saadaan tulokseksi, että molekyylien muodostuminen ei ole energeettisesti

mahdollista, vaan atomien on suotuisinta pysyä yksittäisinä atomeina.

Yksi suuri puute Thomas Fermi –mallissa on elektronien välisen vuorovaikutuksen kuvaaminen.

Mallissa kuvaaminen on tehty ainoastaan yhtälön (10.5) klassisen mekaniikan mukaisella

lausekkeella, joka jättää huomioimatta kvanttimekaaniset ilmiöt: korrelaation ja vaihdon. Usein

lausekkeeseen (10.5) lisätään termi, jossa on mukana ns. aukkofunktio (hole function), jonka

tarkoituksena on korjata elektronien välistä potentiaalienergiaa siten, että se huomioi

kvanttimekaaniset ominaisuudet. Huom. Tässä mainittu vaihtovuorovaikutus on sama ilmiö, joka

havaittiin aikaisemmin Slaterin determinantin yhteydessä (vrt. yhtälö 6.33). Vaihtotermi aiheutti

Fermin aukon elektronien lähistölle. Lisäksi on olemassa ns. Coulombin aukko, joka on

kvanttimekaaninen ilmiö, jota luvun 6 HF-teoria ei sisällä. Tämän ilmiön osuutta kutsutaan DFT:ssä

korrelaatiotermin avulla. Coulombin aukon huomiotta jättäminen aiheuttaa osaltaan HF-teorian

elektronikorrelaatiovirheen. Fermin ja Coulombin aukot pyritään kuvaamaan em. aukkofunktion

avulla. Slater otti ensimmäisenä mukaan elektronien vuorovaikutuksesta aiheutuvan korjaustermin.

Hän tuli tulokseen, että vaihtotermi (Fermin aukon suuruus) on huomattavasti suurempi kuin

korrelaatiotermi (Coulombin aukon suuruus) ja jätti täten jälkimmäisen huomiotta. Hän esitti

vaihtoenergialle Ex lausekkeen

Ex[ (r)] = rr d34

31

)()3(8

9 , (10.7)

jossa parametri on 1. Aiemmin Bloch ja Dirac olivat johtaneet samanlaisen lausekkeen tasaiselle

elektronikaasulle, jossa oli 2/3. Yhtälön (10.7) mukaisen lausekkeen lisäämistä edellisiin

kutsutaan Thomas Fermi Dirac mallina. Vaihtoenergian parametrin vuoksi näiden yhtälöiden

laskelmia kutsutaan tavallisesti X laskuiksi. Näilläkin laskuilla on nykypäivinä lähinnä vain

historiallinen merkitys.

10.2. Hohenbergin ja Kohnin teoreemat

Edellä kuvattuja tuloksia käytettiin aikoinaan lähinnä kiinteän olomuodon fysiikassa. Niiden suuret

virheet tekivät ne käyttökelvottomiksi molekyylien laskemiseen. Varsinaisen

tiheysfunktionaaliteorian voidaankin katsoa alkaneen vuonna 1964, kun Hohenberg ja Kohn

esittivät ja todistivat kaksi teoreemaa, jotka mullistivat DFT:n ja toivat sen osaksi kvanttikemiallista

koneistoa.

66

Hohenberg Kohnin olemassaoloteoreema (The Hohenberg Kohn Existence Theorem)

DFT:ssä elektronit vuorovaikuttavat sekä toistensa että ns. ulkoisen potentiaalin kanssa. Ulkoiseksi

potentiaaliksi kutsutaan ytimien aiheuttamaa positiivista elektroneja puoleensavetävää potentiaalia.

Esim. edellisessä jelliumissa ulkoinen potentiaali oli tasaisesti jakaantuneesta vakioisesta

varauksesta aiheutuva potentiaali. Hohenberg-Kohnin olemassaoloteoreeman mukaan systeemin

perustilan elektronitiheys määrää yksikäsitteisesti Hamiltonin operaattorin ja täten myös systeemin

energian ja muut ominaisuudet. Jo aiemmin näimme, että pystymme konstruoimaan systeemin

Hamiltonin operaattorin elektronitiheyden avulla. Tällöin teoreemasta jää todistettavaksi, että

perustilan elektronitiheys määrää yksikäsitteisesti ulkoisen potentiaalin, joka tarvitaan Hamiltonin

operaattorin muodostamiseen. Todistus on melko helppo, lähtien vastaoletuksesta, mutta se

sivuutetaan kuitenkin tässä. Se löytyy esim. Cramerin kirjasta sivulta 237.

Hohenberg Kohnin variaatioteoreema (The Hohenberg Kohn Variational Theorem)

Edellinen teoreema kertoi, että jos systeemin perustilan elektronitiheys on tiedossa, saadaan sen

avulla laskettua systeemin energia ja muut ominaisuudet. Se ei kuitenkaan kerro miten voidaan

päätellä onko jokin elektronitiheys juuri perustilan energiatiheys. Toisinsanoen tarvitaan jokin keino

arvioida elektronitiheyden ”hyvyyttä”. Tähän tarjoaa ratkaisun Hohenberg-Kohnin

variaatioteoreema, jonka mukaan elektronitiheys noudattaa variaatioperiaatetta, eli E[ (r)] E0.

Systeemin perustilan energiaa kuvaava funktionaali saa siis pienimmän arvonsa silloin ja vain

silloin kun elektronitiheys on systeemin todellinen perustilan elektronitiheys. Tämä teoreema

voidaan todistaa ensimmäisen avulla siten, että ensimmäisen mukaan elektronitiheys määrää

yksikäsitteisen Hamiltonin operaattorin ja tällöin myös aaltofunktion, jolloin tulos seuraa suoraan

lausekkeen (6.12) mukaisesta variaatioperiaatteesta.

Periaatteessa voimme siis kokeilla erilaisia elektronitiheyksiä ja testata niitä variaatioperiaatteen

mukaan. Tulos kertoo kuinka hyvä arvauksemme oli. Tällainen arvailu ei ole kuitenkaan kovin

tuloksellista ja järkevää. Ensinnäkin meillä ei ole järkevää keinoa parantaa arvaustamme.

Toisekseen tarkoituksemme oli välttää Schrödingerin yhtälön ratkaisemista ja aaltofunktion

laskemista, joten emme halua laskea energian odotusarvoa Hamiltonin operaattorin avulla.

Ongelmana on, että emme tunne funktionaalia. Jos tietäisimme funktionaalin, voisimme laskea

energian suoraan sen avulla sotkeutumatta aaltofunktioon. Tähän asiaan perehdymme seuraavaksi.

67

10.3. Kohn Shamin tiheysfunktionaaliteoria

Luvun 6 molekyyliorbitaaliteoriassa suurimpana vaikeutena oli elektronien välisen

vuorovaikutuksen esittäminen. Edellisten tulosten mukaan elektronitiheys määrää yksikäsitteisesti

systeemin Hamiltonin operaattorin. Jotta tilanteessa ei johduttaisi Hamiltonin operaattorin

vaikeimpaan osaan, Kohn ja Sham huomasivat 1965, että kannattaa tarkastella aluksi Hamiltonin

operaattoria toisiinsa vuorovaikuttamattomien elektronien systeemille. Tällöinhän Hamiltonin

operaattori voidaan jakaa erillisiin yhden elektronin operaattoreihin (ks. luvut 6.7 ja 6.9).

Molekyylin aaltofunktio on tällöin eksaktisti Slaterin determinantti. Kohn ja Sham keksivät ottaa

lähtökohdaksi sellaisen kuvitteellisen toisiinsa vuorovaikuttamattomien elektronien systeemin, jonka

perustilan elektronitiheys olisi täsmälleen sama kuin jollakin todellisella systeemillä, jossa

elektronit vuorovaikuttavat. Koska elektronitiheys määrää yksikäsitteisesti elektronien lukumäärän

sekä ytimien paikat ja varaukset, on nämä suureet oltava samat sekä vuorovaikuttamattomalla että

vuorovaikuttavalla systeemillä. Seuraavaksi jaetaan energian lauseke osiin seuraavasti:

E[ (r)] = Tni[ (r)] + Vne[ (r)] + Vee[ (r)] + T[ (r)] + Vee[ (r)], (10.8)

missä oikeanpuoleiset termit ovat järjestyksessä vuorovaikuttamattomien (non-interacting)

elektronien liike-energia, ytimien ja elektronien välinen potentiaalienergia, klassinen elektronien

välinen potentiaalienergia, korjaustermi vuorovaikuttavan systeemin liike-energiaan ja korjaustermi

elektronien väliseen potentiaaliin, joka huomioi kaikki ei-klassilliset vaikutukset. Yo. lausekkeen

kolme ensimmäistä termiä ovat tunnettuja ja Slaterin determinantin mukainen aaltofunktio olisi

eksakti ratkaisu niistä muodostetulle Hamiltonin operaattorille ja Schrödingerin yhtälölle. Voimme

kirjoittaa lausekkeen myös eksplisiittisemmässä muodossa Diracin merkinnöin:

E[ (r)] =N

ii

ytimet

k ki

kiiii

Zrr

2

21

+N

ii

ii dr

rrr )(

21 + Exc[ (r)]. (10.9)

Tässä aaltofunktio on Slaterin determinantin mukainen aaltofunktio. Lausekkeen 10.8 ”vaikeat”

termit on tässä yhdistetty yhdeksi vaihto korrelaatiotermiksi. Nimitys on hieman harhaanjohtava,

sillä termi sisältää paitsi vaihto- ja korrelaatiotermien osuuden myös korjauksen liike-energiaan.

Nyt voimme tehdä kuten luvussa 6.10, eli muodostaa yhden operaattorin ominaisarvoyhtälön

hiKS

i = i i , (10.10)

jossa Kohn-Sham-operaattori on muotoa

hiKS = r

rrr

rrdZ

i

ytimet

k ki

ki

)(21 2 + Vxc, (10.11)

68

missä

Vxc = xcE (10.12)

on ns. funktionaaliderivaatta. Tämän jälkeen voimme edetä täysin samoin kuin luvussa 6, eli

voimme valita jonkin kantajoukon { } ja muodostaa sekulaarideterminantin, jossa Fockin

operaattorin sijaan käytämme Kohn-Shamin matriisialkioita

K = KSh . (10.13)

Aivan kuten HF-teoriassa, elektronitiheys esiintyy jo mukana operaattorissa, joten Kohn-Sham-

yhtälöiden ratkaiseminen täytyy tehdä iteratiivisesti samanlaista itseytyvän kentän menetelmää SCF

käyttäen (vrt. kuva 6.1). Nyt on syytä pysähtyä hetkeksi ja miettiä mitä saamamme tulos tarkoittaa

ja miten sitä voitaisi käyttää.

Kuten huomattua, Kohn Sham DFT muistuttaa hyvin paljon HF-teoriaa, mutta siinä on eräs hyvin

olennainen eroavaisuus. Tähän asti johdettu DFT ei sisällä minkäänlaisia approksimaatioita, vaan

on eksakti. Käytännössä ainoa mitä pitäisi vielä tietää on Exc[ (r)]... Tähän asiaan paneudutaan

seuraavassa kappaleessa. Jos ajatellaan HF:n ja DFT:n eroja olettaen, että kantajoukon valinnasta

tulevat virheet eivät ole mukana (eli ollaan HF-rajalla), voidaan sanoa, että HF on

approksimatiivinen (ei huomioi elektronikorrelaatiota) teoria, jossa approksimatiiviset yhtälöt

pystytään ratkaisemaan eksaktisti. DFT on puolestaan eksakti teoria, mutta Kohn-Sham- tai

lyhyemmin KS-yhtälöt täytyy ratkaista approksimatiivisesti, koska Exc[ (r)]-funktionaali on

tuntematon.

10.4. Vaihto-korrelaatiofunktionaalit

Kuten mainittua, vaihto-korrelaatiofunktionaali sisältää kvanttimekaaniset korjaukset elektronien

väliseen vuorovaikutukseen. Lisäksi se sisältää myös liike-energiakorjauksen virheeseen, joka tulee

toisiinsa vuorovaikuttamattomien elektronien käsittelystä. Tämä jälkimmäinen korjaus huomioidaan

funktionaaleissa välillä aukkofunktion avulla. Tavallisemmin se jätetään kuitenkin tässä yhteydessä

huomioimatta. Kuten tullaan huomaamaan, vaihto-korrelaatiofunktionaalit sisältävät usein yhden tai

useampia kokeellisia parametreja. Tällöin kokeellisten parametrien määrityksessä tulee huomioitua

jo liike-energiakorjaus. Funktionaaleista puhuttaessa käytetään usein myös suuretta energiatiheys

xc. Se on elektronitiheyden funktionaali ja sen määritelmänä voidaan pitää yhtälöä

Exc[ (r)] = rrr dxc )()( . (10.14)

69

Local Density Approximation (LDA)

Sellaista DFT-menetelmää, joka sisältää oletuksen, että energiatiheys jossakin tietyssä paikassa

riippuu elektronitiheydestä ainoastaan juuri tuossa pisteessä, eli ns. elektronitiheyden lokaalista,

paikallisesta arvosta, kutsutaan local density approximation eli LDA-menetelmäksi. Käytännössä

tämä oletus pitää paikkaansa ainoastaan tasaiselle elektronikaasulle. Tällöin voidaankin edellä

mainitulle X menetelmälle muodostaa LDA-oletuksen mukainen lauseke elektronitiheydelle. Tällä

menetelmällä ei ole kuitenkaan suurta käytännön merkitystä, joten pitkähkön lausekkeen

eksplisiittinen muoto jätetään esittämättä. Ns. open-shell systeemeille (ks. luku 8.2) voidaan käyttää

yleistettyä LDA-menetelmää: LSDA (local spin density approximation).

Generalized Gradient Approximation (GGA)

Edellä todettiin, että LDA-menetelmä ei vastaa hyvin realistista tilannetta molekyylissä. Jotta sitä

saataisi parannettua, voidaan tehdä sellainen oletus, että energiatiheys tietyssä pisteessä riippuu

lisäksi elektronitiheyden gradientista ko. pisteessä, eli siitä miten elektronitiheys muuttuu

kyseisessä pisteessä. Tällaista menetelmää kutsutaan gradienttikorjatuksi tai generalized gradient

approximation eli GGA-menetelmäksi. Kyseisen menetelmän voi pukea matemaattiseen muotoon

seuraavasti:

)(/ rGGAcx = )(/ rLDA

cx +34/

)(

)(

r

rcx , (10.15)

jossa merkintä x/c tarkoittaa, että yhtälöä voidaan käyttää joko vaihto- tai korrelaatiokorjaukselle.

Tunnetuin ja yleisimmin käytetty GGA vaihtofunktionaali on Becken 1988 kehittämä ”B”. B

sisältää yhden kokeellisen parametrin, joka on optimoitu kuuden jalokaasun (heliumista radoniin),

tunnettujen vaihtoenergioiden avulla. Muita samankaltaisia funktionaaleja ovat esimerkiksi PW

(Burke, Perdew ja Wang, 1998) ja mPW (Adamo ja Barone, 1998). Myös sellaisia

vaihtofunktionaaleja, jotka eivät sisällä kokeellisia parametreja, on kehitetty. Tunnetuimpia

tällaisista ovat B86 (Becke, 1986), P (Perdew ja Wang, 1986) ja PBE (Perdew, Burke ja Ernzerhof,

1996-1997).

Korrelaatiotermin osuus on yleensä selvästi pienempi (tavallisesti noin kertaluvun tai kaksi) kuin

vaihtotermin. Tunnetuimpia gradienttikorjattuja korrelaatiofunktionaaleja ovat P86 (Perdew, 1986),

PW91 (Perdew ja Wang, 1992) ja B95 (Becke 1996). Näistä P86 sisältää yhden neon-atomin avulla

optimoidun parametrin ja jälkimmäiset eivät sisällä kokeellisia parametreja. Toinen hyvin tunnettu

70

korrelaatiofunktionaali on LYP (Lee, Young ja Parr, 1988). Se eroaa aiemmista siinä, että se ei yritä

korjata LDA lauseketta gradienttikorjauksella (kuten lausekkeessa 10.15), vaan laskee suoraan koko

korrelaatiotermin. LYP sisältää neljä parametria, jotka on optimoitu helium-atomin avulla.

Tavallisesti vaihto-korrelaatiofunktionaalit annetaan liittämällä yhteen jokin vaihto-osa ja

korrelaatio-osa. Esimerkiksi merkintä BLYP tarkoittaa Becken vaihtofunktionaalin ja LYP-

korrelaatiofunktionaalin käyttämistä. Ylivoimaisesti eniten käytettyjä kombinaatioita ovat BLYP,

BP86 ja BPW91, joista BLYP lienee se eniten käytetty vaihtoehto.

Hybridifunktionaalit

Kuvitellaan, että pystyisimme säätelemään elektronien välistä vuorovaikutusta systeemissämme

jatkuvasti. Oletetaan, että parametri kuvaa vuorovaikutuksen suuruutta. Kun = 0, elektronit

eivät vuorovaikuta ja systeemi on sama kuin kuvitteellinen systeemi KS-SCF-menetelmää

johdettaessa ja sille on olemassa eksakti HF-teorian mukainen ratkaisu. Kun = 1, on kyseessä

reaalinen systeemi, jossa vuorovaikutus on huomioitu kokonaisuudessaan. Tällöin voidaan osoittaa

ns. Hellmann Feynman teoreeman avulla, että vaihtokorrelaatio saadaan kaavasta

Exc = dxc

1

0

)()()( V . (10.16)

Em. integraalia ei pystytä laskemaan, mutta sitä voidaan yrittää arvioida. Lähtöpisteessä tilanne

vastaa HF-teorian mukaista tilannetta, joka voidaan ratkaista. Merkitään tätä energiaa ExcHF.

Päätepisteen energiaa ei pystytä ratkaisemaan suoraan, mutta se voidaan arvioita valitsemalla jokin

em. funktionaaleista. Tällöin ensimmäisenä approksimaationa koko vaihtokorrelaatioenergian

osuudeksi voidaan kirjoittaa (ajattele integraalia pinta-aloina)

Exc = ExcHF + z(Exc

DFT ExcHF), (10.17)

missä parametri z kuvaa minkälaisen osuuden pinta-alasta käyrä peittää.

Tällaista lähestymistapaa kutsutaan myös adiabaattiseksi liittämismenetelmäksi (adiabatic

connection method, ACM), koska siinä liitetään jatkuvalla tavalla kuvitteellinen systeemi

todelliseen vuorovaikuttavaan systeemiin. Edellisen lausekkeen tulosta voidaan parantaa lisäämällä

joitakin kokeellisia parametreja. Ensimmäisen tällaisen yritelmän teki Becke vuonna 1993. Hän

käytti apunaan gradienttikorjattuja B- ja PW91-funktionaaleja. Lauseke on muotoa

ExcB3PW91 = (1 a)Ex

LSDA + aExHF + b Ex

B + EcLSDA + cEc

PW91, (10.18)

jossa parametrit a, b ja c ovat kokeellisesti optimoituja ja arvoiltaan 0,20, 0,72 ja 0,81. Numero 3

menetelmän nimessä tulee parametrien lukumäärästä. Vuonna 1994 Stevens ryhmineen muokkasi

71

em. lauseketta niin, että siinä käytettiin PW91:n sijaan LYP-funktionaalia. Tämä ns. Becken

kolmeparametrinen malli B3LYP määritellään yhtälöllä

ExcB3LYP = (1 a)Ex

LSDA + aExHF + b Ex

B + (1 c)EcLSDA + cEc

LYP, (10.19)

jossa vakioilla a, b ja c on samat lukuarvot kuin edellä. Tällä hetkellä käytössä olevista

funktionaaleista B3LYP on osoittautunut suosituimmaksi. B3LYP-funktionaalia kutsutaan

hybridifunktionaaliksi, koska se on sekoitus HF- sekä DFT-teorian mukaista vaihtovuorovaikutusta.

Myös muita hybridifunktionaaleja on olemassa ja niitä kehitetään koko ajan, mutta ainakin tällä

hetkellä B3-mallit ovat vailla todellista kilpailijaa kemiallisissa sovelluksissa. DFT on menetelmänä

kuitenkin sen verran uusi, että uusien ja parempien mallien esiintulo on vain ajan kysymys.

10.5. Huomioita DFT-menetelmistä

HF-molekyyliorbitaaliteoria vs. KS-tiheysfunktionaaliteoria

On vielä syytä korostaa, että MO-teorian mukaisessa lähestymistavassa etsitään ja optimoidaan

aaltofunktiota. DFT:ssä optimoidaan elektronitiheyttä. Vaikka lähestymistapa on monin paikoin

samanlainen, esim. SCF-iterointi, on perusajatus kuitenkin erilainen. KS-DFT-laskuillakin saadaan

funktio, jota voidaan tavallaan pitää ”aaltofunktiona” siinä mielessä, että se on analoginen HF-

teorian mukaisen aaltofunktion kanssa, mutta ei sama asia. KS-aaltofunktiota on turvallisempi pitää

puhtaasti vain matemaattisena funktiona vaikkakin sille on viime aikoina esitetty myös

kvalitatiivisia kemiallisia päätelmiä.

Laskentatehokkuus

KS-matriisin alkiot (ks. kaavat 10.11 ja 10.13) eivät sisällä samanlaisia neljän indeksin integraaleja

kuten Fockin operaattorin matriisialkiot (6.37). KS-matriisialkioiden laskeminen skaalautuu N2

integraalin laskemiseen. Tällöin KS-SCF-menetelmän pullonkaulaksi tulee matriisin

diagonalisoiminen (sekulaarideterminanttia ratkaistaessa), jonka voidaan osoittaa skaalautuvan N3

mukaisesti. Tällöin voitaisiin, a priori, sanoa, että DFT-menetelmät ovat huomattavasti nopeampia

kuin HF-SCF-laskut. Tämä ei kuitenkaan pidä paikkaansa. Kokemus osoittaa, että DFT-lasku

keskisuurella (n. 15 raskasta atomia) molekyylillä kestää noin kaksinkertaisen ajan kuin HF-lasku

samanlaisella kantajoukolla.

Suuri tekijä edellisessä on kantafunktioilla laskeminen. Kuten aiemmin on todettu, HF-

menetelmissä suosittiin gaussiaanisia GTO-funktioita nimenomaan niiden laskennallisen

helppouden takia. Niiden neljän indeksin integraalit ovat analyyttisesti ratkaistavissa. DFT:ssä näitä

integraaleja ei ole, mutta DFT:ssä käytetty KS-operaattori on jo itsessään numeerinen. Tällöin

72

integraalien numeeriselta laskemiselta ei voi DFT:ssä välttyä. Toisin sanoen DFT-laskuissa ei

saavuteta myöskään laskennallista hyötyä siitä, että käytetään gaussiaanisia kantafunktioita. Syy

miksi niin tavallisesti tehdään, on lähinnä ohjelmistotekninen. HF-SCF-menetelmä on vanhempi

kuin DFT, mutta DFT:n KS-SCF tapa on niin samanlainen kuin HF-SCF, että DFT-menetelmät on

helppo koodata ja lisätä valmiisiin ohjelmistoihin. Tästä syystä DFT-menetelmissäkin käytetään

tavallisimmin samoja gaussiaanisia kantajoukkoja kuin ab initio –menetelmissä. Eivät gaussiaaniset

funktiot mitenkään huonoja ole, mutta DFT tarjoaisi tilaisuuden käyttää myös muita

kantafunktioita. DFT:ssä voidaan käyttää esimerkiksi STO-funktioita, jolloin saadaan supistettua

kantafunktioiden lukumäärää, kun ei tarvitse sovittaa useita GTO-funktioita kuvaamaan yhtä STO-

funktiota. Lisäksi tällä saavutetaan se etu, että funktion käyttäytyminen vastaa paremmin

todellisuutta hyvin lähellä ydintä. Tämä on tärkeää esimerkiksi NMR-laskuissa. Eräs ohjelmisto,

joka käyttää yksinomaan STO-tyyppisiä kantafunktioita on ADF (Amsterdam Density Functional).

Kantajoukot DFT:ssä voidaan laatia myös puhtaasti numeerisina ilman funktionaalista muotoa.

DFT mahdollistaa siis monipuolisen kantajoukon valinnan, mitä ei vielä nykyään ole kaikissa

mahdollisuuksissaan ja tehokkuudessaan yleisesti hyödynnetty. Lisäksi käytössä ei ole vielä

moniakaan puhtaasti DFT-menetelmien laskentaan kehitettyjä koodauksia, jotka laskentatehollisesti

voisivat olla perinteisiä HF-SCF-teoriaan pohjautuvia koodauksia parempia.

Kaikenkaikkiaan keskikokoisille orgaanisille molekyyleille DFT-menetelmä kohtuullisen suurella

kantajoukolla, esim menetelmä B3LYP//6-31G(d,p), on nykyaikaisista kvanttimekaanisista

menetelmistä laskentateho tarkkuussuhteeltaan suositeltavin ja tavallisimmin käytetty.

DFT-menetelmien kehitys

Jos ajatellaan ab initio –menetelmiä, on niissä selkeä tie kohti eksaktia Schrödingerin yhtälön

ratkaisua. Täytyy vain ilmaista aaltofunktio kaikkien konfiguraatioiden lineaarikombinaationa (full

CI). DFT-menetelmissä tulosten systemaattinen parantaminen on hankalaa. DFT:ssä ei ole

etukäteen tiedossa mikä olisi se tie, vaikkakin laskennallisesti mahdoton kuten full CI, kohti

eksaktia ratkaisua. Vaihto-korrelaatiofunktionaalin tällä hetkellä käytetyt lausekkeet ovat

luonteeltaan empiirisiä ja niitä on vaikea tarkentaa teoreettisesti. DFT-menetelmät ovat kuitenkin

hyvien tulostensa ansiosta jatkuvan kehittämisen alla, ja tulevaisuudessa saadaankin varmasti vielä

paremmin kokeellisten tulosten kanssa yhtäpitäviä uusia DFT-menetelmiä.

73

Laskutulosten tarkkuus

Liitteeksi 2 on koottu useita taulukoita, joissa on vertailtu keskenään semiempiirisiä-, ab initio sekä

DFT-menetelmiä. Taulukot on otettu esipuheessa mainituista Cramerin sekä Youngin kirjoista.

Yhteenvetona voidaan sanoa, että tarkimmat tulokset saadaan yleensä elektronikorrelaatio-

menetelmillä (kuten esimerkiksi CCSD), mutta ne ovat laskennallisesti hyvin raskaita. DFT-

menetelmät antavat yleensä parempia tuloksia kuin HF-menetelmät samanlaisilla kantajoukoilla.

DFT-menetelmistä hybridifunktionaali B3LYP antaa usein parhaimmat tulokset.

11. MOLEKYYLISIMULAATIOMENETELMIÄ

Tähän mennessä olemme käsitelleet useantyyppisiä menetelmiä ja ideanamme on ollut löytää

minimienergiarakenne ja laskea tälle energia ja muita ominaisuuksia. Tämänkaltaiselle

ongelmanasettelulle olemme saavuttaneet useita ratkaisumenetelmiä, joiden valinta riippuu lähinnä

molekyylin koosta ja käytettävissä olevasta laskenta-ajasta. On kuitenkin tilanteita, joihin

edellisenkaltainen lähestymistapa ei sovellu. Jos ajatellaan esimerkiksi jotain polymeeristä

rakennetta kuten vaikka polyetyleeniglykolia (PEG, (OCH2CH2)n ), niin sille kysymys

minimienergiarakenteesta ei ole mitenkään selvä. PEG:n rakenne on hyvin ”löysä” johtuen siitä,

että sillä on lukuisia erilaisia rotationaalisia konformaatioita, jotka ovat energeettisesti hyvin lähellä

toisiaan. Toisin sanoen sillä on useita minikohtia potentiaalienergiapinnalla ja minimit ovat hyvin

laakeita (eli ei ole selvää syvää potentiaalikuoppaa). Käytännössä tämä tarkoittaa, että PEG:stä

havaitut kokeelliset tulokset vastaavat keskimääräistä tulosta suurelle molekyylijoukolle. Tällöin

laskutapa, jossa lasketaan vain yhden tietyn rakenteen energia, ei johda kokeellisten tulosten kanssa

yhtenevään tulokseen.

Aiemmat tuloksemme soveltuvat siis hyvin suhteellisen jäykille molekyylirakenteille, joiden

minimienergiarakenne on hyvin määritelty. Monissa tilanteissa tarvitaan kuitenkin menetelmiä

tarkastella molekyylijoukkoja ja niiden keskimääräisiä rakenteita. Esimerkiksi pitkät

aminohappoketjut eli polypeptidit tai vaikkapa polynukleotidit ja –sakkaridit ovat kaikki

molekyylejä, joiden rakenteet eivät ole vain tietyssä staattisessa muodossa, vaan koostuvat useiden

rakenteiden joukosta. Tällaisiin molekyylijoukkojen keskimääräisten suureiden tarkasteluihin on

kehitetty laskennallisia menetelmiä, joista tällä kurssilla esitellään molekyylidynamiikka (MD) ja

74

Monte Carlo –menetelmä (MC). Sitä ennen on kuitenkin syytä käsitellä ongelmanasettelua hieman

tarkemmin ja esitellä faasiavaruuden ja trajektorin käsite.

11.1. Faasiavaruus ja trajektori

Korostettakoon alkuun, että tässä luvussa kuten koko kappaleessa 11 käsitellään molekyylejä

klassisen mekaniikan menetelmin. Klassisen mekaniikan mukainen systeemi on täysin määritetty,

jos tiedämme systeemin kaikkien osien paikat q ja liikemäärät p tietyllä hetkellä. Tällöin siis

systeemi, joka koostuu N:stä hiukkasesta on täysin määritelty 6N koordinaatilla. Tätä 6N-ulotteista

avaruutta kutsutaan faasiavaruudeksi (phase space). Faasiavaruus siis sisältää tiedon paitsi

paikoista, myös hiukkasten nopeuksista (p = mv). Merkitään, että kaikista paikkakoordinaateista

koostuva vektori on q = (x1, y1, z1, x2, y2, z2, ...) ja liikemääristä koostuva vektori on p = (p1,x, p1,y,

p1,z, p2,x, p2,y, p2,z, ...). Tällöin faasiavaruuden piste voidaan ilmaista muodossa X = (q, p). Se käyrä,

jonka systeemi piirtää faasiavaruuteen ajan kuluessa on nimeltään trajektori (trajectory). Koska

faasiavaruus käsittää systeemin jokaisen mahdollisen tilan, voidaan jonkin suureen A

keskimääräinen arvo (odotusarvo) laskea kaavalla

<A> = pqpqpq ddPA ),(),( , (11.1)

jossa P on todennäköisyys, että systeemi on kyseisessä faasiavaruuden pisteessä. Statistisen

mekaniikan mukaan tämä todennäköisyys riippuu systeemin energiasta kyseisessä pisteessä

Boltzmannin jakauman mukaisesti

P(q, p) = kTE

eQ

),(1 pq

, (11.2)

missä Q on ns. partitiofunktio, joka käytännössä normeeraa todennäköisyyden ja k on Boltzmannin

vakio (k · Avogadron vakio = R).

Jos systeemin ominaisuus halutaan laskea kaavan (11.1) avulla, törmätään melkoisiin ongelmiin.

Miten määrittää integroitavat funktiot? Integraali voitaisiin tehdä numeerisesti, mutta koko

faasiavaruus on käytännössä mahdottoman suuri. Jos mietitään esimerkiksi molekyyliä, joka

koostuu yhteensä sadasta hiukkasesta (ytimet plus elektronit), olisi ko. molekyylillä jo pelkästään

koordinaattien etumerkkivaihtoehtoja 2100. Ja tämä ei vastaisi kuin yhtä pistettä kustakin

faasiavaruuden ”hyper-oktantista”. Faasiavaruuden tarkastelu kuitenkin osoittaa, että suurin osa

siitä on ”tyhjää”, eli todennäköisyys löytää systeemi sieltä on nolla. Tällöin kysymys voidaankin

asettaa muotoon mistä tiedämme missä ovat faasiavaruuden oleelliset osat?

75

11.2. Molekyylidynamiikka

Vastataksemme edellisen kappaleen lopun kysymykseen ajatellaan, että olemme optimoineet

systeemimme eli molekyylin ja löytäneet jonkin minimienergiakohdan potentiaalienergiapinnalta.

Tällöin olemme varmastikin jossain faasiavaruuden oleellisessa pisteessä. Oletetaan, että lähdemme

seuraamaan systeemin trajektoria. Tämä tuntuu järkevältä ajatukselta löytää faasiavaruuden muita

oleellisia alueita. Tällöin voimme olettaa, että saisimme keskimääräisen A:n määritettyä laskemalla

keskiarvon A:n arvoista tietyin aikavälein eli

<A> =M

iitA

M)(1 , (11.3)

missä M on havaintojen lukumäärä.

Jos seuraisimme trajektoria äärettömän kauan äärettömän pienin aikavälein, edellisen kaavan tulos

voidaan kirjoittaa integraalimuodossa

<A> =tt

ttdA

t

0

0

)(1lim . (11.4)

Jos oletetaan ns. ergodisuushypoteesi pitäväksi, em. tulos on riippumaton ajanhetkestä t0. Tällöin

myös kaavan (11.4) tulos on sama kuin kaavan (11.1). Eli voimme laskea jonkin suureen

odotusarvon seuraamalla trajektoria ja laskemalla suureen arvon tietyin väliajoin. Miten sitten

seuraamme trajektoria?

Koska faasiavaruuden piste sisältää tiedon systeemin paikasta ja nopeuksista, se myös määrää (jos

ulkopuolisia voimia ei vaikuta systeemiin) systeemin seuraavan faasiavaruuden pisteen ja sitä

kautta, koska trajektori on jatkuva käyrä, koko trajektorin. Tästä on myös seurauksena, että

trajektorit eivät voi leikata toisiaan, sillä tällöin leikkauspisteestä määräytyisi kaksi pistettä, mikä ei

ole mahdollista. Tarkastellaan yksinkertaisena esimerkkinä harmonista värähtelijää, joka koostuu

jousen päässä olevasta pallosta. Tällöin faasiavaruus on vain kaksidimensioinen, joista toinen

määrää pallon paikan ja toinen liikemäärän (nopeuden). Kun jousi venytetään ja päästetään

värähtelemään, on pallon nopeus aluksi nolla. Nopeus saavuttaa maksimin jousen lepopituuden

kohdalla (kokonaisenergia säilyy ja tällöin kaikki energia on liike-energiaa, koska jousen

aiheuttama potentiaalienergia on nolla) ja hidastuu jälleen nollaan, kun pallo saavuttaa toisen

ääripään. Trajektori on yksiulotteiselle harmoniselle värähtelijälle tällöin ellipsin muotoinen (Kuva

11.1).

76

Kuva 11.1. Faasiavaruus ja trajektori yksiulotteiselle harmoniselle oskillaattorille, jonka jousen lepopituuson req.

Harmonisen oskillaattorin trajektori on esimerkki ns. jaksollisesta trajektorista, joka palaa tiettyyn

pisteeseen tietyn ajan kuluttua. Molekyylin trajektori voi olla jaksollinen, mutta se ei ole mitenkään

välttämätöntä.

Harmoniselle värähtelijälle trajektori voidaan kirjoittaa analyyttisesti funktioina (vaikka sitä ei tässä

tehdäkään), mutta tavallisesti ”oikeille” systeemeille täytyy käyttää numeerisia menetelmiä.

Muistutetaan tähän väliin miten derivaatta lasketaan. Derivaatta ajan suhteen voidaan kirjoittaa

muodossa

ttfttf

dtdf )()( , kun t 0. (11.5)

Lisäksi kun muistetaan Newtonin mekaniikasta, että paikan aikaderivaatta on nopeus ja nopeuden

aikaderivaatta kiihtyvyys, voidaan paikkaa ja liikemäärää (kun ne tunnetaan ajan hetkellä t) arvioida

ajan t kuluttua kaavoilla

q(t + t) = q(t) + tmt)(p (11.6)

ja

p(t + t) = p(t) + ma(t) t. (11.7)

Newtonin II lain mukaan F = ma, joten meidän täytyy tietää systeemiin vaikuttavat voimat, jotta

voisimme laskea kiihtyvyydet ja sitä kautta liikemäärien muutokset. Kiihtyvyyksien laskemiseen

molekyylimekaniikkamenetelmien voimakenttälausekkeet sopivat oikein hyvin. Yhtälöiden (11.6)

re

req

reqre

x x

p

q

77

ja (11.7) avulla voimme siis simuloida systeemin trajektoria ja sen käyttäytymistä ajan funktiona.

Tällainen molekyylien simuloiminen ajan funktiona on molekyylidynamiikkaa.

Käytännön kannalta askeleen t koko on hyvin oleellinen. Mitä pienempi kyseinen aikaväli on, sitä

useammin joudutaan laskemaan faasiavaruuden seuraava piste, mikä on laskennallisesti hidasta.

Toisaalta mitä pienemmin väliajoin laskun teemme, sitä paremmin pystymme seuraamaan

trajektoria. Liian suuret aikahypyt voivat pilata simuloinnin täysin. Nyrkkisääntönä pidetään

yleensä, että t:n täytyy olla vähintään kertalukua tai kahta pienempi kuin systeemin nopein

periodinen liike. (Mieti esimerkiksi em. harmonista oskillaattoria. Liian harvalla tarkasteluvälillä

voidaan päätyä esimerkiksi tulokseen, että pallo on seinän toisella puolella.) Tavallisesti

molekyylien nopeimpia liikkeitä ovat sidosten värähtelyt, joiden jakson aika on suuruusluokkaa

10 14 s. Tällöin tarkasteluvälin täytyy olla femtosekuntiskaalalla ja tyypillinen arvo on 0,1 fs. Näin

lyhyt aikaväli tarkoittaa sitä, että molekyylidynamiikkamenetelmissä harvoin tarkastellaan paljoa

nanosekuntia pidempiä aikajaksoja, sillä esimerkiksi 10 ns tarkastelu 0,1 fs aikavälillä tarkoittaa

voimien, uusien faasiavaruuden koordinaattien ja tarkastellun suureen, usein energian, laskemista

107 kertaa. Tällöin suhteellisen hitaat (n. mikrosekuntiskaala) dynaamiset prosessit, kuten

esimerkiksi proteiinien laskostuminen, ovat molekyylidynamiikkamenetelmien saavuttamattomissa.

Tämä on eräs MD-menetelmien suurimmista rajoituksista, johon etsitään parhaillaankin

tehokkaampaa ratkaisua, jolla trajektorin käyttäytymistä pystyttäisi ennustamaan pidempiä

aikavälejä.

11.3. Monte Carlo

Toinen molekyylien keskimääräisiä ominaisuuksia arvioimaan laadittu menetelmä on ns. Monte

Carlo -menetelmä. Monte Carlo -nimellä kulkevia menetelmiä on monilla aloilla ja yhteistä niille

on, että ne sisältävät tavalla tai toisella satunnaislukujen käytön. Satunnaislukujen ja

todennäköisyyslaskennan avulla voidaan laskea monenlaisia asioita, esimerkiksi määrättyjen

integraalien arvoja. Tyypillistä on, että mitä enemmän havaintoja otetaan, sitä paremmin ne

vastaavat oikeaa tarkkaa arvoa (eli kun tarpeeksi kauan heittelee kolikkoa, niin kruunan sekä

klaavan todennäköisyydeksi tulee 0,5).

Nyt voidaan lähtökohtaisesti ajatella kaavan (11.1) mukaista integraalia. Voimme ajatella, että

valitsemme satunnaisesti pisteitä faasiavaruudesta ja laskemme tuloksen siinä. Menetelmä ei ole

kuitenkaan järkevä, koska suurin osa faasiavaruutta on tyhjää, joten satunnaisesti valittu on hyvin

pienellä todennäköisyydellä merkityksellinen piste. Käänteentekevä ajatus Monte Carlo –

78

menetelmien soveltamiselle molekyylien kuvaamiseen tapahtui vuonna 1953, jolloin Metropolis

ryhmineen julkaisi uudenlaisen lähestymistavan ongelmaan. Sen sijaan, että valitsisimme

satunnaisesti faasiavaruuden jonkin pisteen ja painottaisimme tätä Boltzmannin mukaisella

eksponenttitermillä (kaava 11.2), valitsemmekin pisteen Boltzmannin jakauman mukaisella

todennäköisyydellä ja painotamme valittuja pisteitä samanarvoisesti.

Tarkastellaan seuraavaksi yksinkertaistettua tilannetta, jossa kysytty ominaisuus riippuu vain

systeemin paikkakoordinaateista q. Tällöin Metropoliksen idea voidaan kirjoittaa matemaattisesti

yksinkertaiseen muotoon

<A> =X

iiA

X)(1 q , (11.8)

missä X on pisteiden lukumäärä, jotka on kerätty Metropoliksen ”reseptin” mukaisesti. Ennen

”reseptin” tarkempaa selvitystä, voidaan tehdä yo. lausekkeesta joitakin huomioita. Ensinnäkin se

muistuttaa suuresti lauseketta (11.3) ja siinä odotusarvo lasketaan yksinkertaisesti yksittäisten

havaintojen keskiarvona. Oleellinen ero lausekkeeseen (11.3) nähden on kuitenkin, että (11.8) ei

sisällä muuttujana aikaa. Tällöin havaintopisteitä ei voida ajatella minkäänlaisessa järjestyksessä

havaituiksi kuten molekyylidynamiikassa. Monte Carlo –menetelmässä aika ei ole millään tavoin

mukana emmekä edes pyri seuraamaan trajektoria ajan funktiona.

Metropoliksen tapa kerätä havaintopisteitä on seuraava. Aluksi lähdetään liikkeelle jostakin

”järkevästä” pisteestä q1, joka on saatu esimerkiksi pikaisella molekyylimekaniikkaoptimoinnilla.

Tämän jälkeen muutetaan koordinaatteja satunnaisesti ja saadaan uusi piste q2. Todennäköisyys P

sille, että uusi piste otettaisiin mukaan summaan, lasketaan kaavasta

P = minkTE

kTE

e

e1

2

,1 . (11.9)

Toisin sanoen, jos energia uudessa pisteessä on pienempi kuin edellisessä, se otetaan mukaan. Jos

taas uuden pisteen energia on korkeampi, todennäköisyyttä verrataan satunnaislukuun z väliltä [0,1].

Jos P z, piste otetaan mukaan ja jos P < z, lasketaan edellinen piste summaan toisen kerran ja

jatketaan valitsemalla uusi ehdokas. Pisteen koordinaatit riippuvat tässä prosessissa ainoastaan

edellisestä pisteestä. Tällaista prosessia kutsutaan yleisesti Markovin ketjuksi.

Monte Carlo –prosessissa laskennat riippuvat olennaisesti tavasta miten seuraava piste valitaan

edellisestä. Jos muutos edellisestä on hyvin pieni (vaikka uusi piste onkin satunnainen, voidaan

79

kuitenkin määrätä kuinka suuri tämä muutos edellisestä voi olla), saadaan faasiavaruuden pisteitä

kerättyä vain hyvin pieneltä alueelta ja faasiavaruuden kartoitus on laskennallisesti hidasta. Jos taas

pisteiden koordinaatit muuttuvat suuresti edellisestä, tulee uuden pisteen hyväksymiskriteeri

merkitykselliseksi, sillä todennäköisyys, että uusi piste hylätään kasvaa liian suureksi ja

laskentatehoa kuluu hukkaan. Tyypillisesti MC-menetelmät säädetään niin, että noin 20 50 %

uusista yritepisteistä hyväksytään. Mitä enemmän pisteitä kerätään, sitä parempia ovat tulokset.

Tyypillinen pistemäärä on muutaman miljoonan suuruusluokkaa.

Viimeaikoina on kehitetty myös ns. kvantti-Monte Carlo –menetelmiä. Tällaisissa menetelmissä on

pyritty yhdistämään kvanttimekaaniset menetelmät Monte Carlo –tyyppisiin molekyyli-

simulaatioihin. Nämä menetelmät ovat ehkäpä raskaimpia laskennallisia menetelmiä, mitä tällä

hetkellä on olemassa, mutta tulevaisuudessa nekin varmasti niin menetelmien kuin

laskentatehojenkin kehittymisen myötä tulevat yleisesti käytössä olevien menetelmien repertuaariin.

11.4. Molekyylisimulaatioiden sovelluskohteita

Kuten luvun alussa todettiin, molekyylisimulaatiomenetelmät MD ja MC ovat hyödyllisiä

tarkasteltaessa molekyylejä, jotka ovat fleksiibeleitä, eli niiden minimienergiakuopat ovat laakeita

ja niillä on useita energeettisesti toisiaan lähellä olevia rakenteita. Tällaisia ovat muun muassa

polymeerit ja pitkäketjuiset biomolekyylit. Lisäksi MD- ja MC-menetelmät soveltuvat

molekyylijoukkojen laskemiseen. Näin voidaan käsitellä esimerkiksi liuotinvaikutuksia, jotka ovat

muuten laskennallisesti hyvin haasteellisia ja raskaita kuvattavia. Tarkasteltava molekyyli voidaan

näillä menetelmillä yksinkertaisesti ympäröidä halutulla määrällä liuotinmolekyylejä ja tarkastella

tämän jälkeen miten molekyyli liikkuu liuottimien ympäröimänä.

Eräs kemiassa usein vastaantuleva ongelma on jonkin rakenteen mahdollisien konformaatioiden

määrittäminen. Tällaiseen konformaatiohakuun MD- ja MC-menetelmät ovat eräs ratkaisu.

Voimme seurata minkälaisiin rakenteisiin MD ja MC simulaatioissaan päätyvät. Usein menetelmät

jäävät kuitenkin kiertämään jonkin tietyn konformaation lähiseutua, varsinkin jos eri

konformaatioiden välillä on suuri potentiaalivalli. Tällaisissa tilanteissa voidaan käyttää sellaista

simulointimenetelmää, että tarkastelulämpötilaa nostetaan simuloinnin ajaksi, jolloin molekyyli voi

saada riittävästi energiaa ylittää konformaatioiden välisen potentiaalivallin. Tämän jälkeen

lämpötila lasketaan uudelleen alkuperäiseen, jolloin molekyyli päätyy mahdollisesti eri

potentiaalienergiapinnan kuoppaan eli konformaatioon kuin simuloinnin alussa.

laskennallinen kemia ja molekyylimallinnus - luentomoniste

Documents