laskennallinen kemia ja molekyylimallinnus - luentomoniste
TRANSCRIPT
Laskennallinen kemia
ja molekyylimallinnus
Jari Sinkkonen
Turun yliopisto, Kemian laitos
2008
2
ESIPUHE
Nykyään monet käyttäjäystävälliset molekyylimallinnusohjelmistot sekä alati kasvavat laskentaresurssit ovattuoneet laskennallisen kemian lähemmäs ”tavallista” kemistiä, ja ala ei ole enää pelkästään teoreetikkojenmystinen temmellyskenttä, jonne asiaan vihkiytymättömillä ei ole mitään asiaa. Näin ollen onkintodennäköistä, että tulevaisuudessa niin alalla kuin alalla työskentelevä kemisti joutuu tekemisiinjonkinlaisten laskennollisten menetelmien kanssa.
Tämän kurssin tarkoituksena on antaa yleiskuva siitä minkälaisia ovat tavallisimmat laskennallisetmenetelmät, joita kemiassa eteentulevissa ongelmissa yleisimmin käytetään. Kurssin tarkoituksena on myösantaa se tausta, joihin käsiteltävät menetelmät perustuvat. Tämä on oleellista, koska menetelmät lähespoikkeuksetta perustuvat joihinkin oletuksiin ja likimääräistyksiin. Ilman tietoa siitä, mihin käytettymenetelmä perustuu, on suuri todennäköisyys valita tarkasteltavana olevaan kemialliseen ongelmaansopimaton menetelmä ja tällöin laskuista saatujen tulosten luotettavuus on mitätön.
Laskennallisen kemian ja molekyylimallinnuksen maailma on täynnä erilaisia lyhenteitä ja omaa jargoniaan,kuten AMBER, PM3, HF-SCF, B3LYP/6-31G* jne. Tavoitteena on, että tämän kurssin jälkeen nuo edellämainitut ja monet muutkin ovat tuttuja, mikä helpottaa huomattavasti perehtymistä alan kirjallisuuteenmahdollisissa myöhemmin eteentulevissa tehtävissä. Lisäksi tällä kurssilla tullaan tutustumaan joihinkinyleisiin mallinnusohjelmistoihin.
Tämän monisteen tarkoituksena on kattaa kurssilla käsiteltävä teoria. Luennoilla käsitellään teoriaakäytännön esimerkkien kera. Moniste saattaa vaikuttaa pelottavan matemaattiselta. Tämänkaltaisen kurssinvaikeutena on se, että monissa menetelmissä taustalla oleva teoria on melko haastavaa matemaattisesti. Olenyrittänyt laatia kurssin siten, että vain aivan oleellisimmat yhtälöt on otettu mukaan ja niiden käytännönmerkitys on pyritty selittämään sanallisesti mahdollisimman hyvin.
Moniste pohjautuu pääasiassa seuraaviin kirjoihin:
Essentials of Computational Chemistry, Theories and Models. Christopher J. Cramer, by John Wiley & SonsLtd, 2002. (Eräs alan ”raamatuista”. Melko kattava ja matemaattisesti kohtuullisen haastava.)
Molecular Modelling for Beginners. Alan Hinchliffe, by John Wiley & Sons Ltd, 2003. (Pehmeämpi laskulaskennalliseen kemiaan. Melko matemaattinen tämäkin, mutta lähtee selvästi alemmalta tasolta. Tämänkirjan jälkeen on helpompi lukea esimerkiksi em. Cramerin kirjaa.)
Computational Chemistry, A Practical Guide for Applying Techniques to Real World Problems. DavidYoung, by John Wiley & Sons Ltd, 2001. (Ei matemaattinen kirja, joka tarkastelee asioita käytännönkannalta. Sisältää paljon hyödyllistä käytännöntietoa, kuten eri ohjelmistojen ja menetelmien vertailua.)
Koska tämä kurssi luennoidaan nyt vasta toista kertaa, on todennäköistä, että monisteesta löytyy edelleenkinvihreitä ja epätäsmällisyyksiä. Pyydänkin huomauttamaan minulle niistä. Haluan kiittää myös FT HenriKivelää useista parannusehdotuksista tähän vuoden 2008 versioon. Kaikenlainen opiskelijapalaute kurssistaon edelleen erittäin tervetullutta. Tavoitteena on, että kurssin seuraavat ”iteraatiot” olisivat aina edellistälähempänä optimia.
Jari Sinkkonen
3
SISÄLTÖ
1. JOHDANTO 42. MOLEKYYLIN GEOMETRIA 7 2.1 PDB-tiedosto 7
2.2 Z-matriisi 83. POTENTIAALIENERGIAPINTA 104. MOLEKYYLIMEKANIIKKA 12 4.1 Potentiaalienergiatermit 12 4.2 Tavallisimmat voimakentät 175. OPTIMOINTIALGORITMEISTA 196. MOLEKYYLIORBITAALITEORIAA 22 6.1 Aaltofunktiot ja operaattorit 22 6.2 Hamiltonin operaattori 23 6.3 Variaatioperiaate 25 6.4 Bornin ja Oppenheimerin approksimaatio 26 6.5 LCAO-lähestymistapa 27 6.6 Sekulaarideterminantti 28 6.7 Hartree-tulo ja Hartreen Hamiltonin operaattori 30 6.8 Elektronin spin ja antisymmetrisyys 32 6.9 Slaterin determinantti 33 6.10 Hartree-Fock SCF-menetelmä 357. SEMIEMPIIRISET MENETELMÄT 39 7.1 Hückelin teoria 40 7.2 Laajennettu Hückelin teoria 42 7.3 CNDO formalismi 43 7.4 INDO formalismit 45 7.5 NDDO formalismit 45 7.6 Semiempiiriset menetelmät ja SAR 468. AB INITIO –MENETELMÄT 48 8.1 Kantajoukot 48 8.2 Open-shell –systeemit 56 8.3 Huomioita laskenta-ajoista 57 8.4 Ab initio HF-teorian antamat tulokset 579. ELEKTRONIKORRELAATIO 58 9.1 Configuration interaction 60 9.2 Coupled cluster 60 9.3 Multiconfiguration SCF 61 9.4 Møller-Plesset häiriöteoria 6110. TIHEYSFUNKTIONAALITEORIA 62 10.1 Tiheysfunktionaaliteorian ensiaskeleita 63 10.2 Hohenbergin ja Kohnin teoreemat 65 10.3 Kohn Shamin tiheysfunktionaaliteoria 67 10.4 Vaihto-korrelaatiofunktionaalit 68 10.5 Huomioita DFT-menetelmistä 7111. MOLEKYYLISIMULAATIOMENETELMIÄ 73 11.1 Faasiavaruus ja trajektori 74 11.2 Molekyylidynamiikka 75 11.3 Monte Carlo 77 11.4 Molekyylisimulaatioiden sovelluskohteita 79LIITTEET
1. Laskennallisessa kemiassa käytetyt suureet ja yksiköt2. Laskennallisten menetelmien tulosten vertailua
4
1. JOHDANTO
Tällä kurssilla perehdytään laskennalliseen kemiaan ja molekyylimallinnukseen. Aluksi onkin syytä
selvittää mitä nuo sanat itseasiassa tarkoittavat.
Tavallisesti käytetään nimitystä teoreettinen kemia kemiasta, jossa pyritään asioiden
matemaattiseen käsittelyyn. Tämä on ns. kynän ja paperin äärellä tapahtuvaa yhtälöiden pyörittelyä.
Kun jokin kemiallinen asia on saatu kuvattua matemaattisilla yhtälöillä niin hyvin, että varsinaiset
laskelmat voidaan suorittaa tietokoneella, puhutaan laskennallisesta kemiasta. Laskennallinen
kemia (computational chemistry) siis tarkoittaa tietokoneen käyttöä kemiallisten laskelmien
apuneuvona.
Kemia, kuten useat muutkin tieteenalat, käyttää asioiden kuvaamiseen erilaisia malleja. Mallit
voivat olla kvalitatiivisia tai kvantitatiivisia. Esimerkkinä mallista voidaan ajatella jo lukiosta tuttua
Bohrin atomimallia. Nils Bohr esitti vuonna 1913 uuden mallin atomin rakenteesta. Malli sisälsi
mm. oletuksen, että elektronit kiertävät atomiydintä tietyillä määrätyillä ympyräradoilla. Bohrin
atomimallin avulla pystyttiin laskemaan vetyatomin spektri, mutta se antoi virheellisiä tuloksia, jos
tarkasteltavassa systeemissä oli useampia elektroneja kuin yksi. Koska Bohrin atomimalli perustuu
määrättyihin matemaattisiin postulaatteihin, voidaan sitä ajatella kvantitatiivisena mallina.
Esimerkki kvalitatiivisesta mallista on vaikkapa orgaanisesta kemiasta tuttu Lewisin tapa piirtää
elektroneja ja kemiallisia sidoksia.
Mallien tarkoituksena on helpottaa jonkin asian kuvaamista ja ymmärtämistä. Malli ei kuitenkaan
yleensä ole eksakti ja täydellinen tapa kuvata kyseistä asiaa. Täten onkin erittäin tärkeää ymmärtää
mitkä ovat mallin oletukset, toisin sanoen mitä mallilla voidaan kuvata, mitä rajoituksia sillä on
sekä kuinka luotettavia ovat mallin antamat tulokset.
Esimerkiksi edellä mainittu Bohrin atomimalli sopii edelleenkin hyvin kuvaamaan vetyatomia ja
antaa kokeellisten mittausten kanssa yhteneviä tuloksia. Mutta on syytä tiedostaa, että
monimutkaisempiin tapauksiin se on riittämätön. Samoin esimerkiksi Lewisin tavassa piirtää
atomien välinen kaksoissidos, on tärkeää ymmärtää, että kyseiset sidokset eivät ole samanlaiset,
vaan toinen on ns. - ja toinen ns. -sidos. Itseasiassa, jos tarkkoja ollaan, on sidosten ja
5
orbitaalienkin kuvaaminen vain malli, joka helpottaa kvanttimekaanisten tuloksien
havainnollistamista.
Molekyylimalli siis tarkoittaa tapaa kuvata molekyyliä. Molekyyliä voidaan mallintaa
useammallakin eri tavalla. Molekyylit voidaan ajatella koostuvan kovista palloista (ytimet) ja niitä
yhdistävistä jousista (sidokset). Tällaiseen klassiseen mekaniikkaan perustuvaan malliin
pohjautuvat molekyylimekaniikkamenetelmät.
Semiempiiriset, ab initio (lat. alusta, perusteista) ja tiheysfunktionaaliteoreettiset (DFT, density
functional theory) menetelmät puolestaan perustuvat kvanttimekaniikkaan. Kvanttimekaniikka on
matemaattinen teoria, jonka ei ole koskaan havaittu antavan ristiriitaisia tuloksia kokeellisten
tulosten kanssa. Kvanttimekaniikka on siis ainakin toistaiseksi täydellisin tapa kuvata atomitason
systeemejä. Kvanttimekaniikan huonona puolena on ainoastaan se, että Schrödingerin yhtälön
ratkaiseminen monimutkaisemmille systeemeille, kuten molekyyleille (poikkeuksena pienin
mahdollinen molekyyli H2+, joka sisältää vain yhden elektronin) ei ole mahdollista eksaktisti, vaan
on tyydyttävä likimääräisiin menetelmiin. Täten koko molekyylimallinnus perustuukin erilaisiin
likiarvomenetelmiin. Jotkin menetelmät käyttävät hyvinkin karkeita approksimaatioita, kun taas
jotkin tulevat toimeen mahdollisimman pienillä likimääräistävillä oletuksilla. Näiden
likimääräistysten ja tulosten luotettavuuden välinen yhteys on syytä ymmärtää.
Miksi sitten ei laskuja tehdä aina parhaalla mahdollisella, lievimmät oletukset sisältävällä
menetelmällä? Tähän on syynä käytettävissä oleva laskentateho. Vaikka tietokoneiden suorituskyky
onkin kehittynyt huimasti viime vuosikymmeninä, ei edelleenkään eikä varmasti
lähitulevaisuudessakaan ole käytännössä mahdollista esimerkiksi mallintaa suuria biomokyylejä
kuten proteiineja korkeatasoisilla ab initio –menetelmillä. Laskennallisessa kemiassa onkin tapana
puhua mikä on minkäkin menetelmän hinta. Tämä tarkoittaa kuinka paljon laskentatehoa mikäkin
menetelmä kuluttaa. Laskenta-aikaa mitataan yleensä ns. CPU-yksiköissä (central processing unit).
Ennen laskennallisen kemian soveltamista tiettyyn ongelmaan onkin syytä miettiä kuinka tarkkoja
tuloksia tarvitsee ja kuinka paljon laskenta-aikaa on käytettävissä, jotta pystyisi valitsemaan
ongelman ratkaisuun sopivan ja järkevän menetelmän.
Mitä kaikkea voidaan laskea? Usein ollaan kiinnostuneita tietyn rakenteen energiasta. Jos meillä on
olemassa rakenne, sille voidaan tehdä ns. single-point energy calculation, joka laskee kyseisen
rakenteen energian tyhjiössä ja 0 K lämpötilassa. Haluttaessa energia voidaan laskea myös jossain
6
tietyssä lämpötilassa ja paineessa, jotka vastaavat esimerkiksi mittauksissa tai synteesissä käytettyjä
olosuhteita. Tavallisesti rakenne, jonka energia halutaan selvittää, täytyy ensin määrittää. Tämä
tarkoittaa energeettisesti optimaalisen rakenteen etsimistä. Tätä geometriaoptimointia käsitellään
tarkemmin luvussa 3. Rakenteen ja energian lisäksi voidaan laskea myös monia rakenteelle
ominaisia kemiallisia ominaisuuksia. Näitä ovat mm. termodynaamisten tilanfunktioiden (entalpia,
Gibbsin energia jne.) arvot, spektroskooppiset suureet (kuten NMR-siirtymät ja kytkentävakiot,
rotaatio- ja vibraatiospektrit, esim IR ja UV-Vis) ja elektroniaffiniteetit ja ionisaatiopotentiaalit.
Lisäksi laskennallisesti voidaan selvittää myös rakenteen ominaisuuksia, jotka eivät ole
kokeellisesti mitattavissa. Tällainen on esimerkiksi sidoksen kertaluku. Usein sidokset eivät ole
todellisuudessa täysin esim. yksinkertaisia tai kaksoissidoksia. Yksinkertainen sidos saattaa omata
jossain määrin myös kaksoissidosluonnetta. Tämänkaltainen informaatio on hyödyllistä esimerkiksi
yhdisteen reaktiivisuuden kannalta.
Mihin laskennallisesti saatuja tuloksia voidaan hyödyntää? Eräs tapa on ennen uutta synteesiä
laskea onko suunniteltu tuote energeettisesti järkevä ja onko sillä jotain tiettyjä haluttuja
ominaisuuksia. Uuden synteesin kehittäminen voi vaatia kuukausien työn, joka saattaisi mennä
hukkaan, jos tuotetta ei synnykään tai se ei ole ominaisuuksiltaan halutunlainen. Toinen tapa on
hyödyntää laskettuja tuloksia kokeellisten tuloksien rinnalla. Näin voidaan tutkia esimerkiksi
spektroskooppisia ominaisuuksia ja isomeriatasapainoja. Esim. NMR-spektreissä saatetaan havaita
keskiarvoiset signaalit kahden nopeasti toisikseen vaihtuvan konformeerin välillä. Laskennallisesti
voidaan laskea kullekin konformaatiolle NMR-spektrit ja energiat erikseen ja päätellä näistä
tasapainosuhde kokeellisesti havaitussa spektrissä.
Tällä kurssilla käsitellään aluksi yleisiä asioita kuten molekyylin rakenteen esittämistä ja
potentiaalienergiapinnan käsitettä. Tämän jälkeen tarkastellaan klassista molekyylimekaniikkaa.
Seuraavaksi on paikallaan luoda pieni katsaus kvanttimekaniikkaan ja molekyyliorbitaaliteoriaan,
joka on lähtokohtana myöhempiin lukuihin, joissa käsitellään ensin semiempiirisiä ja sitten ab initio
ja DFT-menetelmiä. Kurssin loppuosassa tarkastellaan lyhyesti molekyylidynamiikkaa sekä muita
laskennallisesti mielenkiintoisia aiheita kuten konformaatioanalyysia. Aivan lopuksi luodaan
katsaus laskennallisen kemian työkaluihin ja tutkimukseen Suomessa.
7
2. MOLEKYYLIN GEOMETRIA
Jotta molekyyliä voidaan jollain tapaa mallintaa tietokoneellisesti, on sen kolmiulotteinen rakenne
pystyttävä kertomaan tietokoneelle. Molekyylin rakenne voidaan esittää usealla eri tavalla ja
monilla ohjelmilla onkin omat tiedostomuotonsa, joissa ne rakenteen ymmärtävät. Tässä esitetään
kaksi tavallisinta ja eniten käytettyä tiedostomuotoa. Ensimmäisenä esitetään ns. Brookhaven PDB-
tiedoston (Protein Data Bank) rakenne ja tämän jälkeen esimerkiksi Gaussian-ohjelmassa
tavallisimmin käytetty Z-matriisi-tiedostomuoto.
2.1. PDB-tiedosto
Brookhaven protein data bank PDB on ilmainen internet-tietokanta, johon on kerätty
makromolekyylien, kuten proteiinien, kolmiulotteisia rakenteita (jos haluat lisätietoa, kirjoita
googleen esim. PDB ja wikipedia). Tietokannassa on kokeellisesti määritettyjen molekyylien
rakenteita PDB-tiedostomuotoisina (samasta muodosta käytetään toisinaan myös lyhennettä .ent).
Samaa tiedostomuotoa voidaan toki käyttää muunlaistenkin molekyylien kuin suurten
biomolekyylien esittämiseen. PDB-muoto on hyvin yleinen ja paljon käytetty tiedostomuoto.
Esimerkiksi Gaussian ja HyperChem ja monet muutkin mallinnusohjelmistot osaavat lukea tätä
muotoa ja tallentaa rakenteen tässä muodossa.
PDB-tiedostossa rakenne esitetään yksinkertaisesti tavallisessa karteesisessa koordinaatistossa.
Koordinaatiston origon paikka on mielivaltainen. Tiedostossa esitetään aluksi kunkin atomin
numero, tyyppi ja koordinaatit. Tämän jälkeen kerrotaan ns. konnektiivisuudet, eli mikä atomi on
sitoutunut minkäkin kanssa.
Esimerkkinä on esitetty etanolin rakenne (kuva 2.1) HyperChemillä tallennetussa ent-muodossa
(esimerkki 2.1).
Kuva 2.1. Etanolin CH3CH2OH kolmiulotteinen rakenne.
8
HETATM 1 C 1 -1.258 0.467 0.003HETATM 2 C 2 -0.184 -0.642 -0.026HETATM 3 O 3 1.122 -0.053 0.014HETATM 4 H 4 -1.153 1.106 -0.875HETATM 5 H 5 -1.142 1.071 0.904HETATM 6 H 6 -2.252 0.016 0.001HETATM 7 H 7 -0.295 -1.229 -0.940HETATM 8 H 8 -0.317 -1.296 0.839HETATM 9 H 9 1.754 -0.804 0.002CONECT 1 2 4 5 6CONECT 2 1 3 7 8CONECT 3 2 9CONECT 4 1CONECT 5 1CONECT 6 1CONECT 7 2CONECT 8 2CONECT 9 3END
Esimerkki 2.1. Etanolin rakenne PDB-tiedostomuodossa. Esimerkiksi atomi 1 on hiili, jossa on kiinni toinenhiili ja kolme vetyä, eli tällöin sen on oltava etanolin CH3-hiili.
2.2. Z-matriisi
Toinen yleisimmin käytetyistä tavoista antaa rakenne on Z-matriisi. Esimerkiksi Gaussian käyttää
oletusarvoisesti Z-matriisia molekyylin geometrian kuvaamiseen. Z-matriisi rakentuu hieman
samaan tapaan miten molekyyli voidaan ajatella piirrettävän kynällä paperille. Aluksi aloitetaan
jostain atomista, tämän jälkeen seuraava atomi on tietynpituisella sidoksella kiinni aloitusatomissa.
Kolmas atomi taas on tietynlaisen sidoksen päässä toisesta atomista ja muodostaa tietyn kulman
atomien 1-2-3 välille. Neljäs puolestaan voidaan määritellä sidospituudella, sidoskulmalla ja torsio-
eli diedrikulmalla edellisiin nähden. Nämä kolme suuretta määrittävät aina seuraavan atomin
paikan. Esimerkkinä 2.2. on esitetty etanolin rakenne Z-matriisina.
C H 1 B1 H 1 B2 2 A1 H 1 B3 2 A2 3 D1 C 1 B4 4 A3 2 D2 H 5 B5 1 A4 4 D3 H 5 B6 1 A5 4 D4 O 5 B7 1 A6 4 D5 H 8 B8 5 A7 1 D6
B1 1.07000000 B2 1.07000000 B3 1.07000000 B4 1.54000000 B5 1.07000000
9
B6 1.07000000 B7 1.43000000 B8 0.96000000 A1 109.47122063 A2 109.47122063 A3 109.47122063 A4 109.47122063 A5 109.47122063 A6 109.47122063 A7 109.47122063 D1 -120.00000000 D2 120.00000000 D3 60.00000000 D4 -60.00000000 D5 180.00000000 D6 -180.00000000
1 2 1.0 3 1.0 4 1.0 5 1.0 2 3 4 5 6 1.0 7 1.0 8 1.0 6 7 8 9 1.0 9
Esimerkki 2.2. Etanolin rakenne Z-matriisina. Ensimmäisellä rivillä on aloituskohtana hiiliatomi, jotaajatellaan numeroksi 1. Seuraavalla rivillä on atomi 2, joka on H. Se on kiinni atomissa 1 sidospituudella B1.Kolmannella rivillä on atomi 3, joka on kiinni atomissa 1 sidospituudella B2 ja muodostaa atomin 2 kanssakulman A1. Esimerkiksi rivillä 6 on atomi 6, joka on H. Se on kiinni hiilessä 5 sidospituudella B5,muodostaa sidoskulman B5 atomien H6-C5-C1 välille ja torsiokulman H6-C5-C1-H4 välille. Tämän jälkeenon annettu lista siitä kuinka suuri mikäkin sidospituus, sidoskulma ja torsiokulma on. Lopuksi on annettu ns.konnektiivisuudet. Esimerkiksi ensimmäisellä rivillä on kerrottu, että atomissa 1 on kiinni atomit 2, 3, 4 ja 5,kukin yksinkertaisella sidoksella (1.0).
Etanoli-molekyyli muodostuu kaikkiaan yhdeksästä atomista. Kun tarkastellaan sen Z-matriisia
(esimerkki 2.2), huomataan sen koostuvan kahdeksasta sidospituudesta, seitsemästä sidoskulmasta
ja kuudesta torsiokulmasta, eli yhteensä 21 parametrista. Yleisesti ottaen N-atomisen molekyylin
kuvaamiseen tarvitaan 3N 6 parametria, kun N > 2. Ensimmäisen atomin paikka oletetaan
kiinnitetyksi, toisen kuvaamiseen tarvitaan vain yksi sidospituus ja kolmannen yksi sidospituus ja –
kulma. Tämän jälkeen jokaiseen lisäatomiin tarvitaan kolme uutta parametria. Täten em. tuloksen 6
tulee kolmen ensimmäisen atomin tuottamasta vähennyksestä.
Tarkastelemalla edellisen kappaleen PDB-tiedostoa, huomataan siinä olevan 27 parametria. Tämä
johtuu siitä, että origon paikka ja molekyylin asento oletettiin mielivaltaiseksi. Jos origo
oletettaisiin esimerkiksi ensimmäisen atomin paikaksi ja toisen atomin sijaitsevan x-akselin
10
suunnassa ja kolmannen xy-tasossa, voitaisi myös karteesisista koordinateista vähentää kuusi
kappaletta ja päädyttäisiin samaan 3N 6 lukemaan.
N-atomisella molekyylillä sanotaan olevan 3N 6 vapausastetta. Vapausasteen käsite on tärkeä
muun muassa spektroskopiassa. N-atomisella epälineaarisella molekyylillä on täsmälleen 3N 6
värähtelyvapausastetta ja täten yhtä monta erilaista normaalivärähtelymallia.
3. POTENTIAALIENERGIAPINTA
Tavallinen laskennallisen kemian ongelma on löytää energeettisesti edullisin avaruudellinen
rakenne annetulle molekyylille. Tämä tarkoittaa molekyylin potentiaalienergian minimin etsimistä.
Kuten edellä mainittiin, N-atomisen molekyylin kuvaamiseen tarvitaan 3N 6 koordinaattia. Tällöin
myös potentiaalienergia on 3N 6:n muuttujan funktio. Esimerkiksi etanolin potentiaalienergia on
tällöin 21:n muuttujan funktio. Potentiaalienergiaa voidaan ajatella ”21-ulotteisena hyperpintana”.
Usein ollaan kuitenkin kiinnostuneita jonkin tai joidenkin tiettyjen koordinaattien muutosten
vaikutuksesta rakenteen potentiaalienergiaan. Tällöin voidaan tarkastella potentiaalienergiaa tämän
tai näiden koordinaattien funktiona.
Tarkastellaan yksinkertaisena esimerkkinä 1,2-dikloorietaania CH2Cl CH2Cl ja sen
potentiaalienergiaa Cl Cl torsiokulman funktiona. Tällöin potentiaalienergiapinta on
pinnan sijasta pelkkä käyrä. Kyseisellä molekyylillä potentiaalienergia on maksimissaan, kun
torsiokulma on 0° tai 360°. Potentiaalienergialla on kolme minimiä, joista kahdessa Cl-atomit ovat
syn-asemassa ( = 60° ja 300°) ja yhdessä anti-asemassa ( = 180°) keskenään. Jälkimmäisessä
tapauksessa Cl-atomit ovat vastakkaisilla puolilla ja molekyylin potentiaalienergia on minimissään.
Edellisissä tilanteissa potentiaalienergiakäyrässä on minimi, mutta energia on anti-aseman energiaa
korkeampi. Energiaminimiä, jossa potentiaalienergia saavuttaa pienimmän arvonsa, kutsutaan
globaaliksi minimiksi. Muita energiaminimejä, joissa potentiaalienergia on suurempi kuin
globaalissa minimissä, sanotaan lokaaleiksi minimeiksi. 1,2-dikloorietaanilla on siis em.
torsiokulman suhteen kolme minimiä, joista anti-aseman minimi muodostaa energeettisesti
pysyvimmän rakenteen ja on globaali minimi.
11
Tilanne muuttuu hieman hankalammaksi, kun muuttuvia koordinaatteja on enemmän kuin yksi.
Tarkastellaan seuraavaksi kuvien avulla minkälaisia ominaisuuksia voi energiapinnalla olla kahden
koordinaatin systeemissä. Kuvassa 3.1. on esitetty vasemmalla potentiaalienergiapinnan minimi.
Oikealla puolella on sen sijaan esitetty ns. satulapiste. Satulapiste on potentiaalienergiapinnan piste,
joka on maksimi joidenkin koordinaattien suunnassa, mutta minimi muiden suunnassa.
Kuva 3.1. Vasemmalla energiaminimi ja oikealla satulapiste.
Kuvassa 3.2 on puolestaan esitetty kemian kannalta mielenkiintoinen ja realistinen tilanne, joka
voisi vastata sellaisen molekyylin potentiaalienergiapintaa, jossa molekyylillä on kaksi
avaruudellista konformaatiota, jotka voivat muuttua toisikseen tietyn energiavallin ylitettyään. Eli
potentiaalienergiapinnalla on kaksi minimiä, joista toinen on globaali ja toinen lokaali minimi.
Minimien välissä on satulapiste. Satulapisteen merkitys kemian kannalta onkin, että se ilmaisee
transitiotilan rakenteen ja sitä vastaavan energian. Satulapisteen kautta kulkee pienimmän
energiavallin ylittävä tie minimien välillä.
Kuva 3.2. Potentiaalienergiapinta, jossa on esitetty kaksi minimiä (globaali ja lokaali) ja niitä yhdistäväsatulapiste. Molemmissa kuvissa on sama pinta, vain eri suunnista katsottuna.
12
4. MOLEKYYLIMEKANIIKKA
Yksinkertaisin tapa ajatella molekyyliä on kuvitella sen koostuvat kovista palloista (ytimet), jotka
ovat liittyneet jousilla (sidokset) toisiinsa. Tämänkaltaista systeemiä pystytään kuvaamaan klassisen
mekaniikan keinoin ja vältytään raskailta kvanttimekaanisilta laskelmilta. Tämän vuoksi
molekyylimekaniikan laskut ovat hyvin nopeita verrattuna myöhemmin esitettäviin menetelmiin.
Nopeutensa puolesta molekyylimekaniikka sopii hyvin suurien molekyylien mallinnukseen. Myös
pienempiä molekyylejä mallinnettaessa molekyylimekaniikka on hyvä ja nopea menetelmä
alustavaan rakenteen määrittämiseen. Molekyylimekaniikan avulla saatua rakennetta voidaan
käyttää lähtörakenteena raskaammille laskuille ja säästää näin niiden vaatimien iteraatioiden
määrää.
Molekyylimekaniikan ajatuksena on laatia ns. voimakenttä, joka koostuu useista
potentiaalienergiatermeistä, joista kukin liittyy tiettyyn molekyylin ominaisuuteen, kuten
sidospituuksiin tai ytimien ja elektronien väliseen sähköstaattiseen vuorovaikutukseen.
Voimakentän termit sisältävät useita parametreja, jotka voidaan määrittää kokeellisesti tunnettujen
molekyylien avulla. Tällöin on mahdollista parametrisoida voimakenttä esimerkiksi juuri tietyn
tyyppisille molekyyleille, jolloin menetelmä saattaa antaa erittäin hyviä tuloksia samankaltaisille
rakenteille, mutta epäonnistua täysin muille. Erilaiset molekyylimekaniikkamenetelmät ovatkin vain
hieman toisistaan poikkeavia voimakenttälausekkeita erilaisine parametrisointeineen. Seuraavassa
tarkastellaan mitä kaikkea voimakenttälausekkeissa huomioidaan ja minkälaisista osista
tavallisimmat niistä koostuvat. Tämän jälkeen tarkastellaan muutamaa tunnetuinta voimakenttää ja
niiden oletuksia sekä soveltuvuuskohteita.
4.1. Potentiaalienergiatermit
Sidosten venytysvärähtelyt
Tarkastellaan kahden atomin välistä sidospituutta r. Sidospituudella on olemassa tietty arvo req,
jolla potentiaalienergia U(r) saavuttaa minimin. Oletetaan, että energian nollataso on valittu niin,
että U(req) = 0. Jos U(r) ja sen kaikki derivaatat ovat jatkuvia funktioita, kuten käytännössä ovat,
voidaan U(r) lausua matemaattisesti Taylorin sarjakehitelmän avulla:
U(r) = U(req) + ...)(!3
1)(!2
1)( 3eq3
32
eq2
2
eq eqeqeqrr
drUdrr
drUdrr
drdU
rrrrrr (4.1)
Koska U(req) oletetaan energian nollatasoksi, on sarjakehitelmän ensimmäinen termi siis 0. Lisäksi
myös kehitelmän toinen termi on 0, koska U(req) on potentiaalienergiakäyrän minimi, ts. derivaatan
13
nollakohta. Tällöin yksinkertaisin tapa approksimoida sidoksen venytysvärähtelyjä on ottaa
huomioon vain kehitelmän kolmas (toista kertalukua oleva) termi ja olettaa korkeamman kertaluvun
termit mitättömän pieniksi. Jos oletetaan, että tarkastellaan atomien A ja B välistä sidosta, voidaan
kehitelmää (4.1) kuvata yhtälöllä
U(rAB) =21 kAB(rAB rAB,eq)2, (4.2)
missä U(r):n toista derivaattaa kohdassa r = req on merkitty k:lla. Vakiota k kutsutaan voimavakioksi
ja se vastaa harmonisen värähtelijän jousivakiota. Yhtälö (4.2) onkin sama kuin mekaniikasta tuttu
Hooken laki harmoniselle värähtelijälle. Yhtälön (4.2) mukainen potentiaalienergia on siis
muodoltaan paraabeli, jonka minimi on kohdassa r = req. Paraabeli ei kuitenkaan ole kemiallisessa
mielessä järkevä kuvaamaan potentiaalienergiaa kun r kasvaa, sillä se antaa tulokseksi U(r) ,
kun r . Eli kemiallisia sidoksia ei pystytä ”katkaisemaan” lainkaan. Tämä voidaan korjata
lisäämällä U:n lausekkeen myös kehitelmän kolmannen asteen termi. Kolmannen asteen termin
voimavakiota kutsutaan epäharmoniseksi voimavakioksi ja se on negatiivinen. Kolmannen
kertaluvun termi tuottaa näin ollen tietyn maksimiarvon U(r):lle. Sen mukaan ottaminen tuottaa
kuitenkin uuden ongelman, sillä nyt U(r) , kun r . Tämä siis tarkoittaa, että
energeettisesti suotuisin tilanne saavutetaan kun kaikki sidokset ovat täysin dissosioituneet, mikä ei
kemiallisesti ole tietenkään järkevä tulos. Tämä ongelma voidaan jälleen korjata lisäämällä
lausekkeeseen kehitelmän neljännenkin kertaluvun termi. Tällaista neljännen asteen
potentiaalienergiaa kuvaavaa käyrää käytetään useissa käytännön voimakenttälausekkeissa, kuten
orgaanisessa kemiassa yleisesti käytetyssä MM3 voimakentässä. Toisaalta jotkin
voimakenttälausekkeet huomioivat vain kaavan (4.2) mukaisen harmonisen potentiaalienergian.
Nämä voimakentät ovat suunniteltu suurien biomolekyylien mallintamiseen, jolloin pitäytyminen
yksinkertaisimmassa mahdollisessa voimakentässä nopeuttaa laskuja huomattavasti.
Tässä yhteydessä on syytä mainita myös ns. Morsen potentiaalienergiafunktio. Kyseisen funktion
muoto vastaa paremmin kokeellisesti havaittua potentiaalienergiakäyrää kuin em. neljännen
kertaluvun polynomilauseke. Morsen potentiaali on muodoltaan seuraavankaltainen:
U(rAB) = DAB [ )( eqAB,AB1 - rrABe ]2, (4.3)
missä DAB on sidoksen dissosiaatioenergia ja AB kokeellinen sovitusparametri. Kaavan (4.3)
mukaista energialauseketta käytetään laajalti mm. spektroskopiassa, mutta laskennallisesti se ei ole
kovin hyvä, sillä eksponenttifunktion laskeminen on laskentatehollisesti huomattavasti kalliimpaa
kuin polynomifunktion.
14
Sidoskulmat
Voimakenttien sidoskulmista aiheutuva potentiaalienergia kuvataan tavallisesti samoin Taylorin
sarjakehitelmän avulla kuten sidoksetkin edellä. Kehitelmän (4.1) mukainen lauseke atomien A, B
ja C väliselle sidoskulmalle BC voidaan kirjoittaa muotoon
U( BC) =21 [ )2(
ABCk + )3(ABCk ( BC BC,eq) + )4(
ABCk ( BC BC,eq)2 + ... ]
( BC BC,eq)2, (4.4)
missä derivaatat on merkitty voimavakioilla. Käytetystä voimakentästä riippuu kuinka monenteen
kertalukuun asti termejä laskuihin otetaan mukaan. Esimerkiksi edellä mainittu MM3 huomioi
termejä aina kuudenteen kertalukuun saakka. Suurien biomolekyylien laskuihin painotetut
menetelmät huomioivat yleensä selvästi vähemmän termejä ja voivat katkaista lausekkeen jo toisen
kertaluvun termin kohdalta.
Torsiokulmat
Kun ajatellaan Z-matriisin konstruointia, ensimmäistä kahta atomia A ja B kohti tarvitaan
parametriksi ainoastaan sidospituus rAB. Kolmannen atomin C mukaan ottaminen tuo parametriksi
myös sidoskulman BC. Neljännen atomin D paikka voidaan määritellä torsiokulman ABCD avulla.
Torsiokulma ja sen merkki määritellään kuten kuvassa 4.1 on esitetty.
< 0
> 0
A
B
C
D
< 0
> 0
A
B
C
D
< 0
> 0
A
B
C
D
< 0
> 0
A
B
C
D
Kuva 4.1. Torsiokulman ja sen merkin määritelmä. Esim. tässä ABCD 90° = +270°. Kulma atomienlukusuunnassa myötäpäivään on siis positiivinen ja vastapäivään negatiivinen. Huomaa, että tulos on samakatsotaan sitä sitten tason etu- tai takapuolelta.
Koska torsiokulma on jaksollinen (0° = 360° jne.), on myös torsiokulmista aiheutuva
potentiaalienergian lausekekin jaksollinen. Jaksollisia funktioita voidaan kuvata matemaattisesti
polynomilausekkeiden sijasta ns. Fourier-sarjojen avulla, jotka ovat jaksollisia. Taylorin
15
polynomikehitelmää vastaava Fourier-sarjalauseke torsiokulman potentiaalienergialle U( ABCD)
voidaan esittää muodossa
U( ABCD) =21
jjV ABCD, [ )cos()1(1 ABCD,ABCD
1j
j j ]. (4.5)
Yhtälössä (4.5) j kuvaa lausekkeen jaksollisuutta. Esimerkiksi kun j = 2, kosinilauseke tekee kaksi
jaksoa, kun ABCD muuttuu nollasta 360 asteeseen. Jaksollisuus vastaa Fourier-sarjassa tavallaan
polynomilausekkeiden kertalukua. Vj,ABCD kuvaa jaksollisuuden j omaavan termin voimakkuutta,
amplitudia. Kosinilausekkeessa oleva lisätermi j,ABCD on ns. faasitermi. Faasitermit ja amplitudit
ovat voimakenttälausekkeelle ominaisia kokeellisesti määritettyjä parametreja. Usein
kolmejaksoiseen termiin asti ulottuva summaus antaa hyviä tuloksia kokeellisiin verrattuna.
Esimerkiksi n-butaanilla havaitaan hyvä sopusointu kokeellisten tulosten kanssa.
Torsiokulmia käsitellessä on syytä huomioida myös tilanne, joka voi syntyä, kun tiettyyn atomiin
on liittynyt kolme muuta atomia, jotka eivät ole sitoutuneet keskenään. Esimerkki tällaisesta
rakenteesta on formaldehydi HCOH. Formaldehydin rakenne voidaan silti kuvata torsiokulman
avulla, vaikka varsinaista todellista torsiokulmaa ei kemiallisessa mielessä olekaan. Matemaattisesti
rakenteen potentiaalienergia voidaan kuitenkin kuvata kaavan (4.5) mukaisesti kuten tavallisillakin
torsiokulmilla. Tämä on esimerkki ns. epäaidosta torsiosta (improper torsion).
Van der Waalsin voimat
Varsinaisten geometristen ominaisuuksien lisäksi voimakenttälausekkeissa on otettava huomioon
muitakin atomien välisiä vuorovaikutuksia. Yksi näistä on van der Waalsin voimat. Tarkastellaan
atomeita A ja B, jotka eivät ole sitoutuneet toisiinsa. Jos atomit ovat kaukana toisistaan ne eivät
vaikuta merkittävästi toisiinsa. Tilanne muuttuu, kun atomit tuodaan lähemmäs toisiaan. Tällöin
atomeita alkaa vetää puoleensa ns. van der Waalsin voimat, kuten indusoituneet dipoli-dipoli
vuorovaikutukset. Tällaisten vuorovaikutusten on havaittu olevan kääntäen verrannollinen atomien
etäisyyden kuudenteen potenssiin. Atomit eivät kuitenkaan voi lähestyä äärettömästi toisiaan, sillä
tietyllä etäisyydellä niitä ympäröivät elektroniset vuorovaikutukset estävät lähestymisen. Tällöin
toisiinsa sitoutuneiden atomien potentiaalienergiaa voidaan kuvata kuvan 4.2 mukaisella käyrällä.
Energia on nolla, kun atomit ovat kaukana toisistaan. van der Waalsin voimat vetävät atomeja
toisiinsa ja energia saavuttaa tietyn minimin, jonka jälkeen elektroniset hylkimisvoimat aiheuttavat
energiakäyrään jyrkän vallin.
16
r(AB)
Pote
ntia
alie
nerg
ia
Kuva 4.2. Potentiaalienergian käyttäytyminen toisiinsa sitoutumattomien atomien A ja B välisen etäisyydenfunktiona. Kuvan käyrä on piirretty käyttäen yhtälön (4.6) mukaista Lennard-Jonesin potentiaalia.
Potentiaalienergiaa voidaan tässä tapauksessa kuvata ns. Lennard-Jonesin potentiaalin mukaisesti
yhtälöllä
U(rAB) =6
AB
AB12AB
AB
rb
ra . (4.6)
Parametrit a ja b ovat ominaisia vakioita atomeille A ja B. Yhtälössä (4.6) jälkimmäisen termin
kuudes potenssi tulee dipoli-dipoli vuorovaikutusten etäisyysriippuvuudesta, sen sijaan
ensimmäisen termin 12. potenssia ei ole johdettavissa teoriasta, vaan se on valittu, koska se kuvaa
havaittua potentiaalia riittävän hyvin. Oleellisin syy valinnalle on laskennallinen etu. Ensinnäkin
potenssitermi on edullisempi laskea kuin esimerkiksi logaritminen, eksponenttinen tai
neliöjuurellinen termi. Lisäksi juuri 12. potenssi on helppo laskea, koska yhtälössä joudutaan
laskemaan kuudes potenssi. Tällöin 12. potenssi saadaan vain kertomalla kuudes potenssi itsellään,
mikä on laskennallisesti halpa operaatio. Tällöin 12. potenssi on edullisempi laskettava kuin
esimerkiksi 11. potenssi. Koska laskennallisissa menetelmissä yhtälön (4.6) kaltaisia termejä tulee
laskettua hyvin useita, tulevat pienetkin ajansäästöt merkittäviksi laskujen kokonaiskestoa ajatellen.
Sähköstaattiset vuorovaikutukset
Useat voimakentät ottavat huomioon atomien välisen elektronegatiivisuuseron. Tämä voidaan
huomioida samankaltaisella lausekkeella kuten kahden varautuneen (varaus Q) hiukkasen välinen
vuorovaikutus
U(rAB) =AB
BA
041
rQQ
. (4.7)
Erimerkkisille varauksille energia on siis negatiivinen (puoleensa vetävä) ja saman merkkisille
positiivinen (hylkivä).
17
Ristitermit
Aiemmin esitetyt sidospituudet, sidoskulmat ja torsiokulmat eivät ole täysin riippumattomia
toisistaan. Tietyissä kemiallisissa tilanteissa tämä riippuvuus korostuu. Esimerkiksi amideilla C=O
ja C N sidokset eivät ole puhtaasti kaksin- ja yksinkertaisia sidoksia vaan -konjugoituneita ja
sisältävät molemmat osittaista kaksoissidosluonnetta. Ristitermit voidaan huomioida yhtälön (4.8)
kaltaisilla lisätermeillä:
U(rAB, BC) =21 kAB,ABC(rAB rAB,eq)( BC BC,eq), (4.8)
missä voimavakion kAB,ABC suuruus kuvastaa ristitermin vaikutusta.
4.2. Tavallisimmat voimakentät
Erilaisten mallinnusohjelmistojen käyttämät molekyylimekaniikkamenetelmät perustuvat siis
potentiaalienergialausekkeen (voimakentän) minimien etsimiseen. Voimakentän lausekkeissa on
otettu huomioon edellä esitetyt termit ja lisäksi joitain muita mahdollisia lisätekijöitä kuten
esimerkiksi vetysitoutuminen. Yleisesti ottaen potentiaalienergian lauseke sisältää tarkasteltavan
rakenteen vapausasteiden mukaisen määrän (3N 6, kun molekyylissä N atomia) optimoitavia
koordinaatteja (optimointia käsitellään lyhyesti seuraavassa luvussa) ja on muotoa
U(kok.) = U(sidokset) + U(sidoskulmat) + U(torsiokulmat) + U(Van der Waals)
+ U(sähköstaattiset) + U(ristitermit) + U(muut). (4.9)
Molekyylimekaniikkamenetelmien nimistö on jossain määrin sekava. Usein menetelmien kehittäjät
eivät muuta menetelmän nimeä päivittäessään voimakenttäparametrejaan. Tällain on vaikea seurata
mitä voimakenttää minkäkin niminen menetelmä milloinkin käyttää. Esimerkiksi menetelmästä
MM3 on olemassa useita eri vuosina tehtyjä versioita. Usein näkee käytettävän esimerkiksi
nimitystä MM3(96) kertomaan, että kyseessä on voimakenttä, joka on päivitetty vuonna 1996.
Lisävaikeutena on se, että mallinnusohjelmistoihin sisällytetyt molekyylimekaniikkamenetelmät
voivat olla nimeltään samoja kuin jokin toinen, mutta hieman ehkä muokattu ohjelmistoon
sopivaksi, kuten HyperChemin molekyylimekaniikkamenetelmä MM+. Vielä tämän lisäksi
menetelmällä ja ohjelmistolla voi olla jopa sama nimi, kuten AMBER. Nykyään AMBER on
molekyylimallinnusohjelmisto, joka sisältää monia erilaisia voimakenttiä, joista yksi on nimeltään
myös AMBER. Taulukossa 4.1 on esitetty muutamia tavallisimmin käytettyjä
molekyylimekaniikkamenetelmiä ja niiden erityispiirteitä.
18
Taulukko 4.1. Yleisimpiä molekyylimekaniikkamenetelmiä ja niiden ominaisuuksia.Nimi Soveltuvuus Ominaisuuksia
DREIDING Orgaaniset ja bio-orgaanisetmolekyylit
Yleiskäyttöinen. Vanhahko, nykyään käytetään uudempiamenetelmiä. Sidosvärähtelyt voidaan mallintaa Morsenpotentiaalin avulla.
MM1 Hiilivedyt Ensimmäisiä menetelmiä (1976). Soveltuu vainhiilivedyille. Ei huomioi sähköstaattisia vuorovaikutuksia.Ei juurikaan käytetä nykyään, koska on parannettujaversioita.
MM2 Hiilivedyt Parannettu versio MM1:stä. Käytössä nykyäänkin. MMXja MM+ ovat muokattuja versioita MM2:sta.
MM3 Orgaaniset molekyylit Edelleen kehitetty versio MM2:sta. Luultavasti käytetyinmolekyylimekaniikka menetelmä tavallisille pienehköilleorgaanisille yhdisteille.
MMFF Orgaaniset molekyylit Merck Molecular Force Field. Yleiskäyttöinen ja melkouusi (1996) orgaanisen kemian voimakenttä. Kehitettyalunperin pääasiassa molekyylidynamiikkasimulointeihin,mutta toimii hyvin geometriaoptimoinneissakin.
AMBER Proteiinit ja nukleiinihapot Assisted Model Building with Energy Refinement.Parametrisoitu proteiineille ja nukleiinihapoille. Ottaahuomioon mm. liuottimen ja vetysitoutumisen. Ei huomioiristitermejä. Tulokset hyviä proteiineille janukleiinihapoille, mutta epäluotettava muunlaisillemolekyyleille.
CHARMM Biomolekyylit Chemistry at HARvard Macromolecular Mechanics.Yleisesti käytetty biomolekyylien voimakenttä. MenetelmäCHARMm on muuten sama kuin edellinen, mutta onkaupallinen ohjelma.
OPLS Biomolekyylit,orgaaniset liuottimet
Optimized Potentials for Liquid Simulation. Parametrisoituorgaanisille liuottimille. Käytetään myös biomolekyylienmolekyylidynamiikkamallinnuksessa.
SHAPES Siirtymämetalliyhdisteet Epäorgaanisten yhdisteiden mallinnus on usein hankalaa jatulosten luotettavuuden suhteen on syytä olla varovainen.
Mietittäessä molekyylimekaniikan soveltamista johonkin tiettyyn kemian ongelmaan, tulee mieleen
kaksi kysymystä: mikä olisi paras menetelmä omaan ongelmaani ja kuinka luotettavia tulokset ovat.
Ensimmäiseen kysymykseen vastaus on, että paras menetelmä on se, joka on parametrisoitu
samankaltaisille yhdisteille, kun tutkimasi yhdiste, tai muuten osoittautunut hyväksi menetelmäksi
samankaltaisten yhdisteiden tutkimuksessa aikaisemmin kirjallisuuden perusteella. Tavallisten
pienehköjen orgaanisten molekyylien mallintamiseen suositeltavimpia ovat MM2, MM3 ja MMFF
voimakentät. Biomolekyyleillä valinta kohdistuu yleensä joko AMBER:iin tai CHARMM:iin.
19
Epäorgaanisten yhdisteiden mallintamiseen on valitettavan harvoja menetelmiä. Usein voimakenttä
täytyy olla parametrisoitu esimerkiksi juuri tietylle metallille. Molekyylimekaniikkatulosten
luotettavuuden suhteen on syytä olla varovainen. Juuri samankaltaisille yhdisteille, kun
parametrisoinnissa käytetyt, tulokset saattavat olla erittäinkin hyviä. Kuitenkin uudentyyppisille
yhdisteille on tuloksiin suhtauduttava varauksella ja niitä olisi hyvä päästä vertaamaan kokeellisten
tulosten kanssa.
Nykyään molekyylimekaniikkamenetelmiä käytetään nopeutensa vuoksi pääasiassa suurien
biomolekyylien mallinnuksessa. Toinen molekyylimekaniikan tavallisimmista käyttötarkoituksista
on molekyylidynamiikkasimuloinnit, joissa menetelmän nopeus on myös oleellista.
Molekyylidynamiikkaa käsitellään lyhyesti kurssin loppupuolella. Pienemmille molekyyleille
molekyylimekaniikkaa voi käyttää nopeana kvalitatiivisena apuna visualisoimaan rakennetta.
Lisäksi molekyylimekaniikan avulla voi nopeasti rakentaa lähtörakenteita raskaammille
kvanttimekaanisille mallinnusmenetelmille.
5. OPTIMOINTIALGORITMEISTA
Tässä luvussa kuvataan lyhyesti minkälaisilla periaatteilla potentiaalienergiakäyriltä ja -pinnoilta
löydetään halutut minimikohdat. Funktioiden optimointi ja ääriarvojen etsiminen on kokonainen
matematiikan osa-alue ja tässä yhteydessä ei ole tarkoitus alkaa käymään läpi erilaisia algoritmejä.
Tarkoituksena on lähinnä antaa kuva siitä minkätyyppisiin menetelmiin algoritmit voidaan jaotella
ja mitkä ovat niiden hyvät ja huonot puolet molekyylimallinnuksen kannalta. Kuten edellä on
mainittu, N-atomisella molekyylillä tarvitaan p = 3N 6 koordinaattia kuvaamaan sen rakenne.
Oletetaan, että nämä koordinaatit ovat q1, q2, ..., qp. Tällöin molekyylin rakenne voidaan kuvata
vektorilla q = (q1, q2, ..., qp)T. (Huom. Lihavoidut suureet viittaavat vektoriin.) Kyseinen vektori siis
määrittää yksikäsitteisen pisteen potentiaalienergiapinnalla. Jotta optimointimenetelmät voitaisi
jakaa tietyntyyppisiin, on syytä ensin selvittää mitä tarkoitetaan potentiaalienergian gradientilla g =
grad U ja sen Hessen matriisilla eli Hessiaanilla:
20
pq
...2
1
q , g =
pqU
qUqU
...2
1
ja H =
2
2
1
2
1
2
21
2
..............................
......
pp
p
qU
qqU
qqU
qU
. (5.1)
Molekyylin potentiaalienergia riippuu siis paikasta potentiaalienergiapinnalla, eli U = U(q). Pistettä,
jossa U:n gradientti g = 0, kutsutaan stationaariseksi pisteeksi. Tavallisen yhden muuttujan funktion
gradientti on sama kuin derivaatta. Gradientin nollakohdista löydetään potentiaalienergiapinnan
minimit ja maksimit. Useampiulotteisessa tapauksessa gradientin nollakohta voi olla myös
satulapiste. Stationaarisen pisteen laatu voidaan selvittää laskemalla Hessen matriisin ominaisarvot.
Jos kaikki ominaisarvot ovat positiivisia, on kyseessä minimi, ja vastaavasti, jos kaikki ovat
negatiivisia, niin maksimi. (Huomaa, että tässäkin erikoistapauksena on tuttu yhdenmuuttujan
tilanne, jossa toisen derivaatan merkin perusteella pystytään päättelemään ääriarvon laatu.) Muussa
tapauksessa kyseessä on satulapiste. Kemian kannalta mielenkiintoisimpia satulapisteitä ovat ne,
joissa piste on minimi kaikissa muissa suunnissa paitsi maksimi yhdessä. Tämä tarkoittaa, että
ominaisarvoista tasan yksi on negatiivinen ja muut positiivisia. Tällainen satulapiste kuvaa
kemiassa transitiotilaa.
Seuraavassa on esitetty kolme tapaa, joihin erilaiset optimointimenetelmät voidaan luokitella.
Menetelmät, jotka eivät käytä gradientteja
Potentiaalienergiaminimin voi löytää yksinkertaisesti esimerkiksi niin, että potentiaalienergiapinta
ajatellaan verkoksi pisteitä. Valitaan jokin aloituspiste ja lasketaan U ko. pisteessä. Tämän jälkeen
lasketaan U tämän viereisissä pisteissä ja valitaan niistä pienimmän energian antava piste uudeksi
lähtöpisteeksi. Tällä tavoin päädytään ennemmin tai myöhemmin minimipisteeseen. Toinen tapa on
valita jokin alkupiste ja etsiä minimi koordinaatti kerrallaan. Kun kaikkia koordinaatteja
optimoidaan syklisesti vuorotellen, päädytään lopulta minimiin. Tämänkaltaisten menetelmien
etuna on se, että vältytään gradienttien ja Hessen matriisien laskemiselta, mikä säästää laskenta-
aikaa. Toisaalta menetelmien heikkoutena on, että ne saattavat lähestyä minimiä hitaasti, joten
optimointisyklejä saattaa tulla runsaasti.
21
Ensimmäisen kertaluvun menetelmät
Nämä menetelmät ovat sellaisia, jotka ottavat huomioon myös U:n gradientin. Eräs havainnollinen
tällainen menetelmä on ns. jyrkimmän laskeutumisen (steepest descent) menetelmä. Siinä oletetaan
jokin alkupiste, jossa lasketaan U. Tämän jälkeen jokaisen atomin paikkaa muutetaan hieman x-, y-
ja z-suunnassa ja lasketaan U uudelleen näissä alkupisteen ympäristöön kuuluvissa pisteissä. Se
missä pisteessä U vähenee eniten, otetaan uudeksi lähtöpisteeksi. Menetelmä etsii siis jyrkimmän
tien alas kohti minimiä. Tällöin optimointisyklien määrä on huomattavasti pienempi kuin edellisissä
menetelmissä. Tosin haittana on, että joka pisteessä täytyy tehdä lukuisia laskuja. Muita
ensimmäisen kertaluvun menetelmiä ovat ns. konjugaattigradienttimenetelmät. Tällainen on mm.
Polak-Ribière algoritmi, joka esim. HyperChemissä on oletusalgoritmina.
Toisen kertaluvun menetelmät
Nämä menetelmät käyttävät laskuissaan paitsi gradientteja myös Hessen matriisia. Tällaisia
menetelmiä ovat mm. Newton Raphson sekä Fletcher Powell algoritmit. Näistä ensin mainittu on
moniulotteinen yleistys lukiostakin tutusta (?) menetelmästä etsiä nollakohtia yhden muuttujan
funktioille. Yhteistä toisen kertaluvun menetelmille on, että niissä ns. iteraatiosyklien määrä jää
melko vähäiseksi, koska algoritmi löytää minimin tehokkaasti vähillä askeleilla. Kuitenkin Hessen
matriisin laskeminen jokaisessa pisteessä saattaa olla laskennallisesti raskas tehtävä.
Sopivimman algoritmin valitseminen riippuu monesta seikasta, mutta joitain yleissääntöjä voidaan
kuitenkin antaa. Laskettaessa suuria molekyylejä molekyylimekaniikkamenetelmien avulla,
potentiaalienergialausekkeissa saattaa olla erittäin monta termiä. Tällöin Hessen matriisin
muodostaminen on raskas tehtävä johtuen matriisin suuresta dimensiosta. Tavallisimmin
molekyylimekaniikkalaskuissa suurilla molekyyleillä käytetäänkin ensimmäisen kertaluvun
algoritmeja. Yleensä ne ovat selkeästi nopeampia ja tehokkaampia kuin menetelmät, jotka eivät
käytä gradientteja lainkaan.
Pienemmillä molekyyleillä Hessen matriisi ei ole niin raskas laskennallisesti ja esimerkiksi
Newton Raphson on laajalti käytetty menetelmä. Kyseisen menetelmän yhtenä heikkoutena on, että
sen lähtötilanne täytyy olla jo kohtuullisen lähellä optimia. Usein onkin järkevämpää optimoida
muutama sykli ensin esimerkiksi steepest descent –menetelmällä ja vaihtaa tämän jälkeen
Newton Raphsoniin. Kvanttimekaanisissa menetelmissä on yleensä laskennallisesti edullista päästä
minimiin niin vähin iteraatiosyklein kuin mahdollista. Nämä menetelmät käyttävätkin yleisimmin
22
toisen kertaluvun algoritmeja. Kvanttimekaanisiin menetelmiin paneudutaankin seuraavissa
luvuissa tarkemmin.
6. MOLEKYYLIORBITAALITEORIAA
Seuraavissa luvuissa käsiteltävien semi-empiiristen, ab initio ja tiheysfunktionaaliteoreettisten
menetelmien ymmärtämiseksi, on syytä käydä läpi ensin joitakin kvanttimekaniikan perusasioita ja
termejä. Tämän jälkeen käsitellään molekyyliorbitaali(MO)teoriaa. Käsittelyn ideana on miettiä
mitä asioita täytyy ottaa huomioon, jos halutaan kuvata molekyylejä kvanttimekaanisin menetelmin.
Molekyylien kuvaaminen on selvästi hankalampi tehtävä kuin atomien.
6.1. Aaltofunktiot ja operaattorit
Tähän asti olemme käsitelleet mikroskooppisia systeemejämme, molekyylejä, klassisen fysiikan
tarjoamilla makroskooppisille systeemeille paremmin sopivilla menetelmillä. Mikroskooppisessa
maailmassa tilanne on kuitenkin erilainen. Kvanttimekaniikan voidaan ajatella alkaneen vuonna
1900, jolloin Max Planck selitti mustan kappaleen säteilyn niin, että säteily koostui pienistä
diskreeteistä energiakvanteista. Myöhemmin havaittiin paitsi säteilyn myös esimerkiksi atomien
elektronisten energioiden olevan kvantittuneet. Tästä on seurauksena, että esimerkiksi
vibraatiospektreissä havaitaan vain tiettyjä diskreettejä energioita vastaavia siirtymiä. Huomattiin,
että säteilyllä onkin myös hiukkasluonne ja lisäksi, että myös materialla on aaltoluonne.
Mikroskooppisen maailman uudet ilmiöt saivat aikaan kokonaan uuden fysiikan teorian,
kvanttimekaniikan, joka kehitettiin nopeassa tahdissa 1920-1930 lukujen vaihteessa.
Kvanttimekaniikka tarjoaa avaimet mikromaailman, kuten molekyylien, ominaisuuksien
selvittämiseen, ja ainakaan tähän mennessä minkään kvanttimekaniikan tuloksen ei ole havaittu
olevan ristiriidassa kokeellisten mittausten kanssa.
Kvanttimekaniikan keskeisimpiä käsitteitä ovat aaltofunktiot ja operaattorit. Kemiallisen systeemin
tilaa kuvataan aaltofunktiolla (toisinaan käytetään myös nimitystä tilavektori). Operaattori on
matemaattinen objekti, joka nimensä omaisesti operoi aaltofunktioon. Yleisesti operaattorin
operoidessa funktioon, saadaan tuloksena uusi funktio. Jos operaattorin operoidessa tiettyyn
aaltofunktioon saadaan tulokseksi vakiokerrointa vaille sama funktio, kutsutaan tätä kerrointa
23
operaattorin ominaisarvoksi ja operoitua aaltofunktiota ominaisfunktioksi. Tämä voidaan yleisesti
kuvata yhtälöllä
A a . (6.1)
Edellisessä yhtälössä A on operaattori (operaattorit merkitään tavallisesti isolla kirjaimella),
operaattorin ominaisfunktio ja a sitä vastaava ominaisarvo. Yhtälö (6.1) tulkitaan
kvanttimekaniikassa usein matriisiyhtälöksi siten, että operaattoria A vastaa jokin n x n matriisi ja
ajatellaan n-riviseksi pystyvektoriksi (tästä nimitys tilavektori). Ominaisarvo a on sitä vastoin
tavallinen luku, skalaari.
Yhtälön (6.1) merkitys on se, että kvanttimekaniikassa fysikaalista suuretta vastaa tietty operaattori
ja operaattorin ominaisarvot vastaavat kyseisen suureen mahdollisia mittausarvoja. Aaltofunktiota
itsessään on hankalaa havainnollistaa, mutta aaltofunktion tulolla kompleksikonjugaattinsa
kanssa on selkeä käytännön merkitys, sillä se kuvaa todennäköisyystiheyttä. Kvanttikemian
kannalta oleelliset aaltofunktiot ovat reaalisia, joten kompleksikonjugointi ei vaikuta niihin. Tällöin
siis suure = 2 kuvaa todennäköisyystiheyttä. Esimerkiksi elektronin aaltofunktion neliö
kuvastaa todennäköisyyttä löytää elektroni tietystä paikasta. Lisäksi kvanttikemian operaattorit ovat
ns. Hermiittisiä (tai itseadjungoituja), mistä on seurauksena, että ominaisarvot ovat reaalilukuja.
Aaltofunktiota itseään on vaikea kuvata käytännössä. Erään ajattelutavan tarjoaa Cramerin kirja:
”From this very formal presentation, the nature of can hardly be called anything but mysterious.
Indeed, perhaps the best description of at this point is that it is an oracle when queried with
questions by an operator, it returns answers.”
6.2. Hamiltonin operaattori
Operaattoria, jonka ominaisarvoina saadaan systeemin mahdolliset energiat, kutsutaan Hamiltonin
operaattoriksi. Hamiltonin operaattorin ominaisarvoyhtälö voidaan siis kirjoittaa muodossa
H E , (6.2)
missä H on Hamiltonin operaattori ja E systeemin energia, kun se on ominaistilassa . Yhtälöä
(6.2) kutsutaan Schrödingerin yhtälöksi. Hamiltonin operaattorin muodosta riippuu onko
Schrödingerin yhtälö ratkaistavissa vai ei. Hamiltonin operaattorin lausekkeessa huomioidaan
kaikki systeemin energiaan vaikuttavat tekijät. Kun tarkastellaan molekyyliä, johon ei vaikuta
mitkään ulkoiset tekijät (kuten ulkoinen sähkö- tai magneettikenttä tai suhteellisuusteoreettiset
vaikutukset), on Hamiltonin operaattori muotoa
24
H = i
iem
22
2 kk
km2
2
2 041
i k ik
k
rZe 2
+04
1ji ijre2
+04
1lk kl
lk
rZZe2
.
(6.3)
Indeksit i ja j käyvät läpi kaikki molekyylin sisältämät elektronit ja k ja l ytimet, on Planckin
vakio jaettuna 2 :llä, me on elektronin ja mk ytimen k massa, 0 on tyhjiön permittiivisyys, e on
alkeisvaraus, Z on atomin järjestysluku, rab on partikkelien (elektroni tai ydin) a ja b välinen
etäisyys ja 2 (nabla toiseen) on Laplacen operaattori, joka karteesisissa koordinaateissa on muotoa
2i =
2
2
ix+
2
2
iy+
2
2
iz. (6.4)
Lausekkeen (6.3) mukaan aaltofunktio on siis 3n koordinaatin funktio, missä n on elektronien ja
ytimien yhteenlaskettu lukumäärä ja kolme tulee siitä, että partikkelin paikkaa kuvaamaan tarvitaan
x-, y- ja z-koordinaatti.
Vaikka Hamiltonin operaattorin lauseke (6.3) saattaakin näyttää pitkältä ja monimutkaiselta, se
koostuu helposti ymmärrettävissä olevista osista. Kvanttimekaniikassa liike-energiaa esitetään
operaattorilla T, joka on muotoa
T = 22
2m. (6.5)
Hamiltonin operaattorin kaksi ensimmäistä termiä sisältävät siis elektronien sekä ytimien liike-
energian. Loput kolme termiä esittävät potentiaalienergiaa. Ensimmäinen näistä on elektronien ja
ytimien välisestä sähköisestä vetovoimasta aiheutuva. Lausekkeen (6.3) neljäs termi koostuu
elektronien ja viides ytimien välisestä sähköisestä hylkimisestä aiheutuvasta potentiaalienergiasta.
Summalausekkeessa esiintyvät i < j ja k < l tulevat siitä, että summassa laskettaisiin kutakin
hiukkasparia vastaava termi vain kertaalleen.
Hamiltonin operaattorille on yleensä useita erilaisia aaltofunktioita i (energioilla Ei), jotka
toteuttavat ominaisarvoyhtälön (6.2). Nämä funktiot voidaan valita niin, että ne ovat sekä
ortogonaalisia että normitettuja (=ortonormeerattuja) eli
ijji dr , (6.6)
missä ij on ns. Kroeneckerin delta (=1, kun i = j, ja 0, kun i j) ja integraalin dr on 3n-ulotteisen
avaruuden tilavuuselementti. Edellisessä lausekkeessa ortogonaalisuus tarkoittaa sitä, että integraali
on nolla, kun aaltofunktiot ovat erit, ja normeeraus sitä, että kunkin aaltofunktion neliön integraali
on yksi.
25
Nyt ominaisarvoyhtälöä ja edellistä tulosta hyväksi käyttäen saadaan
ijjjijjjiji EdEdEd rrr . (6.7)
Tämä tulos on hyvin tärkeä, sillä se kertoo, että laskemalla yhtälön (6.7) mukaisia integraalin arvoja
saadaan tulokseksi molekyylin mahdolliset energiat. Tosin sitä ennen täytyy tietää tarkemmin
minkälaisia aaltofunktiot ovat.
6.3. Variaatioperiaate
Edellisen kappaleen mukaan molekyylin energia pystytään siis periaatteessa laskemaan, jos
aaltofunktio tunnetaan. Siihen miten aaltofunktio sitten löydetään, keskitytään tässä luvussa.
Oletetaan, että on jokin mielivaltainen funktio. Edelleen voidaan olettaa, että pystymme
lausumaan :n joidenkin ominaisarvoyhtälön (6.2) täyttävien ortonormeerattujen kantafunktioiden
i lineaarikombinaationa, eli voimme kirjoittaa
=i
iic , (6.8)
jossa kertoimet ci ovat joitain tuntemattomia lukuja. Myös kantafunktiot ovat tuntemattomia
funktioita. Lisäksi voidaan olettaa, että on ortonormeerattu. Tällöin yhtälöiden (6.6) ja (6.8)
perusteella voidaan kirjoittaa
rr dccdj
jji
ii2 = rdcc ji
i,jji
=ji
jicc,
ij =i
ic2 = 1, (6.9)
missä viimeinen yhtäsuuruus seuraa :n ortonormeerauksesta. Vastaavalla tavalla voidaan
yhtälöiden (6.7) ja (6.8) perusteella kirjoittaa
rr dcHcdHj
jji
ii )()( = rdHcc jii,j
ji
=ji
jicc,
Ej ij =i
ic2 Ei. (6.10)
Tämän tuloksen käytännön merkitys on siinä, että tilaa vastaava energia voidaan lausua
kantafunktioiden kertoimien ja niiden yksittäisten energioiden avulla. Seuraavaksi oletetaan, että
energioiden Ei joukossa on olemassa alhaisin energia ja merkitään tätä E0. Huom: se, että alin
energia on olemassa, on eräs kvanttimekaniikan ominaisuuksista. Nyt kahdesta edellisestä
tuloksesta yhdistämällä saadaan
rdH E0 rd2 =i
ic2 (Ei E0) 0, (6.11)
26
missä viimeinen summalauseke on suurempi tai yhtäsuuri kuin nolla, koska 2ic 0 ja Ei E0 0.
Tällöin siis
rr
ddH
2 E0. (6.12)
Tätä tulosta kutsutaan variaatioperiaatteeksi ja sillä on erittäin tärkeitä seurauksia. Periaate kertoo,
että laskemalla yhtälön vasemmanpuoleinen integraali, saadaan aina suurempi lukema kuin
systeemin perustilaa kuvaava matalin mahdollinen energia. Se tarjoaa menetelmän, jolla arvioida
likimääräisen aaltofunktion hyvyyttä. Voimme aluksi ”arvata” jonkin lähtökohtaisen aaltofunktion
ja ryhtyä sitten parantelemaan eli optimoimaan tätä ”arvausfunktiota” siten, että yhtälön (6.12)
vasemman puolen integraalille saataisiin mahdollisimman pieni arvo. Lisäksi on syytä huomata, että
tulos (6.12) ei ole riippuvainen siitä millaisia kantafunktiot i ovat ja miten ne on valittu, eli
voimme konstruoida arvausfunktion millä tahansa haluamallamme tavalla ja lähteä sitten
variaatioperiaatteen mukaan optimoimaan parasta mahdollista, matalimman energian tilaa kuvaavaa
aaltofunktiota. Seuraavana tehtävänä onkin käsitellä sitä, minkälainen olisi järkevä ja hyvä
arvausfunktio matalimman energian tilalle. Sitä ennen käsitellään kuitenkin eräs laskuja
huomattavasti nopeuttava yksinkertaistus.
6.4. Bornin ja Oppenheimerin approksimaatio
Tähän asti olemme käsitelleet monen hiukkasen molekyylisysteemiä teoreettisen abstraktisti.
Tosiasiassa tarkkaa aaltofunktiota molekyylille on erittäin vaikeaa laatia. Tähän on syynä lähinnä
Hamiltonin operaattorin (6.3) potentiaalitermit, sillä niiden mukaan mikään hiukkanen (elektroni tai
ydin) ei liiku riippumattomasti muista, vaan päinvastoin jokainen hiukkanen kokee kaikkien muiden
hiukkasten veto/poistovoiman. Tätä kutsutaan usein korrelaatioksi kvanttimekaniikassa. Jotta
tilannetta saataisiin yksinkertaistettua, oletetaan ns. Bornin ja Oppenheimerin approksimaatio
pitäväksi.
Voidaan olettaa, että molekyylissä ytimet liikkuvat paljon hitaammin kuin elektronit. Tämä oletus
on järkevä, sillä protonin ja neutronin massat ovat n. 1800-kertaisia elektronin massaan nähden, ja
lausekkeen (6.5) mukaisesti massa on liike-energiatermissä nimittäjänä. Tällöin voidaan ajatella,
että ytimien liikkuessa uuteen sijaintiin, elektronit asettuvat saman tien uudelleen ytimien sijainnin
aiheuttaman potentiaalikentän mukaisesti. Näin ollen ytimien ja elektronien liike voidaan käsitellä
erillisinä ja elektronien energiat voidaan laskea ajatellen ytimet kiinnitettyinä paikallaan olevaksi
verkostoksi. Tätä oletusta kutsutaan Bornin ja Oppenheimerin approksimaatioksi. Jos ytimien
27
paikka oletetaan kiinnitetyksi, niiden liike-energiatermi on nolla, ja ytimien välinen hylkimistermi
saa jonkin tietyn vakioarvon ydinten paikkojen geometriasta riippuen. Tällöin yhtälön (6.3)
mukainen täydellinen Hamiltonin operaattori pelkistyy ns. elektroniseksi Hamiltonin operaattoriksi
Hel = i
iem
22
2 041
i k ik
k
rZe2
+04
1ji ijre2
(6.13)
ja Schrödingerin yhtälön
Hel el Eel el (6.14)
ratkaisuna saadaan ns. elektroninen aaltofunktio ja energia. Jokaista ydinten muodostamaa
systeemiä kohti on olemassa elektroninen aaltofunktio el, joka riippuu siis vain elektronien
koordinaateista. Yleensä keskitytään käytännössä ratkaisemaan vain elektronista Schrödingerin
yhtälöä (6.14).
Bornin ja Oppenheimerin approksimaatio on melko lievä ja yleensä hyvin oikeutettu. Tavallaan se
on lähtökohtana jo sille, että yleensä voidaan puhua mm. potentiaalienergiapinnoista (vrt. luku 3).
Potentiaalienergiapintojen avulla on esitetty nimenomaan elektroninen energia ydinten
koordinaattien funktiona. Jatkossa tullaan keskittymään ainoastaan elektroniseen Hamiltonin
operaattoriin, aaltofunktioon ja energiaan eikä alaindeksiä ’el’ enää erikseen merkitä.
6.5. LCAO-lähestymistapa
Edellä oleva Hamiltonin operaattorin muoto (6.13) on jo huomattavasti mukavampi kuin
alkuperäinen (6.3). Lauseke (6.13) sisältää kuitenkin erään laskennallisesti hyvin ongelmallisen
termin, nimittäin elektronien välisen korrelaation. Tähän termiin palataan myöhemmin, mutta
tarkastellaan seuraavaksi yksinkertaistettua tilannetta, jossa systeemimme koostuu ainoastaan
yhdestä elektronista. Tällöin yhtälön (6.13) viimeinen eli elektronikorrelaatiotermi voidaan jättää
pois.
Variaatioperiaatteen mukaan, voimme rakentaa lähtökohtaisen aaltofunktion kuten haluamme ja
tämän jälkeen arvioida funktion ”hyvyyttä” yhtälön (6.12) avulla; mitä pienempi tulos, sen parempi.
Mikä olisi sitten järkevä tapa valita lähtökohtainen aaltofunktio? Matematiikassa on usein tapana
esittää mielivaltainen funktio joidenkin kantafunktioiden avulla. Tällaiseksi kantajoukoksi (basis
set) on järkevää valita funktioita, jotka ovat laskennallisesti miellyttäviä ja yksinkertaisia.
Esimerkiksi molekyylimekaniikassa torsiokulmia kuvattiin Fourier-sarjoilla. Siinä mielivaltainen
28
torsionaalista energiaa kuvaava funktio kuvattiin kosinitermeistä koostuvien kantafunktioiden
avulla.
Tällä hetkellä tarkasteltavana on siis vain yhden elektronin systeemit. Jos myös ytimiä olisi vain
yksi, tilanne olisikin suoraviivainen, sillä voisimme eksaktisti ratkaista Schrödingerin yhtälön ja
saada tuloksena kaipaamamme aaltofunktiot. Tuloksena olisi tällöin aiemmista kursseista tutut
vetyatomin ratkaisuna saadut funktiot eli atomiorbitaalit 1s, 2s, 2p, 3s, 3p, 3d jne. Koska nämä ovat
tunnettuja funktioita, on luonnollista ottaa lähtökohdaksi, että voisimme kuvata myös molekyylien
aaltofunktioita näiden atomisten aaltofunktioiden avulla. Näin ollen voimme valita lähtökohtaiseksi
molekyylin aaltofunktioksi lineaarikombinaation atomien aaltofunktioista i eli
=N
iiia
1, (6.15)
missä on kuvattu N:stä atomien aaltofunktiosta i muodostetun kantajoukon avulla (kukin i
kertoimella ai painotettuna). Tätä molekyylin aaltofunktion esitystapaa kutsutaan LCAO-
lähestymistavaksi (Linear Combination of Atomic Orbitals). Tässä on syytä korostaa, että yhtälön
(6.15) mukainen esitystapa on puhtaasti matemaattinen. Onkin parempi ajatella atomiorbitaaleja
tässä yhteydessä ainoastaan joinakin funktioina, joiden avulla voidaan kuvata koko molekyylin
aaltofunktiota. Eli sanoilla orbitaali ja funktio on tässä sama merkitys.
Koska aaltofunktion neliöllä kuvataan todennäköisyystiheyttä, voidaan ajatella, että tämä
käsittelemämme elektroninen aaltofunktio on eräänlainen kartta, joka kertoo mistäpäin
todennäköisimmin elektronin molekyylissä löydämme. Täten valitsemiemme kantafunktioiden on
oltava sellaisia, että ne sallivat elektronin kulkea sinne missä niiden suuri todennäköisyys on
energeettisesti optimaalisinta. Elektronitiheyskartta (ja siis molekyyliorbitaali) voidaan laatia
useammallakin tavalla kantafunktioista. Esimerkiksi kemiallisesti on intuitiivista puhua hiilen sp-
hybridisoituneista C H molekyyliorbitaaleista. Kyseisen kaltainen molekyyliorbitaali voidaan
rakentaa yhtä hyvin käyttämällä pelkästään esimerkiksi atomien pallosymmetrisiä s-orbitaaleja.
Täten yhtälön (6.15) atomiorbitaalien ja niiden kertoimien kemiallisen tulkinnan kanssa on syytä
olla varovainen.
6.6. Sekulaarideterminantti
Seuraavaksi ryhdytään soveltamaan kappaleessa 6.3 esitettyä variaatioperiaatetta LCAO-periaatteen
mukaiseen molekyyliseen arvausfunktioon. Sijoittamalla yhtälön (6.15) molekyylin aaltofunktio
variaatioperiaatteen lausekkeeseen (6.12) saadaan
29
E =ij
jiji
ijji
ji
jiji
ji
jiji
ji
N
jjj
N
iii
jjj
iii
Saa
Haa
daa
dHaa
daa
daHa
,
,
,
,
))((
)()(
r
r
r
r, (6.16)
missä on lopuksi käytetty osoittajan ja nimittäjän integraaleille merkintää Hij ja Sij. Yhtälöissä (6.9)
ja (6.10) käytettyjä ortonormaalisuusominaisuuksia ei voi tässä yhteydessä käyttää, sillä
atomiorbitaaleista muodostuva kantajoukko ei ole ortonormaali. Edellä merkittyjä integraaleja
kutsutaan nimillä resonanssi-integraali (Hij, resonance integral) ja peittointegraali (Sij, overlap
integral). Jälkimmäisellä on selkeä fysikaalinen merkitys, sillä se kuvaa sitä missä määrin kaksi
kantafunktiota peittävät toisiaan. Resonanssi-integraalilla ei ole niin selvää intuitiivista merkitystä,
paitsi tapauksessa jossa i=j, jolloin se kuvastaa energiaa, joka elektronilla on kyseisellä
atomiorbitaalilla.
Variaatioperiaatteen mukaan todellista yhden elektronin systeemin perustilan energiaa lähestytään,
mitä pienempiä ovat yhtälön (6.16) avulla lasketut energiat. Em. yhtälössä vapaina muuttujina ovat
kertoimet ai. Täten pienimmän energian antavat kertoimet löydetään ehdosta
kaE
k
0 (6.17)
eli energian osittaisderivaatat jokaisen kertoimen suhteen täytyy olla nollia. Kun yhtälöä (6.16)
derivoidaan kertoimien suhteen saadaan laskuoperaatioiden jälkeen tulokseksiN
ikikii kESHa
10)( . (6.18)
Tämä tulos kertoo, että meillä on N kappaletta yhtälöitä (k kulkee yhdestä N:ään) ja kussakin
yhtälössä on N kappaletta tuntemattomia (ai kertoimet). Lineaarialgebran mukaisesti tällaiselle
yhtälöryhmälle saadaan nollasta eroava ratkaisu silloin ja vain silloin kun tuntemattomien
kertoimista muodostetun determinantin arvo on nolla, eli tässä tapauksessa saadaan
0
2211
2222222121
1112121111
NNNNNNNN
NN
NN
ESHESHESH
ESHESHESHESHESHESH
. (6.19)
Tätä determinanttia kutsutaan sekulaarideterminantiksi. Determinantin ratkaisuksi saadaan joukko
(N kappaletta) energia-arvoja Ej, joista jotkin saattavat olla samoja eli ns. degeneroituneita. Kullekin
energia-arvolle voidaan ratkaista kertoimet aij yhtälön (6.18) mukaan. Alimmalle energia-arvolle Ej
(ja parametreille aij) saadaan optimaalisin aaltofunktio, joka on kantafunktioidensa avulla
lausuttavissa siis muodossa
30
j =N
iiija
1. (6.20)
Systeemin alimman energian mukainen aaltofunktio eli molekyyliorbitaali kuvaa siis systeemin
perustilaa. Korkeamman energian molekyyliorbitaalit kuvaavat puolestaan virittyneitä tiloja.
Kootusti tämän kappaleen tuloksena voidaan sanoa, että optimaalinen yhden elektronin aaltofunktio
molekyylille saadaan seuraavalla proseduurilla:
1. Valitaan N kantafunktiota.
2. Lasketaan resonanssi- ja peittointegraalit Hij ja Sij (N2 kappaletta).
3. Muodostetaan sekulaarideterminantti ja ratkaistaan N kappaletta juuria Ej.
4. Ratkaistaan kertoimet aij yhtälöstä (6.18) kullekin Ej-arvolle ja sitä kautta MO:t.
Huomionarvoista on, että tällä proseduurilla saadut MO:t ovat keskenään ortogonaalisia.
6.7. Hartree-tulo ja Hartreen Hamiltonin operaattori
Edellä käsiteltiin systeemiä, jossa on vain yksi elektroni ja löydettiin ko. systeemille menetelmä
optimaalisen molekyyliorbitaalin määrittämiseksi. Tarkastellaan seuraavaksi systeemiä, joka
koostuu useammasta elektronista, mutta jätetään edelleen elektronikorrelaatiotermi huomiotta.
Tällöin molekyylin Hamiltonin operaattori H voidaan separoida erillisiin yhden elektronin
Hamiltonin operaattoreihin hi, eli
H =N
iih
1, (6.21)
missä
hi = 2
21
i
M
k ik
k
rZ
1. (6.22)
Em. yhtälöissä N on elektronien ja M ytimien lukumäärä. Huomaa myös, että tässä yhteydessä (jos
vertaat yhtälöön 6.13) on siirrytty käyttämään ns. atomisia yksiköitä. Laskennallisessa kemiassa
käytetään usein atomisia yksiköitä, joissa suurin osa vakioista valitaan ykköseksi, jolloin niitä ei
tarvitse kantaa mukana yhtälöissä. Yleisimmät yksiköt vastaavine SI-järjestelmän arvoineen on
koottu Liitteenä 1 olevaan taulukkoon.
Yhden elektronin Hamiltonin operaattoreiden täytyy toteuttaa vastaava yhden elektronin
Schrödingerin yhtälö
hi i = i i. (6.23)
31
Separoituvalle Hamiltonin operaattorille monen elektronin aaltofunktio (merkitään HP) saadaan
yhden elektronin aaltofunktioiden tulosta, ns. Hartree-tulosta (Hartree-product). Tämä nähdään
seuraavalla laskulla:
H HP = NH 21 = N
N
iih 21
1
= Nh 211 )( + Nh )( 221 + … + )(21 NNh
= N211 )( + N)( 221 + … + )(21 NN
= N
N
ii 21
1=
N
ii
1HP. (6.24)
Monen elektronin Hamiltonin operaattorin ominaisfunktioksi saadaan siis Hartree-tulo, eli
yksittäisten elektronien aaltofunktioiden tulo, ja vastaavaksi ominaisarvoksi yksittäisten elektronien
ominaisarvojen summa. Huomaa myös, että jos yksittäisten elektronien aaltofunktiot ovat
normeerattuja, niin samoin on myös niiden tulo.
Kuten edellä mainittiin, elektronien välinen hylkimistermi jätettiin edelleen huomiotta. Voidaan silti
miettiä kuinka hyvä em. Hartree-tulon aaltofunktio olisi, jos laskisimme sitä käyttäen energian
oikealla Hamiltonin operaattorilla (6.13), joka siis huomioi myös elektronikorrelaation. Tämä
tarkoittaa sitä, että haluaisimme löytää aaltofunktiot, jotka minimoivat energian odotusarvon eli
suureen
< HP H HP> = rdH HPHP . (6.25)
Edellä integraali on merkitty ns. Diracin merkintätavalla. Variaatiolaskennan keinoin saadaan tästä
minimointitehtävästä mielenkiintoinen tulos, jonka mukaan jokainen tällainen energian minimoiva
aaltofunktio i on tietyn operaattorin (Hartreen Hamiltonin operaattorin) hi ominaisfunktio, missä
hi = 2
21
i
M
k ik
k
rZ
1 + Vi{j}, (6.26)
jossa viimeinen termi sisältää vuorovaikutuspotentiaalin kaikkien niiden toisten elektronien kanssa,
jotka ovat orbitaalilla j, ja voidaan laskea kaavalla
Vi{j}=ij
jij
j drr
. (6.27)
Viimeisen kaavan j on elektroniin j liittyvä varaustiheys (eli todennäköisyystiheys). Täten kaavan
(6.26) viimeinen termi on muodoltaan aivan samanlainen kuin keskimmäinenkin; ainoana erona on,
että ytimet on ajateltu pistemäisinä varauksina, kun taas elektroneilla on jatkuva varausjakauma,
jolloin integrointi koko avaruuden yli on tarpeellinen. Potentiaalin lausekkeessa on huomattavaa se,
32
että se sisältää keskimääräisen repulsiivisen vaikutuksen, jonka yksi elektroni kokee. Koska
todennäköisyystiheys i = i2, on tilanne kuitenkin ongelmallinen. Tarkoituksenahan on siis
laskea optimaalinen aaltofunktio kaavan (6.26) antaman Hamiltonin operaattorin avulla, mutta nyt
Hamilton itsessään jo sisältää kyseisen funktion, joten herää kysymys miten voimme käyttää
kyseistä operaattoria ennen kuin edes tiedämme mikä se on?
Tähän ongelmaan kehitti ratkaisun Hartree jo vuonna 1928. Ratkaisu kulkee ns. itseytyvän kentän
menetelmän nimellä (SCF, self-consistent field). Ideana on, että aluksi arvataan aaltofunktiot
kaikille molekyyliorbitaaleille (Hartree käsitteli näin atomiorbitaaleja) ja käytetään näitä funktioita
Hartreen Hamiltonin operaattoreiden hi muodostamiseen. Kun näin saatujen operaattoreiden avulla
ratkaistaan Schrödingerin yhtälö (6.23), saadaan tuloksena joukko uusia aaltofunktioita, jotka mitä
todennäköisimmin eroavat aluksi arvatuista. Tämän jälkeen näitä uusia, oletettavasti parempia,
aaltofunktioita käytetään uusien Hamiltonin operaattoreiden muodostamiseen, jonka jälkeen näillä
uusilla operaattoreilla ratkaistaan taas uudet aaltofunktiot. Näin jatketaan iteratiivisesti kunnes
Schrödingerin yhtälöstä saadut uudet aaltofunktiot eivät enää eroa operaattoreissa käytetyistä
edellisen syklin aaltofunktioista. Tätä prosessia kutsutaan SCF-menetelmäksi.
Nyt olemme päässeet molekyyliorbitaalien kuvaamisessa jo huomattavan pitkälle. Seuraavaksi
voidaankin kysyä miten monen elektronin tapauksessa elektronit käytännössä sijoitetaan
molekyyliorbitaaleilleen? Jotta tähän kysymykseen voisi vastata, täytyy ottaa käsittelyyn myös
suure, joka on tähän asti sivuutettu kokonaan nimittäin elektronin spin.
6.8. Elektronin spin ja antisymmetrisyys
Kaikilla elektroneilla on karakteristinen spinkvanttiluku. Elektronin spinin aaltofunktio on ns.
spinoperaattorin Sz ominaisfunktio. Operaattorilla Sz on vain kaksi ominaisarvoa (±½ ) ja niitä
vastaavat aaltofunktiot ovat ortonormaaleja ja niitä merkitään tyypillisesti kreikkalaisilla kirjaimilla
ja . Elektronin spin seuraa luonnollisella tavalla relativistisesta kvanttiteoriasta, eli siitä kun
Einsteinin suhteellisuusteoria otetaan huomioon kvanttimekaniikan yhtälöissä. Tämän havainnon
teki ensimmäisenä Paul Dirac. Toinen relativistisen käsittelyn tuoma seuraus kvanttimekaniikkaan
on ns. Paulin kieltosääntö, joka kertoo, että molekyylin kahdella elektronilla ei voi olla täsmälleen
samat kvanttiluvut. Edellisissä luvuissa saatu molekyyliorbitaali määrää kaikki muut kvanttiluvut
(pää-, sivu- ja magneettinen kvanttiluku) paitsi spinin, joten Paulin kieltosäännöstä seuraa, että
yhdellä orbitaalilla voi olla täten korkeintaan kaksi elektronia ja niillä on vastakkaiset spinit. Tällöin
33
voisimme kirjoittaa Hartree-tulon mukaisen aaltofunktion kahdelle elektronille esimerkiksi
muodossa
HP = )2()2()1()1( ba . (6.28)
Tässä tapauksessa HP kuvaa ns. triplettitilaa, eli sellaista tilaa, jossa kahden elektronin spinit ovat
samansuuntaiset (molemmilla ). Esityksessä a b, koska muuten elektroneilla 1 ja 2 olisi samat
kvanttiluvut. Lisäksi aaltofunktiot a ja b oletetaan ortonormaaleiksi.
Edellä mainittu aaltofunktio on tähänastisen tietomme perusteella järkevästi konstruoitu. Siinä on
vikana ainoastaan se, että se on fundamentaalisesti mahdoton. Edellä mainittu Paulin kieltosääntö
on nimittäin vain erikoistapaus yleisemmästä relativistisen kvanttimekaniikan tuloksesta:
antisymmetrisyysperiaatteesta. Elektronit ovat fermioneja (ns. spin-½ hiukkasia) ja fermionien
täytyy kvanttiteorian mukaan olla antisymmetrisiä minkä tahansa paikka- ja spinkoordinaatin
vaihdon suhteen. Tämä ehto voidaan kirjoittaa matemaattisesti muotoon
(q1(1), q2(2),..., qi(i),..., qj(j),... qN(N))
= (q1(1), q2(2),..., qj(i),..., qi(j),... qN(N)). (6.29)
Tuloksessa siis tarkastellaan N elektronin systeemiä, jota kutakin kuvaa paikka- ja
spinkoordinaateista muodostuva q-vektori. Jos vaihdamme jotkin koordinaatit, täytyy aaltofunktion
vaihtaa merkkiään.
Kun tarkastellaan yhtälön (6.28) mukaista aaltofunktiota, huomataan välittömästi, että se ei ole
antisymmetrinen. Pienellä muokkauksella siitä saadaan kuitenkin antisymmetrinen, nimittäin jos
kirjoitamme
HP = )1()1()2()2()2()2()1()1(2
1baba . (6.30)
Neliöjuurikerroin eteen tulee normeerauksesta (Laskutehtävä: tarkista, että HP on todellakin
antisymmetrinen ja normeerattu!).
6.9. Slaterin determinantti
Edellisen lausekkeen (6.30) mukainen aaltofunktio voidaan kirjoittaa matemaattisesti myös
determinantin muodossa
HP =)2()2()2()2()1()1()1()1(
21
ba
ba . (6.31)
34
Antisymmetrisyysperiaate vastaa siis tässä kirjoitusmuodossa sitä, että vaihdettaessa determinantin
kaksi riviä keskenään, merkki muuttuu; ja näinhän determinantin laskusäännöt osoittavatkin. Tätä
kirjoitustapaa ja determinanttia kutsutaan Slaterin determinantiksi. Yleisesti Slaterin determinantin
mukainen aaltofunktio voidaan kirjoittaa muodossa
SD =
)()()(
)2()2()2()1()1()1(
!1
21
21
21
NNNN
N
N
N
. (6.32)
Edellisessä on oletettu N elektronia, ja merkintä tarkoittaa ns. spinorbitaalia eli
molekyyliorbitaalin ja spin-aaltofunktion tuloa. Slaterin determinanteilla on tiettyjä mielenkiintoisia
ominaisuuksia. Huomionarvoista on se, että kukin elektroni esiintyy kertaalleen jokaisella spin-
orbitaalilla. Tämä kuvastaa kvanttimekaniikan erästä perusoletusta, jonka mukaan hiukkasia ei
voida erottaa toisistaan, eli kaikki elektronit ovat ”samanlaisia”.
Mielenkiintoinen tulos saadaan, kun lasketaan elektronien välisestä repulsiosta aiheutuva kaavan
(6.25) kaltainen integraali Slaterin aaltofunktiota (6.30) käyttäen:
2211SD12
SD
1 ddddr
rr
= 2211
22
12
22 )2()2(1)1()1(21 dddd
r ba rr
2211
2
12
2 )2()2()2(1)1()1()1(2 ddddr abba rr
+ 2211
22
12
22 )1()1(1)2()2( ddddr ba rr
= 21
2
12
2 )2(1)1(21 rr dd
r ba
2112
)2()2(1)1()1(2 rr ddr abba
+ 21
2
12
2 )1(1)2( rr ddr ba
= ababbaab Jddr
J 2112
)2()2(1)1()1(221 rr
= Jab Kab. (6.33)
35
Tuloksen termiä Jab kutsutaan ns. Coulombiseksi integraaliksi, sillä se kuvaa tavallista klassisen
mekaniikan mukaista kahden elektronin välistä hylkimisvoimaa. Jälkimmäistä Kab taas kutsutaan
ns. vaihtointegraaliksi, joka esittää kahden elektronin välistä vaihtovuorovaikutusta, joka on
kvanttimekaaninen ilmiö, jolla ei ole klassista vastinetta. Laskelman (6.33) tulos kertoo, että
todennäköisyys löytää kaksi elektronia lähellä toisiaan samansuuntaisilla spineillä pienenee
energiatermillä Kab. Sanotaan, että ns. Fermi-aukko ympäröi kutakin elektronia. Kyseinen ilmiö on
ominainen samansuuntaisille spineille. Jos vastaava laskelma tehtäisiin aaltofunktiolle, joka
sisältäisi spinit (1) ja (2), huomattaisiin (Tarkista!), että tuloksena saadaan vain Jab.
6.10. Hartree-Fock SCF-menetelmä
Fock oli ensimmäinen, joka käsitteli Hartreen SCF-teoriaa käyttäen aaltofunktioina Slaterin
determinantin mukaisia funktioita. Yhtälöä (6.26) vastaavana tuloksena yhden elektronin Fockin
operaattori fi voidaan lausua muodossa
fi = 2
21
i
M
k ik
k
rZ
1 + Vi
HF{j}, (6.34)
missä viimeinen potentiaalitermi on nyt muotoa 2Ji Ki, joka vastaa edellisessä luvussa kuvattuja
integraaleja. Kerroin 2 tulee siitä, että termejä Jab ja Kab summatessa (vrt. yht. 6.27)
samansuuntaisille spineille tulee tulokseksi Jab Kab ja erisuuntaisille pelkkä Jab.
Kuuluisat Hartree-Fockin yhtälöt voidaan esittää siten muodossa
fi i = i i, (6.35)
joka koostuu siis yhden elektronin Schrödingerin yhtälöistä spinorbitaaleille, kun operaattorina on
Fockin operaattori.
Nyt voidaan näiden tulosten valossa käsitellä tilannetta kappaleen 6.6. sekulaarideterminantti-
menetelmän mukaisesti. Kuten em. luvussa, voimme kirjoittaa sekulaariyhtälön Fockin operaattorin
avulla muotoon
0
2211
2222222121
1112121111
NNNNNNNN
NN
NN
ESFESFESF
ESFESFESFESFESFESF
, (6.36)
missä erona aiempaan on ainoastaan, että resonanssi-integraalit on nyt korvattu integraaleilla Fij.
Peittointegraalit ovat edelleen samat kuin aiemmin. Vuonna 1951 Roothan esitti tärkeän julkaisun,
36
jossa käsiteltiin HF-laskelmien käytännön suorittamista kantajoukon avulla matriisiyhtälöin. Edellä
olevassa lausekkeessa F:t voidaan käsittää matriisielementteinä ja ne voidaan kirjoittaa muodossa
F =ytimet
k kk P
rZ )(
21)(1
21 2 , (6.37)
missä kreikkalaisin kirjaimin on indeksoitu kantafunktioita (erotukseksi siitä, että tavalliset indeksit
viittaavat orbitaaleihin). Edellisen kaavan merkinnät tarkoittavat integraaleja
< A > = rdA (6.38)
ja
( ) = )2()1()2()2(1)1()1(12
rr ddr
. (6.39)
Jälkimmäistä integraalia kutsutaan ns. neljän indeksin integraaliksi (four-index integral). Kaavojen
integraaleille käytetään myös nimityksiä yhden elektronin (6.38) ja kahden elektronin (6.39)
integraalit. Jälkimmäisiä painottavat kertoimet P muodostavat ns. tiheysmatriisin. Tiheysmatriisi
kuvaa sitä missä määrin tietyt yksittäiset kantafunktiot vaikuttavat monen elektronin aaltofunktioon
ja kuinka energeettisesti merkittäviä Coulombiset ja vaihtointegraalit ovat. Tiheysmatriisin alkiot
saadaan kaavasta
P = 2 i
miehitetty
iiaa , (6.40)
missä a-kertoimet määrittävät kantafunktion vaikutuksen suuruuden (vrt. LCAO-periaate)
molekyyliorbitaaliin i. Aaltofunktioiden määrittäminen kantafunktioiden avulla on nyt samanlainen
prosessi kuten kuvattu sivulla 30. Sekulaarideterminantista ratkaistaan energia-arvot, joiden avulla
lasketaan kantafunktioiden kertoimet. Mutta nyt sekulaarideterminantin ratkaisemiseen tarvittava
tiheysmatriisi koostuu jo kertoimista, jotka on tarkoitus ratkaista. Tämä paradoksaalinen tilanne
pystytään hoitamaan kuten sivulla 32, eli itseytyvän kentän menetelmällä (SCF). Aluksi voidaan
arvata tiheysmatriisi ja käyttää sitä sekulaariyhtälön ratkaisemiseen. Tämän jälkeen ratkaistaan a-
kertoimet, joista muodostetaan uusi tiheysmatriisi. HF-SCF menetelmä on esitetty kaaviomaisesti
kuvassa 6.1.
Tässä esitetty HF-teoria on rakenteellisesti varsin kaunis. Sillä on kuitenkin tiettyjä kemiallisia ja
käytännöllisiä rajoituksia. Kemiallisesti suurin ongelma on Fock-operaattorin yhden elektronin
luonne, eli se ottaa elektronikorrelaation muihin elektroneihin huomioon ainoastaan
keskimääräistyneenä. Voidaan tietysti kysyä kuinka hyvä tämä approksimaatio on, ja asiaan
palataankin myöhemmin elektronikorrelaatio-luvussa. Käytännön kannalta HF-teoriassa on
37
ongelmana laskujen kesto. Laskujen kesto on paljolti seurausta neljän indeksin integraalien
laskemisen raskaudesta. Jos kantafunktioina käytetään LCAO-periaatteen mukaisia funktioita, on
niiden integraalit ratkaistava numeerisesti, mikä on työlästä laskennallisesti. Lisäksi näiden
integraalien määrä on masentavan suuri. Koska jokainen indeksi käy läpi kaikki kantafunktiot, tulee
neljän indeksin integraaleja laskettavaksi kaikkiaan N4 kappaletta, missä N on kantafunktioiden
lukumäärä. Täten käytännössä ei pystytä käyttämään niin suuria kantajoukkoja, jotka laskutulosten
tarkkuuden kannalta olisivat parhaita.
Kuva 6.1. Kaaviokuva HF-SCF-proseduurista. Jos molekyylin geometriaa ei optimoida, on kyseessä ns.single-point calculation eli energian laskeminen tietylle rakenteelle. Muuten prosessi koostuu sekä SCF- ettägeometrianoptimointisykleistä.
Tästä tilanteesta voidaan jatkaa periaatteessa kahdella tavalla. Ensimmäinen suunta on se, että
otetaan mukaan lisäapproksimaatioita joidenkin kokeellisten parametrien muodossa. Ts.
Valitse kantajoukko.
Valitse lähtörakenteen geometria.
Laske peittointegraalit sekä kaavojen6.38 ja 6.39 mukaiset integraalit.
Arvaa tiheysmatriisi P(0).
Muodosta ja ratkaise Hartree-Fock sekulaariyhtälö 6.36.
Muodosta uusi tiheysmatriisia-kertoimista.
Onko uusi tiheysmatriisi P(n)
riittävän samanlainen kuinedellinen P(n-1)?
Optimoi molekyylin geometria?
Toteuttaako geometriaoptimointikriteerit?
Valitse uusi geometriaoptimointialgoritmin mukaisesti.
Ilmoita tulos.
Korvaa P(n-1) P(n):llä.
kyllä
ei
kyllää
kyllä eiei
38
parametrisoidaan osittain yhtälöitä, jotta saadaan laskuja nopeutettua. Tällaisia semiempiirisiä
menetelmiä käsitellään seuraavassa luvussa. Toinen suuntaus on pitää HF-teoriaa askeleena kohti
eksaktia Schrödingerin yhtälön ratkaisua. Periaatteessa, jos kantajoukkoa pystyttäisiin laajentamaan
äärettömän suureksi saataisi määritettyä energia, joka eroaisi todellisesta ainoastaan
elektronikorrelaation vaikutuksen verran. Elektronikorrelaatioksi kutsutaan tässä yhteydessä yleensä
termiä, joka erottaa ns. oikean elektronien välisen vuorovaikutuksen siitä hieman virheellisestä
tuloksesta, joka syntyy kun käsittelemme elektronien vaikutusta toisiinsa keskiarvoittuneena. Täten
on kehitetty menetelmiä, joilla päästäisiin tähän HF-rajaan (HF limit) ilman lisäapproksimaatioita.
Näitä menetelmiä kutsutaan ab initio –menetelmiksi ja niihin tutustutaan paremmin luvussa 8.
Tähän loppuun vielä lyhyesti kertauksena mitä tässä luvussa itseasiassa saavutettiin. Lähtökohtana
oli ongelma, miten saadaan määritettyä molekyyliorbitaalit eli Hamiltonin operaattorin
ominaisfunktiot molekyylille, joka koostuu useista ytimistä ja elektroneista. Koska kyseistä
ongelmaa ei voi ratkaista suoraan Schrödingerin yhtälöstä, johdettiin variaatioperiaate, joka antaa
tavan lähestyä oikeaa ratkaisua. Tämän jälkeen teimme Bornin ja Oppenheimerin approksimaation,
jonka jälkeen saimme menetelmän yhden elektronin sisältämän systeemin ratkaisemiseen LCAO-
periaatteen mukaisesti. Tästä jatkettiin Hartreen mukaisella oletuksella, että elektroneita voidaan
kuvata yhden elektronin operaattoreilla. Hartree-tulo antoi keinon löytää molekyylin aaltofunktion
SCF-menetelmän avulla. Hartree-tulon mukainen aaltofunktio ei kuitenkaan täyttänyt relativistisen
kvanttimekaniikan antisymmetrisyysperiaatetta. Tämän vuoksi aaltofunktiot esitettiinkin em.
periaatetta noudattavina Slaterin determinantteina. Kun Slaterin determinantteja käytetään Hartreen
mukaisiin yhtälöihin, päädytään Hartree-Fockin teoriaan. Lopputuloksena saatava HF-SCF-
menetelmä tarjoaa periaatteessa elektronikorrelaatiota vaille eksaktin ratkaisun Schrödingerin
yhtälöön (sikäli kun Bornin ja Oppenheimerin approksimaatio oletetaan oikeutetuksi). Tämän luvun
tulokset muodostavat lähtökohdan seuraaville luvuille.
39
7. SEMIEMPIIRISET MENETELMÄT
Edellisessä luvussa päädyttiin lopuksi Hartree-Fockin teoriaan, joka fysikaaliselta ja
matemaattiselta rakenteeltaan on varsin vaikuttava, mutta omaa kuitenkin käytännön heikkouksia.
Suurin ongelma teoriassa on laskujen raskaus, mikä on lähinnä seurausta suuresta määrästä ns.
neljän indeksin integraaleja (6.39) ja iteratiivisesta (SCF) lähestymistavasta. Ilmeisesti yksi keino
nopeuttaa laskuja olisi approksimoida näitä integraaleja jollain tavoin ja yrittää saada niiden
lukumäärää pienemmäksi. Tällaisia approksimaatioita voisi kutsua numeerisiksi approksimaatioiksi.
Lisäksi voidaan tehdä ns. kemiallisia approksimaatioita (chemically virtuous approximations),
joiden tarkoituksena on yksinkertaistaa ja jopa parantaa laskutuloksia. Useat näistä
approksimaatioista käsittävät jonkinlaisten kokeellisten parametrien huomioimista laskuissa. Tästä
syystä menetelmiä kutsutaankin semiempiirisiksi (puolikokeellisiksi) menetelmiksi.
Ennen menetelmiin perehtymistä kannattaa hieman miettiä tulosta, joka edellisessä luvussa saatiin.
On syytä huomioida, että saatu kahden tai useamman elektronin HF-aaltofunktio ei ole alkuperäisen
Schrödingerin yhtälön (ks. yhtälöt 6.13 ja 6.14) ratkaisu, vaan yhtälön, jossa elektronien vaikutus
käsitellään siten millä tavoin kukin yksittäinen elektroni (kullakin elektronilla on oma yhden
elektronin Fockin operaattorinsa) näkee toiset elektronit. Tällöin HF-energia on aina suurempi kuin
mitä yhtälön 6.14 mukainen ”eksakti” energia olisi (variaatioperiaate). Mutta kuinka suuri on tämä
elektronikorrelaatiotermin vaikutus? Tarkastellaan yksinkertaista kahden elektronin systeemiä:
helium-atomia. Tälle saadaan ns. HF-rajan mukaiseksi energiaksi 2,86168 hartreeta.
Kirjallisuuden mukaan eksakti energia heliumille on 2,90372 hartreeta, joten elektronikorrelaation
suuruus tässä tapauksessa on 0,04204 hartreeta mikä ei näissä yksiköissä näytä pahalta, mutta on
tutummissa yksiköissä noin 110 kJ mol 1. Ja tämä on siis vain helium-atomille. Suuremmille
atomeille ja molekyyleille voidaan olettaa lukeman olevan vielä paljon suurempi.
Ensisilmäyksellä tämä on järkyttävä havainto. Jos mietitään esimerkiksi Gibbsin energian
riippuvuutta tasapainovakiosta ( G = RT lnK), niin voidaan helposti laskea, että tasapainovakion
muuttuminen kymmenkertaiseksi 298 K:ssä aiheuttaa 5,7 kJ mol 1 suuruisen Gibbsin energian
muutoksen systeemiin. Samanlainen muutos tulee aktivaatioenergiaan, jos kemiallisen reaktion
nopeus muuttuu kymmenkertaiseksi. Näihin verrattuna elektronikorrelaation suuruus on järkyttävän
suuri. Voidaankin kysyä mitä HF-teorialla voidaan ylipäätään laskea. Michael Dewar, joka on
semiempiiristen menetelmien johtavia kehittäjiä, onkin verrannut tilannetta seuraavaan esimerkkiin:
40
”It is like weighing the captain of a ship by first weighing the ship with the captain on board, then
weighing the ship without her, and then taking the difference.” Eli mittausten/laskujen virherajat
ovat niin suuret, että mittaustulos hukkuu niihin.
Myöhemmin tullaan huomaamaan, että tilanne ei ole niin paha kuin miltä se näyttää. Virheet, jotka
elektronikorrelaation huomioimattomuus aiheuttaa kumoavat yleensä toisensa ja HF-tuloksia
voidaan oikeasti käyttää. Mutta tässä semiempiiristen menetelmien yhteydessä on huomattavaa, että
kemiallisten approksimaatioiden tekeminen voi joissain tapauksissa jopa parantaa tulosten
tarkkuutta puhtaisiin HF-menetelmiin verrattuna.
Seuraavaksi tarkastellaan menetelmiä pääasiassa niiden kehittämisjärjestyksessä. Aluksi lähinnä
havainnollisuutensa vuoksi tarkastellaan Hückelin teoriaa, jolla ei nykyään ole suurtakaan
käytännön merkitystä. Lopuksi tullaan uusimpiin ja nykyään eniten käytettyihin menetelmiin kuten
PM3 ja AM1.
7.1. Hückelin teoria
Tarkastellaan edellisen luvun LCAO-periaatteen soveltamista molekyyliorbitaaleihin Erich
Hückelin 1930-luvulla kehittämän teorian mukaisesti. Käsittelykohteina Hückelillä olivat
ainoastaan tasomaiset aromaattiset ja tyydyttymättömät hiilivedyt. Jotta sivulla 30 esitetyt neljä
vaihetta saataisi yksinkertaisesti suoritettua, Hückel teki seuraavat oletukset:
a) Kantajoukko muodostetaan ainoastaan samansuuntaisista hiilien 2p-orbitaaleista (koska
Hückel oli kiinnostunut tasomaisisa -systeemeistä). Näitä orbitaaleja on yksi per atomi.
b) Peittointegraalit määritetään tavalla: Sij = ij, eli 2p-funktiot ovat ortonormeeratut.
c) Hii = = metyyliradikaalin ionisaatioenergia (oletettuna negatiivisena lukuna). Tämän on
tarkoitus vastata miehittyneen 2p-orbitaalin energiaa sp2-tyyppisessä hiiliatomissa.
d) Hij = kun i ja j ovat vierekkäisiä hiiliatomeja. Tässä vastaa stabiloivaa energiaa
(negatiivinen), joka on -sidoksilla kahteen irralliseen p-orbitaaliin nähden (Kuva 7.1).
e) Hij = 0, kun i ja j ovat kauempana toisistaan.
41
90o
E = E E = 2Ep
Kuva 7.1. -sidoksen stabiloiva vaikutus kahteen irralliseen p-orbitaaliin nähden. E = 2Ep E = 2 .Huomaa, että tällöin siis = Ep ja E = 2 + 2 .
Nyt voimme esimerkkinä käsitellä allyylisysteemiä Hückelin MO-teorian mukaisesti. Systeemi
koostuu kolmesta hiilestä (ks. kuva 7.2) ja täten siis kantajoukko kolmesta 2p-orbitaalista, jotka
voidaan numeroida kuten kuvassa 7.2. Nyt yhtälön (6.19) mukainen sekulaarideterminantti ja -
yhtälö voidaan kirjoittaa edellisten oletusten mukaan yksinkertaisesti muotoon
EE
E
0
0= 0 (7.1)
Tämä kolmannen asteen yhtälö voidaan helposti ratkaista (suorita laskut!) ja tulokseksi saadaan
kolme juurta:
E = + 2 , ja 2 . (7.2)
Näistä ensimmäinen on matalinta energiaa vastaava energia (koska ja negatiivisia). Sitä
vastaavan molekyyliorbitaalin kantafunktioiden kertoimet a1, a2 ja a3 saadaan ratkaistua
yhtälöryhmästä (6.18). Tulokseksi saadaan (tee laskut!) a1 = a3 ja a2 = 2 a1. Jos halutaan, että
aaltofunktio on normeerattu, saadaan ehdosta (6.9) ratkaistua, että a1 = ½ jne. ja tällöin aaltofunktio
siis muotoa
3211 21
22
21 ppp . (7.3)
Tämä alinta energiaa vastaava ns. bonding-orbitaali on havainnollistettu kuvassa 7.2. Jos vastaavat
laskut tehtäisiin korkeammille energia-arvoille, saataisiin kertoimiksi (eikun laskemaan!) ja sitä
kautta ns. non-bonding ( 2) ja antibonding ( 3) orbitaaleiksi
3212 220
22 ppp (7.4)
ja
3213 21
22
21 ppp . (7.5)
42
CC
CHH
H
H H
1 32
E
+ 2½
- 2½
Kuva 7.2. Hückelin molekyyliorbitaalit allyylisysteemille. Molekyyliorbitaalit koostuvat paperin tasoonnähden kohtisuorassa olevista p-atomiorbitaaleista. Esitetty orbitaalien miehitys vastaa allyylikationia. Esim.yksi lisäelektroni orbitaalille 2 vastaisi allyyliradikaalia.
Hückelin teorian mukainen esitys voidaan käsittää semiempiiriseksi siinä mielessä, että se sisältää
laskuja helpottavia approksimaatioita ja lisäksi ja ovat kokeellisia parametreja. Seuraavaksi
esitetään tästä hieman laajennettu versio.
7.2. Laajennettu Hückelin teoria
Kuten edellä on tullut ilmi, vaatii N:n kantafunktion systeemin ratkaiseminen sellaisen
sekulaarideterminantin ratkaisemista, jossa on N riviä. Laajennettu Hückelin malli pitää sisällään
kaksi erityisen tärkeää oletusta. Ensinnäkin se olettaa, että kaikki sisempien kuorien elektronit
jätetään huomiotta ja vain valenssielektronit huomioidaan. Eli siis oletetaan, että ulkokuorien
elektronit määräävät molekyylien ominaisuudet. Kaikki modernit semiempiiriset menetelmät tekevät
tämän oletuksen.
Toinen oletus on, että nämä valenssiorbitaalit voidaan esittää ns. STO (Slater-type orbital)
funktioina eli Slaterin tyyppisinä orbitaaleina. (Huom. Älä sekoita tätä käsitettä Slaterin
determinanttiin ja sen mukaiseen aaltofunktioon.). STO-funktiot voidaan esittää yleisesti kaavalla
),()!2(
)2(),,,;,,( 1
21
21
ml
rn
n
Yern
mlnr , (7.4)
43
missä etummainen vakiotermi tulee normeerauksesta, eksponentti riippuu atomista (valitaan
Slaterin kehittämien sääntöjen mukaan), n, m ja l ovat kvanttilukuja, Ylm palloharmoninen
kulmamuuttujien funktio ja r määrää ns. radiaalisen osan (vrt. Y ja r vetyatomin orbitaalien
ratkaisuissa). Nämä orbitaalit muistuttavat muodoltaan vetyatomin ratkaisuina saatavia
atomiorbitaaleja. Mm. kulmaosa on sama ja säde r on eksponentiaalisesti laskeva, mikä on järkevää
kemiallisesti. Lisäksi STO-funktioilla on ominaisuus, joka tekee ne hyvin käyttökelpoisiksi, sillä
niiden peittointegraalit Sij atomien välisen etäisyyden suhteen ovat suoraan laskettavissa eikä niitä
tarvitse näinollen approksimoida Kroeneckerin deltalla.
Diagonaaliset resonanssi-integraalit Hii käsitellään kuten Hückelin teoriassa, eli ne vastaavat
elektronien ionisaatiopotentiaaleja kyseisellä valenssiorbitaalilla. Ei-diagonaaliset resonanssi-
integraalit puolestaan approksimoidaan diagonaalisten ja peittointegraalien avulla. Nämä voidaan
esittää Wolfsbergin ja Helmholzin ehdottamalla kaavalla:
Hij = 21 Cij (Hii + Hjj) Sij, (7.5)
missä Cij on kokeellinen vakio. Näin em. oletuksien mukaan voidaan rakentaa
sekulaarideterminantti ja ratkaisemalla se saadaan energiat ja molekyyliorbitaalit. Koska
matriisielementit Hij ja Sij eivät riipu molekyyliorbitaaleista, voidaan orbitaalit laskea suoraan ilman
aikaa vievää iteratiivista SCF-sykliä. Nämä ominaisuudet tekevät laajennetun Hückelin teorian
mukaiset laskut hyvin nopeiksi, mutta monet ja hyvin karkeat approksimaatiot heikentävät laskujen
tarkkuutta. Tietyntyyppisiin ongelmiin menetelmää käytetään kuitenkin yhä näinäkin päivinä.
Menetelmää voidaan käyttää esimerkiksi rakenteeltaan massiivisten orgaanisten polymeerien
tutkimukseen.
7.3. CNDO formalismi
Edellämainituissa Hückelin menetelmissä ei huomioitu elektronin spiniä. Myöskään SCF-
iteraatiosyklejä ei Hückelin menetelmissä tarvittu. Seuraavaksi otetaan lähtökohdaksi luvun 6
lopputuloksena saatu HF-SCF-teoria ja käsitellään tilannetta Fockin matriisin (6.37) valossa.
CNDO (complete neglect of differential overlap) menetelmän kehitti Pople tutkimusryhmineen
vuonna 1965. CNDO-menetelmä käsittää seuraavat yksinkertaistukset:
a) Kantajoukko esitetään STO-funktioiden avulla vain valenssiorbitaaleille kuten laajennetussa
Hückelin menetelmässäkin. CNDO:ssa käsitellään vain s ja p orbitaaleja.
b) Peittointegraalit määritetään tavalla: Sij = ij.
44
c) Neljän indeksin integraalit (6.39) esitetään muodossa ( ) = ( ), mikä
tarkoittaa sitä, että vain identtiset orbitaalit antavat nollasta eroavia integraaleja kullekin
atomille ja kaikki ne integraalit, jotka kuvaavat eri kantafunktioiden välistä peittoa häviävät.
Tästä tulee myös nimitys CNDO.
d) Jäljelle jääneet kahden elektronin integraalit lasketaan kaavasta ( ) = AB, missä ja
ovat atomien A ja B kantafunktioita ja AB on kokeellinen parametri, joka voidaan laskea
atomien A ja B ionisaatiopotentiaalien ja elektroniaffiniteettien avulla.
e) Yhden elektronin integraalien diagonaalielementit saadaan kaavasta:
k k
k
rZ2
21 = IP
kkZZk k
Z A)(A
. (7.6)
Hieman hankalannäköisestä muodostaan huolimatta, yhtälöstä (7.6) riittää todeta tässä
yhteydessä vain se, että kyseiset integraalit saadaan siis kokeellisista parametreista. Z on
ytimen varausluku, IP ionisaatioenergia ja AB edellä mainittu kokeellinen parametri.
f) Ns. off-diagonaalielementit saadaan puolestaan kaavalla:
k k
k
rZ2
21 =
2)( BA S
, (7.7)
missä on jälleen kokeellinen parametri. Tässä kuvattu peittomatriisi puolestaan lasketaan
käyttäen STO-funktioita eikä approksimoida nollaksi tai ykköseksi kuten kohdassa b.
Vaikka CNDO-formalismi saattaakin vaikuttaa monimutkaiselta, se on kuitenkin karkea
yksinkertaistus HF-teoriasta. Ensinnäkin kohta c rajaa neljän indeksin integraalien määrän N4:stä
N2:een. Lisäksi kyseiset integraalit lasketaan algebrallisten kaavojen avulla, mikä on laskennallisesti
erittäin nopeaa. Samoin CNDO:ssa yhden elektronin integraalit saadaan pelkistä algebrallisista
lausekkeista.
Kemiallisessa mielessä rajuin yksinkertaistus CNDO-menetelmässä on, että elektronien välistä
repulsiota edustavat kahden elektronin integraalit oletetaan vain atomin tyypistä riippuviksi.
Esimerkiksi hiilelle käytetään aina samaa arvoa CC riippumatta siitä minkälainen on orbitaalien
tyyppi (esim. s tai p) tai orientaatio (esim. vapaat elektroniparit). Ensimmäistä ongelmaa voidaan
pitää ns. yhden keskuksen ongelmana, sillä se liittyy tietyn atomin ympärillä oleviin elektronisiin
vuorovaikutuksiin. Jälkimmäistä taas voidaan ajatella kahden keskuksen ongelmaksi. Esimerkkinä
vapaan elektroniparin vaikutus hydratsiinien rotaatioon.
45
7.4. INDO formalismit
Yhden keskuksen ongelmat CNDO-menetelmässä korjataan osittain INDO (intermediate neglect of
differential overlap) menetelmässä. Ko. menetelmässä annetaan kahden elektronin integraaleille
useampia mahdollisia lukuarvoja riippuen orbitaalityypistä. INDO-menetelmä on edelleen
tarkkuudeltaan melko vaatimaton varsinkin geometrian optimoinnissa. Mutta jos optimoitu
geometria on jo olemassa, INDO on osittautunut antavan hyviä tuloksia spektroskooppisille
ominaisuuksille, sillä esimerkiksi värähtelytaajuudet riippuvat pääasiassa tietyn atomin
ympäristöstä. Esimerkiksi vuonna 1973 esitetty malli INDO/S on parametrisoitu nimenomaan
spektroskooppisista parametreista ja antaa melko hyviä tuloksia aina yksinkertaisista orgaanisista
yhdisteistä siirtymämetalleihinkin. Koska myös INDO/S on hyvin nopea laskennallisesti, voidaan
sitä käyttää suurille biomolekyyleillekin.
Suuri edistysaskel semiempiiristen menetelmien käytössa tapahtui, kun jo aiemmin mainittu
Michael Dewar vuonna 1975 esitti ns. MINDO/3 mallin. (third-generation modified INDO).
Dewarin lähtökohta menetelmän kehittämiselle oli sen yleispätevyys monentyyppisille lähinnä
orgaanisille yhdisteille. Lisäksi hänen parametrisointi-ideologiansa oli enemmän matemaattinen
kuin kemiallinen. Hän käsitteli esimerkiksi STO-funktioiden -eksponentteja vain matemaattisina
parametreina, joita voi muokata niin kauan kuin ne vain säilyvät fysikaalisesti realistisina.
Aikanaan MINDO-malli syrjäytti tarkkuudellaan monet aiemmat, mutta nykyään on jälleen
kehittyneempiäkin yleisluontoisia malleja tarjolla, joten MINDO:n käyttö on vähäistä.
7.5. NDDO formalismit
Kun INDO-menetelmässä korjattiin CNDO:n puutteita yhden keskuksen tilanteissa, pyritään
NDDO (neglect of diatomic differential overlap) menetelmässä vastaavaan kahden keskuksen
ongelmien osalta. NDDO-menetelmä huomioi minkälaisia orbitaalikombinaatioita kaksi keskusta
voivat saada. Esim. yhdestä s- ja kolmesta (x, y ja z) p-orbitaalista voidaan muodostaa 10 erilaista
kahden orbitaalin kombinaatiota, josta seuraa 102 = 100 erilaista kahden elektronin integraalia. Jos
tarkasteluissa otetaan mukaan vielä d-orbitaalit, on integraaleja jo 2025. Vaikka määrä saattaakin
näyttää suurelta, se on silti hyvin pieni verrattuna siihen, että lasketaan kaikki mahdolliset
integraalit, kuten tehtäisiin HF-teoriassa. Nykyään yleisimmin käytetyt semiempiiriset menetelmät
ovat luonteeltaan NDDO-menetelmiä.
46
Ensimmäinen NDDO-menetelmä oli vuonna 1977 Dewarin kehittämä MNDO (modified neglect of
differential overlap) atomeista C, H, O ja N koostuville molekyyleille. Nykyisin ko. malli on
parametrisoitu lähes kaikille ensimmäisten jaksojen alkuaineille ja muutamille metalleillekin.
Lisäksi MNDO-malli lisää myös ytimien välisestä repulsiosta aiheutuvan termin SCF-energiaan
(vrt. Bornin ja Oppenheimerin approksimaatio). MNDO-mallia näkee käytettävän jonkin verran
vieläkin kemian alan kirjallisuudessa.
Dewarin seuraava parannus oli AM1 (Austin model 1, hän työskenteli tuohon aikaan Texasin
yliopistossa Austinissa) vuonna 1985. AM1 on muokattu versio MNDO:sta, jossa mm. ytimien
välinen repulsiotermin muotoa on parannettu. Lisäksi AM1:ssa on pyritty ottamaan huomioon
vetysitoutuminen. Nykyaikaisista semiempiirisistä menetelmistä AM1 on toinen yleisesti tänä
päivänä käytetyistä menetelmistä.
Toinen nykyään pääasiassa käytetty semiempiirinen menetelmä on PM3 (parametrized model 3).
Menetelmän kehitti James Stewart (joka oli Dewarin laboratoriossa mukana kehittämässä mm.
AM1-menetelmää, mutta lähti sittemmin itsenäiseksi tutkijaksi) vuonna 1989. Hänen
lähtökohtanaan oli parantaa AM1-mallissa havaittuja puutteita. Kaikenkaikkiaan PM3-malli antaa
keskimäärin hieman parempia tuloksia kuin AM1. Kummallakin mallilla on omat vahvuutensa ja
heikkoutensa, mutta yleiskäyttöisyytensä vuoksi ne ovat käyttökelpoisimmat tällä hetkellä olemassa
olevista semiempiirisistä menetelmistä.
Semiempiirisiä menetelmiä kehitetään yhä. Uudempia malleja ovat mm. vuonna 1992 esitetty
MNDO/d, joka huomioi d-orbitaalit. Tarkasteltaessa mm. metalleja sisältäviä yhdisteitä MNDO/d
on tarkkuudeltaan ylivoimainen edellisiin verrattuna. MNDO-mallista on olemassa myös versio
MNDOC, joka puolestaan ottaa huomioon myös elektronikorrelaation. Koska todennäköisesti
lähitulevaisuudessakaan ei suurille biomolekyyleille pystytä laskuja tekemään esim. HF-teorian
mukaisesti, on semiempiiristen menetelmien kehitystyö edelleenkin tärkeää ja sitä tehdään koko
ajan. Lisäksi nykyään on keskitytty kehittämään menetelmiä, jotka liikkuisivat tietyssä mielessä
jossain semiempiiristen ja puhtaasti teoreettisten välimaastossa. Tällainen on esimerkiksi SAM1
(semi-ab initio method 1).
7.6. Semiempiiriset menetelmät ja SAR
Käsitellään lopuksi esimerkinomaisesti yksi tapa käyttää semiempiirisiä menetelmiä käytännön
tutkimuksissa. Eräs viimeaikoina huomiota erityisesti lääketeollisuudessa saanut tutkimusala on ns.
47
SAR, joka tulee sanoista structure-activity relationship. SAR:n ideana on selvittää minkälaiset
rakenteelliset tekijät vaikuttavat molekyylin (tyypillisesti farmakologiseen) aktiivisuuteen. SAR-
laskelmat tarkoittavat yleensä suurta joukkoa usein lineaarisia yhtälöitä, joissa rakenteen aktiivisuus
on esitetty erilaisten molekyylin rakenteeseen liittyvien muuttujien funktiona. Tällaisia muuttujia
voivat olla esimerkiksi molekyylimassa, dipolimomentti, höyrynpaine, pintailmiöihin liittyvät
suureet ja erilaiset geometriset tekijät. Kun tällainen yhtälöjoukko on ratkaistu ja ns. SAR on
käytettävissä, sen avulla voidaan ennustaa erilaisten rakenteiden aktiivisuuksia. Kun rakenne-
aktiivisuustekijöitä pystytään määrittämään kvantitatiivisesti, puhutaan QSAR-menetelmästä
(quantitative SAR).
Esimerkiksi lääkeyhtiöllä saattaa olla tietokannassaan valmistamilleen yhdisteille suuri joukko
molekyylien kokeellisia ominaisuuksia, joiden pohjalta voidaan laatia rakenne-aktiivisuusyhteyksiä.
Tällöin voidaan periaatteessa syntetisoida uusi molekyyli, mitata sen kokeellisia parametreja ja
ennustaa SAR:n avulla molekyylin farmakologinen aktiivisuus. Huomattavasti helpompaa olisi, jos
syntetisoinnin sijasta voisimmekin laskea uudelle molekyylille tarvittavat parametrit ja tällöin
edelleen ennustaa aktiivisuuden ilman, että sitä tarvitsee kokeellisesti valmistaa. Tällöin voisimme
kartoittaa minkälaisien molekyylien synteesien käytännön tekemiseen kannattaa todella panostaa.
Tällaiseen molekyylien ominaisuuksien kartoitukseen semiempiiriset menetelmät sopivat hyvin
nopeutensa ansiosta. Kun rakenteen geometria on optimoitu, voidaan sen jälkeen melko helposti
laskea sille myös muita suureita, joita voidaan käyttää SAR:ssa.
Jotta tulisi jonkinlainen mielikuva minkälaisista suuruusluokista ajan ja molekyylimäärien suhteen
tällaisissa tutkimuksissa puhutaan, niin esimerkiksi vuonna 1998 julkaistiin tutkimus, jossa
optimoitiin geometriat AM1-menetelmällä 53000 yhdisteelle 14 tunnissa, kun käytettävissä oli
senaikainen 128 prosessorista koostuva supertietokone. Tällainen nopeus on mahdollista
kvanttimekaanisista menetelmistä vain semiempiirisille menetelmille.
48
8. AB INITIO –MENETELMÄT
Luvussa 6 esitetyn Hartree-Fockin teorian perusolettamuksena oli keskeiskentän oletus, eli se että
elektroni kokee kaikki muut elektronit keskimääräisenä kenttänä. Kuten aiemmin on tullut jo
mainittua, oletus aiheuttaa oikeaan eksaktiin energiaan elektronikorrelaation suuruisen virheen.
Tässä luvussa käsitellään menetelmiä, jotka hyväksyvät elektronikorrelaatiosta aiheutuvan virheen,
mutta pyrkivät muuten mahdollisimman täydelliseen ja puhtaan kvanttimekaaniseen käsittelyyn; eli
pyrkivät HF-rajaan, jolloin poikkeama eksaktista Schrödingerin yhtälön antamasta energiasta olisi
tarkalleen elektronikorrelaation suuruinen: Ekorr = E EHF (E on eksakti oikea energia ja EHF HF-
rajan energia). Tällaisia menetelmiä kutsutaan ab initio –menetelmiksi. Nimi tulee latinasta ja
voidaan kääntää ”alusta alkaen”.
Vaikka semiempiirisien menetelmien käsittelyn yhteydessä mainittiinkin elektronikorrelaation
vaikutuksen olevan hyvin suuri, voidaan ab initio –menetelmiä silti käyttää melko luotettavasti
samankaltaisien systeemien, kuten esimerkiksi konformaatioiden, energiaeron määrittämiseen.
Tällöin elektronikorrelaation suuruuden oletetaan olevan samansuuruinen molemmille systeemeille.
Lisäksi menetelmillä pystytään laskemaan hyvin muita suureita kuin energiaa.
HF-rajaan pääsyn esteenä on yleensä kantajoukko (basis set), jonka avulla aaltofunktio oletetaan
lausuttavaksi. Jos käytettävissä olisi äärettömän suuri kantajoukko, voitaisi aaltofunktio ”sovittaa”
täydellisesti kantafunktioihin ja tällöin HF-raja saavutetaan. Käytännössä äärettömän suuruinen
kantajoukko on kuitenkin mahdoton. Täten ab initio –menetelmien käyttö on paljolti HF-SCF-
teorian mukaisen aaltofunktion ratkaisemista jonkin tietyn kantajoukon funktiona. Seuraavaksi
käsitelläänkin niitä kantajoukkoja, joita ab initio –menetelmät tavallisimmin käyttävät. Nämä samat
kantajoukot soveltuvat myös myöhemmin esiin tulevien, kuten tiheysfunktionaaliteoreettisten,
menetelmien käyttöön ja ovat hyvin keskeinen osa nykyaikaista laskennallista kemiaa.
8.1. Kantajoukot
Kun pohditaan kantajoukon tehokkuutta tai hyvyyttä, on kiinnitettävä huomiota lähinnä kolmeen
asiaan. Ensinnäkin, koska ab initio –menetelmissä ei tehdä lisäoletuksia neljän indeksin integraalien
(6.39) suhteen, kantajoukon suuruus eli kantafunktioiden lukumäärä N on tärkeä tekijä. Näitä neljän
indeksin integraaleitahan oli N4 kappaletta. Joten mahdollisimman pieni kantajoukko kuulostaa
houkuttelevimmalta. Toinen laskunopeuteen vaikuttava seikka on kuinka nopeasti em. integraalit
49
pystytään laskemaan. Yleisesti ottaen, jos integraalit joudutaan laskemaan numeerisesti (jotain
numeerista algoritmia käyttäen), laskeminen on huomattavasti hitaampaa kuin jos ne pystyttäisiin
laskemaan algebrallisesti (jolloin tarkat arvot voidaan laskea suoraan integroiduista lausekkeista).
Täten suurempikin kantajoukko voi olla nopeampi kuin pieni, jos sen kantafunktiot ovat helpommin
integroitavissa. Kolmantena huomioitavana asiana on, että kantafunktiot ovat kemiallisesti järkevän
mallisia. Tämä tarkoittaa esimerkiksi sitä, että ne ovat atomeja lähellä amplitudiltaan suuria ja
häviävät kohti nollaa etäisyyden kasvaessa, eli ne vastaavat käyttäytymiseltään elektronin
todennäköisyystiheyttä. Näiden kolmen ehdon optimaalinen toteuttaminen on kantafunktioiden
kehityksen lähtökohta.
STO-funktiot
Slaterin tyyppiset orbitaalit (STO) esitettiin laajennetun Hückelin teorian yhteydessä yhtälöllä (7.4).
Näillä on se kemiallisesti miellyttävä ominaisuus, että ne vastaavat hyvin läheisesti vedyn
atomiorbitaaleja. Ab initio HF-teoriassa niillä on kuitenkin oleellinen heikkous, sillä niiden neljän
indeksin integraaleille ei ole olemassa yleistä analyyttistä ratkaisua, vaan ne joudutaan laskemaan
numeerisesti. Tämä rajoittaa STO-funktioiden käyttöä suuremmilla molekyyleillä huomattavasti.
GTO-funktiot
Vuonna 1950 esitettiin vaihtoehtoinen kantafunktiojoukko STO-funktioille. Jos STO-funktiota
halutaan muokata siten, että niiden neljän indeksin integraalit olisivat laskettavissa analyyttisesti,
riittää korvata eksponenttifunktion r neliöllään r2. Tämä muuttaa funktion muodon vastaamaan
Gaussin kellokäyrän muotoa ja näitä funktioita kutsutaankin Gaussin tyyppisiksi orbitaaleiksi
(GTO, Gaussian-type orbitals). Atomikeskeiset GTO-funktiot voidaan kuvata karteesisessa (x,y,z)
koordinaatistossa yleisesti kaavalla
)(21
43
222
)!2()!2()!2(!!!)8(2),,,;,,( zyxkji
kji
ezyxkjikjikjizyx . (8.1)
Ylläolevassa lausekkeessa vakio määrää Gaussin funktion leveyden. Jos on suuri,
eksponenttifunktio pienenee nopeasti kohti nollaa ja on ns. kompakti. Jos taas on pieni, funktio
häviää hitaasti ja sillä voidaan kuvata kaukana atomista tapahtuvia vuorovaikutuksia. Tällaista
funktiota sanotaan diffuusiksi. Indeksit i, j ja k ovat ei-negatiivisia kokonaislukuja ja vastaavat
oikeiden atomiorbitaalien kvanttilukuja karteesisessa mielessä. Erityisesti kun i = j = k = 0, vastaava
GTO on pallosymmetrinen ja sitä kutsutaankin s-tyypin GTO:ksi. Tilanteessa, jossa jokin indeksi
on yksi ja muut nollia, saadaan GTO-funktio, joka on symmetrinen x- y- tai z-akselin suhteen
50
(riippuen siitä mikä indekseistä on yksi: esim jos se on i, niin silloin x-akselin suhteen). Nämä
vastaavat p-atomiorbitaaleja ja niitä kutsutaan p-tyypin GTO:iksi.
Jos indeksien summa on kaksi, funktioita kutsutaan d-tyypin GTO:iksi. On kuitenkin huomion
arvoista se, että tällaisia kombinaatioita on kuusi, joista saadaan mahdollisiksi termeiksi yhtälössä
(8.1) x2, y2, z2, xy, xz ja yz. Näitä funktioita kutsutaan karteesisiksi d-funktioiksi. Kuitenkin
Schrödingerin yhtälössä vetyatomille saadaan vain viisi d-orbitaalia, jotka yleensä ilmoitetaan
muodossa xy, xz, yz, x2 y2 ja 3z2 r2. Näistä kaksi viimeistä ovat lineaarikombinaatioita
karteesisista d-funktioista. Jotkin gaussiaaniset kantajoukot käyttävät d-funktioina kuutta ja jotkin
viittä funktiota. Tämä on hyvä huomioida kantajoukkoja käytettäessä. Kun indeksien summa
kasvaa, puhutaan f-funktioista jne. Tällöin myös lukumääräerot karteesisten ja vetyatomin
ratkaisuista peräisin olevien funktioiden välillä kasvavat.
Sovitetut Gaussin funktiot
Vaikka GTO-funktiot ovatkin laskennallisesti miellyttäviä, niillä on kuitenkin tiettyjä huonoja
ominaisuuksia. Eräs suurimmista huolenaiheista on funktioiden muoto: kun GTO-funktiot ovat
tasaisia ja derivoituvia kaikkialla, on aidoissa vetyatomin orbitaaleissa sitävastoin derivaatan
epäjatkuvuuskohta. Lisäksi Gaussin funktioiden toisen asteen eksponentiaalinen vaimeneminen on
liian nopeaa atomiorbitaaleihin verrattuna. Tällöin siis elektronin löytämistodennäköisyys pienenee
liian nopeasti etäisyyden funktiona.
Jotta löydetään optimaalinen ratkaisu niin laskentatehollisesti kuin funktioiden kemiallisen muodon
mielessäkin, käytetään tavallisimmin tapaa, jossa oikean mallisia STO-funktioita pyritään
kuvaamaan mahdollisimman hyvin helposti laskettavilla GTO-funktioilla. Toisin sanoen ei käytetä
yksittäisiä GTO-funktioita, vaan näistä muodostettuja lineaarikombinaatioita, jotka sovitetaan
vastaamaan STO-funktioiden muotoa mahdollisimman hyvin. Tällaisia funktioita kutsutaan
sovitetuiksi (tai kontrahoiduiksi) Gaussin funktioiksi (contracted Gaussian functions). Yksittäisiä
GTO-funktioita kutsutaan puolestaan primitiivisiksi Gaussin funktioiksi (primitive Gaussians).
Sovitettu Gaussin funktio voidaan esittää primitiivi-Gaussien avulla muodossa
),,,;,,(),,,;,,(1
kjizyxckjizyx a
M
aa , (8.2)
51
missä kertoimet c valitaan niin, että summafunktion muoto vastaa parhaiten STO-funktioiden
muotoa ja niin, että siitä tulee normitettu. On huomattavaa, että termi on eri kaikissa
primitiiveissä. M on primitiivifunktioiden lukumäärä.
Mikä olisi sopiva määrä primitiivifunktioita kuvaamaan STO-funktiota riittävän hyvin? Hehre,
Stewart ja Pople ovat vuonna 1969 tutkineet erikokoisten kantajoukkojen tehokkuutta ja päätyivät
tulokseen, että kolmen primitiivifunktion käyttäminen on optimaalisinta. Suurempi määrä kuvaisi
tarkemmin STO-funktioita, mutta olisi laskennallisesti jo huomattavan raskas. Tällaisia kolmesta
primitiivistä muodostuneita Gaussin sovitettuja kantafunktioita kutsutaan STO-3G kantajoukoksi
(yleisesti STO-MG).
Nimitys STO-3G on selkeä siinä mielessä, että se kertoo miten sovitus on tehty. Varsinkin
vanhemmassa kirjallisuudessa käytetään toisenlaista nimeämistapaa kantafunktioille. Em. STO-3G
vedyille olisi tällä tavalla kirjoitettuna (3s)/[1s]. Kaarisulkulauseke kertoo kuinka monta ja minkä
tyyppisiä primitiivifunktiota on käytetty ja hakasulkulauseke sovitettujen funktioiden lukumäärän ja
tyypin. Jos tarkastellaan myös jaksollisen järjestelmän toisen jakson alkuaineita, STO-3G esitetään
muodossa (6s3p/3s)/[2s1p/1s]. Esimerkiksi litium vaatisi tällöin kolme kappaletta 1s-, 2s- sekä 2p-
primitiivejä, eli yhteensä 6s3p. Näistä muodostetaan yksi 1s, 2s ja 2p sovitettu funktio. Nämä on
erotettu vedyn vastaavista kenoviivalla /.
Single- , Multiple- , ja Split-valenssi
Edellä mainittu STO-3G kantajoukko on esimerkki ns. single- kantajoukosta. Tämä tarkoittaa, että
kutakin orbitaalia kuvataan vain yhdellä sovitetulla Gaussin funktiolla. Esim. H ja He kuvataan
tällöin yhdellä 1s-funktiolla. Toisen jakson alkuaineille Li-Ne on käytössä 5 funktiota: 1s, 2s, 2px,
2py ja 2pz. Kolmannelle jaksolle (Na-Ar) on näiden lisäksi vielä 3s, 3px, 3py ja 3pz eli kaikkiaan 9
funktiota, jne. Tämä on minimimäärä, joka tarvitaan kantajoukoksi. Tällaista kantajoukkoa
kutsutaan myös minimaaliseksi kantajoukoksi.
Tällainen kantafunktioiden lukumäärä on kuitenkin hyvin pieni, kun ajatellaan, että HF-rajalle
pääsy vaatisi ääretöntä kantajoukkoa. Eräs tapa lisätä kantajoukon ”joustavuutta” on dekontrahoida
sitä. Sen sijaan että käyttäisimme yhtä sovitettua Gaussin funktiota, joka on koostunut kolmesta
primitiivistä, voimmekin käyttää esimerkiksi kahta sovitettua Gaussin funktiota, joista toinen
koostuu kahdesta primitiivistä ja toinen vain yhdestä primitiivistä. Molemmissa tapauksissa kanta
52
siis koostuisi kaikkiaan kolmesta primitiivistä, mutta sovitettuja Gaussin funktioita, joita käytetään
yhtälön (6.15) mukaisessa molekyylin aaltofunktion lineaarikombinaatiolausekkeessa, olisi
ensimmäisessä tapauksessa yksi ja toisessa kaksi. Herää kysymys mitä hyötyä tästä on? Hyöty tulee
siitä, että saamme lisää joustavuutta todellisen molekyyliorbitaalin kuvaamiseen, sillä em.
käsittelyssä sekulaarideterminantin koko kasvaa. Varsinaisten integroitavien kantafunktioiden,
primitiivigaussiaanien, lukumäärä pysyy edelleen samana, joten laskenta-aika ei oleellisesti pitene.
Kantajoukkoa, jossa on kaksi funktiota kuvaamassa kutakin atomiorbitaalia kutsutaan double-
kantajoukoksi. Jos funktioita on kolme, puhutaan triple- kantajoukosta jne. Kirjain zeta ( ) tulee
siitä, että atomiorbitaalia kuvaavassa STO-funktion lausekkeessa eksponenttina on tapana käyttää
symbolia , kuten yhtälössä (7.4) on esitetty.
Sovitetut kantafunktiot siis sovitetaan vastaamaan mahdollisimman hyvin STO-funktiota, joka
vastaa muodoltaa LCAO-approksimaation mukaista vetyatomin atomiorbitaalia. Jos sovitettua
funktiota käytetään sen sijaan molekyylin aaltofunktion esittämiseen, ei yhdelle sovitetulle
funktiolle voida antaa kuin yksi kerroin yhtälön (6.15) mukaisessa lausekkeessa. Tällöin on siis
mahdollisimman hyvän molekyyliorbitaalin kuvaamisen kannalta edullisempaa käyttää
dekontrahoituja funktioita.
Lisäksi tällä kontrahoitujen/dekontrahoitujen funktioiden käyttötavalla on se merkittävä
ominaisuus, että jokaista orbitaalia ei tarvitse välttämättä kuvata samalla tavalla. Tarkastellaan
esimerkiksi happiatomia. Sille voitaisiin optimoida vaikkapa kolmesta primitiivistä muodostuva
sovitettu Gaussin funktio, joka vastaisi mahdollisimman hyvin 1s-atomiorbitaalia esittävää STO-
funktiota. Jos tarkastelisimme jotakin happea sisältävää molekyyliä, löytäisimme
molekyyliorbitaalin, joka vastaa hyvin läheisesti sovitetulla Gaussin funktiolla esitettyä 1s-
atomiorbitaalia. Tämä johtuu siitä, että molekyylien kemialliset ominaisuudet, kuten atomien väliset
sitoutumiset, ovat pääasiassa riippuvaisia valenssi- eli ulkokuoren elektroneista ja siis
valenssiorbitaaleista (valence orbitals). Tällöin on siis laskennallisesti aivan turhaa tuhlata suurinta
osaa laskuajasta sisempien kuorien orbitaalien (core orbitals) laskemiseen, jos ne ovat aina lähes
samanlaiset. Järkevämpää on panostaa valenssiorbitaalien mahdollisimman hyvään kuvaamiseen.
Tämän voimme tehdä käyttämällä ns. split-valenssi (split-valence tai valence-multiple- )
kantajoukkoa, jossa käytämme erityyppistä kantajoukkoa sisä- ja valenssiorbitaaleille.
53
Yleensä riittää kun kuvataan sisäorbitaaleja yhdellä sovitetulla Gaussin funktiolla, joka tavallisesti
koostuu kolmesta tai kuudesta primitiivistä. Valenssiorbitaalien kuvaamiseen taas käytetään usein
dekontrahoituja funktioita, jotka tavallisimmin koostuvat kukin yhdestä tai kolmesta primitiivistä.
Tällaisia split-valenssi kantajoukkoja ovat (kemian alan kirjallisuudessa erittäin tunnetut) Poplen
kantajoukot kuten: 3-21G, 6-21G, 4-31G, 6-31G ja 6-311G. Kantajoukon nimi kertoo
kontraktiotavan. Ensimmäinen numero kertoo kuinka monesta primitiivistä koostuvia sovitettuja
Gaussin funktioita käytetään sisäorbitaaleille. Väliviivan jälkeiset numerot kertovat kuinka monesta
primitiivistä koostuu kukin sovitettu Gaussin funktio valenssiorbitaaleille. Jos näitä numeroita on
kaksi, tarkoittaa se, että valenssiorbitaaleja kuvataan kahdella sovitetulla funktiolla ja koko
kantajoukkoa kutsutaan tällöin valence-double- -kantajoukoksi. Jos näitä numeroita on kolme
kappaletta, puhutaan valence-triple- -kantajoukosta.
Sovitetuille Gaussin funktioille esitettiin myös toinen merkintätapa. Samaa tapaa voidaan käyttää
tässäkin. Esimerkiksi haluttaessa laskea vesi-molekyyli, 6-311G kantajoukko olisi toisella tavalla
kirjoitettuna (11s5p/5s)/[4s3p/3s]. Merkintä 6-311 siis kertoo, että sisäorbitaaleja kuvataan yhdellä
sovitetulla funktiolla, joka koostuu kuudesta primitiivistä (huom. sisäorbitaaleja on vain hapen 1s).
Valenssiorbitaaleja kuvataan kolmella sovitetulla funktiolla, joista yksi koostuu kolmesta
primitiivistä ja muut ovat vain yksittäisiä primitiivifunktioita. Tällöin siis esim. hapen kuvaamiseen
tarvitaan 11 s-primitiiviä (6 1s-primitiiviä + 3 + 1 + 1 2s-primitiiviä) ja 5 p-primitiiviä (3 + 1 + 1).
Näistä muodostetaan 4 sovitettua s-funktiota (1s + 3 kpl 2s) ja 3 sovitettua p-funktiota.
Miten näissä multiple- - ja split-valenssi kantajoukoissa sitten valitaan GTO-funktioiden kertoimet
lineaarikombinaatiota muodostettaessa sekä eksponenttitermi ? Koska kantajoukko ei ole enää
minimaalinen, ei sitä voida suoraan sovittaa STO-funktioon. Pople ryhmineen käytti ongelmaan
joukkoa testimolekyylejä ja sovitti variaatiolaskennan keinoin kertoimet ja eksponentin vastaamaan
parasta mahdollista tulosta testijoukon molekyyliorbitaaleille. Valenssikuorien koostuessa
useammasta sovitetusta funktiosta (esim. 311), kuvataan kolmesta primitiivistä koostuvalla
funktiolla yleensä valenssiorbitaalien ”sisempiä osia”, joissa elektronitiheys on suurin. Näillä siis
eksponentti , joka kuvaa eksponenttitermin leveyttä, on suuri. Korjaukset valenssikuorien
”ulompiin osiin”, tehdään yleensä vain yksittäisistä primitiiveistä muodostuvilla funktioilla (311-
tapauksessa kahdella). Näissä eksponentti , on pienempi, eli Gaussin funktio on ”diffuusimpi”.
54
Poplen kantajoukoista vielä sellainen huomio, että ne ovat ns. segmentoituja, mikä tarkoittaa, että
esim. 2s- ja 3s-kantafunktioissa ei käytetä samoja primitiivifunktioita (segmented contraction).
Tämä päteen kaikkiin eri pääkuoren, mutta saman kulmaosan sisältäviin orbitaaleihin. Toinen tapa
on ns. Raffanettin tapa käyttää yleistä sovitusta (general contraction). Tässä käytetään tiettyä
joukkoa samoja primitiivejä jokaisessa sovitetussa kantafunktiossa, mutta ne esiintyvät kussakin eri
kertoimilla. Tällä tavalla saavutetaan tiettyjä etuja esim. integraalien laskentatehokkuudessa.
Samoja primitiivejä sisältävät integraalit riittää laskea vain kertaalleen ja ne voidaan tallettaa ja
hakea uudelleen käyttöön kun niitä tarvitaan uudelleen. Tällaisia split-valenssikantajoukkoja ovat
ns. Dunningin kantajoukot kuten cc-pVDZ ja cc-pVTZ jne. Kantajoukkojen nimessä cc tulee
sanoista correlation-consistent, joka tarkoittaa, että kantajoukon eksponentit ja kertoimet ovat
optimoitu käyttäen laskelmia, jotka huomioivat myös elektronikorrelaation. Loppuosan pVDZ tulee
sanoista polarized Valence Double Zeta. Eli tässä tapauksessa valenssiorbitaalit kuvataan double-
zeta kontraktiolla. Polarisaatiofunktioihin puolestaan perehdytään seuraavaksi.
Polarisaatiofunktiot
Vaikka edellisissä luvuissa on puhuttu paljon STO-funktioista ja niiden vastaavuudesta
atomiorbitaalien kanssa, on syytä muistaa, että atomiorbitaalit ovat vain malli, jolla ajattelemme
pystyvämme kuvaamaan molekyyliorbitaaleja. Molekyyliorbitaalien mallintaminen
atomiorbitaaleilla ei aina kuitenkaan anna oikean muotoisia molekyyliorbitaaleja. Tarkastellaan
esimerkiksi ammoniakkia NH3. Sen tiedetään olevan rakenteeltaan pyramidimainen, jossa voi
tapahtua ns. typpi-inversio, jossa pyramidi muuttuu toiseksi (tässä tapauksessa samanlaiseksi)
pyramidiksi. Tämä muutos tapahtuu tasomaisen rakenteen kautta, jota voidaan ajatella muutoksen
transitiotilaksi. Kuitenkin HF-laskut käyttäen s- ja p-funktioita kantafunktioina ennustaa tasomaisen
rakenteen olevan minimienergiarakenne.
Ongelmana em. tapauksessa on, että laskelmat käyttäen atomikeskisiä s- ja p-funktioita eivät anna
molekyylin aaltofunktiolle riittävästi ”joustavuutta” kuvaamaan pyramidista rakennetta. Molekyylit
vaativat usein siis enemmän joustavuutta tai liikkumavaraa aaltofunktionsa kuvaamiseen kuin mitä
s- ja p-atomiorbitaaleista muodostuvat kantafunktiot tarjoavat. Tätä liikkumavaraa voidaan antaa
lisäämällä kantajoukkoon ns. polarisaatiofunktioita. Tavallisesti tämä tehdään käyttämällä
polarisaatiofunktioina pykälää korkeamman sivukvanttiluvun omaavia funktioita kuin atomi
itsessään edellyttäisi. Eli suomeksi sanottuna hiilelle ja muille toisen jakson alkuaineille käytetään
alunperin tarvittavien p-funktioiden lisäksi polaarisaatiofunktioina d-funktioita. Vedylle s-
funktioiden lisäksi käytetään p-funktioita. Tämä lisää kantajoukon joustavuutta kuvata
55
monimutkainen molekyyliorbitaali huomattavasti. (Toinen mahdollisuus olisi käyttöää funktioita,
jotka eivät ole atomikeskisiä. Gaussiaaniset tällaiset ovat ns. FLOGO (floating Gaussian orbital)
funktioita, mutta ne eivät ole laskennallisesti yhtä tehokkaita kuin atomikeskiset).
Polarisaatiofunktioita käytetään nykyään laskuissa lähes poikkeuksetta. Ne merkitään Poplen
kantajoukkoihin tähdellä *. Esimerkiksi kantajoukko 6-31G* tarkoittaa, että d-funktioita käytetään
”polarisoimaan” 6-31G:n p-funktioita. Jos kantajoukossa on myös toinen tähti, tarkoittaa se, että p-
funktioita (s-funktioiden lisäksi) on käytetty vedylle ja heliumille, esim. 6-311G**. Yleisesti
polarisaatiofunktioille käytetään myös vaihtoehtoisia merkintöjä * = (d) ja ** = (d,p). Tällöin esim.
6-31G** = 6-31G(d,p).
Dunningin kantajoukoissa käytetään taas hieman erityyppistä systeemiä. On huomattu, että
polarisaatiofunktioilla saavutetaan tietty optimaalinen tehokkuus dekontraktiosysteemistä riippuen.
Esimerkiksi double- kantajoukolle lisätään yleensä d-funktiot jokaiselle raskaalle atomille (=atomi,
joka ei ole H tai He) ja p-funktiot vedylle. Triple- kantajoukolle puolestaan lisätään yksi joukko f-
funktioita ja kaksi d-funktioita raskaille atomeille sekä yksi joukko d-funktioita ja kaksi p-funktioita
vedylle. Tätä polarisaatiofunktiosysteemiä käytetään kantajoukoissa cc-pVnZ, missä n = 2 (D),
3(T), 4(Q), 5, 6, jne. Esim raskaille atomeille kantajoukossa cc-pV6Z käytetään yhtä i-funktiota,
kahta h-funktiota, kolmea g-funktiota, neljää f-funktiota ja viittä d-funktiota. Tämän lisäksi kun
valenssifunktioita on vielä kuusi s- ja p-funktiota sekä sisäkuorien elektroneja vastaavat funktiot,
niin saadaan yhteensä 140 kantafunktiota kuvaamaan kutakin toisen jakson atomia. On
sanomattakin selvää, että tällaisilla kantajoukoilla laskut ovat hyvin raskaita.
Jos Poplen kantajoukoissakin halutaan (kuten nykyään usein tehdään) käyttää useampia
polarisaatiofunktioita, kirjoitetaan ne tähden sijasta näkyviin sulkulausekkeeseen. Eli tällöin esim.
6-31G* = 6-31G(d). Tällä systeemillä on helppo ilmaista useammat polarisaatiofunktiot, esim. 6-
31G(3d2fg,2pd), joka tarkoittaa, että raskaille atomeille on lisätty kolme d-, kaksi f- ja yksi g-
funktio.
Diffuusiofunktiot
Anioneilla tai elektronegatiivisilla atomeilla elektronien varaustiheys ulottuu tavanomaista
kauemmas atomista. GTO-funktiot kuitenkin vaimenevat etäisyyden kasvaessa kohti nollaa edellä
esitetyillä kantajoukoilla ei pystytä kuvaamaan tilannetta riittävän hyvin kaukana atomista.
Tällaisen tilanteen korjaamiseen käytetään ns. diffuusiofunktioita. Diffuusiofunktiot ovat tavallisesti
56
GTO-tyypin funktioita, joiden eksponentti on paljon pienempi (nyrkkisääntönä noin neljäsosa
pienimmästä kantajoukon :sta) kuin muilla kantajoukon GTO-funktioilla. Tällöin GTO-funktion
muoto siis levenee ja se tuo lisää joustavuutta kantajoukkoon kuvaamaan varaustiheyttä kaukana
atomista. Sanotaan, että kantajoukko on augmentoitu (augmented) diffuusiofunktioilla. Tämä
merkitään Poplen kantajoukkoihin plus-merkillä. Esim. 6-31+G(d) tarkoittaa, että raskaat atomit on
augmentoitu yhdellä s- ja yhdellä p-funktiojoukolla. Toinen plus-merkki tarkoittaa diffuusien s-
funktioiden lisäämistä vedyille, esim 6-311++G(3df,2pd).
Dunningin kantajoukoissa cc-pVnZ diffuusiofunktiot merkitään etuliitteellä aug-. Näissä
diffuusiofunktiot lisätään kullekin sivukvanttiluvun kuvaamalle orbitaalille. Esimerkiksi merkintä
aug-cc-pVTZ tarkoittaa, että diffuusiofunktiot on lisätty raskaiden atomien f-, d-, p- ja s-funktioille
sekä kevyiden atomien d-, p- ja s-funktioille.
Erityisesti laskettaessa happamuuksia ja elektroniaffiniteettejä diffuusiofunktiot ovat
välttämättömiä. Esimerkiksi vetyfluoridin happamuus lisääntyy energiatermein ( G = RT lnK)
noin 180 kJ mol 1, kun käytetään kantajoukkoa 6-31+G(d) kantajoukon 6-31G(d) sijasta.
8.2. Open-shell -systeemit
Vaikkei asiaa ole erikseen korostetukaan, luvun 6 molekyyliorbitaaliteoreettinen käsittely on tehty
olettaen molekyyliorbitaalit pareittain miehitetyiksi, eli kullakin orbitaalilla on joko nolla tai kaksi
elektronia. Tällaista systeemiä sanotaan closed-shell -systeemiksi. Luvun 6 käsittely pätee kaikille
”tavallisille” molekyyleille. On kuitenkin poikkeuksia, joissa molekyyleillä on parittomasti
miehitettyjä orbitaaleja, esimerkiksi radikaalit. Tällaisia molekyylejä, joissa on yhden elektronin
sisältävä orbitaali, kutsutaan open-shell -systeemeiksi.
Luvun 6 HF-teoriaa kutsutaan rajoitetuksi Hartree-Fock (RHF, restricted HF) teoriaksi. Esimerkiksi
radikaalien käsittelyssä on käytettävä tästä muokattuja teorioita. Ensimmäinen on ns. rajoitettu
open-shell HF-teoria eli ROHF-teoria. Tämä teoria ei kuitenkaan käsittele spiniä oikein ja antaa
ristiriitaisia tuloksia mm. kokeellisien elektronin spinresonanssimittauksien kanssa. HF-teoriaa
voidaan muokata myös siten, että käsitellään parittoman elektronin spinit täysin erillisinä toisistaan.
Käsittely johtaa hieman erilaiseen Fockin matriisiin ja ns. rajoittamattomaan (unrestricted) HF-
teoriaan eli UHF-teoriaan. Tällä kurssilla ei mennä UHF-teoriaan sen syvemmin. Tarkoituksena oli
57
tuoda esiin, että kaikkiin tapauksiin käsittelemämme HF-teoria ei sovellu. Esimerkiksi NMR:stä
tuttujen J-kytkentävakioiden laskuissa on käytettävä UHF-teoriaa. UHF-teoria kaksinkertaistaa
laskenta-ajat HF-teoriaan verrattuna.
8.3. Huomioita laskenta-ajoista
Toistaiseksi on korostettu sitä, että ab initio HF-teoria skaalautuu muodollisesti N4:ään, eli neljän
indeksin integraaleja tulee laskettavaksi N4 kappaletta, missä N on kantajoukon koko. Usein tilanne
ei ole kuitenkaan aivan näin paha, vaan laskentaa voidaan tehostaa.
Aiemmin oli tapana laskea tarpeelliset integraalit, tallentaa ne tietokoneelle ja käyttää niitä aina
tarvittaessa, sillä useita Fockin matriisin integraaleista tarvitaan useaan otteeseen. Nykyaikaiset
tietokoneprosessorit ovat kuitenkin niin nopeita, että on laskentatehollisesti kannattavampaa laskea
jokainen integraali sitä mukaa kun se tulee vastaan, vaikka sama integraali olisi laskettu jo aiemmin.
Toisinsanoen integraalien tuloksia ei kannata tallentaa lainkaan, koska tallennus on hitaampaa kuin
uudelleenlaskeminen. Tällaista laskentatapaa kutsutaan suoraksi SCF:ksi (direct SCF).
Eräs laskuja oleellisesti nopeuttava seikka on se, että integraalien suuruuksille voidaan laskea
yläraja hyvinkin nopeasti. Tällöin esimerkiksi neljän indeksin integraaleille voidaan asettaa jokin
tietty raja, jonka jälkeen integraalia ei enää lasketa tarkasti, vaan se arvioidaan tasan nollaksi.
Suurissa molekyyleissä on tällaisia integraaleja hyvin paljon, sillä jos kantafunktiot ovat kaukana
toisistaan on helppo kuvitella integraalin olevan erittäin pieni.
Laskenta-aikaa HF-teoreettisessa geometriaoptimoinnissa pienentää huomattavasti se, että rakenne
on alustavasti optimoitu jo kohtuullisen hyväksi jollakin kevyemmällä menetelmällä, esim.
molekyylimekaniikan tai semiempiiristen menetelmien avulla. Lisäksi molekyylin mahdollinen
symmetria, otettaessa se huomioon, saattaa nopeuttaa laskenta-aikaa hyvinkin paljon, koska se
rajoittaa molekyylin vapausasteiden lukumäärää.
8.4. Ab initio HF-teorian antamat tulokset
Seuraavassa lyhyesti ab initio HF-teorian antamien tulosten luotettavuudesta. Kattavampi vertailu
eri menetelmien tarkkuudesta tehdään, kun DFT-menetelmät on esitetty luvussa 10.
58
Energetiikka
Kuten aiemmin mainittu, HF-teorian energia-arvot ovat lähtökohtaisesti virheellisiä johtuen
elektronikorrelaation osuudesta. Tämän vuoksi HF-energioita voidaan käyttää vain energioiden
vertailuun samankaltaisilla systeemeillä kuten konformeereillä.
Reaktioille, joissa elektronien lukumäärä muuttuu, energia-arvot eivät ole vertailukelpoisia. Myös
reaktioille, joissa sidostyypit oleellisesti muuttuvat HF-menetelmien energiat eivät anna kovinkaan
luotettavia tuloksia. Esimerkiksi ilmakehässä tapahtuvalle reaktiolle: CO + HO· H· + CO2 on
kokeellisesti saatu reaktioentalpiaksi 96 kJ mol 1. HF-teoria antaa eri kantajoukoilla seuraavat
tulokset: STO-3G: +143 kJ mol 1, 3-21G: +13 kJ mol 1, 6-31G(d,p): 24 kJ mol 1, joten tuloksia ei
voi pitää kovinkaan hyvinä.
Tilanne kuitenkin paranee, kun vertaillaan konformationaalisia energioita. Esimerkiksi 1995
suoritetussa tutkimuksessa 35 orgaanisen yhdisteen konformaatiotasapainon energioissa havaittiin
keskimääräiseksi virheeksi HF/6-31+G(d,p) menetelmällä 2,5 kJ mol 1, mikä on jo melko pieni.
Vastaavan suuruusluokan keskimääräisiä virheitä on havaittu myös HF/6-31G(d)-menetelmällä.
Tarkasteltaessa glukoosin konformaatioita havaitaan HF/cc-pVDZ-menetelmän antavan oikein
hyviä tuloksia keskivirheen ollessa n. 0,4 kJ mol 1.
Geometria
HF-menetelmät antavat melko hyviä minimienergiarakenteita jo melko pienilläkin kantajoukoilla.
HF/cc-pVDZ-menetelmän keskimääräisiksi virheiksi on arvioitu raskaiden atomien sidospituuksissa
n. 0,03 Å, vedyn ja raskaan atomin sidospituudessa n. 0,015 Å ja sidoskulmissa n. 1,5°. Myös
torsiokulmille saadaan hyvin ennustettuja arvoja.
9. ELEKTRONIKORRELAATIO
Aiemmissa luvuissa on viitattu useaan otteeseen elektronikorrelaatioon ja siihen, että HF-teoria ei
huomioi elektronikorrelaatiota. Elektronikorrelaatioksi kutsutaan siis sitä energiaeroa, joka on
eksaktin Schrödingerin yhtälön antaman energian ja HF-rajan (eli HF-teorian mukaisen energian
äärettömällä kantajoukolla) energian välillä (vrt. s. 48). HF-teoria aiheuttaa virhettä yhden
elektronin operaattorin luonteensa johdosta. Varsinainen Hamiltonin operaattori on ns. monen
59
elektronin operaattori, mutta HF-teoriassa käytetty Fockin operaattori on yhden elektronin
operaattori, jossa elektronien vuorovaikutus muihin perustuu siihen miten elektroni kokee muiden
elektronien synnyttämän keskimääräisen sähkökentän.
Mistä elektronikorrelaatio pääasiassa aiheutuu? Mikä on se virhe, jonka HF-teorian keskimääräisen
kentän oletus aiheuttaa? Virhettä voi olla periaatteessa kahdenlaista. Yleisin virhe aiheutuu ns.
dynaamisesta elektronikorrelaatiosta, mikä tarkoittaa, että HF-teoria ei huomioi elektronien liikettä
toisiinsa nähden. Elektronit ovat jatkuvassa liikkeessä ja niiden liikkeeseen vaikuttaa jokaisen toisen
elektronin liikkuminen. Tämän lisäksi virhettä voi syntyä epä-dynaamisesta elektronikorrelaatiosta.
Tällainen tilanne tapahtuu, jos molekyylillä on kaksi sellaista molekyyliorbitaalia, jotka ovat
energialtaan hyvin samanlaisia (degeneroituja) ja sellaisia, että niille pitäisi vielä sijoittaa kaksi
elektronia (eli energialtaan korkeimpia miehitettyjä orbitaaleja). Tällöin lähtemällä liikkeelle
Slaterin determinantin mukaisesta aaltofunktiosta HF-SCF laskelmalla päädytään jompaan kumpaan
näistä orbitaaleista.
Miten elektronikorrelaatio voidaan sitten huomioida laskuissa? On luonnollinen tapa ajatella, että
paremmin eksaktia aaltofunktiota kuvaava aaltofunktio pystyttäisiin rakentamaan (jälleen kerran)
lineaarikombinaatiosta. Koska Slaterin determinantti on HF-teorian mukaan osoittautunut melko
hyväksi lähtökohdaksi molekyylin aaltofunktion kuvaamiseen, voi ajatella vielä paremman
aaltofunktion olevan sellainen, joka koostuu useista determinanteista eli toisinsanoen on muotoa
= c0 HF + c1 1 + c2 2 + ..., (9.1)
missä ensimmäinen determinantti on HF-teorian mukainen Slaterin determinantti ja toiset jotain
muita determinantteja. On osoittautunut, että jos elektronikorrelaatio on dynaaminen, kaavan (9.1)
mukaisessa kehitelmässä HF-osaa vastaava kerroin c0 on huomattavasti suurempi kuin muut ci:t.
Degeneroituneiden energioiden tapauksessa saadaan useampia likimäärin yhtäsuuria c-kertoimia.
Seuraavaksi käsitellään lyhyesti muutamia yleisimpiä elektronikorrelaatiomenetelmiä ja niiden
perusideoita. Käsittely on kvalitatiivinen, sillä elektronikorrelaatiomenetelmien teoria on
matemaattisesti melko monimutkainen ja menee yli tämän kurssin tarkoituksen.
Elektronikorrelaatiomenetelmiä ei ole kuitenkaan syytä sivuuttaa, sillä ne ovat nykypäivinä
tarkimpia, joskin myös raskaimpia, olemassaolevia menetelmiä molekyylimallinnuksessa.
60
9.1. Configuration interaction
Ensimmäisenä esitetään ns. configuration interaction (konfiguraatiovuorovaikutus) eli CI-
menetelmä. Siinä molekyylin aaltofunktio esitetään lausekkeen (9.1) kaltaisesti muodossa
CI = a0 HF +. .mieh
i
virt
r
ri
ria +
. .mieh
ji
virt
sr
rsij
rsija + ..., (9.2)
missä i ja j ovat miehitettyjä orbitaaleja ja r ja s ns. virtuaalisia orbitaaleja (= virittyneitä tiloja =
virittyneitä Slaterin determinantteja). Ensimmäinen summatermi sisältää kaikki yksinkertaisesti
virittyneet (single excitations) tilat, toinen kaikki kaksinkertaisesti virittyneet (double excitations)
jne. On osoitettu, että yhtälön (9.2) mukainen molekyyliorbitaali on eksakti ratkaisu Schrödingerin
yhtälöön, jos kaikki mahdolliset virittyneet tilat otetaan huomioon, ja laskuissa käytetään ääretöntä
kantajoukkoa. Menetelmää, jossa otetaan huomioon kaikki erilaiset tavat eli konfiguraatiot, joilla
elektronit voivat olla virittyneet, sanotaan ns. full-CI-menetelmäksi. Eli full-CI-menetelmä
äärettömällä kantajoukolla antaa siis eksaktin ratkaisun. Valitettavasti se ei ole vain laskennallisesti
mahdollinen. Mahdolliset elektronien konfiguraatiot saadaan kaavalla
Nkonf = )!1()!()!1(!)!1(!
mnmnmmnn , (9.3)
missä n on kantafunktioiden lukumäärä ja m elektroniparien lukumäärä. Esimerkiksi, jos ajatellaan
käytettävän 6-311G** kantajoukkoa bentseenille, saadaan m = 21 ja n = 144. Tämä antaa
konfiguraatioiden määräksi n. 5 · 1050, joten full-CI-lasku on käytännössä täysin mahdoton. Yhtälön
(9.2) mukainen summa on siis katkaistava. Ns. CIS-menetelmä (CI Singles) ottaa huomioon vain
kertaalleen virittyneet tilat eli ensimmäisen summalausekkeen. Jos huomioon otetaan molemmat
summalausekkeet, saadaan menetelmä CISD (CI Singles and Doubles). Saman periaatteen
mukaisesti saadaan esim. neljä ensimmäistä summatermiä huomioiva menetelmä CISDTQ tai
menetelmä, joka huomioi pelkästään toisen summalausekkeen CID.
9.2. Coupled Cluster
Coupled cluster –menetelmä perustuu ajatukseen, että molekyylin aaltofunktio voidaan kirjoittaa
muodossa
CC = exp(T) HF, (9.4)
missä T on ns. klusterioperaattori ja koostuu summasta T1 + T2 + ... +Tn, jossa n on elektronien
lukumäärä. Operaattorin eksponenttifunktio ajatellaan tässä muodostuvan eksponenttifunktion
sarjakehitelmän avulla (sillä matemaattisesti operaattori eksponenttina ei ole mitenkään itsestään
selvä käsite...). Operaattori T muuttaa miehitettyjä orbitaaleja virtuaalisiksi orbitaaleiksi.
Esimerkiksi T1 tekee kaikki yksinkertaisesti virittyneet muutokset (singly excited, kuten edelläkin),
61
T2 kaksinkertaisesti virittyneet jne. Täten siis esimerkiksi operaattori T2 operoi aaltofunktioon
tavalla
T2 HF =. .mieh
ji
virt
sr
rsij
rsijt , (9.5)
mikä vastaa CI-menetelmän doubles-summaa. Selvitettävänä tässä on siis kertoimet t. Vastaavalla
tavalla kuin edellä, otetaan summaoperaattoriin T mukaan yleensä vain muutamia alkupään
operaattoreita ja päädytään menetelmiin kuten CCSD tai CCSDT jne.
9.3. Multiconfiguration SCF
Tämä ns. MCSCF-menetelmä on samantapainen kuin CI-menetelmä. CI-menetelmän eräs ongelma
on, että HF-SCF-menetelmä kuvaa hyvin miehitettyjä orbitaaleja, mutta ei virtuaalisia orbitaaleja.
MCSCF-menetelmässä käytetään SCF-menetelmää kaavan (9.1) mukaiseen summalausekkeeseen,
jossa aaltofunktio on esitetty Slaterin determinattien lineaarikombinaationa. Tällainen
”moniulotteinen” iteraatiomenetelmä vaatii käyttäjältä varovaisuutta ja perehtyneisyyttä, sillä
iteraatiossa saatetaan usein päätyä kemiallisesti epätodellisiin minimeihin ja ne on kyettävä
erottamaan oikeista minimeistä.
9.4. Møller-Plesset häiriöteoria
Viimeisenä elektronikorrelaatiomenetelmänä esitetään ns. Møller-Plesset eli MP-menetelmä.
Fysiikassa on usein tapana esittää jokin ilmiö, joka on melko pieni varsinaiseen suureeseen
verrattuna ns. häiriönä. Häiriöteoria (perturbation theory) on yleinen matemaattinen teoria, jota
voidaan soveltaa moniin tilanteisiin. Møller ja Plesset esittivät miten elektronikorrelaation osuus
voidaan ajatella häiriötermiksi HF-teorian mukaisen Hamiltonin operaattorin rinnalla. Toisinsanoen
he lähtivät liikkeelle oletuksesta, että Schrödingerin yhtälön mukainen eksakti Hamiltonin
operaattori voidaan esittää muodossa
H = H0 + H1, (9.6)
missä jälkimmäinen termi on ns. häiriötermi. Häiriöteoriassa on ominaisuutena, että häiriö voidaan
käsitellä tietyn kertaluvun häiriönä. Mitä suurempi on kertaluku, sitä tarkempi on tulos, mutta laskut
muuttuvat aina monimutkaisemmiksi. Sovellettaessa häiriöteoriaa HF-teoriaan osoittautuu
ensimmäisen kertaluvun häiriöteoreettinen käsittely antavan identtisen tuloksen HF-teorian kanssa.
Toisen kertaluvun häiriöteoreettista käsittelyä kutsutaan MP2-menetelmäksi, kolmannen MP3 jne.
Häiriöteorian kertaluvun kasvaessa kasvaa myös vaadittava laskenta-aika. Kun HF-teoria
skaalautuu kantafunktioiden määrän suhteen neljänteen potenssiin, on vastaava luku MP2-
menetelmässä 5, MP3-menetelmässä 6 jne, joten laskelmat pitenevät joka askeleella kertaluvulla.
62
MPn-teorian antamien energioiden on havaittu suppenevan kohti tiettyä arvoa kun n kasvaa, mutta
ei ole todistettu onko tuo arvo todellinen Schrödingerin yhtälön mukainen eksakti energia.
Yleisesti ottaen voidaan sanoa, että elektronikorrelaatiomenetelmät antavat parempia tuloksia kuin
pelkkä HF-SCF-teoria. Haittana on, että elektronikorrelaatiomenetelmät ovat laskennallisesti hyvin
raskaita. Seuraava likimääräinen järjestys kuvaa menetelmien raskautta:
HF < MP2 ~ MP3 ~ CCD < CISD < CCSD < MP4 < CCSDT.
Eräs tapa saavuttaa HF-teoriaa parempia tuloksia joutumatta kuitenkaan hyvin raskaisiin laskuihin
on käyttää elektronien tiheysfunktionaaliteoriaa. Tähän nykyään suurinta suosiota laskennallisessa
kemiassa nauttivaan menetelmään perehdymme seuraavaksi.
10. TIHEYSFUNKTIONAALITEORIA
Cramerin kirja aloittaa tiheysfunktionaaliteoriasta kertovan luvun lauseella:”What a strange and
complicated beast a wave function is.” Kuten aiemmin on todettu, aaltofunktio on vaikeasti
havainnollistettavissa oleva funktio, jota on hankalaa ajatella intuitiivisesti. Lisäksi aaltofunktio on
hyvin monen muuttujan funktio, sillä Bornin ja Oppenheimerin mukainen elektroninen aaltofunktio
riippuu systeemin kunkin elektronin paikasta ja spinistä. Aaltofunktio on siis itseasiassa 4N
muuttujan funktio, missä N on systeemin elektonien lukumäärä, joka suuremmissa molekyyleissä ei
ole aivan pieni luku. Lisäksi aaltofunktion dimensio on vähintäänkin erikoinen, sillä aaltofunktion
neliöhän kuvaa tunnetusti todennäköisyystiheyttä, eli todennäköisyyttä per tilavuusyksikkö, esim
m3. Tästä voidaan päätellä, että aaltofunktion yksikkö on m 3/2. Voidaankin oikeutetusti kysyä, eikö
olisi jotain hieman konkreettisempaa ja yksinkertaisempaa suuretta, jonka avulla voisimme
määrittää systeemin energian ja sitä kautta systeemin muut halutut ominaisuudet?
Vastaus edelliseen kysymykseen on myönteinen. Tällainen suure on elektronitiheys , joka kuvaa
nimensä mukaisesti elektronien määrää tilavuusyksikössä. Tällöin elektronitiheys on molekyylin
koosta sekä atomien ja elektronien lukumäärästä riippumatta aina ainoastaan kolmen muuttujan (=
paikan) funktio, eli = (x,y,z) = (r). Lisäksi elektronitiheys on paljon helpommin
havainnollistettavissa oleva suure kuin aaltofunktio. Elektronitiheys voidaan määrittää jopa
kokeellisesti röntgendiffraktiomittausten avulla.
63
Se, että elektronitiheys on sellainen suure, jonka avulla voimme lausua systeemin energian, ei ole
mitenkään itsestään selvää. Schrödingerin yhtälön mukaisesti energia saadaan Hamiltonin
operaattorin ominaisarvona. Tällöin voidaan ajatella, että jos voimme rakentaa Hamiltonin
operaattorin elektronitiheyden avulla, pystymme määrittämään myös energian. Kun mietitään mitä
tietoja tarvitaan Hamiltonin operaattorin (ks. yhtälö 6.13) kirjoittamiseksi, on tunnettava ainoastaan
ytimien paikat ja varaukset sekä elektronien lukumäärä. Viimeisin saadaan lausuttua
elektronitiheyden avulla helposti, sillä elektronien kokonaismäärä on luonnollisesti elektronien
tiheyden integraali koko avaruuden yli:
N = rr d)( . (10.1)
Lisäksi ytimien paikat on helposti saatavissa elektronitiheydestä, sillä ne vastaavat
elektronitiheyden lokaaleja maksimikohtia (negatiiviset elektronit ovat mielellään positiivisen
ytimen lähistöllä). Tällöin jää pohdittavaksi vielä ytimien varaus. Voidaan kuitenkin osoittaa, että
)(2)(
0AA
rA
A rZrr
A
, (10.2)
missä ZA on ytimen A varausluku ja rA radiaalinen etäisyys ytimestä A. on puolestaan
keskimääräinen säteittäinen varaustiheys. Lausekkeen matemaattista muotoa oleellisempaa on tässä
yhteydessä se, että ytimien kohdalla elektronitiheys sisältää tietoa ytimien varauksista. Tällöin siis
elektronitiheyden avulla pystytään määrittämään kaikki ne suureet, jotka tarvitaan Hamiltonin
operaattorin kirjoittamiseksi. Tämä ei vielä sinänsä auta millään tavalla tilannettamme, sillä se, että
kirjoittaisimme Hamiltonin operaattorin elektronitiheyden avulla johtaisi edelleen tekemisiin
Schrödingerin yhtälön ja aaltofunktion kanssa, mitä haluaisimme lähtökohtaisesti välttää. Oleellinen
tulos on se, että elektronitiheys näyttäisi olevan suure, jota kannattaa miettiä paremminkin, koska se
on yksinkertainen ja sen avulla päästään periaatteessa kiinni molekyylin energiaan Hamiltonin
operaattorin kautta.
Seuraavaksi alamme miettiä miten saisimme energian lausuttua elektronitiheyden avulla. Toisin
sanoen etsimme lauseketta E, joka riippuu elektronitiheydestä ja antaa tuloksena systeemin
energian. Tämä merkitään yleensä tavalla:
E [ (r)] = molekyylin energia. (10.3)
Matematiikassa funktio on otus, joka muuttaa jonkin tavallisen luvun toiseksi luvuksi (esimerkiksi
sini). Operaattori on puolestaan sellainen, joka muuttaa funktioita toisiksi funktioiksi (esimerkiksi
derivointi). Lausekkeen (10.3) E ei ole näistä kumpaakaan, sillä se muuttaa funktion
(elektronitiheyden) tavalliseksi luvuksi (energiaksi). Matemaattisesti tällaista veijaria kutsutaan
64
funktionaaliksi ja se merkitään kaavan (10.3) tavoin hakasulkulausekkeena. Tästä tulee nimi
tiheysfunktionaaliteoria eli DFT (density functional theory). Toisinsanoen alamme siis seuraavaksi
miettiä minkälainen tiheysfunktionaali antaisi meille molekyylin energian.
10.1. Tiheysfunktionaaliteorian ensiaskeleita
Energia voidaan jakaa liike-energiaksi (T) ja potentiaalienergiaksi (V), eli E = T + V. Jos aluksi
ajatellaan molekyyliä klassisen mekaniikan mukaisesti, voidaan potentiaalienergia lausua helposti
elektronitiheyden avulla kaavoilla
Vne[ (r)] =ytimet
k k
k dZ rrrr
)( (10.4)
ja
Vee[ (r)] =21
2121
21 )()( rrrr
rr dd , (10.5)
missä ensimmäinen termi kuvaa ytimien ja elektronien välistä vetovoimaa ja jälkimmäinen
elektronien välistä hylkimisvoimaa. Elektronien lausekkeissa tarvitaan integraalit, koska
elektronitiheys on jatkuva funktio. Ytimillä riittää summa, koska ytimet ajatellaan kiinnitetyksi
”verkostoksi”. Jälkimmäisen termin kerroin ½ tulee siitä, ettei elektronien hylkimisvoimaa
laskettaisi kahteen kertaan (vrt. esim. yhtälö 6.3).
Liike-energia on potentiaalienergiaa hankalammin lausuttavissa (r):n avulla. Ensimmäisen
yrityksen kuvata liike-energiaa tekivät Thomas ja Fermi jo vuonna 1927. (Onkin huomattavaa, että
elektronitiheyden käyttöä energian määritykseen käsiteltiin jo samoihin aikoihin kun
kvanttimekaniikan kehitys oli kuumimmillaan.) Thomas ja Fermi tarkastelivat kuvitteellista ainetta,
”jelliumia”, joka sisältää äärettömän määrän elektroneja. Elektronit liikkuvat äärettömässä
tilavuudessa, jossa on tasaisesti jakautunut positiivinen varaus (eli positiivinen varaus ei ole
keskittynyt erillisiin hiukkasiin, ytimiin, kuten tavallisesti). ”Jelliumia” kutsutaan myös tasaiseksi
elektronikaasuksi (uniform electron gas). He johtivat kyseiselle aineelle fermionien statististisen
mekaniikan avulla liike-energian lausekkeeksi
Tueg[ (r)] = rr d35
32
2 )()3(103 . (10.6)
Tätä lauseketta em. potentiaalienergialausekkeiden kera voidaan pitää ensimmäisenä
tiheysfunktionaaliteoreettisena menetelmänä. Niissä energia on lausuttu puhtaasti elektronitiheyden
avulla ilman minkäänlaista yhteyttä aaltofunktioon. Thomas Fermi –yhtälöillä on tässä lähinnä
historiallinen merkitys. Kemian kannalta yhtälöt ovat aivan liian karkeat kuvaamaan molekyyliä;
65
itseasiassa niistä saadaan tulokseksi, että molekyylien muodostuminen ei ole energeettisesti
mahdollista, vaan atomien on suotuisinta pysyä yksittäisinä atomeina.
Yksi suuri puute Thomas Fermi –mallissa on elektronien välisen vuorovaikutuksen kuvaaminen.
Mallissa kuvaaminen on tehty ainoastaan yhtälön (10.5) klassisen mekaniikan mukaisella
lausekkeella, joka jättää huomioimatta kvanttimekaaniset ilmiöt: korrelaation ja vaihdon. Usein
lausekkeeseen (10.5) lisätään termi, jossa on mukana ns. aukkofunktio (hole function), jonka
tarkoituksena on korjata elektronien välistä potentiaalienergiaa siten, että se huomioi
kvanttimekaaniset ominaisuudet. Huom. Tässä mainittu vaihtovuorovaikutus on sama ilmiö, joka
havaittiin aikaisemmin Slaterin determinantin yhteydessä (vrt. yhtälö 6.33). Vaihtotermi aiheutti
Fermin aukon elektronien lähistölle. Lisäksi on olemassa ns. Coulombin aukko, joka on
kvanttimekaaninen ilmiö, jota luvun 6 HF-teoria ei sisällä. Tämän ilmiön osuutta kutsutaan DFT:ssä
korrelaatiotermin avulla. Coulombin aukon huomiotta jättäminen aiheuttaa osaltaan HF-teorian
elektronikorrelaatiovirheen. Fermin ja Coulombin aukot pyritään kuvaamaan em. aukkofunktion
avulla. Slater otti ensimmäisenä mukaan elektronien vuorovaikutuksesta aiheutuvan korjaustermin.
Hän tuli tulokseen, että vaihtotermi (Fermin aukon suuruus) on huomattavasti suurempi kuin
korrelaatiotermi (Coulombin aukon suuruus) ja jätti täten jälkimmäisen huomiotta. Hän esitti
vaihtoenergialle Ex lausekkeen
Ex[ (r)] = rr d34
31
)()3(8
9 , (10.7)
jossa parametri on 1. Aiemmin Bloch ja Dirac olivat johtaneet samanlaisen lausekkeen tasaiselle
elektronikaasulle, jossa oli 2/3. Yhtälön (10.7) mukaisen lausekkeen lisäämistä edellisiin
kutsutaan Thomas Fermi Dirac mallina. Vaihtoenergian parametrin vuoksi näiden yhtälöiden
laskelmia kutsutaan tavallisesti X laskuiksi. Näilläkin laskuilla on nykypäivinä lähinnä vain
historiallinen merkitys.
10.2. Hohenbergin ja Kohnin teoreemat
Edellä kuvattuja tuloksia käytettiin aikoinaan lähinnä kiinteän olomuodon fysiikassa. Niiden suuret
virheet tekivät ne käyttökelvottomiksi molekyylien laskemiseen. Varsinaisen
tiheysfunktionaaliteorian voidaankin katsoa alkaneen vuonna 1964, kun Hohenberg ja Kohn
esittivät ja todistivat kaksi teoreemaa, jotka mullistivat DFT:n ja toivat sen osaksi kvanttikemiallista
koneistoa.
66
Hohenberg Kohnin olemassaoloteoreema (The Hohenberg Kohn Existence Theorem)
DFT:ssä elektronit vuorovaikuttavat sekä toistensa että ns. ulkoisen potentiaalin kanssa. Ulkoiseksi
potentiaaliksi kutsutaan ytimien aiheuttamaa positiivista elektroneja puoleensavetävää potentiaalia.
Esim. edellisessä jelliumissa ulkoinen potentiaali oli tasaisesti jakaantuneesta vakioisesta
varauksesta aiheutuva potentiaali. Hohenberg-Kohnin olemassaoloteoreeman mukaan systeemin
perustilan elektronitiheys määrää yksikäsitteisesti Hamiltonin operaattorin ja täten myös systeemin
energian ja muut ominaisuudet. Jo aiemmin näimme, että pystymme konstruoimaan systeemin
Hamiltonin operaattorin elektronitiheyden avulla. Tällöin teoreemasta jää todistettavaksi, että
perustilan elektronitiheys määrää yksikäsitteisesti ulkoisen potentiaalin, joka tarvitaan Hamiltonin
operaattorin muodostamiseen. Todistus on melko helppo, lähtien vastaoletuksesta, mutta se
sivuutetaan kuitenkin tässä. Se löytyy esim. Cramerin kirjasta sivulta 237.
Hohenberg Kohnin variaatioteoreema (The Hohenberg Kohn Variational Theorem)
Edellinen teoreema kertoi, että jos systeemin perustilan elektronitiheys on tiedossa, saadaan sen
avulla laskettua systeemin energia ja muut ominaisuudet. Se ei kuitenkaan kerro miten voidaan
päätellä onko jokin elektronitiheys juuri perustilan energiatiheys. Toisinsanoen tarvitaan jokin keino
arvioida elektronitiheyden ”hyvyyttä”. Tähän tarjoaa ratkaisun Hohenberg-Kohnin
variaatioteoreema, jonka mukaan elektronitiheys noudattaa variaatioperiaatetta, eli E[ (r)] E0.
Systeemin perustilan energiaa kuvaava funktionaali saa siis pienimmän arvonsa silloin ja vain
silloin kun elektronitiheys on systeemin todellinen perustilan elektronitiheys. Tämä teoreema
voidaan todistaa ensimmäisen avulla siten, että ensimmäisen mukaan elektronitiheys määrää
yksikäsitteisen Hamiltonin operaattorin ja tällöin myös aaltofunktion, jolloin tulos seuraa suoraan
lausekkeen (6.12) mukaisesta variaatioperiaatteesta.
Periaatteessa voimme siis kokeilla erilaisia elektronitiheyksiä ja testata niitä variaatioperiaatteen
mukaan. Tulos kertoo kuinka hyvä arvauksemme oli. Tällainen arvailu ei ole kuitenkaan kovin
tuloksellista ja järkevää. Ensinnäkin meillä ei ole järkevää keinoa parantaa arvaustamme.
Toisekseen tarkoituksemme oli välttää Schrödingerin yhtälön ratkaisemista ja aaltofunktion
laskemista, joten emme halua laskea energian odotusarvoa Hamiltonin operaattorin avulla.
Ongelmana on, että emme tunne funktionaalia. Jos tietäisimme funktionaalin, voisimme laskea
energian suoraan sen avulla sotkeutumatta aaltofunktioon. Tähän asiaan perehdymme seuraavaksi.
67
10.3. Kohn Shamin tiheysfunktionaaliteoria
Luvun 6 molekyyliorbitaaliteoriassa suurimpana vaikeutena oli elektronien välisen
vuorovaikutuksen esittäminen. Edellisten tulosten mukaan elektronitiheys määrää yksikäsitteisesti
systeemin Hamiltonin operaattorin. Jotta tilanteessa ei johduttaisi Hamiltonin operaattorin
vaikeimpaan osaan, Kohn ja Sham huomasivat 1965, että kannattaa tarkastella aluksi Hamiltonin
operaattoria toisiinsa vuorovaikuttamattomien elektronien systeemille. Tällöinhän Hamiltonin
operaattori voidaan jakaa erillisiin yhden elektronin operaattoreihin (ks. luvut 6.7 ja 6.9).
Molekyylin aaltofunktio on tällöin eksaktisti Slaterin determinantti. Kohn ja Sham keksivät ottaa
lähtökohdaksi sellaisen kuvitteellisen toisiinsa vuorovaikuttamattomien elektronien systeemin, jonka
perustilan elektronitiheys olisi täsmälleen sama kuin jollakin todellisella systeemillä, jossa
elektronit vuorovaikuttavat. Koska elektronitiheys määrää yksikäsitteisesti elektronien lukumäärän
sekä ytimien paikat ja varaukset, on nämä suureet oltava samat sekä vuorovaikuttamattomalla että
vuorovaikuttavalla systeemillä. Seuraavaksi jaetaan energian lauseke osiin seuraavasti:
E[ (r)] = Tni[ (r)] + Vne[ (r)] + Vee[ (r)] + T[ (r)] + Vee[ (r)], (10.8)
missä oikeanpuoleiset termit ovat järjestyksessä vuorovaikuttamattomien (non-interacting)
elektronien liike-energia, ytimien ja elektronien välinen potentiaalienergia, klassinen elektronien
välinen potentiaalienergia, korjaustermi vuorovaikuttavan systeemin liike-energiaan ja korjaustermi
elektronien väliseen potentiaaliin, joka huomioi kaikki ei-klassilliset vaikutukset. Yo. lausekkeen
kolme ensimmäistä termiä ovat tunnettuja ja Slaterin determinantin mukainen aaltofunktio olisi
eksakti ratkaisu niistä muodostetulle Hamiltonin operaattorille ja Schrödingerin yhtälölle. Voimme
kirjoittaa lausekkeen myös eksplisiittisemmässä muodossa Diracin merkinnöin:
E[ (r)] =N
ii
ytimet
k ki
kiiii
Zrr
2
21
+N
ii
ii dr
rrr )(
21 + Exc[ (r)]. (10.9)
Tässä aaltofunktio on Slaterin determinantin mukainen aaltofunktio. Lausekkeen 10.8 ”vaikeat”
termit on tässä yhdistetty yhdeksi vaihto korrelaatiotermiksi. Nimitys on hieman harhaanjohtava,
sillä termi sisältää paitsi vaihto- ja korrelaatiotermien osuuden myös korjauksen liike-energiaan.
Nyt voimme tehdä kuten luvussa 6.10, eli muodostaa yhden operaattorin ominaisarvoyhtälön
hiKS
i = i i , (10.10)
jossa Kohn-Sham-operaattori on muotoa
hiKS = r
rrr
rrdZ
i
ytimet
k ki
ki
)(21 2 + Vxc, (10.11)
68
missä
Vxc = xcE (10.12)
on ns. funktionaaliderivaatta. Tämän jälkeen voimme edetä täysin samoin kuin luvussa 6, eli
voimme valita jonkin kantajoukon { } ja muodostaa sekulaarideterminantin, jossa Fockin
operaattorin sijaan käytämme Kohn-Shamin matriisialkioita
K = KSh . (10.13)
Aivan kuten HF-teoriassa, elektronitiheys esiintyy jo mukana operaattorissa, joten Kohn-Sham-
yhtälöiden ratkaiseminen täytyy tehdä iteratiivisesti samanlaista itseytyvän kentän menetelmää SCF
käyttäen (vrt. kuva 6.1). Nyt on syytä pysähtyä hetkeksi ja miettiä mitä saamamme tulos tarkoittaa
ja miten sitä voitaisi käyttää.
Kuten huomattua, Kohn Sham DFT muistuttaa hyvin paljon HF-teoriaa, mutta siinä on eräs hyvin
olennainen eroavaisuus. Tähän asti johdettu DFT ei sisällä minkäänlaisia approksimaatioita, vaan
on eksakti. Käytännössä ainoa mitä pitäisi vielä tietää on Exc[ (r)]... Tähän asiaan paneudutaan
seuraavassa kappaleessa. Jos ajatellaan HF:n ja DFT:n eroja olettaen, että kantajoukon valinnasta
tulevat virheet eivät ole mukana (eli ollaan HF-rajalla), voidaan sanoa, että HF on
approksimatiivinen (ei huomioi elektronikorrelaatiota) teoria, jossa approksimatiiviset yhtälöt
pystytään ratkaisemaan eksaktisti. DFT on puolestaan eksakti teoria, mutta Kohn-Sham- tai
lyhyemmin KS-yhtälöt täytyy ratkaista approksimatiivisesti, koska Exc[ (r)]-funktionaali on
tuntematon.
10.4. Vaihto-korrelaatiofunktionaalit
Kuten mainittua, vaihto-korrelaatiofunktionaali sisältää kvanttimekaaniset korjaukset elektronien
väliseen vuorovaikutukseen. Lisäksi se sisältää myös liike-energiakorjauksen virheeseen, joka tulee
toisiinsa vuorovaikuttamattomien elektronien käsittelystä. Tämä jälkimmäinen korjaus huomioidaan
funktionaaleissa välillä aukkofunktion avulla. Tavallisemmin se jätetään kuitenkin tässä yhteydessä
huomioimatta. Kuten tullaan huomaamaan, vaihto-korrelaatiofunktionaalit sisältävät usein yhden tai
useampia kokeellisia parametreja. Tällöin kokeellisten parametrien määrityksessä tulee huomioitua
jo liike-energiakorjaus. Funktionaaleista puhuttaessa käytetään usein myös suuretta energiatiheys
xc. Se on elektronitiheyden funktionaali ja sen määritelmänä voidaan pitää yhtälöä
Exc[ (r)] = rrr dxc )()( . (10.14)
69
Local Density Approximation (LDA)
Sellaista DFT-menetelmää, joka sisältää oletuksen, että energiatiheys jossakin tietyssä paikassa
riippuu elektronitiheydestä ainoastaan juuri tuossa pisteessä, eli ns. elektronitiheyden lokaalista,
paikallisesta arvosta, kutsutaan local density approximation eli LDA-menetelmäksi. Käytännössä
tämä oletus pitää paikkaansa ainoastaan tasaiselle elektronikaasulle. Tällöin voidaankin edellä
mainitulle X menetelmälle muodostaa LDA-oletuksen mukainen lauseke elektronitiheydelle. Tällä
menetelmällä ei ole kuitenkaan suurta käytännön merkitystä, joten pitkähkön lausekkeen
eksplisiittinen muoto jätetään esittämättä. Ns. open-shell systeemeille (ks. luku 8.2) voidaan käyttää
yleistettyä LDA-menetelmää: LSDA (local spin density approximation).
Generalized Gradient Approximation (GGA)
Edellä todettiin, että LDA-menetelmä ei vastaa hyvin realistista tilannetta molekyylissä. Jotta sitä
saataisi parannettua, voidaan tehdä sellainen oletus, että energiatiheys tietyssä pisteessä riippuu
lisäksi elektronitiheyden gradientista ko. pisteessä, eli siitä miten elektronitiheys muuttuu
kyseisessä pisteessä. Tällaista menetelmää kutsutaan gradienttikorjatuksi tai generalized gradient
approximation eli GGA-menetelmäksi. Kyseisen menetelmän voi pukea matemaattiseen muotoon
seuraavasti:
)(/ rGGAcx = )(/ rLDA
cx +34/
)(
)(
r
rcx , (10.15)
jossa merkintä x/c tarkoittaa, että yhtälöä voidaan käyttää joko vaihto- tai korrelaatiokorjaukselle.
Tunnetuin ja yleisimmin käytetty GGA vaihtofunktionaali on Becken 1988 kehittämä ”B”. B
sisältää yhden kokeellisen parametrin, joka on optimoitu kuuden jalokaasun (heliumista radoniin),
tunnettujen vaihtoenergioiden avulla. Muita samankaltaisia funktionaaleja ovat esimerkiksi PW
(Burke, Perdew ja Wang, 1998) ja mPW (Adamo ja Barone, 1998). Myös sellaisia
vaihtofunktionaaleja, jotka eivät sisällä kokeellisia parametreja, on kehitetty. Tunnetuimpia
tällaisista ovat B86 (Becke, 1986), P (Perdew ja Wang, 1986) ja PBE (Perdew, Burke ja Ernzerhof,
1996-1997).
Korrelaatiotermin osuus on yleensä selvästi pienempi (tavallisesti noin kertaluvun tai kaksi) kuin
vaihtotermin. Tunnetuimpia gradienttikorjattuja korrelaatiofunktionaaleja ovat P86 (Perdew, 1986),
PW91 (Perdew ja Wang, 1992) ja B95 (Becke 1996). Näistä P86 sisältää yhden neon-atomin avulla
optimoidun parametrin ja jälkimmäiset eivät sisällä kokeellisia parametreja. Toinen hyvin tunnettu
70
korrelaatiofunktionaali on LYP (Lee, Young ja Parr, 1988). Se eroaa aiemmista siinä, että se ei yritä
korjata LDA lauseketta gradienttikorjauksella (kuten lausekkeessa 10.15), vaan laskee suoraan koko
korrelaatiotermin. LYP sisältää neljä parametria, jotka on optimoitu helium-atomin avulla.
Tavallisesti vaihto-korrelaatiofunktionaalit annetaan liittämällä yhteen jokin vaihto-osa ja
korrelaatio-osa. Esimerkiksi merkintä BLYP tarkoittaa Becken vaihtofunktionaalin ja LYP-
korrelaatiofunktionaalin käyttämistä. Ylivoimaisesti eniten käytettyjä kombinaatioita ovat BLYP,
BP86 ja BPW91, joista BLYP lienee se eniten käytetty vaihtoehto.
Hybridifunktionaalit
Kuvitellaan, että pystyisimme säätelemään elektronien välistä vuorovaikutusta systeemissämme
jatkuvasti. Oletetaan, että parametri kuvaa vuorovaikutuksen suuruutta. Kun = 0, elektronit
eivät vuorovaikuta ja systeemi on sama kuin kuvitteellinen systeemi KS-SCF-menetelmää
johdettaessa ja sille on olemassa eksakti HF-teorian mukainen ratkaisu. Kun = 1, on kyseessä
reaalinen systeemi, jossa vuorovaikutus on huomioitu kokonaisuudessaan. Tällöin voidaan osoittaa
ns. Hellmann Feynman teoreeman avulla, että vaihtokorrelaatio saadaan kaavasta
Exc = dxc
1
0
)()()( V . (10.16)
Em. integraalia ei pystytä laskemaan, mutta sitä voidaan yrittää arvioida. Lähtöpisteessä tilanne
vastaa HF-teorian mukaista tilannetta, joka voidaan ratkaista. Merkitään tätä energiaa ExcHF.
Päätepisteen energiaa ei pystytä ratkaisemaan suoraan, mutta se voidaan arvioita valitsemalla jokin
em. funktionaaleista. Tällöin ensimmäisenä approksimaationa koko vaihtokorrelaatioenergian
osuudeksi voidaan kirjoittaa (ajattele integraalia pinta-aloina)
Exc = ExcHF + z(Exc
DFT ExcHF), (10.17)
missä parametri z kuvaa minkälaisen osuuden pinta-alasta käyrä peittää.
Tällaista lähestymistapaa kutsutaan myös adiabaattiseksi liittämismenetelmäksi (adiabatic
connection method, ACM), koska siinä liitetään jatkuvalla tavalla kuvitteellinen systeemi
todelliseen vuorovaikuttavaan systeemiin. Edellisen lausekkeen tulosta voidaan parantaa lisäämällä
joitakin kokeellisia parametreja. Ensimmäisen tällaisen yritelmän teki Becke vuonna 1993. Hän
käytti apunaan gradienttikorjattuja B- ja PW91-funktionaaleja. Lauseke on muotoa
ExcB3PW91 = (1 a)Ex
LSDA + aExHF + b Ex
B + EcLSDA + cEc
PW91, (10.18)
jossa parametrit a, b ja c ovat kokeellisesti optimoituja ja arvoiltaan 0,20, 0,72 ja 0,81. Numero 3
menetelmän nimessä tulee parametrien lukumäärästä. Vuonna 1994 Stevens ryhmineen muokkasi
71
em. lauseketta niin, että siinä käytettiin PW91:n sijaan LYP-funktionaalia. Tämä ns. Becken
kolmeparametrinen malli B3LYP määritellään yhtälöllä
ExcB3LYP = (1 a)Ex
LSDA + aExHF + b Ex
B + (1 c)EcLSDA + cEc
LYP, (10.19)
jossa vakioilla a, b ja c on samat lukuarvot kuin edellä. Tällä hetkellä käytössä olevista
funktionaaleista B3LYP on osoittautunut suosituimmaksi. B3LYP-funktionaalia kutsutaan
hybridifunktionaaliksi, koska se on sekoitus HF- sekä DFT-teorian mukaista vaihtovuorovaikutusta.
Myös muita hybridifunktionaaleja on olemassa ja niitä kehitetään koko ajan, mutta ainakin tällä
hetkellä B3-mallit ovat vailla todellista kilpailijaa kemiallisissa sovelluksissa. DFT on menetelmänä
kuitenkin sen verran uusi, että uusien ja parempien mallien esiintulo on vain ajan kysymys.
10.5. Huomioita DFT-menetelmistä
HF-molekyyliorbitaaliteoria vs. KS-tiheysfunktionaaliteoria
On vielä syytä korostaa, että MO-teorian mukaisessa lähestymistavassa etsitään ja optimoidaan
aaltofunktiota. DFT:ssä optimoidaan elektronitiheyttä. Vaikka lähestymistapa on monin paikoin
samanlainen, esim. SCF-iterointi, on perusajatus kuitenkin erilainen. KS-DFT-laskuillakin saadaan
funktio, jota voidaan tavallaan pitää ”aaltofunktiona” siinä mielessä, että se on analoginen HF-
teorian mukaisen aaltofunktion kanssa, mutta ei sama asia. KS-aaltofunktiota on turvallisempi pitää
puhtaasti vain matemaattisena funktiona vaikkakin sille on viime aikoina esitetty myös
kvalitatiivisia kemiallisia päätelmiä.
Laskentatehokkuus
KS-matriisin alkiot (ks. kaavat 10.11 ja 10.13) eivät sisällä samanlaisia neljän indeksin integraaleja
kuten Fockin operaattorin matriisialkiot (6.37). KS-matriisialkioiden laskeminen skaalautuu N2
integraalin laskemiseen. Tällöin KS-SCF-menetelmän pullonkaulaksi tulee matriisin
diagonalisoiminen (sekulaarideterminanttia ratkaistaessa), jonka voidaan osoittaa skaalautuvan N3
mukaisesti. Tällöin voitaisiin, a priori, sanoa, että DFT-menetelmät ovat huomattavasti nopeampia
kuin HF-SCF-laskut. Tämä ei kuitenkaan pidä paikkaansa. Kokemus osoittaa, että DFT-lasku
keskisuurella (n. 15 raskasta atomia) molekyylillä kestää noin kaksinkertaisen ajan kuin HF-lasku
samanlaisella kantajoukolla.
Suuri tekijä edellisessä on kantafunktioilla laskeminen. Kuten aiemmin on todettu, HF-
menetelmissä suosittiin gaussiaanisia GTO-funktioita nimenomaan niiden laskennallisen
helppouden takia. Niiden neljän indeksin integraalit ovat analyyttisesti ratkaistavissa. DFT:ssä näitä
integraaleja ei ole, mutta DFT:ssä käytetty KS-operaattori on jo itsessään numeerinen. Tällöin
72
integraalien numeeriselta laskemiselta ei voi DFT:ssä välttyä. Toisin sanoen DFT-laskuissa ei
saavuteta myöskään laskennallista hyötyä siitä, että käytetään gaussiaanisia kantafunktioita. Syy
miksi niin tavallisesti tehdään, on lähinnä ohjelmistotekninen. HF-SCF-menetelmä on vanhempi
kuin DFT, mutta DFT:n KS-SCF tapa on niin samanlainen kuin HF-SCF, että DFT-menetelmät on
helppo koodata ja lisätä valmiisiin ohjelmistoihin. Tästä syystä DFT-menetelmissäkin käytetään
tavallisimmin samoja gaussiaanisia kantajoukkoja kuin ab initio –menetelmissä. Eivät gaussiaaniset
funktiot mitenkään huonoja ole, mutta DFT tarjoaisi tilaisuuden käyttää myös muita
kantafunktioita. DFT:ssä voidaan käyttää esimerkiksi STO-funktioita, jolloin saadaan supistettua
kantafunktioiden lukumäärää, kun ei tarvitse sovittaa useita GTO-funktioita kuvaamaan yhtä STO-
funktiota. Lisäksi tällä saavutetaan se etu, että funktion käyttäytyminen vastaa paremmin
todellisuutta hyvin lähellä ydintä. Tämä on tärkeää esimerkiksi NMR-laskuissa. Eräs ohjelmisto,
joka käyttää yksinomaan STO-tyyppisiä kantafunktioita on ADF (Amsterdam Density Functional).
Kantajoukot DFT:ssä voidaan laatia myös puhtaasti numeerisina ilman funktionaalista muotoa.
DFT mahdollistaa siis monipuolisen kantajoukon valinnan, mitä ei vielä nykyään ole kaikissa
mahdollisuuksissaan ja tehokkuudessaan yleisesti hyödynnetty. Lisäksi käytössä ei ole vielä
moniakaan puhtaasti DFT-menetelmien laskentaan kehitettyjä koodauksia, jotka laskentatehollisesti
voisivat olla perinteisiä HF-SCF-teoriaan pohjautuvia koodauksia parempia.
Kaikenkaikkiaan keskikokoisille orgaanisille molekyyleille DFT-menetelmä kohtuullisen suurella
kantajoukolla, esim menetelmä B3LYP//6-31G(d,p), on nykyaikaisista kvanttimekaanisista
menetelmistä laskentateho tarkkuussuhteeltaan suositeltavin ja tavallisimmin käytetty.
DFT-menetelmien kehitys
Jos ajatellaan ab initio –menetelmiä, on niissä selkeä tie kohti eksaktia Schrödingerin yhtälön
ratkaisua. Täytyy vain ilmaista aaltofunktio kaikkien konfiguraatioiden lineaarikombinaationa (full
CI). DFT-menetelmissä tulosten systemaattinen parantaminen on hankalaa. DFT:ssä ei ole
etukäteen tiedossa mikä olisi se tie, vaikkakin laskennallisesti mahdoton kuten full CI, kohti
eksaktia ratkaisua. Vaihto-korrelaatiofunktionaalin tällä hetkellä käytetyt lausekkeet ovat
luonteeltaan empiirisiä ja niitä on vaikea tarkentaa teoreettisesti. DFT-menetelmät ovat kuitenkin
hyvien tulostensa ansiosta jatkuvan kehittämisen alla, ja tulevaisuudessa saadaankin varmasti vielä
paremmin kokeellisten tulosten kanssa yhtäpitäviä uusia DFT-menetelmiä.
73
Laskutulosten tarkkuus
Liitteeksi 2 on koottu useita taulukoita, joissa on vertailtu keskenään semiempiirisiä-, ab initio sekä
DFT-menetelmiä. Taulukot on otettu esipuheessa mainituista Cramerin sekä Youngin kirjoista.
Yhteenvetona voidaan sanoa, että tarkimmat tulokset saadaan yleensä elektronikorrelaatio-
menetelmillä (kuten esimerkiksi CCSD), mutta ne ovat laskennallisesti hyvin raskaita. DFT-
menetelmät antavat yleensä parempia tuloksia kuin HF-menetelmät samanlaisilla kantajoukoilla.
DFT-menetelmistä hybridifunktionaali B3LYP antaa usein parhaimmat tulokset.
11. MOLEKYYLISIMULAATIOMENETELMIÄ
Tähän mennessä olemme käsitelleet useantyyppisiä menetelmiä ja ideanamme on ollut löytää
minimienergiarakenne ja laskea tälle energia ja muita ominaisuuksia. Tämänkaltaiselle
ongelmanasettelulle olemme saavuttaneet useita ratkaisumenetelmiä, joiden valinta riippuu lähinnä
molekyylin koosta ja käytettävissä olevasta laskenta-ajasta. On kuitenkin tilanteita, joihin
edellisenkaltainen lähestymistapa ei sovellu. Jos ajatellaan esimerkiksi jotain polymeeristä
rakennetta kuten vaikka polyetyleeniglykolia (PEG, (OCH2CH2)n ), niin sille kysymys
minimienergiarakenteesta ei ole mitenkään selvä. PEG:n rakenne on hyvin ”löysä” johtuen siitä,
että sillä on lukuisia erilaisia rotationaalisia konformaatioita, jotka ovat energeettisesti hyvin lähellä
toisiaan. Toisin sanoen sillä on useita minikohtia potentiaalienergiapinnalla ja minimit ovat hyvin
laakeita (eli ei ole selvää syvää potentiaalikuoppaa). Käytännössä tämä tarkoittaa, että PEG:stä
havaitut kokeelliset tulokset vastaavat keskimääräistä tulosta suurelle molekyylijoukolle. Tällöin
laskutapa, jossa lasketaan vain yhden tietyn rakenteen energia, ei johda kokeellisten tulosten kanssa
yhtenevään tulokseen.
Aiemmat tuloksemme soveltuvat siis hyvin suhteellisen jäykille molekyylirakenteille, joiden
minimienergiarakenne on hyvin määritelty. Monissa tilanteissa tarvitaan kuitenkin menetelmiä
tarkastella molekyylijoukkoja ja niiden keskimääräisiä rakenteita. Esimerkiksi pitkät
aminohappoketjut eli polypeptidit tai vaikkapa polynukleotidit ja –sakkaridit ovat kaikki
molekyylejä, joiden rakenteet eivät ole vain tietyssä staattisessa muodossa, vaan koostuvat useiden
rakenteiden joukosta. Tällaisiin molekyylijoukkojen keskimääräisten suureiden tarkasteluihin on
kehitetty laskennallisia menetelmiä, joista tällä kurssilla esitellään molekyylidynamiikka (MD) ja
74
Monte Carlo –menetelmä (MC). Sitä ennen on kuitenkin syytä käsitellä ongelmanasettelua hieman
tarkemmin ja esitellä faasiavaruuden ja trajektorin käsite.
11.1. Faasiavaruus ja trajektori
Korostettakoon alkuun, että tässä luvussa kuten koko kappaleessa 11 käsitellään molekyylejä
klassisen mekaniikan menetelmin. Klassisen mekaniikan mukainen systeemi on täysin määritetty,
jos tiedämme systeemin kaikkien osien paikat q ja liikemäärät p tietyllä hetkellä. Tällöin siis
systeemi, joka koostuu N:stä hiukkasesta on täysin määritelty 6N koordinaatilla. Tätä 6N-ulotteista
avaruutta kutsutaan faasiavaruudeksi (phase space). Faasiavaruus siis sisältää tiedon paitsi
paikoista, myös hiukkasten nopeuksista (p = mv). Merkitään, että kaikista paikkakoordinaateista
koostuva vektori on q = (x1, y1, z1, x2, y2, z2, ...) ja liikemääristä koostuva vektori on p = (p1,x, p1,y,
p1,z, p2,x, p2,y, p2,z, ...). Tällöin faasiavaruuden piste voidaan ilmaista muodossa X = (q, p). Se käyrä,
jonka systeemi piirtää faasiavaruuteen ajan kuluessa on nimeltään trajektori (trajectory). Koska
faasiavaruus käsittää systeemin jokaisen mahdollisen tilan, voidaan jonkin suureen A
keskimääräinen arvo (odotusarvo) laskea kaavalla
<A> = pqpqpq ddPA ),(),( , (11.1)
jossa P on todennäköisyys, että systeemi on kyseisessä faasiavaruuden pisteessä. Statistisen
mekaniikan mukaan tämä todennäköisyys riippuu systeemin energiasta kyseisessä pisteessä
Boltzmannin jakauman mukaisesti
P(q, p) = kTE
eQ
),(1 pq
, (11.2)
missä Q on ns. partitiofunktio, joka käytännössä normeeraa todennäköisyyden ja k on Boltzmannin
vakio (k · Avogadron vakio = R).
Jos systeemin ominaisuus halutaan laskea kaavan (11.1) avulla, törmätään melkoisiin ongelmiin.
Miten määrittää integroitavat funktiot? Integraali voitaisiin tehdä numeerisesti, mutta koko
faasiavaruus on käytännössä mahdottoman suuri. Jos mietitään esimerkiksi molekyyliä, joka
koostuu yhteensä sadasta hiukkasesta (ytimet plus elektronit), olisi ko. molekyylillä jo pelkästään
koordinaattien etumerkkivaihtoehtoja 2100. Ja tämä ei vastaisi kuin yhtä pistettä kustakin
faasiavaruuden ”hyper-oktantista”. Faasiavaruuden tarkastelu kuitenkin osoittaa, että suurin osa
siitä on ”tyhjää”, eli todennäköisyys löytää systeemi sieltä on nolla. Tällöin kysymys voidaankin
asettaa muotoon mistä tiedämme missä ovat faasiavaruuden oleelliset osat?
75
11.2. Molekyylidynamiikka
Vastataksemme edellisen kappaleen lopun kysymykseen ajatellaan, että olemme optimoineet
systeemimme eli molekyylin ja löytäneet jonkin minimienergiakohdan potentiaalienergiapinnalta.
Tällöin olemme varmastikin jossain faasiavaruuden oleellisessa pisteessä. Oletetaan, että lähdemme
seuraamaan systeemin trajektoria. Tämä tuntuu järkevältä ajatukselta löytää faasiavaruuden muita
oleellisia alueita. Tällöin voimme olettaa, että saisimme keskimääräisen A:n määritettyä laskemalla
keskiarvon A:n arvoista tietyin aikavälein eli
<A> =M
iitA
M)(1 , (11.3)
missä M on havaintojen lukumäärä.
Jos seuraisimme trajektoria äärettömän kauan äärettömän pienin aikavälein, edellisen kaavan tulos
voidaan kirjoittaa integraalimuodossa
<A> =tt
ttdA
t
0
0
)(1lim . (11.4)
Jos oletetaan ns. ergodisuushypoteesi pitäväksi, em. tulos on riippumaton ajanhetkestä t0. Tällöin
myös kaavan (11.4) tulos on sama kuin kaavan (11.1). Eli voimme laskea jonkin suureen
odotusarvon seuraamalla trajektoria ja laskemalla suureen arvon tietyin väliajoin. Miten sitten
seuraamme trajektoria?
Koska faasiavaruuden piste sisältää tiedon systeemin paikasta ja nopeuksista, se myös määrää (jos
ulkopuolisia voimia ei vaikuta systeemiin) systeemin seuraavan faasiavaruuden pisteen ja sitä
kautta, koska trajektori on jatkuva käyrä, koko trajektorin. Tästä on myös seurauksena, että
trajektorit eivät voi leikata toisiaan, sillä tällöin leikkauspisteestä määräytyisi kaksi pistettä, mikä ei
ole mahdollista. Tarkastellaan yksinkertaisena esimerkkinä harmonista värähtelijää, joka koostuu
jousen päässä olevasta pallosta. Tällöin faasiavaruus on vain kaksidimensioinen, joista toinen
määrää pallon paikan ja toinen liikemäärän (nopeuden). Kun jousi venytetään ja päästetään
värähtelemään, on pallon nopeus aluksi nolla. Nopeus saavuttaa maksimin jousen lepopituuden
kohdalla (kokonaisenergia säilyy ja tällöin kaikki energia on liike-energiaa, koska jousen
aiheuttama potentiaalienergia on nolla) ja hidastuu jälleen nollaan, kun pallo saavuttaa toisen
ääripään. Trajektori on yksiulotteiselle harmoniselle värähtelijälle tällöin ellipsin muotoinen (Kuva
11.1).
76
Kuva 11.1. Faasiavaruus ja trajektori yksiulotteiselle harmoniselle oskillaattorille, jonka jousen lepopituuson req.
Harmonisen oskillaattorin trajektori on esimerkki ns. jaksollisesta trajektorista, joka palaa tiettyyn
pisteeseen tietyn ajan kuluttua. Molekyylin trajektori voi olla jaksollinen, mutta se ei ole mitenkään
välttämätöntä.
Harmoniselle värähtelijälle trajektori voidaan kirjoittaa analyyttisesti funktioina (vaikka sitä ei tässä
tehdäkään), mutta tavallisesti ”oikeille” systeemeille täytyy käyttää numeerisia menetelmiä.
Muistutetaan tähän väliin miten derivaatta lasketaan. Derivaatta ajan suhteen voidaan kirjoittaa
muodossa
ttfttf
dtdf )()( , kun t 0. (11.5)
Lisäksi kun muistetaan Newtonin mekaniikasta, että paikan aikaderivaatta on nopeus ja nopeuden
aikaderivaatta kiihtyvyys, voidaan paikkaa ja liikemäärää (kun ne tunnetaan ajan hetkellä t) arvioida
ajan t kuluttua kaavoilla
q(t + t) = q(t) + tmt)(p (11.6)
ja
p(t + t) = p(t) + ma(t) t. (11.7)
Newtonin II lain mukaan F = ma, joten meidän täytyy tietää systeemiin vaikuttavat voimat, jotta
voisimme laskea kiihtyvyydet ja sitä kautta liikemäärien muutokset. Kiihtyvyyksien laskemiseen
molekyylimekaniikkamenetelmien voimakenttälausekkeet sopivat oikein hyvin. Yhtälöiden (11.6)
re
req
reqre
x x
p
q
77
ja (11.7) avulla voimme siis simuloida systeemin trajektoria ja sen käyttäytymistä ajan funktiona.
Tällainen molekyylien simuloiminen ajan funktiona on molekyylidynamiikkaa.
Käytännön kannalta askeleen t koko on hyvin oleellinen. Mitä pienempi kyseinen aikaväli on, sitä
useammin joudutaan laskemaan faasiavaruuden seuraava piste, mikä on laskennallisesti hidasta.
Toisaalta mitä pienemmin väliajoin laskun teemme, sitä paremmin pystymme seuraamaan
trajektoria. Liian suuret aikahypyt voivat pilata simuloinnin täysin. Nyrkkisääntönä pidetään
yleensä, että t:n täytyy olla vähintään kertalukua tai kahta pienempi kuin systeemin nopein
periodinen liike. (Mieti esimerkiksi em. harmonista oskillaattoria. Liian harvalla tarkasteluvälillä
voidaan päätyä esimerkiksi tulokseen, että pallo on seinän toisella puolella.) Tavallisesti
molekyylien nopeimpia liikkeitä ovat sidosten värähtelyt, joiden jakson aika on suuruusluokkaa
10 14 s. Tällöin tarkasteluvälin täytyy olla femtosekuntiskaalalla ja tyypillinen arvo on 0,1 fs. Näin
lyhyt aikaväli tarkoittaa sitä, että molekyylidynamiikkamenetelmissä harvoin tarkastellaan paljoa
nanosekuntia pidempiä aikajaksoja, sillä esimerkiksi 10 ns tarkastelu 0,1 fs aikavälillä tarkoittaa
voimien, uusien faasiavaruuden koordinaattien ja tarkastellun suureen, usein energian, laskemista
107 kertaa. Tällöin suhteellisen hitaat (n. mikrosekuntiskaala) dynaamiset prosessit, kuten
esimerkiksi proteiinien laskostuminen, ovat molekyylidynamiikkamenetelmien saavuttamattomissa.
Tämä on eräs MD-menetelmien suurimmista rajoituksista, johon etsitään parhaillaankin
tehokkaampaa ratkaisua, jolla trajektorin käyttäytymistä pystyttäisi ennustamaan pidempiä
aikavälejä.
11.3. Monte Carlo
Toinen molekyylien keskimääräisiä ominaisuuksia arvioimaan laadittu menetelmä on ns. Monte
Carlo -menetelmä. Monte Carlo -nimellä kulkevia menetelmiä on monilla aloilla ja yhteistä niille
on, että ne sisältävät tavalla tai toisella satunnaislukujen käytön. Satunnaislukujen ja
todennäköisyyslaskennan avulla voidaan laskea monenlaisia asioita, esimerkiksi määrättyjen
integraalien arvoja. Tyypillistä on, että mitä enemmän havaintoja otetaan, sitä paremmin ne
vastaavat oikeaa tarkkaa arvoa (eli kun tarpeeksi kauan heittelee kolikkoa, niin kruunan sekä
klaavan todennäköisyydeksi tulee 0,5).
Nyt voidaan lähtökohtaisesti ajatella kaavan (11.1) mukaista integraalia. Voimme ajatella, että
valitsemme satunnaisesti pisteitä faasiavaruudesta ja laskemme tuloksen siinä. Menetelmä ei ole
kuitenkaan järkevä, koska suurin osa faasiavaruutta on tyhjää, joten satunnaisesti valittu on hyvin
pienellä todennäköisyydellä merkityksellinen piste. Käänteentekevä ajatus Monte Carlo –
78
menetelmien soveltamiselle molekyylien kuvaamiseen tapahtui vuonna 1953, jolloin Metropolis
ryhmineen julkaisi uudenlaisen lähestymistavan ongelmaan. Sen sijaan, että valitsisimme
satunnaisesti faasiavaruuden jonkin pisteen ja painottaisimme tätä Boltzmannin mukaisella
eksponenttitermillä (kaava 11.2), valitsemmekin pisteen Boltzmannin jakauman mukaisella
todennäköisyydellä ja painotamme valittuja pisteitä samanarvoisesti.
Tarkastellaan seuraavaksi yksinkertaistettua tilannetta, jossa kysytty ominaisuus riippuu vain
systeemin paikkakoordinaateista q. Tällöin Metropoliksen idea voidaan kirjoittaa matemaattisesti
yksinkertaiseen muotoon
<A> =X
iiA
X)(1 q , (11.8)
missä X on pisteiden lukumäärä, jotka on kerätty Metropoliksen ”reseptin” mukaisesti. Ennen
”reseptin” tarkempaa selvitystä, voidaan tehdä yo. lausekkeesta joitakin huomioita. Ensinnäkin se
muistuttaa suuresti lauseketta (11.3) ja siinä odotusarvo lasketaan yksinkertaisesti yksittäisten
havaintojen keskiarvona. Oleellinen ero lausekkeeseen (11.3) nähden on kuitenkin, että (11.8) ei
sisällä muuttujana aikaa. Tällöin havaintopisteitä ei voida ajatella minkäänlaisessa järjestyksessä
havaituiksi kuten molekyylidynamiikassa. Monte Carlo –menetelmässä aika ei ole millään tavoin
mukana emmekä edes pyri seuraamaan trajektoria ajan funktiona.
Metropoliksen tapa kerätä havaintopisteitä on seuraava. Aluksi lähdetään liikkeelle jostakin
”järkevästä” pisteestä q1, joka on saatu esimerkiksi pikaisella molekyylimekaniikkaoptimoinnilla.
Tämän jälkeen muutetaan koordinaatteja satunnaisesti ja saadaan uusi piste q2. Todennäköisyys P
sille, että uusi piste otettaisiin mukaan summaan, lasketaan kaavasta
P = minkTE
kTE
e
e1
2
,1 . (11.9)
Toisin sanoen, jos energia uudessa pisteessä on pienempi kuin edellisessä, se otetaan mukaan. Jos
taas uuden pisteen energia on korkeampi, todennäköisyyttä verrataan satunnaislukuun z väliltä [0,1].
Jos P z, piste otetaan mukaan ja jos P < z, lasketaan edellinen piste summaan toisen kerran ja
jatketaan valitsemalla uusi ehdokas. Pisteen koordinaatit riippuvat tässä prosessissa ainoastaan
edellisestä pisteestä. Tällaista prosessia kutsutaan yleisesti Markovin ketjuksi.
Monte Carlo –prosessissa laskennat riippuvat olennaisesti tavasta miten seuraava piste valitaan
edellisestä. Jos muutos edellisestä on hyvin pieni (vaikka uusi piste onkin satunnainen, voidaan
79
kuitenkin määrätä kuinka suuri tämä muutos edellisestä voi olla), saadaan faasiavaruuden pisteitä
kerättyä vain hyvin pieneltä alueelta ja faasiavaruuden kartoitus on laskennallisesti hidasta. Jos taas
pisteiden koordinaatit muuttuvat suuresti edellisestä, tulee uuden pisteen hyväksymiskriteeri
merkitykselliseksi, sillä todennäköisyys, että uusi piste hylätään kasvaa liian suureksi ja
laskentatehoa kuluu hukkaan. Tyypillisesti MC-menetelmät säädetään niin, että noin 20 50 %
uusista yritepisteistä hyväksytään. Mitä enemmän pisteitä kerätään, sitä parempia ovat tulokset.
Tyypillinen pistemäärä on muutaman miljoonan suuruusluokkaa.
Viimeaikoina on kehitetty myös ns. kvantti-Monte Carlo –menetelmiä. Tällaisissa menetelmissä on
pyritty yhdistämään kvanttimekaaniset menetelmät Monte Carlo –tyyppisiin molekyyli-
simulaatioihin. Nämä menetelmät ovat ehkäpä raskaimpia laskennallisia menetelmiä, mitä tällä
hetkellä on olemassa, mutta tulevaisuudessa nekin varmasti niin menetelmien kuin
laskentatehojenkin kehittymisen myötä tulevat yleisesti käytössä olevien menetelmien repertuaariin.
11.4. Molekyylisimulaatioiden sovelluskohteita
Kuten luvun alussa todettiin, molekyylisimulaatiomenetelmät MD ja MC ovat hyödyllisiä
tarkasteltaessa molekyylejä, jotka ovat fleksiibeleitä, eli niiden minimienergiakuopat ovat laakeita
ja niillä on useita energeettisesti toisiaan lähellä olevia rakenteita. Tällaisia ovat muun muassa
polymeerit ja pitkäketjuiset biomolekyylit. Lisäksi MD- ja MC-menetelmät soveltuvat
molekyylijoukkojen laskemiseen. Näin voidaan käsitellä esimerkiksi liuotinvaikutuksia, jotka ovat
muuten laskennallisesti hyvin haasteellisia ja raskaita kuvattavia. Tarkasteltava molekyyli voidaan
näillä menetelmillä yksinkertaisesti ympäröidä halutulla määrällä liuotinmolekyylejä ja tarkastella
tämän jälkeen miten molekyyli liikkuu liuottimien ympäröimänä.
Eräs kemiassa usein vastaantuleva ongelma on jonkin rakenteen mahdollisien konformaatioiden
määrittäminen. Tällaiseen konformaatiohakuun MD- ja MC-menetelmät ovat eräs ratkaisu.
Voimme seurata minkälaisiin rakenteisiin MD ja MC simulaatioissaan päätyvät. Usein menetelmät
jäävät kuitenkin kiertämään jonkin tietyn konformaation lähiseutua, varsinkin jos eri
konformaatioiden välillä on suuri potentiaalivalli. Tällaisissa tilanteissa voidaan käyttää sellaista
simulointimenetelmää, että tarkastelulämpötilaa nostetaan simuloinnin ajaksi, jolloin molekyyli voi
saada riittävästi energiaa ylittää konformaatioiden välisen potentiaalivallin. Tämän jälkeen
lämpötila lasketaan uudelleen alkuperäiseen, jolloin molekyyli päätyy mahdollisesti eri
potentiaalienergiapinnan kuoppaan eli konformaatioon kuin simuloinnin alussa.