luento 5 - jyväskylän yliopistousers.jyu.fi/~majkir/numen/luento5_flat.pdfluento 5 numeeriset...
TRANSCRIPT
Numeeriset menetelmat TIEA381
Luento 5
Kirsi Valjus
Jyvaskylan yliopisto
Luento 5 () Numeeriset menetelmat 3.4.2013 1 / 28
Luennon 5 sisalto
Luku 4: Ominaisarvotehtavista
Potenssiinkorotusmenetelma
QR-menetelma
Luento 5 () Numeeriset menetelmat 3.4.2013 2 / 28
Luku 4: Ominaisarvotehtvista
Luku 4. Ominaisarvotehtavista
Ominaisarvotehtaviin tormataan monilla tieteenaloilla:
rakenneanalyysissa ominaisarvotehtavan ratkaisu antaa rakenteen(laiva tai lentokone) ominaisvarahtelytaajuudet.
kvanttifysiikassa systeemeja kuvataan Schrodingerin yhtalolla,jonka ominaisarvot ovat eri tilojen energiat.
makrotalousmalleissa niin sanottujen tasapainotettujenhinnoittelustrategioiden ja tuotantorakenteiden maarittaminenjohtaa ominaisarvotehtaviin.
Luento 5 () Numeeriset menetelmat 3.4.2013 3 / 28
Luku 4: Ominaisarvotehtvista 4.1 Algebrallinen ominaisarvotehtava
4.1 Algebrallinen ominaisarvotehtava
Skalaari λ on n × n neliomatriisin AAA ominaisarvo, jos on olemassavektori xxx 6= 000, s.e.
AAAxxx = λxxx . (1)
Vektoria xxx sanotaan ominaisvektoriksi.
Matriisin ominaisarvojen muodostama joukko on matriisinspektri.
Ominaisarvot ovat ne parametrin λ arvot, joilla yhtalolla
(AAA− λIII )xxx = 000
on nollasta poikkeava ratkaisu.
Ominaisarvoa vastaava ominaisvektori ei ole yksikasitteinen:Jos xxx on ominaisvektori ja α 6= 0 mielivaltainen vakio, niin αxxxon myos ominaisvektori.
Luento 5 () Numeeriset menetelmat 3.4.2013 4 / 28
Luku 4: Ominaisarvotehtvista 4.1 Algebrallinen ominaisarvotehtava
Algebrallinen omin.arvotehtava jatkuu
Ominaisarvot ovat karakteristisen polynominpn(λ) := det(AAA− λIII ) nollakohdat.
Koska n-asteisella polynomilla on tasmalleen n kompleksistajuurta, on ominaisarvojakin n kappaletta. Niita merkitaanyleensa symboleilla λ1, ..., λn.
Reaalisenkin matriisin ominaisarvot voivat olla kompleksisia.Symmetrisen matriisin ominaisarvot ovat kuitenkin aina reaalisia.
Luento 5 () Numeeriset menetelmat 3.4.2013 5 / 28
Luku 4: Ominaisarvotehtvista 4.1 Algebrallinen ominaisarvotehtava
Algebrallinen omin.arvotehtava jatkuu
Ominaisarvon algebrallinen kertaluku kertoo, kuinkamoninkertainen karakteristisen polynomin juuri ominaisarvo on.
Geometrinen kertaluku on ominaisarvoon liittyvien lineaarisestiriippumattomien ominaisvektoreiden lukumaara.
Jos algebrallinen kertaluku on suurempi kuin geometrinenkertaluku, ominaisarvoa sanotaan defektiiviseksi.
Luento 5 () Numeeriset menetelmat 3.4.2013 6 / 28
Luku 4: Ominaisarvotehtvista 4.1 Algebrallinen ominaisarvotehtava
Esimerkki 4.1.
Tarkastellaan matriisia AAA:
AAA =
3 −1 0−1 2 −10 −1 3
; λIII =
λ 0 00 λ 00 0 λ
.AAA:n karakteristinen polynomi on
det(AAA− λIII ) =
∣∣∣∣∣∣3− λ −1 0−1 2− λ −10 −1 3− λ
∣∣∣∣∣∣ = (3− λ)
∣∣∣∣2− λ −1−1 3− λ
∣∣∣∣− (−1)
∣∣∣∣−1 −10 3− λ
∣∣∣∣= · · · = −λ3 + 8λ2 − 19λ+ 12 = p3(λ).
Luento 5 () Numeeriset menetelmat 3.4.2013 7 / 28
Luku 4: Ominaisarvotehtvista 4.1 Algebrallinen ominaisarvotehtava
Esimerkki 4.1. jatkuu
Ratkaistaan p3(λ) = 0 ja saadaan λ1 = 1, λ2 = 3 ja λ3 = 4.
Sijoitetaan λ1 = 1 yhtaloon (AAA− λ1III )xxx = 000; 2 −1 0−1 1 −10 −1 2
x1
x2
x3
= 000 ⇒
2x1 − x2 = 0
−x1 + x2 − x3 = 0
−x2 + 2x3 = 0,
mista saadaan x2 = 2x1 ja x3 = −x1 + 2x1 = x1.
Siten λ1:sta vastaava ominaisvektori on xxx1 = (x1, 2x1, x1).
Merkitaan x1 = a, a ∈ R⇒ xxx1 = (a, 2a, a).
Luento 5 () Numeeriset menetelmat 3.4.2013 8 / 28
Luku 4: Ominaisarvotehtvista 4.1 Algebrallinen ominaisarvotehtava
Esimerkki 4.1. jatkuu
Sijoitetaan λ2 = 3 yhtaloon (AAA− λ2III )xxx = 000; 0 −1 0−1 −1 −10 −1 0
x1
x2
x3
= 000 ⇒
−x2 = 0
−x1 − x2 − x3 = 0
−x2 = 0,
mista saadaan x2 = 0 ja x3 = −x1.
Siten λ2:sta vastaava ominaisvektori on xxx2 = (x1, 0,−x1).
Merkitaan x1 = b, b ∈ R⇒ xxx2 = (b, 0,−b).
Vastaavalla tavalla saadaan λ3:sta vastaava ominaisvektorixxx3 = (c ,−c , c).
Luento 5 () Numeeriset menetelmat 3.4.2013 9 / 28
Luku 4: Ominaisarvotehtvista 4.1 Algebrallinen ominaisarvotehtava
Esimerkki: 1D Schrodingerin yhtalo
Kuvaa kvanttimekaanisten systeemien riippuvuuksia
Kun hiukkanen liikkuu potentiaalin U(x) alaisena, niin hiukkasentilafunktio Ψ(x) toteuttaa Schrodingerin yhtalon{
−Ψ′′(x) + aU(x)Ψ(x) = λΨ(x), 0 < x < 1
Ψ(0) = Ψ(1) = 0
Ψ(x) - systeemin tilatλ - tilojen energiat
Ajasta riippumaton Schrodingerin yhtalo, ts. systeemin energiaei muutu ajan funktiona vaan paikan x funktiona.
Luento 5 () Numeeriset menetelmat 3.4.2013 10 / 28
Luku 4: Ominaisarvotehtvista 4.1 Algebrallinen ominaisarvotehtava
Esimerkki: 1D Schrodingerin yhtalo jatkuu
Diskretisoidaan yhtalo differenssimenetelmalla: (i = 1, .., n)
−Ψ(xi − h) + 2Ψ(xi)−Ψ(xi + h)
h2+ aU(xi)Ψ(xi) = λΨ(xi),
matriisimuodossa26666664
2h2 + aU(x1) − 1
h2
− 1h2
2h2 + aU(x2) − 1
h2
. . .. . .
. . .
− 1h2
− 1h2
2h2 + aU(xn)
37777775
2666664Ψ1
Ψ2
...Ψn−1
Ψn
3777775 = λ
2666664Ψ1
Ψ2
...Ψn−1
Ψn
3777775 .
⇒ Algebrallinen ominaisarvotehtava AAAΨ = λΨ
Luento 5 () Numeeriset menetelmat 3.4.2013 11 / 28
Luku 4: Ominaisarvotehtvista 4.1 Algebrallinen ominaisarvotehtava
Ominaisarvojen numeerinen laskeminen
Ominaisarvojen ja -vektorien numeerinen laskeminen on paljontyolaampaa kuin lineaarisen yhtaloryhman ratkaiseminen.
Toisin kuin lineaarisen yhtaloryhman tapauksessa, yleisetominaisarvotehtavien ratkaisumenetelmat ovat aina iteratiivisia.
Vaikka ominaisarvot voidaan periaatteessa laskea polynomienjuurten laskemiseen tarkoitetuilla algoritmeilla, ei nain kannatamenetella juuri koskaan.
Painvastoin, polynomien juuret kannattaa laskea ominaisarvojenlaskemiseen tarkoitetuilla algoritmeilla!
Luento 5 () Numeeriset menetelmat 3.4.2013 12 / 28
Luku 4: Ominaisarvotehtvista 4.2. Potenssiinkorotusmenetelmat
4.2. Potenssiinkorotusmenetelmat
Olkoon matriisin AAA ominaisarvoille voimassa|λ1| > |λ2| ≥ |λ3| ≥ . . . ≥ |λn|.
Oletetaan lisaksi, etta vastaavat ominaisvektorit on normeerattusiten, etta ‖vvv (j)‖∞ = 1, j = 1, ..., n.
Likiarvo itseisarvoltaan suurimmalle ominaisarvolle λ1 ja sitavastaavalle ominaisvektorille vvv (1) voidaan laskea iteratiivisestiseuraavalla tavalla:
Luento 5 () Numeeriset menetelmat 3.4.2013 13 / 28
Luku 4: Ominaisarvotehtvista 4.2. Potenssiinkorotusmenetelmat
Potenssiinkorotusmenetelma jatkuu
Olkoon xxx (0) alkuarvaus ominaisvektorille vvv (1).Muodostetaan jonot {xxx (k)} ja {ck} seuraavasti:
yyy (k) = AAAxxx (k),
ck+1 = y(k)j , missa j valittu s.e. |y (k)
j | = max1≤p≤n
{|y (k)p |}
xxx (k+1) =1
ck+1yyy (k).
Voidaan osoittaa, etta
limk→∞
xxx (k) = vvv (1), limk→∞
ck = λ1.
Luento 5 () Numeeriset menetelmat 3.4.2013 14 / 28
Luku 4: Ominaisarvotehtvista 4.2. Potenssiinkorotusmenetelmat
Osoitetaan, etta x (k) → v (1)
Oletetaan, etta alkuarvaus xxx (0) voidaan esittaa normeerattujenominaisvektorien lineaarikombinaationa
xxx (0) = β1vvv(1) + β2vvv
(2) + . . . + βnvvv(n) siten, etta β1 6= 0,
ts. etta ominaisvektorit vvv (i) muodostavat Rn:n kannan.
Talloin saadaan
xxx (k) =1
c1c2 . . . ck
(β1λ
k1vvv
(1) + β2λk2vvv
(2) + . . . + βnλknvvv
(n))
=λk
1
c1c2 . . . ck
(β1vvv
(1) + β2
(λ2
λ1
)k
vvv (2) + . . . + βn
(λn
λ1
)k
vvv (n)
).
Luento 5 () Numeeriset menetelmat 3.4.2013 15 / 28
Luku 4: Ominaisarvotehtvista 4.2. Potenssiinkorotusmenetelmat
Osoitetaan, etta x (k) → v (1) (cont.)
Edella saatiin
xxx (k) =λk
1
c1c2 . . . ck
(β1vvv
(1) + β2
(λ2
λ1
)k
vvv (2) + . . . + βn
(λn
λ1
)k
vvv (n)
).
Alkuperaisesta oletuksesta seuraa∣∣∣ λi
λ1
∣∣∣ < 1, kun i > 1.
Siten
limk→∞
(λi
λ1
)k
= 0
ja edelleen
limk→∞
xxx (k) =λk
1β1
c1c2 . . . ckvvv (1).
Luento 5 () Numeeriset menetelmat 3.4.2013 16 / 28
Luku 4: Ominaisarvotehtvista 4.2. Potenssiinkorotusmenetelmat
Osoitetaan, etta x (k) → v (1) (cont.)
Ominaisvektori kerrottuna vakiolla on edelleen samaan ominaisarvoonliittyva ominaisvektori.
⇒ xxx (k) konvergoi λ1:een liittyvaan ominaisvektoriin.
Lisaksi voidaan osoittaa, etta
limk→∞
ck = λ1.
Luento 5 () Numeeriset menetelmat 3.4.2013 17 / 28
Luku 4: Ominaisarvotehtvista 4.2. Potenssiinkorotusmenetelmat
Potenssiinkorotusmenetelma jatkuu
Menetelma on yksinkertainen.
Konvergenssi on hidasta, jos |λ1
λ2| ≈ 1.
Etukateen voi olla vaikea tietaa, ovatko menetelman vaatimatoletukset voimassa. (ts. |λ1| > |λi |, vvv (j) lineaarisestiriippumattomia, β1 6= 0)
Luento 5 () Numeeriset menetelmat 3.4.2013 18 / 28
Luku 4: Ominaisarvotehtvista 4.2. Potenssiinkorotusmenetelmat
Siirretty kaanteinen potenssiinkorotusmenetelma
Samaa ideaa voidaan kayttaa muidenkin ominaisarvojen laskemiseen.Tama perustuu seuraavaan huomioon:
Jos (λ,vvv) on matriisin AAA ominaispari, niin ((λ− σ)−1,vvv) on matriisin(AAA− σIII )−1 ominaispari.
Olkoon AAA:n ominaisarvot reaaliset ja λ1 > λ2 > . . . > λn.Lukua σ lahimpana oleva ominaisarvo voidaan laskea korvaamallapotenssimenetelman askel yyy (k) = AAAxxx (k) seuraavalla:
yyy (k) = (AAA− σIII )−1xxx (k).
Luento 5 () Numeeriset menetelmat 3.4.2013 19 / 28
Luku 4: Ominaisarvotehtvista 4.2. Potenssiinkorotusmenetelmat
Siirretty kaanteinen potenssiinkorotusmenetelma
Kaanteismatriisia ei muodosteta eksplisiittisesti, vaan kaytannossaratkaistaan
(AAA− σIII )yyy (k) = xxx (k)
esim. LU-hajotelmaa kayttaen.
Matriisien AAA ja (AAA− σIII )−1 ominaisvektorit ovat samat, ts.algoritmiin ei tarvitse tehda muita muutoksia.
Huomaa, etta nyt ck → 1λ−σ , ts. haluttu ominaisarvo saadaan
kaavasta λ = σ + 1ck.
Itseisarvoltaan pienin ominaisarvo λn, mikali |λn| < |λn−1|,saadaan asettamalla σ = 0.
Luento 5 () Numeeriset menetelmat 3.4.2013 20 / 28
Luku 4: Ominaisarvotehtvista 4.3. QR-menetelma
4.3. QR-menetelma
Olkoon QQQ kaantyva matriisi.
Talloin matriisit AAA ja QQQ−1AAAQQQ ovat similaarisia, eli niilla on samatominaisarvot.
Lisaksi, jos xxx on matriisin AAA ominaisvektori, niin QQQ−1xxx on matriisinQQQ−1AAAQQQ ominaisvektori.
Oletetaan, etta AAA:n ominaisarvot ovat reaaliset ja yksinkertaiset.
QR-hajotelma: Jokainen matriisi AAA voidaan esittaaortogonaalimatriisin QQQ (eli QQQ−1 = QQQT) ja ylakolmiomatrisin RRRtulona AAA = QQQRRR .
Luento 5 () Numeeriset menetelmat 3.4.2013 21 / 28
Luku 4: Ominaisarvotehtvista 4.3. QR-menetelma
QR-menetelma jatkuu
Olkoon AAA(0) := AAA annettu matriisi.
Muodostetaan jono matriiseja {AAA(k)} seuraavasti:
Tehdaan QR-hajotelma AAA(0):lle:
AAA(0) = QQQ(0)RRR (0) ⇒ (QQQ(0))−1
AAA(0) = RRR (0).
AsetetaanAAA(1) = RRR (0)QQQ(0)
ja sijoitetaan edella ratkaistu RRR (0) :
AAA(1) = (QQQ(0))−1
AAA(0)QQQ(0).
⇒ matriisit AAA(0) ja AAA(1) ovat similaarisia, eli niilla on samatominaisarvot.
Luento 5 () Numeeriset menetelmat 3.4.2013 22 / 28
Luku 4: Ominaisarvotehtvista 4.3. QR-menetelma
QR-menetelma jatkuu
Iteraatiolla k + 1:
Tehdaan QR-hajotelma AAA(k):lle:
AAA(k) = QQQ(k)RRR (k) ⇒ (QQQ(k))−1
AAA(k) = RRR (k).
AsetetaanAAA(k+1) = RRR (k)QQQ(k) = (QQQ(k))
−1AAA(k)QQQ(k),
ts. matriiseilla AAA(k) ja AAA(k+1) on samat ominaisarvot.
Nyt matriisien jono {AAA(k)} lahenee ylakolmiomatriisia (taidiagonaalimatriisia, jos AAA on symmetrinen), jolla on samatominaisarvot kuin matriisilla AAA = AAA(0).
Luento 5 () Numeeriset menetelmat 3.4.2013 23 / 28
Luku 4: Ominaisarvotehtvista 4.3. QR-menetelma
QR-menetelma jatkuu
Seka kolmiomatriisin, etta diagonaalimatriisin ominaisarvot ovatdiagonaalilla, ts. jono {AAA(k)} lahenee matriisia
Λ =
λ1 . . .0 λ2...
. . . . . ....
0 . . . 0 λn
,jossa AAA:n ominaisarvotsijaitsevat diagonaalilla.
QR-hajotelman laskeminen taydelle matriisille on tyolasta⇒ kaytannossa AAA muunnetaan aluksi lahes ylakolmio- matriisiksi,
ns. Hessenberg-muotoon, jolle QR-hajotelma on laskennallisestiedullisempi muodostaa.
Luento 5 () Numeeriset menetelmat 3.4.2013 24 / 28
Luku 4: Ominaisarvotehtvista 4.3. QR-menetelma
Esimerkki 4.2.
ul l l l l lm1 m2 m3
k1 k2 k3
Tarkastellaan kuvan yksinkertaista jousi-massa-systeemia.Jos jatetaan kitka huomiotta, niin massojen mi poikkeamat xi(t)vaakasuuntaan lepotilasta voidaan laskea differentiaaliyhtaloryhmasta
(k1 + k2)x1(t)− k2x2(t) = m1x′′1 (t)
−k2x1(t) + (k2 + k3)x2(t) = m2x′′2 (t)
−k3x2(t) + k3x3(t) = m3x′′3 (t).
Luento 5 () Numeeriset menetelmat 3.4.2013 25 / 28
Luku 4: Ominaisarvotehtvista 4.3. QR-menetelma
Esimerkki 4.2. jatkuu
Etsitaan tilannetta, jossa kaikki massat varahtelevat samalla(tuntemattomalla) taajuudella ω. Tehdaan yrite
xi(t) = vi cos(ωt), i = 1, 2, 3,
missa vvv = (v1, v2, v3) on tuntematon vektori. Sijoittamalla yrite ed.kalvon yhtaloihin havaitaan, etta ω:n ja vvv :n on toteutettavayhtaloryhma (tassa λ = ω2)k1+k2
m1
−k2
m10
−k2
m2
k2+k3
m2
−k3
m2
0 −k3
m3
k3
m3
v1
v2
v3
= λ
v1
v2
v3
.Ominaisarvotehtavan ratkaisuksi saadaan jousi–massa-systeeminkolme ominaisvarahtelytaajuutta ja ominaismuotoa, jotka vastaavateo. yhtalon kolmea ominaisparia (λi ,vvv
(i)), i = 1, 2, 3.
Luento 5 () Numeeriset menetelmat 3.4.2013 26 / 28
Luku 4: Ominaisarvotehtvista 4.3. QR-menetelma
Esimerkki 4.2. jatkuu
Olkoon yksinkertaisuuden vuoksi mi = ki = 1, i = 1, 2, 3. Lasketaanominaisarvot QR-menetelmalla.
AAA(1) =
2.80 −0.75 0.00−0.75 1.99 0.16
0.00 0.16 0.21
, AAA(3) =
3.22 −0.23 0.00−0.23 1.59 0.00
0.00 0.00 0.20
AAA(6) =
3.25 −0.03 0.00−0.03 1.56 0.00
0.00 0.00 0.20
, AAA(9) =
3.25 0.00 0.000.00 1.56 0.000.00 0.00 0.20
Omin.arvojen likiarvot ovat λ1 ≈ 3.25, λ2 ≈ 1.56, λ3 ≈ 0.20.
Luento 5 () Numeeriset menetelmat 3.4.2013 27 / 28
Luku 4: Ominaisarvotehtvista 4.3. QR-menetelma
Esimerkki 4.2. jatkuu
AAA symmetrinen ⇒ AAA(k) → diagonaalimatr. ⇒ omin. arvotdiagonaalilla.
⇒ Saadaan ominaisvarahtelytaajuudet ωi (λi = ω2i )
⇒ Saadaan ominaisvektorit vvv (i)
⇒ Systeemin ominaismuodot saadaan sijoittamalla ωi ,vvv(i) xi(t):n
lausekkeeseen⇒ Kurssin www-sivulla jousi–massa-systeemin ominaismuodot
esitettyna animaationa ajan suhteen.
Luento 5 () Numeeriset menetelmat 3.4.2013 28 / 28