直接解法による大規模疎行列に 対する連立1次方程...

51
直接解法による大規模疎行列に 対する連立1次方程式ソルバー — IBM WSMP の紹介 渡部 善隆 [email protected] . 九州大学情報基盤センター QNAセミナー June 21, 2005 – p.1/50

Upload: others

Post on 18-Jan-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

直接解法による大規模疎行列に

対する連立1次方程式ソルバー

—IB

MW

SM

Pの紹介

渡部善隆

wat

anab

e@cc

.kyu

shu

-u.a

c.jp

.

九州大学情報基盤センター

QNAセミナー

June

21,2

005

–p.

1/50

Page 2: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

連立1次方程式

n行列

A=

[aij

]とベクトル

b=

[b1,.

..,b

n]Tに対し

Ax

=b

をみたすベクトル

x=

[x1,.

..,x

n]Tを求める問題.

理学・工学・農学・社会科学・人文科学のあらゆる分野に

現れる.

実際の科学技術分野における数値計算の計算時間の大半

は連立1次方程式を解くことに費やされているといわれ

ている.

QNAセミナー

June

21,2

005

–p.

2/50

Page 3: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

次数

方程式の次数(

nの

“n”)は問題によって異なる.

2次元

Poi

sson方程式の数値解法の例題

....

....

....

....

...1

21

定常

Nav

ier-

Sto

kes方程式の精度保証

....

....

....

....

..11

,400

代数的マルチグリッド法による電磁界解析

....

....

....

.160

,464

Sto

kes方程式の有限要素近似解

....

....

....

....

....

.1,4

10,4

79

原子炉圧力モデルの弾性構造解析

....

....

....

....

..10

,328

,853

nが大きくなると,全要素をメモリに格納することは困難.

《例》

10,0

00,0

00×

10,0

00,0

00の行列を

IEE

E75

4倍精度実数

(8バイト

)で宣言

10,0

00,0

00×

10,0

00,0

00≈

800,

000

GB

yte

QNAセミナー

June

21,2

005

–p.

3/50

Page 4: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

疎行列

(spa

rse

mat

rix)

たとえば有限要素法・差分法で関数方程式(連続問題)を離

散化した場合,得られる

Aの多くは疎行列となる.

010

2030

4050

60

0 10 20 30 40 50 60

nz =

180

050

100

150

200

250

300

350

400

450

0 50 100

150

200

250

300

350

400

450

nz =

188

7

QNAセミナー

June

21,2

005

–p.

4/50

Page 5: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

疎行列の格納形式

行列の非零要素(と限られた数の零要素)を記憶領域に格納

する方法.

A=

⎡ ⎢ ⎢ ⎢ ⎣00

05

02

00

10

00

00

40⎤ ⎥ ⎥ ⎥ ⎦

⇒S

=

(3,1

)1

(2,2

)2

(4,3

)4

(1,4

)5

圧縮行格納法

(com

pres

sed

row

stor

age)

圧縮列格納法

(com

pres

sed

colu

mn

stor

age)

圧縮対角格納法

(com

pres

sed

diag

onal

stor

age)

スカイライン格納法

(sky

line

stog

age)

etc.

QNAセミナー

June

21,2

005

–p.

5/50

Page 6: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

連立1次方程式の数値解法の分類

直接法

Gau

ssの消去法,

Cho

lesl

y分解

,etc

.

反復法 定常反復法

SO

R法,

Gau

ss-S

eide

l法,e

tc.

非定常反復法

CG法,

BiC

G法

,GM

RE

S法

,etc

.

直接法と反復法の組み合わせ

解の反復改良,不動点定理に基づく解の精度保証

,etc

. QNAセミナー

June

21,2

005

–p.

6/50

Page 7: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

反復法

Ax

=b

真の解に収束していく近似解の列を逐次作成していく手法.

x0→

x1→

x2→

···→

x

定常反復法

一定(定常)の処理を繰り返すことによって近似解を作成

する方法.

xk

=x

k−1

+R

(b−

Ax

k−1

),k≥

1,R

:gi

ven

非定常反復法

各反復ごとに変化する情報を取り込みながら計算を進める.

多くは反復によって直交するベクトル列を作り出す.

xk∈

span

{r0,A

r0,A

2r

0,.

..,A

k−1

r0}

r0:

give

n

QNAセミナー

June

21,2

005

–p.

7/50

Page 8: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

反復法の特徴

行列を分解する必要がないため,疎行列の構造を保つこ

とができる

.

基本の計算は「行列×ベクトル」と内積計算のため,収

束が速ければ計算量が 非零要素数

×n

のオーダーになることが期待される.

収束を加速させるための前処理技法が数多く提案されて

いる.

QNAセミナー

June

21,2

005

–p.

8/50

Page 9: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

反復法の問題点

行列の性質(固有値・特異値など)に大きく依存する.

初期値

x0によって収束特性が変わることがある.

右辺

bによって収束特性が変わることがある.

非定常反復法は丸め誤差の影響を受けやすい.

050

010

0015

0020

0025

0030

0035

0040

0045

0050

0010

−16

10−

14

10−

12

10−

10

10−

8

10−

6

10−

4

10−

2

100

itera

tion

num

ber

relative residual

1e-1

4

1e-1

2

1e-1

0

1e-0

8

1e-0

6

0.00

01

0.011

100

020

4060

8010

012

0

rela

tive

res

idua

l

主要な非対称行列に対する非定常反復法については「最適

な手法はない」という研究結果がある.

“How

fast

are

nons

ymm

etric

mat

rixite

ratio

ns?”

SIA

MJo

urna

lon

Mat

rixA

naly

sis

and

App

licat

ions

,Vol

.13,

1992

,778

-795

.

QNAセミナー

June

21,2

005

–p.

9/50

Page 10: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

直接法

Ax

=b

ほとんどが行列の分解に基づく手法.

LU分解

: A=

LU,

L:下三角行列

,U

:上三角行列

.

Aが正則

⇔Aが適当な列変換により

LU分解可能.

行列に特異性がない限り(経験的に)安定に解ける.

一度行列を分解しておけば,異なる

bに対して(行列の分

解に比べて)高速に計算可能.

精度保証付き数値計算への応用が可能

(連立

1次方程式,固有値問題,特異値問題)

QNAセミナー

June

21,2

005

–p.

10/5

0

Page 11: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

(通常の)直接法の問題点

1.L

U分解の計算量は

O(n

3)(

nは次数).

⇒次数が大きくなると計算時間が膨大になる.

2.分解を行なうと行列の疎な構造が崩れる.

⇒より多くのメモリ空間が必要.

LU分解前

LU分解後

分解によるゼロ要素の損失を

fill-

inと呼ぶ.

QNAセミナー

June

21,2

005

–p.

11/5

0

Page 12: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

疎行列に対する直接法の研究

fill-i

nの数を《出来るだけ》減らす手法.

⇒メモリ量と計算量の削減.

疎行列構造を生かした

LU分解手法.

LU分解後の行列構造をあらかじめ求め,不要な計算

を省く.

⇒計算量の削減.

QNAセミナー

June

21,2

005

–p.

12/5

0

Page 13: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

Fill

redu

cing

orde

ring

010

2030

4050

60

0

10 20 30 40 50 60

nz = 240

010

2030

4050

60

0

10 20 30 40 50 60

nz = 1022

A=⇒

LU

Q,

P,Q

:pe

rmut

atio

nm

atrix QNAセミナー

June

21,2

005

–p.

13/5

0

Page 14: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

Rev

erse

Cut

hill-

McK

eeor

deri

ng

010

2030

4050

60

0

10 20 30 40 50 60

nz = 240

010

2030

4050

60

0

10 20 30 40 50 60

nz = 240

010

2030

4050

60

0

10 20 30 40 50 60

nz = 978

A⇒

PA

Q⇒

LU

QNAセミナー

June

21,2

005

–p.

14/5

0

Page 15: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

Min

imum

degr

eeor

derl

ing

010

2030

4050

60

0

10 20 30 40 50 60

nz = 240

010

2030

4050

60

0

10 20 30 40 50 60

nz = 240

010

2030

4050

60

0

10 20 30 40 50 60

nz = 636

A⇒

PA

Q⇒

LU

QNAセミナー

June

21,2

005

–p.

15/5

0

Page 16: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

Ord

erin

gal

gori

thm

s

MD

min

imum

degr

ee(T

inne

yan

dW

alke

r,19

67)

MM

Dm

ultip

lem

inim

umde

gree

(Liu

,198

5)

AM

Dap

prox

imat

em

inim

umde

gree

(Am

esto

y,et

al.,

1996

)

ND

nest

eddi

ssec

tion

(Geo

rge,

1973

)M

ET

ISm

ultil

evel

nest

eddi

ssec

tion

rout

ine

(Kar

ypis

and

Kum

ar,1

998)

MS

mul

tisec

tion

(Ash

craf

tand

Liu

1998

)

MF

loca

lmin

imum

fill(

Tin

ney

and

Wal

ker

1967

)

QNAセミナー

June

21,2

005

–p.

16/5

0

Page 17: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

Fac

tori

zati

onal

gori

thm

for

A=

AT

A=

[ BV

T

VC

] ,B

=L

BL

T B∈

Rj−

1×j

−1

=

[L

B0

VL−T B

I

][I

0

0C−

VB

−1V

T

][L

B0

VL−T B

I

] T .

VB

−1V

T=

(VL−T B

)(V

L−T B

)T

=

j−1 ∑ k

=1

⎡ ⎢ ⎣l j,k . . .

l n,k

⎤ ⎥ ⎦[l j,k

...l

n,k

].

QNAセミナー

June

21,2

005

–p.

17/5

0

Page 18: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

Spar

sedi

rect

solv

ers

code

fillr

educ

ing

orde

ring

fact

oriz

atio

nal

gorit

hm

BC

SLI

B-E

XT

MM

D,M

ET

ISm

ultif

ront

alM

A57

MD

,AM

D,M

ET

ISm

ultif

ront

al

MU

MP

SM

D,A

MD

,ME

TIS

mul

tifro

ntal

Obl

ioM

MD

,ME

TIS

left/

right

-look

ing,

mul

tifro

ntal

PAR

DIS

OM

MD

,ME

TIS

left/

right

-look

ing

SP

OO

LES

MM

D,N

D,M

Sle

ft-lo

okin

gS

PR

SB

LKLL

TM

MD

left-

look

ing

Sup

erLU

MM

Dle

ft-lo

okin

g

Sup

erM

atrix

Sol

ver-

MF

ND

mul

tifro

ntal

TAU

CS

MD

,AM

D,M

MD

,ME

TIS

left-

look

ing,

mul

tifro

ntal

UM

FPA

CK

AM

Dun

sym

met

ricm

ultif

ront

al

WS

MP

ND

,MF

mul

tifro

ntalQNAセミナー

June

21,2

005

–p.

18/5

0

Page 19: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

Spar

sedi

rect

solv

ers

code

fillr

educ

ing

orde

ring

fact

oriz

atio

nal

gorit

hm

BC

SLI

B-E

XT

MM

D,M

ET

ISm

ultif

ront

alM

A57

MD

,AM

D,M

ET

ISm

ultif

ront

al

MU

MP

SM

D,A

MD

,ME

TIS

mul

tifro

ntal

Obl

ioM

MD

,ME

TIS

left/

right

-look

ing,

mul

tifro

ntal

PAR

DIS

OM

MD

,ME

TIS

left/

right

-look

ing

SP

OO

LES

MM

D,N

D,M

Sle

ft-lo

okin

gS

PR

SB

LKLL

TM

MD

left-

look

ing

Sup

erLU

MM

Dle

ft-lo

okin

g

Sup

erM

atrix

Sol

ver-

MF

ND

mul

tifro

ntal

TAU

CS

MD

,AM

D,M

MD

,ME

TIS

left-

look

ing,

mul

tifro

ntal

UM

FPA

CK

AM

Dun

sym

met

ricm

ultif

ront

al

WS

MP

ND

,MF

mul

tifro

ntalQNAセミナー

June

21,2

005

–p.

18/5

0

Page 20: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

appl

icat

ions

Mat

hem

atic

aLinearSolveは

UM

FPA

CKを利用

Soi

lPlu

s地盤・耐震統合

FE

M解析システム

AP

SY

S半導体デバイス解析ソフト

FU

JIT

SU

FE

M5

有限要素法による構造解析プログラム

MS

C.S

uper

For

m成形加工専用プログラム

Mr.S

OIL

3D2次元

/3次元地盤

FE

M解析システム

QNAセミナー

June

21,2

005

–p.

19/5

0

Page 21: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

WSM

Pの概要

Wat

son

Spa

rse

Mat

rixP

acka

ge

作者

:A

nshu

lGup

taan

dM

.Jos

hi(I

BM

T.J.

Wat

son

Res

earc

hC

ente

r)

逐次版は無料

(AIX

,Lin

ux,S

unO

S,T

ru64

,HP

-UX

).

ソースコード非公開.

実対称正定値,実対称不定値,実一般,複素

Her

mite,複

素対称,複素数一般

For

tran

,Cから利用可能

倍精度

圧縮格納形式

:C

SR

,CS

C,C

SR

-UT,

CS

C-L

T,M

SR

,M

SC

,

スレッド並列版,

MP

I並列版,内部でチューニングされ

たLe

vel3

BLA

Sを使用.

QNAセミナー

June

21,2

005

–p.

20/5

0

Page 22: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

数値計算環境

計算機名

IBM

eSer

ver

p5モデル

595

プロセッサ

PO

WE

R5

1.90

GH

z(Tu

rbo)

64w

ay主記憶容量

256G

BL2キャッシュ

1.9M

B/2

way

L3キャッシュ

36M

B/2

way

OS

AIX

5LV

5.3

コンパイラ

IBM

XL

For

tran

Ent

erpr

ise

Edi

tion

V9.

1

16w

ayで並列実行,最大使用可能メモリ

48G

B,

IEE

E75

4倍精度(

64ビット)実数.

QNAセミナー

June

21,2

005

–p.

21/5

0

Page 23: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

利用方法

!real

symmetric

WSSMP(N,IA,JA,AVALS,DIAG,PERM,INVP,B,LDB,NRHS,

AUX,NAUX,MRP,IPARM,DPARM)

!complex

Hermite/symmetric

ZSSMP(N,IA,JA,AVALS,DIAG,PERM,INVP,B,LDB,NRHS,

AUX,NAUX,MRP,IPARM,DPARM)

!real

general

WGSMP(N,IA,JA,AVALS,B,LDB,NRHS,RMISC,

IPARM,DPARM)

!complex

general

ZGSMP(N,IA,JA,AVALS,B,LDB,NRHS,RMISC,

IPARM,DPARM)

QNAセミナー

June

21,2

005

–p.

22/5

0

Page 24: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

Pha

ses

inW

SMP

0.In

itia

lizin

g(p

aram

eter

chec

k,al

loca

tion,

etc.

)

1.O

rder

ing

(Per

mut

ero

ws

and

colu

mns

ofA

)

2.S

ymb

olic

Fact

ori

zati

on

(Com

pute

elim

inat

ion

grap

han

dst

ruct

ure

ofL

,U,

whe

reA

=L

U)

3.N

um

eric

alFa

cto

riza

tio

n(C

ompu

teA

=L

U,o

rA

=L

LT

,orA

=L

DL

T)

4.F

orw

ard

and

Bac

kwar

dTr

ian

gle

So

lves

(Sol

vetr

iang

ular

syst

ems

Ly

=b

and

Ux

=y

)

5.It

erat

ive

Refi

nem

ent

(Com

pute

r:=

b−

Ax

nan

dx

n+

1:=

xn

+(L

U)−

1r)

QNAセミナー

June

21,2

005

–p.

23/5

0

Page 25: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

Typ

ical

Com

plex

itie

sin

WSM

P

1.O

rder

ing

O(n

)–

O(n

log(n

))

2.S

ymb

olic

Fact

ori

zati

on

O(N

NZ(A

))–

O(N

NZ(L

+U

))

3.N

um

eric

alFa

cto

riza

tio

nO

(n3/2)

–O

(n2)

4.F

orw

ard

and

Bac

kwar

dTr

ian

gle

So

lves

O(N

NZ(L

+U

))=

O(n

log(n

))–

O(n

4/3)

5.It

erat

ive

Refi

nem

ent

O(n

log(

n))

–O

(n4/3)

QNAセミナー

June

21,2

005

–p.

24/5

0

Page 26: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

各ステップの実測比(対称行列)

行列名

並列度

step

0st

ep1

step

2st

ep3

step

4st

ep5

FIN

AN

512

13.

1374

.38

3.87

13.4

62.

622.

532

0.28

72.4

08.

9412

.99

2.75

2.62

30.

3963

.19

12.0

119

.92

2.13

2.33

40.

4263

.00

12.0

320

.05

2.10

2.38

TU

ER

10.

0161

.98

3.53

30.1

62.

052.

272

0.01

59.9

37.

2328

.67

1.91

2.25

30.

0162

.04

10.7

823

.62

1.52

2.02

40.

0162

.03

10.7

523

.67

1.52

2.02

BO

DY

Y4

10.

7974

.35

5.33

13.8

92.

742.

822

1.48

64.9

810

.81

15.9

23.

563.

133

1.99

57.2

513

.21

22.1

82.

582.

654

2.05

56.5

513

.10

22.6

82.

602.

88

単位

:%

QNAセミナー

June

21,2

005

–p.

25/5

0

Page 27: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

使用メモリ量

行列名

次元数

非零要素数

Aに必要な量実使用量

daw

son5

.rsa

5153

753

1157

4MB

73M

BH

ER

M2D

03.r

sa39

2257

1567

096

11M

B32

0MB

cfd2

.RS

A12

3440

1605

669

12M

B45

0MB

M_T

1.rs

a97

578

4925

574

37M

B53

0MB

bmw

cra_

1.rs

a14

8770

5396

386

41M

B93

0MB

inlin

e_1.

rsa

5037

1218

6600

2714

2MB

2,50

0MB

ldoo

r.rsa

9522

0323

7373

3918

1MB

2,50

0MB

Com

paq

DS

20A

lpha

serv

er(E

V6)

,WS

MP

Ver

sion

1.9.

8N

.I.M

.Gou

ld,Y

.Hu

and

J.A

.Sco

tt.:

“Com

plet

ere

sults

from

anu

mer

ical

eval

uatio

nof

spar

sedi

rect

solv

ers

for

the

solu

tion

ofla

rge,

spar

se,s

ymm

etric

linea

rsy

stem

sof

equa

tions

”N

umer

ical

Ana

lyis

Gro

upIn

tern

alR

epor

ts,2

005.

QNAセミナー

June

21,2

005

–p.

26/5

0

Page 28: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

並列化効果(実数・正定値対称)

020406080100

12

34

56

78

910

1112

1314

1516

real, symmetric (N=952203, NZ=23737339)

elapsed time (sec.)

THREADS

QNAセミナー

June

21,2

005

–p.

27/5

0

Page 29: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

並列化効果(実数・非対称)

020406080100

12

34

56

78

910

1112

1314

1516

real, unsymmetric (N=259156, NZ=4429042)

elapsed time (sec.)

THREADS

QNAセミナー

June

21,2

005

–p.

28/5

0

Page 30: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

並列化効果(複素数・対称)

0246810

12

34

56

78

910

1112

1314

1516

complex, symmetric (N=24255, NZ=727884)

elapsed time (sec.)

THREADS

QNAセミナー

June

21,2

005

–p.

29/5

0

Page 31: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

Test

Mat

rice

s

Mat

rixM

arke

thttp://math.nist.gov/MatrixMarket/

Uni

vers

ityof

Flo

rida

Spa

rse

Mat

rixC

olle

ctio

nhttp://www.cise.ufl.edu/research/sparse/matrices/

Num

eric

alA

naly

sis

Gro

upof

CC

LRC

ftp://ftp.numerical.rl.ac.uk/pub/matrices/symmetrix/

QNAセミナー

June

21,2

005

–p.

30/5

0

Page 32: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

性能比較・正定値対称行列

QNAセミナー

June

21,2

005

–p.

31/5

0

Page 33: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

テスト行列

名称

次元数

非零要素数

分野

body

y6.R

SA

1936

677

057

NA

SA

mat

rixbc

sstk

36.R

SA

2305

258

3096

auto

mob

ilesh

ock

abso

rber

msc

2305

2.R

SA

2305

258

8933

MS

C.N

AS

TR

AN

TH

RE

AD

.rsa

2973

622

4989

2T

hrea

ded

conn

ecto

rG

RID

GE

NA

.rsa

4896

232

9485

Grid

gene

ratio

nop

timiz

atio

nna

sasr

b.R

SA

5487

013

6609

7S

huttl

ero

cket

boos

ter

cran

kseg

_2.r

sa63

838

7106

348

Line

arst

atic

anal

ysis

OIL

PAN

.rsa

7375

218

3547

0C

arol

ipan

finan

512.

RS

A74

752

3358

72P

ortfo

lioop

timiz

atio

ns3

dkq4

m2.

rsa

9044

924

5567

0C

ylin

dric

alS

hell

M_T

1.rs

a97

578

4925

574

Tubu

lar

join

tX

104.

rsa

1083

8451

3800

4B

eam

join

tcf

d2.R

SA

1234

4016

0566

9C

FD

pres

sure

mat

rixbm

wcr

a_1.

rsa

1487

7053

9638

6A

utom

otiv

ecr

anks

haft

mod

elS

HIP

SE

C5.

rsa

1798

6051

4647

8S

hip

sect

ion

hood

.rsa

2205

4254

9448

9C

arho

odpw

tk.R

SA

2179

1859

2617

1pr

essu

rized

win

dtu

nnel

inlin

e_1.

rsa

5037

1218

6600

27In

line

skat

erau

dikw

_1.r

sa94

3695

3929

7771

Aut

omot

ive

cran

ksha

ftm

odel

ldoo

r.rsa

9522

0323

7373

39La

rge

door

QNAセミナー

June

21,2

005

–p.

32/5

0

Page 34: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

解法と測定条件

WS

MP

5.3.

15

IBM

ES

SL

V4.

2D

SR

IS−1

0

不完全

Cho

lesk

y分解付き

CG法,疎行列用反復法

x0

=0,反復停止基準

:‖b

−A

xn‖ 2

/‖x

n‖ 2

<10

−10.

DS

RIS

−6不完全

Cho

lesk

y分解付き

CG法,疎行列用反復法

x0

=0,反復停止基準

:‖b

−A

xn‖ 2

/‖x

n‖ 2

<10

−6.

DG

ES

V部分ピボット選択付き

LU分解,一般行列用直接法.

疎行列データは圧縮列格納.

真の解が

x=

1となるように

Aの各行和を右辺

bに設定.加算により

発生する丸め誤差は無視.精度を最大値ノルムで計算.

サブルーチンの前後に時間計測関数を挿入し,経過時間を測定.

QNAセミナー

June

21,2

005

–p.

33/5

0

Page 35: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

正定値対称行列(速度・秒)

名称

次元数

非零要素数

WS

MP

DS

RIS

−10

DS

RIS

−6D

GE

SV

body

y6.R

SA

1936

677

057

0.15

90.

205

0.13

063

.162

bcss

tk36

.RS

A23

052

5830

960.

510

—66

.587

97.8

16m

sc23

052.

RS

A23

052

5889

330.

514

—89

.271

97.3

29T

HR

EA

D.r

sa29

736

2249

892

3.11

3—

—20

4.20

2G

RID

GE

NA

.rsa

4896

232

9485

——

—95

1.61

6na

sasr

b.R

SA

5487

013

6609

71.

201

109.

2042

.414

1370

.299

cran

kseg

_2.r

sa63

838

7106

348

6.21

543

.241

31.1

8520

64.2

27O

ILPA

N.r

sa73

752

1835

470

1.39

880

.049

47.5

6030

44.8

69fin

an51

2.R

SA

7475

233

5872

0.67

50.

164

0.12

934

56.8

23s3

dkq4

m2.

rsa

9044

924

5567

02.

005

172.

9014

7.08

—M

_T1.

rsa

9757

849

2557

44.

061

4997

.919

56.1

—X

104.

rsa

1083

8451

3800

45.

039

9495

.724

43.5

—cf

d2.R

SA

1234

4016

0566

92.

817

22.7

6714

.233

—bm

wcr

a_1.

rsa

1487

7053

9638

65.

892

202.

6117

4.55

—S

HIP

SE

C5.

rsa

1798

6051

4647

85.

366

140.

1889

.481

—ho

od.r

sa22

0542

5494

489

4.24

360

.943

31.6

76—

pwtk

.RS

A21

7918

5926

171

4.91

724

96.6

582.

79—

inlin

e_1.

rsa

5037

1218

6600

2718

.556

4365

.513

16.5

—au

dikw

_1.r

sa94

3695

3929

7771

116.

5926

58.5

1980

.4—

ldoo

r.rsa

9522

0323

7373

3922

.438

625.

8337

0.67

—QNAセミナー

June

21,2

005

–p.

34/5

0

Page 36: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

正定値対称行列(精度)

名称

次元数

非零要素数

WS

MP

DS

RIS

−10

DS

RIS

−6D

GE

SV

body

y6.R

SA

1936

677

057

0.97

5E-1

20.

66E

-08

0.16

E-0

30.

182E

-11

bcss

tk36

.RS

A23

052

5830

960.

124E

-06

—0.

47E

+00

0.84

8E-0

3m

sc23

052.

RS

A23

052

5889

330.

508E

-07

—0.

54E

+00

0.23

9E-0

3T

HR

EA

D.r

sa29

736

2249

892

0.22

7E-0

7—

—0.

595E

-07

GR

IDG

EN

A.r

sa48

962

3294

85—

——

0.40

6E-1

1na

sasr

b.R

SA

5487

013

6609

70.

624E

-09

0.60

E-0

60.

26E

-01

0.17

5E-0

8cr

anks

eg_2

.rsa

6383

871

0634

80.

312E

-11

0.12

E-0

70.

20E

-03

0.67

5E-1

0O

ILPA

N.r

sa73

752

1835

470

0.55

0E-0

90.

10E

-06

0.11

E+

000.

199E

-08

finan

512.

RS

A74

752

3358

720.

133E

-14

0.71

E-0

90.

32E

-04

0.87

7E-1

4s3

dkq4

m2.

rsa

9044

924

5567

00.

301E

-06

0.45

E-0

60.

25E

-03

—M

_T1.

rsa

9757

849

2557

40.

188E

-06

0.13

E-0

40.

81E

-01

—X

104.

rsa

1083

8451

3800

40.

270E

-05

0.52

E-0

50.

17E

+00

—cf

d2.R

SA

1234

4016

0566

90.

136E

-11

0.30

E-0

60.

35E

-02

—bm

wcr

a_1.

rsa

1487

7053

9638

60.

702E

-10

0.34

E-0

60.

33E

+00

—S

HIP

SE

C5.

rsa

1798

6051

4647

80.

178E

-08

0.47

E-0

60.

15E

-02

—pw

tk.R

SA

2179

1859

2617

10.

100E

-06

0.71

E-0

30.

26E

+01

—ho

od.r

sa22

0542

5494

489

0.13

6E-1

00.

28E

-06

0.76

E-0

2—

inlin

e_1.

rsa

5037

1218

6600

270.

243E

-09

0.37

E-0

60.

13E

+01

—au

dikw

_1.r

sa94

3695

3929

7771

0.20

5E-1

00.

18E

-06

0.15

E-0

1—

ldoo

r.rsa

9522

0323

7373

390.

195E

-10

0.45

E-0

50.

97E

-02

QNAセミナー

June

21,2

005

–p.

35/5

0

Page 37: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

性能比較・不定値対称行列

QNAセミナー

June

21,2

005

–p.

36/5

0

Page 38: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

テスト行列

名称

次元数

非零要素数

分野

SP

MS

RT

LS.r

sa29

995

1299

71S

pars

em

atrix

squa

rero

otH

ELM

3D01

.rsa

3222

623

0335

Hel

mho

ltzpr

oble

mbc

sstk

39.R

SA

4677

210

6803

3sh

uttle

rock

etbo

oste

rS

PAR

SIN

E.r

sa50

000

7994

94S

truc

tura

lopt

imiz

atio

nco

pter

2.rs

a55

476

4077

14H

elic

opte

rro

tabl

ade

DIX

MA

AN

L.rs

a60

000

1799

99D

ixon

-Maa

nyop

timiz

atio

nc-

71.R

SA

7663

846

8096

Opt

imiz

atio

nm

odel

A0N

SD

SIL

.rsa

8001

620

0021

Line

arC

ompl

emen

tarit

ypr

oble

mc-

72.R

SA

8406

439

5811

Opt

imiz

atio

nm

odel

bmw

3_2.

rsa

2273

6257

5799

6Li

near

stat

ican

alys

isH

ELM

2D03

.rsa

3922

5715

6709

6H

elm

holtz

prob

lem

QNAセミナー

June

21,2

005

–p.

37/5

0

Page 39: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

解法と測定条件

WS

MP

5.3.

15

IBM

ES

SL

V4.

2D

SR

IS対角スケーリング付き

TF

QM

R法,疎行列用反復法

x0

=0,反復停止基準

:‖b

−A

xn‖ 2

/‖x

n‖ 2

<10

−10.

DG

ES

V部分ピボット選択付き

LU分解,一般行列用直接法

疎行列データは圧縮列格納.

真の解が

x=

1となるように

Aの各列和を右辺

bに設定.加算により

発生する丸め誤差は無視.精度を最大値ノルムで計算.

サブルーチンの前後に時間計測関数を挿入し,経過時間を測定.

QNAセミナー

June

21,2

005

–p.

38/5

0

Page 40: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

不定値対称行列(速度・秒)

名称

次元数

非零要素数

WS

MP

DS

RIS

DG

ES

V

SP

MS

RT

LS.r

sa29

995

1299

710.

211

—23

3.29

7H

ELM

3D01

.rsa

3222

623

0335

0.68

3—

285.

757

bcss

tk39

.RS

A46

772

1068

033

0.87

2—

891.

506

SPA

RS

INE

.rsa

5000

079

9494

——

1003

.262

copt

er2.

rsa

5547

640

7714

0.92

6—

1501

.076

DIX

MA

AN

L.rs

a60

000

1799

99—

0.04

617

60.5

08c-

71.R

SA

7663

846

8096

4.83

94.

085

3924

.913

A0N

SD

SIL

.rsa

8001

620

0021

——

4183

.087

c-72

.RS

A84

064

3958

117.

870

7.51

0—

bmw

3_2.

rsa

2273

6257

5799

65.

375

——

HE

LM2D

03.r

sa39

2257

1567

096

3.67

0—

— QNAセミナー

June

21,2

005

–p.

39/5

0

Page 41: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

不定値対称行列(精度)

名称

次元数

非零要素数

WS

MP

DS

RIS

DG

ES

V

SP

MS

RT

LS.r

sa29

995

1299

710.

103E

-11

—0.

104E

-11

HE

LM3D

01.r

sa32

226

2303

350.

193E

-11

—0.

255E

-10

bcss

tk39

.RS

A46

772

1068

033

0.23

8E-1

0—

0.27

3E-0

9S

PAR

SIN

E.r

sa50

000

7994

94—

—0.

124E

-07

copt

er2.

rsa

5547

640

7714

0.25

4E-1

2—

0.12

1E-0

9D

IXM

AA

NL.

rsa

6000

017

9999

—0.

13E

-07

0.12

8E-1

0c-

71.R

SA

7663

846

8096

0.14

3E-1

10.

25E

-05

0.11

9E-0

9A

0NS

DS

IL.r

sa80

016

2000

21—

—0.

194E

-09

c-72

.RS

A84

064

3958

110.

159E

-11

0.28

E-0

5—

bmw

3_2.

rsa

2273

6257

5799

60.

440E

-06

——

HE

LM2D

03.r

sa39

2257

1567

096

0.28

5E-1

2—

QNAセミナー

June

21,2

005

–p.

40/5

0

Page 42: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

性能比較・非対称行列 Q

NAセミナー

June

21,2

005

–p.

41/5

0

Page 43: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

テスト行列

名称

次元数

非零要素数

分野

wes

t202

120

2173

53C

hem

ical

engi

neer

ing

fidap

011

1661

410

9694

8F

luid

dyna

mic

se4

0r01

0017

281

5535

62F

luid

dyna

mic

sm

empl

us17

758

1261

50E

lect

roni

cci

rcui

tdes

ign

raef

sky3

2120

014

8876

8F

luid

dyna

mic

saf

2356

023

560

4842

56F

luid

dyna

mic

sw

ang3

2606

417

7168

Flu

iddy

nam

ics

lhr3

4c35

152

7640

14C

hem

ical

engi

neer

ing

onet

one1

3605

734

1088

Non

linea

rci

rcui

tson

eton

e236

057

2276

28N

onlin

ear

circ

uits

bbm

at38

744

1771

722

Flu

iddy

nam

ics

av41

092

4109

216

8390

2F

inite

Ele

men

tAna

lysi

sba

yer0

157

735

2777

74C

hem

istr

yve

nkat

5062

424

1717

792

Flu

iddy

nam

ics

epb3

8461

746

3625

The

rmod

ynam

ics

twot

one

1207

5012

2422

4N

onlin

ear

circ

uits

tors

o325

9156

4429

042

Flu

iddy

nam

ics

lang

uag

3991

3012

1633

4N

atur

al-la

ngua

gepr

oces

sing

pre2

6590

3359

5928

2N

onlin

ear

circ

uits

ham

rle3

1447

360

5514

242

Ele

ctro

nic

circ

uitd

esig

n QNAセミナー

June

21,2

005

–p.

42/5

0

Page 44: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

解法と測定条件

WS

MP

5.3.

15

IBM

ES

SL

V4.

2D

GS

F(S

)修正

Mar

kow

itz法による

LU分解,疎行列用直接法

DS

RIS

不完全

LU分解付き

BiC

GS

tab法,疎行列用反復法,

x0

=0,反復停止基準

:‖b

−A

xn‖ 2

/‖x

n‖ 2

<10

−10.

DG

ES

V部分ピボット選択付き

LU分解,一般行列用直接法.

疎行列データは圧縮列格納,

ATx

=bを解く.

真の解が

x=

1となるように

ATの各行の列和を右辺

bに設定.加算

により発生する丸め誤差は無視.精度を最大値ノルムで計算.

サブルーチンの前後に時間計測関数を挿入し,経過時間を測定.

QNAセミナー

June

21,2

005

–p.

43/5

0

Page 45: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

非対称行列(速度・秒)

名称

次元数

非零要素数

WS

MP

DG

SF

(S)

DS

RIS

DG

ES

V

wes

t202

120

2173

530.

030.

003

—0.

12fid

ap01

116

614

1096

948

1.36

625.

88—

37.7

1e4

0r01

0017

281

5535

620.

5751

.55

—39

.30

mem

plus

1775

812

6150

0.38

0.05

1.25

44.7

5ra

efsk

y321

200

1488

768

1.38

69.3

35.

3870

.34

af23

560

2356

048

4256

1.20

3044

—10

2.27

wan

g326

064

1771

681.

4160

3.93

0.31

129.

75lh

r34c

3515

276

4014

1.51

17.3

2—

317.

53on

eton

e136

057

3410

881.

862.

88—

381.

07on

eton

e236

057

2276

280.

940.

78—

386.

70bb

mat

3874

417

7172

24.

62—

—44

1.22

av41

092

4109

216

8390

214

.09

10.4

8—

561.

83ba

yer0

157

735

2777

741.

150.

18—

1583

.33

venk

at50

6242

417

1779

21.

7027

0.69

8.56

1859

.18

epb3

8461

746

3625

1.79

20.7

01.

68—

twot

one

1207

5012

2422

44.

4212

.84

——

tors

o325

9156

4429

042

37.0

734

4.66

4.09

—la

ngua

g39

9130

1216

334

—0.

680.

77—

pre2

6590

3359

5928

234

.47

——

—ha

mrle

314

4736

055

1424

213

13—

——

QNAセミナー

June

21,2

005

–p.

44/5

0

Page 46: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

非対称行列(精度)

名称

次元数

非零要素数

WS

MP

DG

SF

(S)

DS

RIS

DG

ES

V

wes

t202

120

2173

530.

206E

-08

0.26

5E-0

7—

0.44

8E-0

7fid

ap01

116

614

1096

948

0.19

2E-0

50.

279E

-01

—0.

571E

-04

e40r

0100

1728

155

3562

0.47

8E-1

10.

895E

-06

—0.

338E

-08

mem

plus

1775

812

6150

0.23

3E-1

10.

103E

-07

0.77

1E-0

50.

207E

-10

raef

sky3

2120

014

8876

80.

249E

-12

0.28

6E-0

00.

542E

-08

0.31

6E-0

8af

2356

023

560

4842

560.

712E

-13

0.16

1E-0

4—

0.11

9E-1

2w

ang3

2606

417

7168

0.44

8E-1

30.

416E

-05

0.90

5E-0

80.

253E

-12

lhr3

4c35

152

7640

140.

176E

-01

0.28

9E+

03—

0.10

5E+

01on

eton

e136

057

3410

880.

314E

-10

0.74

9E-0

9—

0.75

1E-0

9on

eton

e236

057

2276

280.

991E

-11

0.98

0E-1

0—

0.13

7E-0

9bb

mat

3874

417

7172

20.

100E

-10

——

0.37

9E-0

8av

4109

241

092

1683

902

0.84

0E-1

30.

717E

-07

—0.

864E

-12

baye

r01

5773

527

7774

0.79

0E-0

60.

211E

+03

—0.

757E

-06

venk

at50

6242

417

1779

20.

321E

-12

0.62

4E-0

50.

248E

-07

0.20

4E-1

1ep

b384

617

4636

250.

281E

-13

0.64

0E-0

80.

381E

-07

—tw

oton

e12

0750

1224

224

0.93

2E-1

00.

414E

-08

——

tors

o325

9156

4429

042

0.44

4E-1

40.

561E

-06

0.24

0E-0

7—

lang

uag

3991

3012

1633

4—

0.59

6E-1

10.

179E

-07

—pr

e265

9033

5959

282

0.22

4E-0

4—

——

ham

rle3

1447

360

5514

242

0.20

6E-0

0—

——

QNAセミナー

June

21,2

005

–p.

45/5

0

Page 47: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

知見

「ほぼ頑強

(nea

rlyro

bust

)」

ES

SLの(ピーク性能比

70%を達成する)直接解法と比

較して,速度・精度の面で勝る.

Ord

erin

gによる

fill-i

nの抑止

疎行列構造を生かした行列分解アルゴリズム

他の手法と比較して,精度の面で勝る.

直接法の性質と計算量削減によって丸め誤差の影響が

少ないため?

行列の構造が同じだったり,多くの右辺を持つ場合には

特に有効.

比較の解法としても利用価値大(速度比較,解き難さの

確認

,etc

.).

QNAセミナー

June

21,2

005

–p.

46/5

0

Page 48: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

WSM

Pの問題点

「頑強

(rob

ust)」とはまだ言えない

行列のサイズが大きくなると

4バイト整数の表現可能な値

(-2

1474

8364

8~21

4748

3647)を超え内部エラーとなる.

8バイト版の提供待ち.

4並列以上の並列化性能が芳しくない.

対称行列はピボット選択を行なわない.

対角成分に

0がある行列に対しては利用者が事前に置

換を行なう必要がある.

分解された行列の格納方法が不明.

マニュアルが読みにくい.

QNAセミナー

June

21,2

005

–p.

47/5

0

Page 49: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

問題募集!

100万次元以上歓迎

圧縮行格納法

(com

pres

sed

row

stor

age)

圧縮列格納法

(com

pres

sed

colu

mn

stor

age)

wat

anab

e@cc

.kyu

shu-

u.ac

.jpまでお気軽に.

QNAセミナー

June

21,2

005

–p.

48/5

0

Page 50: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

誤差評価1

定理

:A

x=

bの近似解

x̃と

Aの逆行列

Rが求められたと

き,‖R

A−

I‖ ∞

<1ならば

Aは正則であり,

‖x−

x̃‖ ∞

≤‖R

(b−

Ax̃

)‖∞

1−

‖RA−

I‖ ∞

.

ただし

‖·‖ ∞は最大値ノルム.

R=

(LU

)−1

QNAセミナー

June

21,2

005

–p.

49/5

0

Page 51: 直接解法による大規模疎行列に 対する連立1次方程 …ri2t.kyushu-u.ac.jp/~watanabe/RESERCH/SLIDE/WSMP-QNA.pdf直接解法による大規模疎行列に 対する連立1次方程式ソルバー

誤差評価2

特異値分解

:

A=

VT

UU

T=

VV

T=

I,

Σ=

diag

(σ1,.

..,σ

n),

U=

(u1,.

..,u

n)

‖x−

x̃‖2 2

=n ∑ i=1

1 σ2 i

(ui,

b−

Ax̃

)2

⇒‖x

−x̃‖ 2

≤1

σm

in

‖b−

Ax̃‖ 2

Aの(特に最小)特異値を計算する必要がある.通常,特異値

計算は

Ax

=bを解く以上の手間が必要.

QNAセミナー

June

21,2

005

–p.

50/5

0