物理モデリングとスパースモデリングの融合による自然法則の抽出mns.k.u-tokyo.ac.jp/~sparse2017/pdf/9.pdf ·...

10
物理モデリングとスパースモデリングの融合による自然法則の抽出 1 , 2 , () 3 , 4 . 大学 大学院 , 大学 大学院 , 大学 大学院 B01-3 , スパースモデリングにより データから し, ・シミュレーション デリング るこ により, する モデリング にある.そ ために ケー スを すこ え,右 ように ダイナミクス ,それらを する ダイナミクス に対 する 題を ている. これま についてま める. 1 走査型トンネル顕微鏡データのスパースモデリング 課題 1 1.1 STM トポグラフィ像のスパースモデリング データに まれるピークを し, するピークスペクトル される ある.ピークスペクトル における えられたデー ピーク ある. にピーク 、かつ、 ベイズモデル による ピーク らびにピーク うこ ある.そこ ベクト ルマシン (RVM)[2] スパースモデリングを いた 2 データに対する ピークスペクトル ため フレームワーク について する. Figure 1: SrVO 3 における STM トポグラフィ ,イ ンセット から たカラーマップ .格 パターンに れる してい る.( 大・一 より ) して, Figure 1 にみられるよう トンネル (STM) [1] により られる トポグラフィデータ(以 ,トポ )を扱う.こ トポ スケール トンネル するこ により られる している. Figure 1 られるひ つひ ピーク し,一 域( する. 2 ピクセルマップデータにおけるピークスペクトル せる. により られるデータ D = 512 × 512 ピク セルマップデータ (y =(y 1 ,...,y D )) して えられる.ここ グリッドに されている え,グリッド 各格 におけるピーク (x =(x 1 ,...,x N )) するモデルを える.す わち, y にある x スノイズを y = ˆ Ax + ϵ (1) れる え, x する. ˆ A = A ij (σ) あり ( ピクセル )ピー σ する 2 する.ここ ある x * り,それ以 0 るこ ましい. に対して, 大き N x * スパースに る.したがって,ピーク L 1 ある れる. ため して いられている FISTA いた [4].ハイパーパラメータ λ, σ い, ・樺 らによる一つ (LOOCV) いた [5].ピーク して, されたピーク x * にさらに K-means クラスタリング 1 E-mail: [email protected] 2 E-mail: [email protected] 3 E-mail: [email protected] 4 E-mail: [email protected] 1 科学研究費補助金 新学術領域研究「スパースモデリングの深化と高次元データ駆動科学の創成」 最終成果報告会 (2017/12/18-20)

Upload: others

Post on 19-Aug-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 物理モデリングとスパースモデリングの融合による自然法則の抽出mns.k.u-tokyo.ac.jp/~sparse2017/pdf/9.pdf · 物理モデリングとスパースモデリングの融合による自然法則の抽出

物理モデリングとスパースモデリングの融合による自然法則の抽出

福島孝治 1, 大森敏明 † 2, 中西 (大野)義典 3, 観山正道 ‡ 4.東京大学 大学院総合文化研究科, 神戸大学 大学院工学研究科 †, 東北大学 大学院情報科学研究科 ‡

計画研究 B01-3班の目標は,スパースモデリングにより自然科学データから重要因子を抽出し,理論・シミュレーションの物理モデリングとの接点を探ることにより,自然法則を抽出する普遍的なモデリング原理の構築にある.そのために研究方法の典型ケースを具体的に示すことが重要と考え,右図のように空間構造の形成法則の抽出,時間発展ダイナミクスの抽出,それらを融合する時空間ダイナミクスの抽出に対応する課題を中心に研究を進めている.本稿ではこれまでの研究の進展についてまとめる.

1 走査型トンネル顕微鏡データのスパースモデリング 課題 1

1.1 STMトポグラフィ像のスパースモデリング

データに含まれるピークを分別し,中心位置などの特徴量を抽出するピークスペクトル分解は様々な状況で必要とされる普遍的な問題である.ピークスペクトル分解におけるもっとも困難な問題は与えられたデータのピーク数の推定である.特にピーク数が未知、かつ、膨大な場合では、単純なベイズモデル推定によるピーク数の推定、ならびにピーク分解を同時に行うことは非常に困難である.そこで本節では,関連ベクトルマシン (RVM)[2]とスパースモデリングを用いた 2次元データに対する汎用的なピークスペクトル分解のためのフレームワークの提案とその具体的な実験系への応用について紹介する.

�����

������

������

���

��

���

���

���

���

���

�������

����

����

����

��

����

����

����

����

����

����

��

����

����

Figure 1: 金属酸化物 SrVO3 試料表面における STMトポグラフィ像,インセットは真上から見たカラーマップ図.格子状のパターンに現れる負の値をとる黒い点は酸素欠損を表している.(東工大・一杉研究室より提供)

具体的な実験系として,本研究では Figure 1にみられるような走査型トンネル顕微鏡 (STM)技術 [1]により得られる金属酸化物試料表面のトポグラフィデータ(以下,トポ像)を扱う.このトポ像は原子スケールの微細な探針と試料表面の間のトンネル電流を測定することにより得られる局所的な電子密度分布を表している.実際,Figure 1に見られるひとつひとつのピークは表面原子に相当し,一方で小さな値をとる領域(図中の黒い点)は原子の欠損に相当する.この問題は 2次元ピクセルマップデータにおけるピークスペクトル分解とみなせる.実験により得られるデータは通常、D = 512 × 512程度のピク

セルマップデータ (y = (y1, . . . , yD))として与えられる.ここでは,仮想的なグリッドに基底関数が配置されていると考え,グリッド上の各格子点におけるピーク強度を被推定変数 (x = (x1, . . . , xN ))とするモデルを考える.すなわち,観測結果 yとその背後にある xはガウスノイズを含む線形関係

y = Ax+ ϵ (1)

で結ばれると考え,xを推定する.A = Aij(σ)は観測行列であり (添え字はピクセルの番号),本研究ではピーク幅を σとする等方的 2次元ガウス関数を仮定する.ここで,最終的な推定結果であるx∗は真の原子位置の近傍でのみ有限の値を取り,それ以外では 0の値をとることが望ましい.原子数に対して,十分大きなN を取れば自ずとx∗はスパースになる.したがって,ピーク強度推定問題はL1正則化のある最小二乗法に帰着される.本研究では,最適化のための手法として広く用いられているFISTAを用いた [4].ハイパーパラメータλ, σの選択には交差検証を用い,実際の計算には小渕・樺島らによる一つ抜き交差検証 (LOOCV)の近似手法を用いた [5].ピーク中心位置の推定に関して,推定されたピーク強度 x∗にさらにK-meansクラスタリング

1E-mail: [email protected]: [email protected]: [email protected]: [email protected]

1

科学研究費補助金 新学術領域研究「スパースモデリングの深化と高次元データ駆動科学の創成」最終成果報告会 (2017/12/18-20)

Page 2: 物理モデリングとスパースモデリングの融合による自然法則の抽出mns.k.u-tokyo.ac.jp/~sparse2017/pdf/9.pdf · 物理モデリングとスパースモデリングの融合による自然法則の抽出

法を用いることにより,中心位置の座標を高精度に決定することができる.これにより,入力データの解像度よりも細かな精度で中心位置を決定する方法論が構成できた.[6]実際にFigure 2に示すように,SrVO3 (001)表面に対する STMトポ像の測定結果に対しても今回の手法を用いてピーク抽出を試みることに成功している.

Figure 2: SrVO3表面における STMトポ像 (左図)と対応する RVM 推定結果 (右図).

今回提案する手法により,今までの解析手法では抽出することが困難であった原子配置構造の歪みなどの局所的な物性情報を測定の解像度以上の精度で取り出すことが可能となり,さらにこの手法は 2次元マップデータに対するピークスペクトル分解という普遍的な問題に対する新たな枠組みを与えるもので,広範な計測データに対する応用が期待される.さて,上で示した SrVO3 (001)表面はVO2終端

の上に頂点酸素原子が√2×

√2−45◦表面再構成構

造を取ったものである.電子密度が低い領域はこの頂点酸素原子が欠損しているものに対応している.我々のデータ解析を用いた酸素原子の位置から格子上の配置データとして再構成し,原子が存在しない格子点として原子欠損の位置を決定した (Figure 3中図).解析対象のデータは 50nm2から計 8,453個の格子点が含まれ,うち 1,029個が酸素原子欠損,7,424個が酸素原子に対応する格子点であることが明らかになった.このような個数単位の分別はこれまでの解析技術では明らかにできなかったことであり,今回の我々の解析手法により可能となったものである.原子

��

��

��

��

���

���

� �� �� �� �� ��� ���

����������

��

����

����

����

����

���

���

� � � � � �� �� �� ��

����

-2000

-1000

0

1000

2000

Å

-2000 -1000 0 1000 2000Å

1900

1800

1700

1600

1500

Å

15001400130012001100Å

入力STMトポ像

格子表示

赤: 欠損 (1,029個)黒: 原子 (7,424個)

格子表示による欠損可視化

r/a < 4: 一様な分布r/a > 4: 完全空間ランダム

SrVO3@4K, -10mV bias, 50nm2

欠損のRipleyのL関数

Figure 3: 入力した STMトポグラフィ像 (左図).抽出した酸素原子配置を元に格子化したデータ,赤点は原子欠損を表す(中図).欠損位置に関する Ripley-L関数の結果 (右図).

欠損に関して格子単位での位置を決定できたことから空間分布に関する情報を得ることができる.特に欠損の空間分布がランダムであるかどうかなどは薄膜の電子物性を調べる上で重要な情報であり,ここでは空間統計学の分野で用いる Ripleyの L関数を用いて,各距離における空間配置のランダム性を判定することを試みた.この L関数は L(r) = 0の時,距離 rのスケールでランダムな点分布であることを示している.また,L(r) < 0で一様な点分布(点同士が排他的な分布),L(r) > 0でクラスター化された点分布(点同士が集中した分布)であることを表す指標となっている.SrVO3 の STMトポ像から得られた原子欠損の空間分布に関する Ripleyの L関数の結果を Figure 3右図に示す.これによれば,4格子点以下の距離スケールでは一様な点分布,それ以上の距離スケールでは完全空間ランダムであることが明らかとなった.この結果を承けて,原子欠損間には短距離で有効的に斥力相互作用が働いていることが推察される.

1.2 格子欠損間の有効モデル推定

ナノメートル・スケールでの欠損の分布が明らかにできたことを利用して,酸素原子欠損の正方格子上での分布を統計模型にモデル化することで原子欠損間に働く有効相互作用の推定を行うことを試みる.欠損間に働く相互作用が斥力であるか,引力であるのか.あるいはどの程度の距離範囲で相互作用が働いているとみなせるか.これらの情報は実験結果を説明するために基礎的な情報となるとともに,実験計画の上で薄膜製成条件による変化をよく理解することができる.考えるべき統計モデルとしては,統計物理で広く用いられる格子気体模型をここでは考える.格子気体模型は格子上Λに 2値を取る変数ni ∈ {0, 1} (D = {n1, n2, . . . , nN}, N = #Λ)を考える.ni = 0は原子欠損,ni = 1は原子を示す.この格子気体模型のハミルトニアンを以下のように考える.

2

Page 3: 物理モデリングとスパースモデリングの融合による自然法則の抽出mns.k.u-tokyo.ac.jp/~sparse2017/pdf/9.pdf · 物理モデリングとスパースモデリングの融合による自然法則の抽出

J1

J2J3J4J5…

Figure 4: 相互作用係数のラベル

H(D;J) = −K∑

k=1

∑(i,j)∈Λk

Jk(1− ni)(1− nj) (2)

ここで J = {J1, J2, . . . , JK}は k 次近接にある相互作用の係数 (Figure 4)であり,Λk は k次近接にある 2格子点の組の集合を表している.Jk が正の時,k次近接相互作用が引力であり,負の時,斥力であることを表している.与えられた原子欠損に関する変数 Dに対して,これを説明する尤もらしい相互作用係数 J を推定することを目的とする.相互作用係数に関する事前分布 P (J)として一様分布を取ることとすれば,最尤法を用いた推定 J∗ = argmaxJP (D|J)を行うこととなる.本研究では最尤法に基づく点推定を行うために,勾配法を用いた.具体的な勾配法に関するアルゴリズムとしては,Nesterovの加速法を用いた.相互作用係数推定の前提として、どのKまで考えるかは未知とする.すなわちK を固定して Jkを推定

したのちK を選択する.本方法の有効性を検証するために,予め与えられた真の相互作用次数K∗と相互作用係数により生成した生成データに関して,相互作用係数の推定を行った.(K ≤ 5)用いた場合の相互作用係数から生成したデータに関しての推定結果を Figure 5に示す.K∗ = 3までは有限の値をとるK の数

-1.2

-1

-0.8

-0.6

-0.4

-0.2

0

1 2 3 4 5

J k

K

K=1K=2K=3K=4K=5-1

-0.5-1

-0.8

-0.6

-0.4

-0.2

0

0.2

1 2 3 4 5

J k

K

K=1K=2K=3K=4K=5-1

-0.5-0.25

-1.2

-1

-0.8

-0.6

-0.4

-0.2

0

0.2

1 2 3 4 5

J k

K

K=1K=2K=3K=4K=5-1

-0.5-0.25-0.2

-1

-0.8

-0.6

-0.4

-0.2

0

0.2

1 2 3 4 5J k

K

K=1K=2K=3K=4K=5-1

-0.5-0.25-0.2

-0.125

K*=2 K*=3 K*=4 K*=5

J*1=-1, J2*=-0.5 J*

1=-1, J2*=-0.5, J2*=-0.25

J1*=-1, J2*=-0.5, J3*=-0.25, J4*=-0.25

J1*=-1, J2*=-0.5,J3*=-0.25, J4*=-0.2,

J5*=-0.125※ Jk~1/r2を与えている

Figure 5: Jk 1/r2としたK = 2, 3, 4, 5まで考慮した場合の相互作用推定結果.生成データに用いた相互作用係数は各結果の下に示している.

と Jk を正しく推定することができているが,K∗ = 4, 5に関しては,生成データに用いたパラメタ J4, J5は有限の値であるのにも関わらず,必ず 0となっている.したがって,4次, および 5次の近接相互作用に関する相互作用係数は正しく推定できていないことがわかった.これはそもそもデータの持つ相関長を超えた領域では勾配法の勾配が消失することからくる.すなわち,推定可能な相互作用係数のサイトはデータの持つ相関長により制限されることが示唆される.本節では,広範な 2次元マップデータに対する未知な多数のピークに関する高精度な位置決定を可能と

するスパースモデリングを用いたアルゴリズムとそこから得られる空間分布から有効相互作用を決定するための方法論について述べた.STMトポグラフィ像に対する応用結果を示したが,他にも様々な計測データへの応用が可能である.また,得られた空間分布に関する相互作用有効モデル推定に関しても,我々の推定の枠組みは格子,相互作用ハミルトニアンを対象に応じて変更することで様々な系への応用が考えられる.例えば,二原子種が混在する系に対しては,格子気体模型ではなくイジング模型による定式化が考えられ,より多数種が混在する場合はポッツ模型を考えればよい.このように本節で述べた研究は様々な実験計測データに対して,データ駆動型物性研究の進展に繋がることが期待される.

1.3 準粒子干渉実験のスパースモデリング

スパースモデリングに基づく圧縮センシングを自然科学のさまざまなフーリエ計測に適用することが盛んに行われている.しかしながら,データ数が十分であるかどうかを判断することは難しく,圧縮センシングの成否をどのように判定するかについてはこれまであまり議論されてこなかった.そこで本節では,代表的な物性科学のフーリエ計測である走査トンネル顕微/分光法(scanning tunneling microscopy/spectroscopy,STM/S)による準粒子干渉(quasi-particle interference,QPI)実験を題材にして,交差検証と仮説検定を組み合わせることにより圧縮センシングの成否を判定した研究を紹介する [7].

3

Page 4: 物理モデリングとスパースモデリングの融合による自然法則の抽出mns.k.u-tokyo.ac.jp/~sparse2017/pdf/9.pdf · 物理モデリングとスパースモデリングの融合による自然法則の抽出

STM/Sとは,先端が原子一個からなるほどの探針に電圧を印加して物質の表面に近づけることにより導通する微弱なトンネル電流を計測する手法であり,物質の表面を探針でなぞりながらトンネル電流を計測することにより,状態密度のマッピングデータを得ることができる [8, 9].この QPIパターンのデータをフーリエ変換して波数成分を抽出すると電子状態の分散関係を知ることができる.すなわち,フーリエ基底を表す行列を F,STM/Sデータを yと表すと,フーリエ変換により推定される分散関係 xF は

xF = Fy (3)

により与えられる.STM/Sによる QPI実験にとって最大の弱点はデータ獲得に要する計測時間の長さである.分散関係の全貌を明らかにするためには印加電圧の値を変えて多くの枚数の状態密度マップを得る必要があり,一回の実験に一週間かかることもある.STM/Sを行うには絶えず除振装置を稼働させる必要があるだけでなく,測定条件によっては高真空・極低温・高磁場という環境を一定に保たなければならない.物性科学において QPI実験を普及させるためには,計測時間を削減することによる利便性の向上が求められる.

qx [nm-1]

qy [

nm

-1]

(a) M=64800

-9 -6 -3 0 3 6 9-9

-6

-3

0

3

6

9

Inte

nsity [

arb

. u

nit]

0

0.5

1

1.5

2

2.5

3

3.5

qx [nm-1]

qy [

nm

-1]

(b) M=16200

-9 -6 -3 0 3 6 9-9

-6

-3

0

3

6

9

Inte

nsity [

arb

. u

nit]

0

0.5

1

1.5

2

2.5

3

qx [nm-1]

qy [

nm

-1]

(c) M=7200

-9 -6 -3 0 3 6 9-9

-6

-3

0

3

6

9

Inte

nsity [

arb

. u

nit]

0

0.5

1

1.5

2

2.5

qx [nm-1]

qy [

nm

-1]

(d) M=4050

-9 -6 -3 0 3 6 9-9

-6

-3

0

3

6

9

Inte

nsity [

arb

. u

nit]

0

0.2

0.4

0.6

0.8

1

1.2

1.4

Figure 6: QPI実験に圧縮センシングを適用した結果.STM/Sにより得られるQPIパターンをLASSOにより解析して得られる電子状態の分散関係を示す.Mは STM/Sデータの画素数を表す.M = 64800, 16200, 7200の場合は円環型の分散関係が見られ電子状態の推定に成功しているが,M = 4050の場合は失敗している.

QPI実験の高精度・高速化を行うためにスパースモデリングに基づいて圧縮センシングを適用する.圧縮センシングを行うには解析においてデータ数が少ないことによる不定問題を解決する必要がある.QPI実験では電子状態の分散関係に内在するスパース性,すなわち,あるエネルギーをもつ電子のとりうる波数は少数のものに限られるという事実に着目することが有効であり,スパース解を選好するように l1 ノルムを正則化項として用いる最小二乗法により 推定値 xL は

xL = argminx

{1

2∥y − F†x∥22 + λ∥x∥1

}(4)

と与えられる [3].行列 F†は Fの共役転置である.正則化項の係数 λは,後で述べる交差検証により決定する.Figure 6に,圧縮センシングの有効性を検証するために実際の QPIパターンのデータを用いて行った数値実験の結果を示す.数値実験に用いたのは Ag(111)表面に見られるQPIパターンを 70× 35 nm2の領域に渡って画素数M = 360× 180 = 64800の画像として記録した STM/Sデータである.従来のフーリエ変換のみに基づいた解析を用いる場合,Ag(111)の表面状態に特徴的な円環型の分散関係を見出すために,画素数M = 64800のデータが用いられるが,LASSOを用いて解析を行う場合データ数をランダムにM = 7200に間引いたデータからでも分散関係を推定することができる.したがって,圧縮センシングにより計測時間を少なくとも 9分の 1にできることが示唆される.本節では物性科学のフーリエ計測である QPI実験に圧縮センシングを適用した.実験データ解析にお

いて圧縮センシングの成否をどのように判定するかは重要な問題である.Figure 6によるとM = 7200かそれを上回るデータ数の場合には圧縮センシングに成功し,M = 4050の場合は円環が途切れ圧縮センシングは失敗していることが分かる.しかしながら,実際には電子状態を知るために QPI実験を行うのであり,未知であるはずの分散関係と照合することによって圧縮センシングの成否を判定することはできない.我々は交差検証を圧縮センシングの成否判定に用いるために仮説検証の枠組みと組み合わせることを提案した.[7] このような枠組みは他のフーリエ計測にも有効に働くことが期待される.

2 神経活動データからの脳神経ダイナミクスの抽出 課題 2

近年の計測技術の進展により,脳神経システムにおいても大規模かつ高次元のイメージングデータが得られつつある [11].膜電位イメージングやカルシウムイメージングによって,神経細胞内部の時空間応答の計測

4

Page 5: 物理モデリングとスパースモデリングの融合による自然法則の抽出mns.k.u-tokyo.ac.jp/~sparse2017/pdf/9.pdf · 物理モデリングとスパースモデリングの融合による自然法則の抽出

や,複数細胞の電位応答の同時計測が実現されているが,脳神経システムの動態を解明する上で,これらの神経応答を支配する非線形ダイナミクスを抽出する方法の確立が重要である.本課題では,物理モデリングとスパースモデリングに基づいて,脳計測データから,その背後にある非線形ダイナミクスを抽出するためのデータ駆動型アルゴリズムの開発を推進してきた [12, 13, 14, 15, 16].複数の神経細胞からの同時計測を実現するカルシウムイメージングデータから,その背後にある神経

ネットワークのダイナミクスや神経素子のダイナミクスを同時に推定する方法の構築を行い,逐次モンテカルロ法とマルコフ連鎖モンテカルロ法を融合した推定アルゴリズムを構成することにより,ネットワーク構造と神経素子特性の同時推定を実現する方法を提案した [15].神経細胞における非線形ダイナミクスの抽出に当たっては,多数のイオンチャネル候補から真のイオン

チャネルのみを抽出する方法の確立が重要である.そこで,本課題では,スパースモデリングを用いることにより,多数の非線形型のイオンチャネルの候補から,計測データに潜む神経細胞ダイナミクスのみを抽出する方法を提案し,その有効性を示した [16].本稿では,上記の 2つの成果を中心に報告するが,これらの成果に加えて,神経細胞の空間構造である

樹状突起における非線形時空間ダイナミクスを抽出する方法を提案し,部分的な観測データから,膜電位やイオンチャネル変数の推定を実現するとともに,樹状突起が従う非線形型反応拡散方程式の背後にある拡散定数やイオンチャネルのコンダクタンスをも同時に推定するアルゴリズムを構築した [14].

2.1 ベイズ推論に基づくイメージングデータからの神経回路ダイナミクスの推定

Fig. 7(a)に示すように,神経ネットワークを構成する複数の神経細胞からイメージングデータが得られる状況において,その背後にあるネットワーク構造 θ1 と各ニューロン素子の特性 θ2 を定めるパラメータの分布推定を実現する方法を提案する.まず,神経ネットワークのダイナミクスとして,膜電位 vj とカルシウム濃度 xj (j = 1, · · · , N)のダイ

ナミクスを導入し,さらに,イメージング計測を確率モデル化することにより,状態空間モデルを構成する.各ニューロンの膜電位 vj のダイナミクスが次に示す微分方程式で表されるとする.

dvjdt

= −ICa,i(vj)− IK,j (vj , nj)− IL,i(vj)− Isyn,j (vj)− Iext,j + ξ(v)j (5)

ここで,ICa,j,IK,j,IL,iはカルシウム電流,カリウム電流,リーク電流を示す.nj はカリウム電流のチャネル変数である.Isyn,j はシナプス電流であり,Iext,j は外部入力,ξ

(v)j は白色雑音である.シナプス電流

Isyn,j は他のニューロンからの電流を示し,次式に従う.

Isyn,j (v) =∑k =j

gj,kα(t− tspike,k) (v − Esyn,k) (6)

ここで,gj,k は,ニューロン kからニューロン jへのシナプスコンダクタンスであり,ネットワーク構造を定める.α(t− tspike,k)は直近のスパイク時刻 tspike,kから時刻 tまでの時間を引数とする関数であり,Esyn,k

は反転電位を示す.各ニューロンのカルシウム濃度 xj は,式 (5)で与えたカルシウム電流 ICa,j に依存するものとして,次

に従う微分方程式に従うとする.dxj

dt= Axj − BICa,j + ξ

(x)j (7)

ここで,A,B はカルシウム濃度のダイナミクスを定める定数である.式 (5)を時間に関して離散化することにより,膜電位 vt = [vt,1, vt,2, ..., vt,N ]の確率モデルは次式のよ

うに導出される.

p (vt|vt−1,θ1) = N (vt|vt−1 − ICa(vt−1)− IK (vt−1,nt−1)− IL(vt−1)− Isyn (vt−1,θ1)− Iext,Σv) (8)

ここで,θ1 = {gj,k} はネットワーク構造を定めるパラメータの集合である.同様に,Ca2+ 濃度 xt =[xt,1, xt,2, ..., vx,N ]の確率モデルは,式 (7)より,次式のように与えられる.

p(xt|xt−1,vt−1,θ2) = N (xt|Axt−1 −BICa(vt−1),Σx) (9)

ここで,θ2 = {A,B,Σx}は個々のニューロンの反応特性を定めるパラメータである.以上の確率モデルをもとに,隠れ変数 zt = {vt,xt}を有するシステムモデル p(zt+1|zt)が導出される.次に,カルシウムイメージング計測を考慮した観測モデルp (yt|zt)を定める.蛍光度yt = [yt,1, yt,2, ..., yt,N ]

はカルシウム濃度 xtに依存する非線形関数 F (xt) から得られるものとすると,観測モデルは次式のように定式化される.

p (yt|zt) = N (yt|F (xt),Σy) (10)

5

Page 6: 物理モデリングとスパースモデリングの融合による自然法則の抽出mns.k.u-tokyo.ac.jp/~sparse2017/pdf/9.pdf · 物理モデリングとスパースモデリングの融合による自然法則の抽出

Observation

variables

Hidden variables

System model

Observation

model

(a) (b)Neural system Calcium imaging data

Observation

Bayesian

Estimation

Characteristic of

individual neuronsNetwork structure

Parameter Distribution

of and

Time

Neuron 1

Time

Neuron 2

Figure 7: (a)イメージングデータからのネットワークダイナミクス推定の枠組み.複数細胞から計測されるイメージングデータからネットワーク構造 θ1 と個々の細胞特性 θ2 の同時推定を行う.(b)状態空間モデル.膜電位 vt とカルシウム濃度 xt を隠れ変数とし,蛍光度 yt を観測値とする.

ここで,Σy は yt の分散である.以上のように導出した状態空間モデルを用いることで,逐次モンテカルロ法により,隠れ変数 z1:T を推

定する方法を構成する.時刻 tにおける隠れ状態 zt は,同時刻 tにおける観測値 y1:t を用いて次式のように推定される.

p(zt|y1:t) =p(yt|zt)p(zt|y1:t−1)∫p(yt|zt)p(zt|y1:t−1)dzt

(11)

ここで,p(zt|y1:t−1)は,予測分布であり,ベイズの定理を用いて次式のように導かれる.

p(zt|y1:t−1) =

∫p(zt|zt−1)p(zt−1|y1:t−1)dzt−1 (12)

システムモデルと観測モデルをこれらの 2つの更新式に交互に適用し,逐次的な周辺化を行うことで,隠れ状態 z1:T の推定を実現する.本節では,パラメータΘと隠れ変数 z1:T を同時に推定するために,粒子マルコフモンテカルロ法を用

いた推定法を提案する.逐次モンテカルロ法とマルコフ連鎖モンテカルロ法を融合することにより,局所最大が存在する場合でも,精緻な推定を実現する方法を実現する.ステップ kにおけるサンプルΘk,zk

1:T

を得るために,まず,提案分布からパラメータの候補Θ∗ を生成する.

Θ∗ ∼ q(Θ|Θk−1) (13)

ここで,Θk−1は直近のステップ k − 1で採択されたパラメータ値である.次に,逐次モンテカルロ法を用いて,隠れ変数 z∗

1:T を生成すると同時に,全時刻にわたる周辺化を行うことで,周辺尤度 p(y1:T |Θ∗)を

求める.この周辺尤度 p(y1:T |Θ∗)に基づいて,次に示す確率 rで,生成されたパラメータΘ∗と隠れ変数

z∗1:T をステップ kにおける採択値Θk = Θ∗,zk

1:T = z∗1:T とする.

r = min

[1,

p(y1:T |Θ∗)p(Θ∗)q(Θk−1|Θ∗)

p(y1:T |Θk−1)p(Θk−1)q(Θ∗|Θk−1)

](14)

上記の手順を繰り返すことにより,パラメータΘと隠れ変数 z1:T の分布推定を行う.提案法の有効性を検証するために,数値実験データを用いた推定を行う.蛍光度 y1:T のみが観測される

ものとして,隠れ状態 z1:T を推定するとともに,各ニューロン素子のパラメータ θ1 とネットワーク結合を定める最大コンダクタンスのパラメータ θ2を同時に推定した結果を示す.例として,一部のニューロンの応答やネットワーク結合の推定結果を示している.FIg. 8(a)において,膜電位 vtが正確に推定されており,神経細胞特有の非線形応答としてのスパイクが正しく再現されている.さらに,カルシウム濃度 xtの時間変化も正しく推定されていることがわかる.次に,各ニューロン素子のパラメータΘ1とネットワーク結合を定める最大コンダクタンスのパラメータΘ2 の推定結果を,それぞれ,Fig. 8(b),(c)に示す.真値(赤線)の値付近にピークをもつパラメータの分布が推定されていることがわかる.以上の結果より,提案法によって,イメージングデータから,神経細胞各素子のダイナミクスとネットワーク結合が同時に推定可能であることが示された.

6

Page 7: 物理モデリングとスパースモデリングの融合による自然法則の抽出mns.k.u-tokyo.ac.jp/~sparse2017/pdf/9.pdf · 物理モデリングとスパースモデリングの融合による自然法則の抽出

time

(a) (b) (c)

Figure 8: イメージングデータからのネットワーク構造と神経素子の同時推定.(a)隠れ変数 (膜電位,カルシウム濃度)の推定結果.青線が推定値を示し,赤線は真値を示す.(b)(c)ネットワーク結合強度と神経細胞の応答特性の同時推定.赤線は真値を示す.

本節では,複数のニューロンから計測されるイメージングデータから神経ネットワーク構造と神経素子の応答特性の分布を同時推定する方法を提案した.逐次モンテカルロ法とマルコフ連鎖モンテカルロ法の融合により,神経回路ダイナミクスの推定が実現されることを示した.本手法は,多次元のネットワークダイナミクスの抽出という普遍的な問題に対する枠組みを与えるものであり,神経系に限らず,様々なイメージングデータに対する広範な応用が期待される.

2.2 スパースモデリングに基づく神経細胞ダイナミクスの抽出

神経細胞は,ナトリウムチャネル,カリウムチャネルなどのイオンチャネルを介した非線形膜電流により多彩な神経応答を示すことが知られている.しかしながら,多数の種類のイオンチャネルが存在しているため,計測データの背後にある非線形ダイナミクスを精緻に抽出することは困難である.従来の研究では,ニューロンの数理モデルを用いた大規模なシミュレーションにより,多数のイオンチャネルについて,最大コンダクタンスの値の組み合わせを網羅的にシミュレーションを行う研究がおこなわれているが,計算量が膨大となってしまうという問題点がある [17].本研究では,スパースモデリングを神経細胞ダイナミクスの推定に援用することで本質的にデータに含まれるイオンチャネルのみの抽出を実現する.神経細胞の膜電位ダイナミクスは,Hodgkin-Huxleyモデルを拡張した,コンダクタンスベースモデル

により記述される.

CdV

dt= −

∑Z

gZmMZ

Z hNZ

Z (V − EZ) + Iext(t) (15)

ここで,Zはイオンチャネルの種類を表す.C は膜容量を表し,gZは最大コンダクタンスを表す.MZ,NZ

は 0以上の整数であり,EX は反転電位,Iextは外部入力を示す.式 (15)におけるmZ,hZはイオンチャネルのダイナミクスを示すチャネル変数であり,次に示す非線形型の微分方程式に従う.

dmZ

dt= αmZ(V )(1−mZ)− βmZ(V )mZ (16)

dhZ

dt= αhZ(V )(1− hZ)− βhZ(V )hZ (17)

ここで,αmZ(V )と βmZ

(V )は V の関数である.式 (15)に示すように,コンダクタンスベースモデルは,非線形ダイナミクスを実現するチャネル変数か

らなる膜電流の線形和を有する.このことに注目し,Fig. 9(a)に示すように,最大コンダクタンス gX にスパース性を導入することで,神経細胞の非線形ダイナミクスの抽出を実現する.

E =

T∑t=1

(CVt+1 − Vt

∆+∑Z

gZmMZ

Z,t hNZ

Z,t (Vt − EX)− Iext

)2

+ λ∑Z

|gZ| (18)

ここで,第 1項はコンダクタンスベースモデルが満たすべき微分方程式を離散化したことにより得られる項であり,第 2項は L1ノルム正則化を示す.λは正則化定数である.

7

Page 8: 物理モデリングとスパースモデリングの融合による自然法則の抽出mns.k.u-tokyo.ac.jp/~sparse2017/pdf/9.pdf · 物理モデリングとスパースモデリングの融合による自然法則の抽出

(a) (b)

candidate ion channels

Figure 9: (a)スパースモデリングに基づく神経細胞ダイナミクスの推定の枠組み.種々のイオン電流の線形和に注目することにより,最大コンダクタンス gZ のスパース推定を行う.(b)神経細胞ダイナミクスの推定結果.横軸はイオンチャネルの候補の種類,縦軸は最大コンダクタンスの値を示す.提案法では,20個のイオンチャネルの候補のうち,真のモデルが有する 2つのイオンチャネルのみが抽出されている.

提案法であるスパースモデリングに基づく神経細胞ダイナミクスを用いた推定結果を示す.真のイオンチャネルは 2種類であるとして数値実験データを生成し,この膜電位データのみを用いて,20種類のイオンチャネルの候補から最大コンダクタンスのスパース推定を行う.Fig. 9(b)は推定された最大コンダクタンスの値を示している.Fig. 9より,従来法では,実際には存在しないイオンチャネルについても非ゼロのコンダクタンスが推定されているのに対し,提案法では,真の数理モデルで非ゼロとなるイオンチャネルにおいてのみ非ゼロとなり,コンダクタンスの値がより正確に推定されていることがわかる.本節では,神経細胞から計測される時系列データから神経細胞の非線形ダイナミクスを抽出する方法を

提案した.イオンチャネルとして多数の候補が存在する状況において,スパースモデリングを導入することにより,データの背後にある非線形イオン電流のみを抽出することができることを示した.本節で提案した枠組みは,動的システムにおける様々な非線形項の候補が存在する場合に,本質的な因子を抽出する上で有効と考えられるため,非線形ダイナミクスのモデリング全般に対して,広く有効であると考えられる.

3 岩石–水相互作用を支配する反応ダイナミクス 課題 3

実験・計測データに基づいて,その背後にあるダイナミクスを推定することは,自然科学において最も重要な課題の一つである.特に,生物分野や地学分野では,多くの場合,システムの支配方程式が必ずしも明確ではなく,対象のシステムの複雑さに比して,一部の観測データのみが与えられる状況が多い.したがって,限られた実験・観測データからデータ駆動で支配方程式を推定する方法の確立が求められている.ここでは,生物分野や地学分野の代表例として,脳科学と地球科学に注目し,スパースモデリングやベイズ推論に基づいたダイナミクス抽出技術の研究を推進してきた [10, 19].本節では,地球科学班 (A02-1)と共同で研究開発を進めている,岩石―水相互作用を支配する不均質反応ダイナミクスに対するベイズ推論に基づいた推定アルゴリズムについて紹介する [19].

3.1 岩石–水相互作用を支配する不均質反応ダイナミクスの物理モデリング

岩石—水相互作用は,地球表層近傍における岩石形成のダイナミクスを理解する上で重要な相互作用である [20].すなわち,地球表層近傍における熱水や地下水などは,流れとともに鉱物の溶解と析出によってその組成を変化させる.このような岩石–水相互作用の理解は,鉱床や地熱地帯の開発,放射性廃棄物の地層処分,地下水などの汚染,二酸化炭素の地中貯留など地圏環境を利用しようとする上で重要である.しかしながら,実験室とフィールドとで,得られる反応速度定数が数桁も異なる結果がしばしば生じている.したがって,岩石—水相互作用を代表とする固相と液相が混在する不均質反応が従う非線形ダイナミクスを精緻に推定するためのデータ駆動的なアプローチの確立が重要である.ここで議論する不均質反応ダイナミクスとして,反応物(固相,モル数 n(r))が溶解して,中間物(液

相,モル濃度 C(i))となり,中間物が析出することで生成物(固相,モル数 n(p))が得られる逐次反応 (反応物 n(r)⇒中間物 C(i)⇒生成物 n(p))を考える.反応物,中間物,生成物のうち,雑音が重畳された中間物yのみが時間的にまばらに観測される状況を想定し,反応物.中間物,生成物の時間変化とその背後にある不均質ダイナミクスの反応定数 {kr,kp}を同時推定するベイズ推論に基づくアルゴリズムを構成する.本節で扱うベイズ推論は,順過程の確率モデルを定式化することで,推論に必要な逆過程が従う確率で

ある事後確率を与える枠組みである.まず,真のシステムが従うべき順過程の時間発展ダイナミクスの確率モデルであるシステムモデルを導出する.固相と液相の間の反応が表面積に依存するものとして,反応物

8

Page 9: 物理モデリングとスパースモデリングの融合による自然法則の抽出mns.k.u-tokyo.ac.jp/~sparse2017/pdf/9.pdf · 物理モデリングとスパースモデリングの融合による自然法則の抽出

Figure 10: 観測データからの不均質反応ダイナミクスの推定.(a)反応物 n(r)t ,中間物 C

(i)t ,生成物 n

(p)t の

推定結果.実線は推定値,破線は真値を示す.(b)(c):反応定数 kr,kp の推定結果.破線は真値を示す.

n(r) と生成物 n(p) が次に示す 1次反応に従うとする.

dn(r)

dt′= krSr(n

(r))(C(i) − Cr,eq) + ξr(t′), (19)

dn(p)

dt′= kpSp(n

(p))(C(i) − Cp,eq) + ξp(t′), (20)

n(r) + vC(i) + n(p) = const. (21)

ここで,t′ は時刻を示す.kr と kp は不均質反応を支配する反応定数であり,Sr(n(r)),Sp(n

(p)) は,それぞれ,反応物,生成物の表面積である.表面積のモデルとしては,鉱物粒子の幾何学的な形を維持してモル数に依存して変化するモデルやモル数に依存しないモデルが提案されており,一般に,Sr(n

(r)) ∝(n(r)

)αr,Sp(n

(p)) ∝(n(p)

)αp と表される.非線形ダイナミクスに従う場合を取り扱う.ξr と ξp は雑音項を示し,Cr,eq,Cp,eqは平衡濃度,vは溶液の体積を示す.前節と同様に時間に関して離散化を行い,時間発展に関する順過程の確立モデルをと観測過程の確立モデルを決めると,時々刻々の状態変数の推定が可能となる.観測データが与えられない時刻では予測分布のみを構成することにより推定を行なう.具体的には,EMアルゴリズムを用いた推定法を構成し,状態変数の推定とハイパーパラメータ推定を交互に行う [19].提案アルゴリズムにより推定された状態変数の時間変化を Fig. 10(a))に示す.ここで,観測データ yt

としては,数値実験データ(観測点数Nobs = 31,観測ノイズ強度 σy = 10−2)を用いた.Fig. 10(a)において,各隠れ変数の推定値(実線)は,真値(破線)をよく再現しており,直接的に観測される中間物 C

(i)t

のみならず,反応物 n(r)t ,生成物 n

(p)t をも精緻に推定していることが示される.また,Fig. 10(b)と (c)に

示す通り,推定アルゴリズムの反復が進むにつれて,反応定数 kr,kpも真値 (破線)に近づいていることがわかる.また,観測ノイズ強度 σy を変化させた場合には,真値への近づくまでのステップ数が変動するものの,最終的に真値に近い値が得られている.したがって,提案法により,部分的に観測される雑音が重畳された観測データから,不均質反応ダイナミクスを支配する反応定数が推定可能であることが示される.

3.2 反応拡散方程式への展開

これまでの議論では,反応過程のみを考慮してきた.しかしながら,岩石形成ダイナミクスを代表とする不均質反応では,反応課程のみならず,拡散過程も重要となる [19].本節では,不均質反応の時空間ダイナミクスを推定する方法を提案する [18].これまでの議論に対して,空間点 xを考慮すると,場所 xにおける中間物 Ci

x は,次式の微分方程式に従う.

dCix

dt= −krS

rx(C

ix − Cr,eq)− kpS

px(C

ix − Cp,eq)−D(2Ci

x − Cix−1 − Ci

x+1) + ξix (22)

ここで,kr,kpは反応定数であり,Dは拡散定数である.一方,反応物Nrx と生成物Np

x は式 (??)と xに依存して Ci と結合した式 (19)と (20)に従う.これらの不均質反応時空間ダイナミクスに基づいて状態空間モデルを構成する.Fig. 11に示すように,空間的な移動は中間物のみに生じる.逐次モンテカルロ法と EMアルゴリズムを融合することにより,不均質反応ダイナミクスを定める反応

定数 kr,kp と拡散定数Dを推定した結果を,Fig. 12に示す.全空間点が観測できる場合に,反応定数と拡散定数が正確に推定できることが確認できる.さらに,1地点おきや 2地点おきの計測の場合でも精緻に

9

Page 10: 物理モデリングとスパースモデリングの融合による自然法則の抽出mns.k.u-tokyo.ac.jp/~sparse2017/pdf/9.pdf · 物理モデリングとスパースモデリングの融合による自然法則の抽出

1,ty

1,

r

tN

1,

p

tN

1,

i

tC

2,

r

tN

2,

i

tC

2,

p

tN

Space (index x)

Observed

Data3,ty

,

r

x tN

,

i

x tC

,

p

x tN

,x ty

Hidden

Variables

Figure 11: 不均質反応時空間ダイナミクスの状態空間モデル.

step

rk

pk

True

step

Every Points

Every Other Points

Every Two Points

D

step

Figure 12: 不均質反応時空間ダイナミクスを支配する反応定数 kr,kpと拡散定数Dの推定結果.

推定されていることから,提案アルゴリズムは非均質反応の時空間ダイナミクス抽出に有効であることが示される.本節では,不均質反応ダイナミクスの推定を実現するためのベイズ推論に基づいたアルゴリズムを紹介

した.本節で示したように,ベイズ推論に基づくダイナミクス抽出アルゴリズムは,不均質反応を含む様々なシステムの物理モデリングを行う上で有効であり,時間方向のみならず空間方向をも考慮した反応輸送方程式に対する推定アルゴリズムの構築や表面積モデルのモデル選択法の構築できている.

References

[1] Binnig, Rohrer, Gerber and Weibel: Phys. Rev. Lett., Vol. 50, 120 (1983).

[2] Tipping: J. Machine Learn. Res., Vol. 1, 211 (2001).

[3] Tibshirani: J. Royal. Stat. Soc. Ser. B, Vol. 58, 267 (1996).

[4] Beck and Teboulle: SIAM J. Imaging Sci., Vol. 2, 183 (2009).

[5] Obuchi and Kabashima: J. Stat. Mech.: Theory and Experiment, Vol. 2016, 053304 (2016).

[6] Miyama and Hukushima, arXiv:1703.08643 (2017).

[7] Nakanishi-Ohno, Haze, Yoshida, Hukushima, Hasegawa and Okada: J. Phys. Soc. Jpn., Vol. 85, 093702 (2016).

[8] Hasegawa and Avouris: Phys. Rev. Lett., Vol. 71, 1071 (1993).

[9] Crommie, Lutz and Eigler: Nature, Vol. 363, 524 (1993).

[10] Omori and Hukushima: J. Phys. Conf. Ser., Vol. 699, 012011 (2016).

[11] 大森,ビッグデータの利活用と機械学習研究,電気学会誌,Vol. 133, 633 (2013).

[12] Yotsukura, Omori, Nagata and Okada: IPSJ Transaction on Mathematical Modeling and Its Applications,Vol. 7, 52 (2014).

[13] 大森,回帰問題への機械学習的アプローチ~スパース性に基づく回帰モデリング~,システム制御情報学会誌,Vol.59, 151-156 (2015).

[14] Omori and Hukushima: Journal of Physics: Conference Series, Vol. 699, pp. 012011-1-8 (2016).

[15] Inoue and Omori, ACM International Conference Proceedings Series, ISMSI, pp. 68-73 (2017)

[16] 大塚,大森, スパースモデリングによる神経細胞ダイナミクスの推定, システム制御情報学会研究発表講演会講演論文集,pp. 61-1–61-5 (2017)

[17] Prinz, Bucher and Marder, Nature Neuroscience, Vol. 7, pp. 1345-1352 (2004).

[18] Omori, Morimoto, Kuwatani, Okamoto and Hukushima: JpGU-AGU Joint Meeting, MGI29-09 (2017).

[19] Omori, Kuwatani, Okamoto and Hukushima: Phys. Rev. E, Vol. 94, 033305 (2016).

[20] Lasaga: Kinetic Theory in the Earth Science, Princeton University Press (1998).

[21] Doucet, Freitas and Gordon: Sequential Monte Carlo Methods in Practice, Springer-Verlag (2001).

10