化学系・生物系の計算モデル -...

Post on 22-May-2020

2 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

化学系・生物系の計算モデル

計算モデルの研究(萩谷研究室)

計算モデル 論理 人工物

安心・安全

自然現象

あやしい あぶない

解析 設計

検証 抽出

分子・量子 生物

λ計算 並行計算 グラフ書換

生物に触発された計算 自然計算 分子計算 量子計算

ソフトウェア プロトコル

DNAロボット 暗号プロトコル

最近の研究プロジェクト ・ 分散処理ミドルウェアの検証(モデル検査)(産総研・情報学研究所との共同研究) ・ 分子ロボティクス・合成生物学およびそのための計算モデル・情報環境(川又) ・ 量子(鍵配送・投票)プロトコルの検証(角谷・久保田)

DNAシステムの グラフ書き換えモデル

DNAシステムのモデル

• DNAの立体構造 --- 二本鎖の螺旋構造 – 第一原理計算(量子化学) – 分子動力学

第一原理計算(量子化学)

http://www.advancesoft.jp/service/analysis/analysis_02.html

分子動力学

http://ambermd.org/tutorials/basic/tutorial1/

DNAシステムのモデル

• DNAの立体構造 --- 二本鎖の螺旋構造 – 第一原理計算(量子化学) – 分子動力学

• DNAの二次構造 – どのベースとどのベースがつながっているか – ヘアピンなどの様々なループ構造

• まとまったセグメント単位の二次構造 – グラフ – 多くのDNAシステムはこのレベルでモデル化可能

水素結合 ハイブリダイゼーション

ATACCAACAATAGTAACAGAC

TTGTTATCATTGTCTG

c b a d

B C D

c d

グラフ=分子

c b a d

B C D

c d ノード(節・頂点)

エッジ(辺)

エッジ(矢)

ATACCAACAATAGTAACAGAC

TTGTTATCATTGTCTG

c b a d

B C D

c d

ATACCAACAATAGTAACAGAC

TTGTTATCATTGTCTG

c b a d

B C D

c d

ATACCAACAATAGTAACAGAC

TTGTTATCATTGTCTG

AGTAACAGAC

c b a d

B C D

c d

グラフの書き換え

c b a d

B C D

c d

グラフの書き換え

c b a d

B C D

c d

グラフの書き換え

c b a d

B C D

c d

グラフ書き換え規則

y

x

X Y

y

y

x

X Y

y

三種類の反応

c A

C

A

c a

C A

a A

• Hybridization • Denaturation • Branch migration

c A

C

A

c a

C A

a A

• Hybridization • Denaturation • Branch migration

三種類の反応

c A

C

A

c a

C A

a A

• Hybridization • Denaturation • Branch migration

三種類の反応

三種類の反応

c A

C

A

c a

C A

a A

• Hybridization • Denaturation • Branch migration

c A

C

A

c a

C A

a A

• Hybridization • Denaturation • Branch migration

三種類の反応

c a A

C A

A

c a

C A

• Hybridization • Denaturation • Branch migration

三種類の反応

Branch Migration

y

x

X Y

y

y

x

X Y

y

Hybridization

x

X

x

X

Hybridization

x

X Y

y

x

X Y

y

Denaturation

x

X

x

X

マルチセット書き換え

化学反応のモデル

• 濃度大 – 連続濃度に対する微分方程式

• 少分子 – マルチセット書き換え系

• マルチセットの要素=分子=グラフ – 確率マルチセット書き換え系

• 確率微分方程式(マスター方程式)

連続濃度に対する微分方程式

22

21 2 RGkBRk

dtdG

−=

1k

2k

マルチセット書き換え系

確率的マルチセット書き換え系

propensity 11

423

c

222

12

c

1c

2c

マスター方程式

rrggbbbrggggbbbrrrgbbbbrrggbbb pccpcpcdt

dp

+

+

= 2121 2

212

13

22

24

11

14

23

確率的マルチセット書き換え系

propensity11

423

c

222

12

c

1c

2c解析的に 調べるのは 一般に困難

Gillespie法とτ跳躍法

• 確率的シミュレーションの標準的手法 – 各々の書き換え規則(反応)は、 propensityに比例した確率で実行される – a0 をpropensityの和としたとき、 いずれかの規則が今から時間 t のうちに 実行される確率は 1−e−a0t

Gillespie法

今から時間 t の間に実行されない 確率を P(t) とすると、P(0) = 1 で、 dP(t) = −a0 P(t) dt

1

r

t

縦軸に 0 から 1 まで一様に乱数を生成すると、 1-r から 1 までに入る確率は r。これは、ちょうど、 時刻 t までに反応が起こる確率に等しい。

1−e−a0t

0

• 確率的シミュレーションの標準的手法 – 各々の書き換え規則(反応)は、 propensityに比例した確率で実行される – a0 をpropensityの和としたとき、 いずれかの規則が今から時間 t のうちに 実行される確率は 1−e−a0t

• Gillespie法の各ステップ – [0,1] の一様乱数 r から (1/a0)ln(1/r) によって 次の書き換えの時刻を決定 – 乱数を用いてpropensityに比例して規則を選択

Gillespie法

今から時間 t の間に実行されない 確率を P(t) とすると、P(0) = 1 で、 dP(t) = −a0 P(t) dt

1− e−a0t = 1−r

分子種 i の個数が Xi

τ跳躍法

• Gillespie法の効率化 • 分子数がある程度大きい場合、 数回の反応では分子数は大きく変化しない • 適当な時間間隔 τ の間に

propensityが a の反応が起こる回数 n は、

平均 aτ のPoisson分布に従う

• 遺伝子と制御タンパクのモデル

抑制された遺伝子

遺伝子

タンパク

0.1 1.0 0.0001 0.001

0.1 1.0 0.0001 0.001

0.1 1.0 0.0001 0.001

去年のレポート課題

B C

b

c a

A C

T1

T2

t2 B A t1 Input 2 Input 1

DNA Automaton

想定する反応

• 2分子(構造)の間の相補鎖のhybridization – 連続する相補鎖は一度に結合。 – Denaturationはなしとする。

• 1分子(構造)内のbranch migration

課題(ボトムライン)

• ストランド投入の順序が以下の場合について 生成される構造をすべて数え上げよ。

– 入力以外の混合 – Input1投入 – Input2投入

反応のパラメータ

• 2分子の相補鎖のhybridizationの速度: 0.1 – 連続する相補鎖は一度に結合。 – Denaturationはなしとする。

• 1分子内のbranch migrationの速度: 0.01 • 反応時間

– 入力以外のストランドを混合してから100単位時間 – Input1を投入してから100単位時間 – Input2を投入してから100単位時間

課題(オプション)

• 連続的シミュレーション – 各ストランドの初期濃度: 10.0単位濃度 – 刻み幅: 0.01くらいに設定。

• 確率的シミュレーション – 各ストランドは10個ずつ用意。 – 速度は単位時間あたりの反応確率を与える。

• 各分子(構造)の濃度・個数をプロット。 • 両者を比較すると面白い。

b

c a

A C

T1

T2

t2 B A t1 Input 2 Input 1

DNA Automaton

B C

B C

b

c a

A C

T1

T2

t2 B A t1 Input 2 Input 1

DNA Automaton

B C

b c a

A C

T1

T2

t2 B A t1 Input 2 Input 1

DNA Automaton

B C

b

c a

A C

T1

T2

t2 B A t1 Input 2 Input 1

DNA Automaton

B C

b c a

A C

T1

T2

t2 B A t1 Input 2 Input 1

DNA Automaton

B C

b

c a

A C

T1

T2

t2 B Input 2

DNA Automaton

A t1

B C

b

c a

A C

T1

T2

t2 B Input 2

DNA Automaton

A t1

B C

b c a

A C

T1

T2 A t1

DNA Automaton

t2 B Input 2

B C

b c a

A C

T1

T2 A t1

DNA Automaton

t2 B Input 2

B C

b

c a

A C

T1

T2

t2 B

A t1 Input 1

DNA Automaton

B C

b

c a

A C

T1

T2

t2 B

A t1 Input 1

DNA Automaton

B C

b c a

A C

T1

A t1 Input 1

DNA Automaton

T2

t2 B

B C

b c a

A C

T1

A t1 Input 1

DNA Automaton

T2

t2 B

B C

b

c a

A C

T1

T2

DNA Automaton

A t1

t2 B

B C

b

c a

A C

T1

T2

DNA Automaton

A t1

t2 B

B C

b

c a

A C

T1

T2

DNA Automaton

A t1

t2 B

B C

b

c a

A C

T1

T2

DNA Automaton

A t1

t2 B

B C

b c a

A C

T1

A t1

DNA Automaton

T2

t2 B

B C

b c a

A C

T1

A t1

DNA Automaton

T2

t2 B

B C

b c a

A C

T1

A t1

DNA Automaton

T2

t2 B

B C

b c a

A C

T1

A t1

DNA Automaton

T2

t2 B

今年の課題にしたい

• 連続的シミュレーション – 各ストランドの初期濃度: 10.0単位濃度 – 刻み幅: 0.01くらいに設定。

• 確率的シミュレーション – 各ストランドは10個ずつ用意。 – 速度は単位時間あたりの反応確率を与える。

• 各分子(構造)の濃度・個数をプロット。 • 両者を比較すると面白い。

反応のパラメータ

• 2分子の相補鎖のhybridizationの速度: 0.1 – 連続する相補鎖は一度に結合。 – Denaturationはなしとする。

• 1分子内のbranch migrationの速度: 0.01 • 反応時間

– 入力以外のストランドを混合してから100単位時間 – Input1を投入してから100単位時間 – Input2を投入してから100単位時間

DNA反応の速度

反応速度の推定

• Hybridization – 実測値

• およそ一定とみなす

• Denaturation – 二本鎖の自由エネルギーとhybridizationの速度から逆算する

• Branch migration – 実測値

• 配列(特に長さ)に依存

RTG

D

H ekkK

∆−

==

DNA(RNA)の二次構造 • ベースペア i.j の集合 • k-ループ --- k 個のベースペアで囲まれたループ

– 1-ループ • ヘアピン(hairpin)

– 2-ループ • スタック(stack) • バルジ(bulge) • 内部(interior)

– マルチ・ループ(multi-loop) • ループに対してエネルギーが割り当てられる。

ヘアピン スタック バルジ 内部

3-ループ

これらの構造にエネルギーを割り当てる。 (nearest neighborモデル)

a. ヘアピン b. 内部 c. バルジ d. マルチ e. スタック f. シュードノット

DNA二本鎖のエネルギーモデル

・ ・ ・ ・ ・ ・

・ ・ ・ ・ ・ ・

Base pair が交差する場合は考慮しない ( = 一本鎖における Pseudoknot free)

全体の ΔG を部分的な構造の ΔG の総和として計算する

5‘-

3‘-

- 3‘

- 5‘

インターナルループ [Zuker 03]

フリーエンド [Zuker 03]

使用するパラメータ

スタッキングペア [Tanaka 04]

バルジループ

一塩基バルジループ [Tanaka 04]

その他のバルジ [Zuker 03]

Nearest-Neighbor model (NN model)

π計算と確率π計算

並列・並行・分散 • 並列計算

– たくさんのプロセスがそれぞれのコンピュータ(CPU)の上で同時に計算する

• 並行計算 – 複数のプロセスが通信し合いながら、ひとまとまりの計算を行う

– 必ずしも並列計算を必要としない

×平行計算 • 分散計算

– たくさんのプロセスが物理的に分散して計算する

プロセス計算の蘊蓄

• プロセス計算の原点は化学抽象機械にある – 化学反応に触発された抽象的な計算体系 – 並列・並行・分散計算のモデル

• 以後、様々なプロセス計算が発展 – パイ計算・応用パイ計算・アンビエント計算・・・ – ネットワークプロトコルやウェブサービス – プロセス計算に基づくプログラミング言語

• 最近では生体内の化学反応にも応用 – 確率π計算・κ計算

Chemical Abstract Machine

π計算

• 並行計算のモデル • チャネルを通して通信し合うプロセス

– 各種の反応を表現することが可能 • 入れ子の構造

– 膜のモデル • プロセス間の等価性の理論が発展 • 非決定性に確率を付与 ⇒ 確率π計算

プロセスの定義

Gene(a,b) := τ.(Gene(a,b)|Protein(b)) + a.τ.Gene(a,b) Protein(b) := b.Protein(b) + τ.0

チョイス

並列合成

自発的遷移

チャネルaからの入力

チャネルbへの出力

自発的遷移

...|(… + τ.P + …)|... → ...|P|... ...|(τ.(Gene(a,b)|Protein(b)) + a.τ.Gene(a,b))|... → ...|Gene(a,b)|Protein(b)|… ...|(b.Protein(b) + τ.0)|... → ...|0|... ≡ ...|...

通信

...|(… + a.P + …)|(… + a.Q + …)|... → ...|P|Q|... • より一般的には ...|(… + a(x).P(x) + …)|(… + a(M).Q + …)|... → ...|P(M)|Q|...

通信

...|(… + a.P + …)|(… + a.Q + …)|... → ...|P|Q|... ...|(τ.(Gene(a,b)|Protein(b)) + a.τ.Gene(a,b)) |(a.Protein(a) + τ.0)|... → ...|τ.Gene(a,b)|Protein(a)|...

Gene(a,b)|Protein(a) ≡ (τ.(Gene(a,b)|Protein(b)) + a.τ.Gene(a,b))|(a.Protein(a) + τ.0) → τ.Gene(a,b)|Protein(a) → Gene(a,b)|Protein(a) ≡ (τ.(Gene(a,b)|Protein(b)) + a.τ.Gene(a,b))|(a.Protein(a) + τ.0) → (τ.(Gene(a,b)|Protein(b)) + a.τ.Gene(a,b))|0 ≡ (τ.(Gene(a,b)|Protein(b)) + a.τ.Gene(a,b)) → Gene(a,b)|Protein(b) ≡ (τ.(Gene(a,b)|Protein(b)) + a.τ.Gene(a,b))|(b.Protein(b) + τ.0) → Gene(a,b)|Protein(b)|(b.Protein(b) + τ.0)

確率π計算

Gene(a,b) := τt.(Gene(a,b)|Protein(b)) + a.τu.Gene(a,b) Protein(b) := b.Protein(b) + τd.0

チョイス

並列合成

自発的遷移

チャネルaからの入力

チャネルbへの出力

ρ(b)

チャネルbの速度

遅延 遅延

遅延

プロセスの例

• トグル・スイッチ Gene(a,b)|Gene(b,a)

• オシレータ Gene(a,b)|Gene(b,c)|Gene(c,a)

ρ(a) = ρ(b) = ρ(c) = 1.0 t = 0.1 d = 0.001 u = 0.0001

細胞のシミュレーション

細胞内における化学反応

• 転写 – 遺伝子 mRNA

• 翻訳 – mRNA タンパク – 制御タンパクは遺伝子の発現を制御

• 代謝 • シグナル伝達 • …

例:遺伝子回路によるトグル・スイッチ

u: λCI の濃度 v: LacR の濃度

• Tian et al., 2006

Hill係数

u: λCI の濃度 v: LacR の濃度

LacR の生成速度

λCI に依存 しない部分

λCI に依存する部分: λCI は三つまとまって LacR の転写を阻害して いると推測される。 3 は Hill係数という。

Hill係数

u: λCI の濃度 v: LacR の濃度

マイトマイシンに 依存しない部分

マイトマイシンCに 依存する部分: Hill係数は 1

λCI の分解速度

微分方程式を数値的に解くと…

パラメータ s の違い --- マイトマイシンCの濃度の違い

少分子系として…

• τ跳躍法の適用 – λCI と LacR の生成と分解の回数は Poisson分布に従う

Poisson分布の平均

propensityと解釈

確率的シミュレーション(τ跳躍法)

レポート課題

b c d

D C

初期構造

a

最初からくっ付いていると仮定している

B C

b c d

D C

入力

a

A D

Input 1 Input 2

課題 • 確率的シミュレーション

– 初期構造を10個用意。 – Input1とInput2 を10個ずつ同時に投入。 – 100単位時間の確率的シミュレーションを行う。

• 各分子(構造)の個数をプロットせよ。 • 反応のパラメータ

– 2分子の相補鎖のhybridizationの速度: 0.1 • Denaturationはなしとする。

– 1分子内のbranch migrationの速度: 0.01 – 速度は単位時間あたりの反応確率を与える。

反応のパラメータ

• 2分子の相補鎖のhybridizationの速度: 0.1 – Denaturationはなしとする。

• 1分子内のbranch migrationの速度: 0.01 • 速度は単位時間あたりの反応確率を与える。

B C

b c d

D C

構造例

a

A D

b c

d

D C

構造例

a

A D

b c

d

D C

構造例

a

A D B C

もう一つの課題

• 以上の反応系を、確率π計算を使ってモデル化せよ。

• 確率π計算のプロセスの定義を与える。 • プロセスの遷移が反応に対応していることを説明する。

〆切

• 7月末 • 情報科学科のレポート提出ボックスに

top related