prml last yokkuns

36
パターン認識と機械学習(PRML13.3 13.3.3 線形動的システム @yokkuns 洋平 PRML 最終回 2010/09/11 @yokkuns 洋平 (PRML 最終回) パターン認識と機械学習(PRML13.3 13.3.3 2010/09/11 1 / 36

Upload: yohei-sato

Post on 31-May-2015

1.399 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Prml last yokkuns

.

.

. ..

.

.

パターン認識と機械学習(PRML)13.3~ 13.3.3線形動的システム

@yokkuns里 洋平

PRML 最終回

2010/09/11

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 1 / 36

Page 2: Prml last yokkuns

範囲

パターン認識と機械学習

(PRML)の 13.3~13.3.3

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 2 / 36

Page 3: Prml last yokkuns

AGENDA

自己紹介

線形動的システム(Linear Dynamical System)LDSにおける推論LDSの学習LDSの拡張

最後に

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 3 / 36

Page 4: Prml last yokkuns

AGENDA

自己紹介

線形動的システム(Linear Dynamical System)LDSにおける推論LDSの学習LDSの拡張

最後に

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 4 / 36

Page 5: Prml last yokkuns

自己紹介

ID : yokkuns名前 : 里 洋平

職業 : Webエンジニア

http://twitter.com/yokkuns

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 5 / 36

Page 6: Prml last yokkuns

自己紹介 -主催してる勉強会 1

R勉強会@東京(Tokyo.R)是非ご参加下さい!

http://groups.google.co.jp/group/r-study-tokyo

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 6 / 36

Page 7: Prml last yokkuns

自己紹介 -主催してる勉強会 2

数式ニヤニヤ勉強会

PRMLの皆さんは数式が大好きかと思うので是非!

http://groups.google.co.jp/group/grinning-math

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 7 / 36

Page 8: Prml last yokkuns

自己紹介 -今月の発表予定

2010.09.11 RPML最終回パターン認識と機械学習(PRML)

13.3~ 13.3.3線形動的システム

2010.09.19第 9回R勉強会@東京(Tokyo.R#09)

Rによるデータサイエンス第 II部第 4章多次元尺度法

2010.09.25第 7回データマイニング +WEB勉強会@東京(Tokyo.Webmining#7)

初めてでも分かるヘッジファンド入門

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 8 / 36

Page 9: Prml last yokkuns

自己紹介 -今月の発表予定

2010.09.11 RPML最終回パターン認識と機械学習(PRML)

13.3~ 13.3.3線形動的システム

2010.09.19第 9回R勉強会@東京(Tokyo.R#09)

Rによるデータサイエンス第 II部第 4章多次元尺度法

2010.09.25第 7回データマイニング +WEB勉強会@東京(Tokyo.Webmining#7)

初めてでも分かるヘッジファンド入門

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 9 / 36

Page 10: Prml last yokkuns

AGENDA

自己紹介

線形動的システム(Linear Dynamical System)LDSにおける推論LDSの学習LDSの拡張

最後に

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 10 / 36

Page 11: Prml last yokkuns

システムとは

システム

入力があり、何らかの因果関係を保ちながら出力を行うもの

静的システム

ある時刻での出力がその時刻の入力だけに依存するシステム

動的システム

ある時刻の入力、及び過去の入力や現象が始まったときの内部状態に

依存するシステム

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 11 / 36

Page 12: Prml last yokkuns

隠れマルコフモデルと線形動的システム

隠れマルコフモデル

混合モデルを拡張し、連続した観測地の間の相関をゆるしたもの

潜在変数は離散変数

線形動的システム

確率的 PCAや因子分析のような、連続潜在変数モデルの一般化潜在変数は連続変数でガウス分布

潜在変数が離散、連続である点以外は同じ

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 12 / 36

Page 13: Prml last yokkuns

線形動的システムの確率モデル

遷移確率分布と出力確率分布、最初の潜在変数は、

以下の一般的な形に書くことが出来る

p(zn|zn−1) = N(zn|Azn−1, γ)

p(xn|zn) = N(xn|Czn, σ)

p(z1) = N(z1|µ0, P0)

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 13 / 36

Page 14: Prml last yokkuns

線形動的システム -線形方程式を用いた表記

以下のような線形方程式を用いて表されることが多い

zn = Azn−1 + wn

xn = Czn + vn

z1 = µ0 + u

ここで、ノイズ項は以下の分布をもつ

w ∼ N(x|0, Γ)

v ∼ N(v|0,Σ)

u ∼ N(u|0,V0)

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 14 / 36

Page 15: Prml last yokkuns

カルマンフィルタ

状態推定の問題は、すべて観測データ x1:nが与えられたものとで、

状態 znの条件付分布を求めることに帰着

システムノイズ、観測ノイズ、初期状態が全てガウス分布に従うと

仮定してるので、得られた状態 znの条件付分布もガウス分布になる

平均と分散共分散行列だけ求めればよい

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 15 / 36

Page 16: Prml last yokkuns

カルマンフィルタ

状態空間モデルでは、逐次的なアルゴリズムによって、

状態 znの条件付周辺分布を効率的に求めることが出来る

カルマンフィルタ方程式

フォワード再帰

隠れマルコフモデルの αメッセージと類似

カルマンスムーザ方程式

バックワード再帰

隠れマルコフモデルの βメッセージと類似

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 16 / 36

Page 17: Prml last yokkuns

AGENDA

自己紹介

線形動的システム(Linear Dynamical System)LDSにおける推論LDSの学習LDSの拡張

最後に

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 17 / 36

Page 18: Prml last yokkuns

推定と予測、フィルタ、スムージング

推定

システムの状態を見積もること

現在、過去、未来のいずれについても出来る

予測

現在までの情報に基づき、未来の状態を推定すること

フィルタ

現在の情報に基づき、現在の状態を推定すること

スムージング

現在までの情報に基づき、過去の状態を推定すること

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 18 / 36

Page 19: Prml last yokkuns

カルマンフィルタ方程式(フォワード再帰)

p(zn|x1, ..., xn)に対応する正規化された周辺分布をメッセージとして伝播する

α̂(zn) = N(zn|µn,Vn)

フォワード再帰式は、(13.59)より

cnα̂(zn) = p(xn|zn)∫α̂(zn−1)p(zn|zn−1)dzn−1

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 19 / 36

Page 20: Prml last yokkuns

カルマンフィルタ方程式(フォワード再帰)

(13.75)、(13.76)を代入し

cnN(zn|µn,Vn) = N(xn|Czn,Σ)∫N(zn|Azn−1, Γ)N(zn−1|µn−1,Vn−1)dzn−1

積分部分は、(2.115)の結果を利用することで簡単に計算出来る

∫N(zn|Azn−1, Γ)N(zn−1|µn−1,Vn−1)dzn−1 = N(zn|Aµn−1, AVn−1 AT + Γ)

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 20 / 36

Page 21: Prml last yokkuns

カルマンフィルタ方程式(フォワード再帰)

(2.115)、(2.116)を用いることで周辺分布の平均と共分散が以下のように求まる(ただし、Pn−1 = AVn−1 AT + Γ)

µn = Aµn−1 + Kn(xn − CAµn−1)

Vn = (I − KnC)Pn−1

ここで、カルマンゲインを以下のように定義

Kn = Pn−1CT(CPn−1CT + Σ)−1

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 21 / 36

Page 22: Prml last yokkuns

カルマンフィルタ方程式の解釈

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 22 / 36

Page 23: Prml last yokkuns

カルマンスムーザ方程式(バックワード再帰)

ここからは、スムージングについて考える

LDSの文献では、バックワード再帰を定式化するのに、β̂(zn)ではなく、γ(zn) = α̂(zn)β̂(zn)を用いるのが普通

γ(zn)はガウス分布でなければならないので、以下の形式で書ける

γ(zn) = N(zn|µ̂n, V̂n)

バックワード再帰は、連続潜在変数の場合には、以下の形で書ける

cn+1β̂(zn) =∫β̂(zn+1)p(xn+1|zn+1)p(zn+1|zn)dzn+1

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 23 / 36

Page 24: Prml last yokkuns

カルマンスムーザ方程式(バックワード再帰)

µ̂n, V̂nは、以下のようにもとめられる。(ただし Jn = Vn AT(Pn)−1)

µ̂n = µn + Jn(µ̂n+1 − Aµn)

V̂n = Vn + Jn(V̂n+1 − Pn)JTn

これらの再帰式では、µnと Vnの量が後ろ向きパスで用いられるために

前向きパスの計算がまず最初に終了している必要があることにする

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 24 / 36

Page 25: Prml last yokkuns

事後周辺分布

EMアルゴリズムのために 2つ組の事後周辺分布が必要(13.65)から以下の形で求められる

ζ(zn−1, zn) = (cn)−1α̂(zn−1)p(xn|zn)p(zn|zn−1)β̂(zn)

=N(zn−1|µn−1,Vn−1)N(zn|Azn−1, Γ)N(xn|Czn,Σ)N(zn|µ̂n, V̂n)

cnα̂(zn)

(13.84) を用いて α̂(zn) を置き換え、順序を入れ替えることにより、 ζ(zn−1, zn) が平均が[µ̂n−1, µ̂n]T で与えられるガウス分布に従うことが分かる。

また、zn と zn−1 の共分散は以下の形で与えられる

cov[zn−1, zn] = Jn−1V̂n

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 25 / 36

Page 26: Prml last yokkuns

AGENDA

自己紹介

線形動的システム(Linear Dynamical System)LDSにおける推論LDSの学習LDSの拡張

最後に

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 26 / 36

Page 27: Prml last yokkuns

LDSの学習 -最尤推定

モデルパラメータ θ = {A, Γ,C,Σ, µ0,V0}は、EMアルゴリズムによる最尤推定で決定することが出来る

あるサイクルにおいて推定されたパラメータの値を θold とする

これらのパラメータ値に対し、潜在変数 p(Z|X, θold) の事後分布を決定するための推論アルゴリズムを実行することが出来る

特に、以下の期待値が必要となる。(ここで (13.104) を用いた)

E[zn] = µ̂n

E[znzTn−1

] = Jn−1V̂n + µ̂nµ̂Tn−1

E[znzTn] = V̂n + µ̂nµ̂

Tn

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 27 / 36

Page 28: Prml last yokkuns

LDSの学習 -最尤推定

完全データの対数尤度関数は、(13.6)の対数をとることで以下のように表される

ln p(X, Z|θ) = ln p(z1|µ0,V0) +N∑

n=2

ln p(zn|zn−1, A, Γ)

+

N∑n=1

ln p(xn|zn,C,Σ)

事後分布 p(Z|X, θold)について完全データ尤度関数の期待値を取る

Q(θ, θold) = EZ|θold [ln p(X, Z|θ)]

この関数を各パラメータ θ = {A, Γ,C,Σ, µ0,V0}に関して最大化する

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 28 / 36

Page 29: Prml last yokkuns

LDSの学習 -最尤推定

各パラメータの更新式は以下のようになる

µnew0

= E[z1]

Vnew0

= E[z1 zT1

] − E[z1]E[z1T]

Anew =

N∑n=2

E[znzTn−1

]

N∑

n=2

E[zn−1 zTn]

−1

Γnew =1

N − 1

N∑n=2

{E[znzT

n] − Anew E[zn−1 zTn]

−E[znzTn−1

](Anew)T + Anew E[zn−1 zTn−1

](Anew)T}

Cnew =

N∑n=1

xnE[zTn]

N∑

n=1

E[znzTn]

−1

Σnew =1N

N∑n=1

{xnxT

n − (Cnew)T E[zn]xTn

−xnE[zTn]Cnew + (Cnew)T E[znzT

n]Cnew}

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 29 / 36

Page 30: Prml last yokkuns

AGENDA

自己紹介

線形動的システム(Linear Dynamical System)LDSにおける推論LDSの学習LDSの拡張

最後に

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 30 / 36

Page 31: Prml last yokkuns

拡張カルマンフィルタ

カルマンフィルタを状態方程式が非線形でも良いように拡張したもの

予測分布の平均の付近を線形化することにより、ガウス分布近似を行う

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 31 / 36

Page 32: Prml last yokkuns

スイッチング状態空間モデル

1つの隠れマルコフモデルと、線形動的システムの集合との組み合わせ

各時刻ステップの出力において、離散潜在変数の状態がスイッチと

して用いられ、確率的に 1つの連続潜在変数の鎖が選ばれ、対応する条件付き出力分布から観測変数が出力される。

変分方を用いることにより、効率的な推論スキームが得られる

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 32 / 36

Page 33: Prml last yokkuns

AGENDA

自己紹介

線形動的システム(Linear Dynamical System)LDSにおける推論LDSの学習LDSの拡張

最後に

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 33 / 36

Page 34: Prml last yokkuns

最後に

9/19(日)に第 9回 R勉強会@東京を開催します!まだ、発表者も募集してるので、是非!!

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 34 / 36

Page 35: Prml last yokkuns

AGENDA

自己紹介

線形動的システム(Linear Dynamical System)LDSにおける推論LDSの学習LDSの拡張

最後に

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 35 / 36

Page 36: Prml last yokkuns

ご清聴ありがとうございました

@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 36 / 36