prml last yokkuns
TRANSCRIPT
.
.
. ..
.
.
パターン認識と機械学習(PRML)13.3~ 13.3.3線形動的システム
@yokkuns里 洋平
PRML 最終回
2010/09/11
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 1 / 36
範囲
パターン認識と機械学習
(PRML)の 13.3~13.3.3
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 2 / 36
AGENDA
自己紹介
線形動的システム(Linear Dynamical System)LDSにおける推論LDSの学習LDSの拡張
最後に
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 3 / 36
AGENDA
自己紹介
線形動的システム(Linear Dynamical System)LDSにおける推論LDSの学習LDSの拡張
最後に
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 4 / 36
自己紹介
ID : yokkuns名前 : 里 洋平
職業 : Webエンジニア
http://twitter.com/yokkuns
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 5 / 36
自己紹介 -主催してる勉強会 1
R勉強会@東京(Tokyo.R)是非ご参加下さい!
http://groups.google.co.jp/group/r-study-tokyo
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 6 / 36
自己紹介 -主催してる勉強会 2
数式ニヤニヤ勉強会
PRMLの皆さんは数式が大好きかと思うので是非!
http://groups.google.co.jp/group/grinning-math
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 7 / 36
自己紹介 -今月の発表予定
2010.09.11 RPML最終回パターン認識と機械学習(PRML)
13.3~ 13.3.3線形動的システム
2010.09.19第 9回R勉強会@東京(Tokyo.R#09)
Rによるデータサイエンス第 II部第 4章多次元尺度法
2010.09.25第 7回データマイニング +WEB勉強会@東京(Tokyo.Webmining#7)
初めてでも分かるヘッジファンド入門
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 8 / 36
自己紹介 -今月の発表予定
2010.09.11 RPML最終回パターン認識と機械学習(PRML)
13.3~ 13.3.3線形動的システム
2010.09.19第 9回R勉強会@東京(Tokyo.R#09)
Rによるデータサイエンス第 II部第 4章多次元尺度法
2010.09.25第 7回データマイニング +WEB勉強会@東京(Tokyo.Webmining#7)
初めてでも分かるヘッジファンド入門
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 9 / 36
AGENDA
自己紹介
線形動的システム(Linear Dynamical System)LDSにおける推論LDSの学習LDSの拡張
最後に
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 10 / 36
システムとは
システム
入力があり、何らかの因果関係を保ちながら出力を行うもの
静的システム
ある時刻での出力がその時刻の入力だけに依存するシステム
動的システム
ある時刻の入力、及び過去の入力や現象が始まったときの内部状態に
依存するシステム
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 11 / 36
隠れマルコフモデルと線形動的システム
隠れマルコフモデル
混合モデルを拡張し、連続した観測地の間の相関をゆるしたもの
潜在変数は離散変数
線形動的システム
確率的 PCAや因子分析のような、連続潜在変数モデルの一般化潜在変数は連続変数でガウス分布
潜在変数が離散、連続である点以外は同じ
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 12 / 36
線形動的システムの確率モデル
遷移確率分布と出力確率分布、最初の潜在変数は、
以下の一般的な形に書くことが出来る
p(zn|zn−1) = N(zn|Azn−1, γ)
p(xn|zn) = N(xn|Czn, σ)
p(z1) = N(z1|µ0, P0)
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 13 / 36
線形動的システム -線形方程式を用いた表記
以下のような線形方程式を用いて表されることが多い
zn = Azn−1 + wn
xn = Czn + vn
z1 = µ0 + u
ここで、ノイズ項は以下の分布をもつ
w ∼ N(x|0, Γ)
v ∼ N(v|0,Σ)
u ∼ N(u|0,V0)
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 14 / 36
カルマンフィルタ
状態推定の問題は、すべて観測データ x1:nが与えられたものとで、
状態 znの条件付分布を求めることに帰着
システムノイズ、観測ノイズ、初期状態が全てガウス分布に従うと
仮定してるので、得られた状態 znの条件付分布もガウス分布になる
↓
平均と分散共分散行列だけ求めればよい
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 15 / 36
カルマンフィルタ
状態空間モデルでは、逐次的なアルゴリズムによって、
状態 znの条件付周辺分布を効率的に求めることが出来る
カルマンフィルタ方程式
フォワード再帰
隠れマルコフモデルの αメッセージと類似
カルマンスムーザ方程式
バックワード再帰
隠れマルコフモデルの βメッセージと類似
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 16 / 36
AGENDA
自己紹介
線形動的システム(Linear Dynamical System)LDSにおける推論LDSの学習LDSの拡張
最後に
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 17 / 36
推定と予測、フィルタ、スムージング
推定
システムの状態を見積もること
現在、過去、未来のいずれについても出来る
予測
現在までの情報に基づき、未来の状態を推定すること
フィルタ
現在の情報に基づき、現在の状態を推定すること
スムージング
現在までの情報に基づき、過去の状態を推定すること
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 18 / 36
カルマンフィルタ方程式(フォワード再帰)
p(zn|x1, ..., xn)に対応する正規化された周辺分布をメッセージとして伝播する
α̂(zn) = N(zn|µn,Vn)
フォワード再帰式は、(13.59)より
cnα̂(zn) = p(xn|zn)∫α̂(zn−1)p(zn|zn−1)dzn−1
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 19 / 36
カルマンフィルタ方程式(フォワード再帰)
(13.75)、(13.76)を代入し
cnN(zn|µn,Vn) = N(xn|Czn,Σ)∫N(zn|Azn−1, Γ)N(zn−1|µn−1,Vn−1)dzn−1
積分部分は、(2.115)の結果を利用することで簡単に計算出来る
∫N(zn|Azn−1, Γ)N(zn−1|µn−1,Vn−1)dzn−1 = N(zn|Aµn−1, AVn−1 AT + Γ)
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 20 / 36
カルマンフィルタ方程式(フォワード再帰)
(2.115)、(2.116)を用いることで周辺分布の平均と共分散が以下のように求まる(ただし、Pn−1 = AVn−1 AT + Γ)
µn = Aµn−1 + Kn(xn − CAµn−1)
Vn = (I − KnC)Pn−1
ここで、カルマンゲインを以下のように定義
Kn = Pn−1CT(CPn−1CT + Σ)−1
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 21 / 36
カルマンフィルタ方程式の解釈
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 22 / 36
カルマンスムーザ方程式(バックワード再帰)
ここからは、スムージングについて考える
LDSの文献では、バックワード再帰を定式化するのに、β̂(zn)ではなく、γ(zn) = α̂(zn)β̂(zn)を用いるのが普通
γ(zn)はガウス分布でなければならないので、以下の形式で書ける
γ(zn) = N(zn|µ̂n, V̂n)
バックワード再帰は、連続潜在変数の場合には、以下の形で書ける
cn+1β̂(zn) =∫β̂(zn+1)p(xn+1|zn+1)p(zn+1|zn)dzn+1
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 23 / 36
カルマンスムーザ方程式(バックワード再帰)
µ̂n, V̂nは、以下のようにもとめられる。(ただし Jn = Vn AT(Pn)−1)
µ̂n = µn + Jn(µ̂n+1 − Aµn)
V̂n = Vn + Jn(V̂n+1 − Pn)JTn
これらの再帰式では、µnと Vnの量が後ろ向きパスで用いられるために
前向きパスの計算がまず最初に終了している必要があることにする
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 24 / 36
事後周辺分布
EMアルゴリズムのために 2つ組の事後周辺分布が必要(13.65)から以下の形で求められる
ζ(zn−1, zn) = (cn)−1α̂(zn−1)p(xn|zn)p(zn|zn−1)β̂(zn)
=N(zn−1|µn−1,Vn−1)N(zn|Azn−1, Γ)N(xn|Czn,Σ)N(zn|µ̂n, V̂n)
cnα̂(zn)
(13.84) を用いて α̂(zn) を置き換え、順序を入れ替えることにより、 ζ(zn−1, zn) が平均が[µ̂n−1, µ̂n]T で与えられるガウス分布に従うことが分かる。
また、zn と zn−1 の共分散は以下の形で与えられる
cov[zn−1, zn] = Jn−1V̂n
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 25 / 36
AGENDA
自己紹介
線形動的システム(Linear Dynamical System)LDSにおける推論LDSの学習LDSの拡張
最後に
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 26 / 36
LDSの学習 -最尤推定
モデルパラメータ θ = {A, Γ,C,Σ, µ0,V0}は、EMアルゴリズムによる最尤推定で決定することが出来る
あるサイクルにおいて推定されたパラメータの値を θold とする
これらのパラメータ値に対し、潜在変数 p(Z|X, θold) の事後分布を決定するための推論アルゴリズムを実行することが出来る
特に、以下の期待値が必要となる。(ここで (13.104) を用いた)
E[zn] = µ̂n
E[znzTn−1
] = Jn−1V̂n + µ̂nµ̂Tn−1
E[znzTn] = V̂n + µ̂nµ̂
Tn
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 27 / 36
LDSの学習 -最尤推定
完全データの対数尤度関数は、(13.6)の対数をとることで以下のように表される
ln p(X, Z|θ) = ln p(z1|µ0,V0) +N∑
n=2
ln p(zn|zn−1, A, Γ)
+
N∑n=1
ln p(xn|zn,C,Σ)
事後分布 p(Z|X, θold)について完全データ尤度関数の期待値を取る
Q(θ, θold) = EZ|θold [ln p(X, Z|θ)]
この関数を各パラメータ θ = {A, Γ,C,Σ, µ0,V0}に関して最大化する
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 28 / 36
LDSの学習 -最尤推定
各パラメータの更新式は以下のようになる
µnew0
= E[z1]
Vnew0
= E[z1 zT1
] − E[z1]E[z1T]
Anew =
N∑n=2
E[znzTn−1
]
N∑
n=2
E[zn−1 zTn]
−1
Γnew =1
N − 1
N∑n=2
{E[znzT
n] − Anew E[zn−1 zTn]
−E[znzTn−1
](Anew)T + Anew E[zn−1 zTn−1
](Anew)T}
Cnew =
N∑n=1
xnE[zTn]
N∑
n=1
E[znzTn]
−1
Σnew =1N
N∑n=1
{xnxT
n − (Cnew)T E[zn]xTn
−xnE[zTn]Cnew + (Cnew)T E[znzT
n]Cnew}
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 29 / 36
AGENDA
自己紹介
線形動的システム(Linear Dynamical System)LDSにおける推論LDSの学習LDSの拡張
最後に
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 30 / 36
拡張カルマンフィルタ
カルマンフィルタを状態方程式が非線形でも良いように拡張したもの
予測分布の平均の付近を線形化することにより、ガウス分布近似を行う
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 31 / 36
スイッチング状態空間モデル
1つの隠れマルコフモデルと、線形動的システムの集合との組み合わせ
各時刻ステップの出力において、離散潜在変数の状態がスイッチと
して用いられ、確率的に 1つの連続潜在変数の鎖が選ばれ、対応する条件付き出力分布から観測変数が出力される。
変分方を用いることにより、効率的な推論スキームが得られる
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 32 / 36
AGENDA
自己紹介
線形動的システム(Linear Dynamical System)LDSにおける推論LDSの学習LDSの拡張
最後に
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 33 / 36
最後に
9/19(日)に第 9回 R勉強会@東京を開催します!まだ、発表者も募集してるので、是非!!
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 34 / 36
AGENDA
自己紹介
線形動的システム(Linear Dynamical System)LDSにおける推論LDSの学習LDSの拡張
最後に
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 35 / 36
ご清聴ありがとうございました
@yokkuns 里 洋平 (PRML 最終回) パターン認識と機械学習(PRML) 13.3~ 13.3.3線形動的システム 2010/09/11 36 / 36