prml reading group 10 8.3

31
坪坂 正志 Twitter/hatena id : tsubosaka Mail: m{dot}[email protected] PRML勉強会(10) 8.3 マルコフ確率場 2010/2/14 1 PRML勉強会第9

Upload: masashi-tsubosaka

Post on 28-May-2015

4.045 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Prml Reading Group 10 8.3

坪坂 正志

Twitterhatena id tsubosaka

Mail mdottsubosakagmailcom

PRML勉強会(第10回) 83 マルコフ確率場

2010214 1 PRML勉強会第9回

発表概要

bull マルコフ確率場とは

ndash条件付き独立性(831)

ndash分解特性(832)

bull 有向グラフとの関係(834)

bull 応用例

ndash画像のノイズ除去(833)

2010214 PRML勉強会第9回 2

マルコフ確率場 (Markov Random Field)

bull マルコフネットワーク(Markov network)無向グラフィカルモデルなどとも呼ばれる

bull 変数に対応するノード集合とノード対を接続するリンク集合から成る

bull 前節のグラフィカルモデルと違いリンクは向きを持たない

2010214 PRML勉強会第9回 3

条件付き独立性

bull 任意の集合ABCに対し Aの任意のノードとBの任意のノードを結ぶ全ての経路が集合Cのノードを必ず尐なくとも一つを通るならば

が成立する

bull このとき集合Aと集合Bは集合Cによって遮断(blocked)されている

2010214 PRML勉強会第9回 4

条件付き独立性

bull グラフ上で集合Cに属するノードを取り除いた時に集合Aの任意のノードと集合Bの任意の

ノードとを接続する経路が存在しなければ条件付き独立性が成り立つ

2010214 PRML勉強会第9回 5

A B

C

条件付き独立性

bull グラフ上で集合Cに属するノードを取り除いた時に集合Aの任意のノードと集合Bの任意の

ノードとを接続する経路が存在しなければ条件付き独立性が成り立つ

2010214 PRML勉強会第9回 6

A B

C

条件付き独立性

bull 有向グラフの場合と違って「弁明」現象は起きない

2010214 PRML勉強会第9回 7

A B

C

A B

C

マルコフブランケット

bull ノードとその隣接するノードだけで条件づけられた下で残りの全てのノードに対して条件付き独立となる(Markov property)

2010214 PRML勉強会第9回 8

図828

分解特性

bull 条件付き独立性に対応する分解を考える

bull 今直接接続されない2つのノード について見た時に

が成立する

bull この条件付き独立性が成立するためには

が 同じ因子に含まれないように同時分布が因数分解されなければならない

2010214 PRML勉強会第9回 9

クリーク

bull 分解を説明するにはクリークを導入すると便利

bull クリーク ノードの部分集合でその中で完全グラフとなっているようなもの

bull 極大クリーク クリークで新たに1つノードを追加するとクリークでなくなるもの

2010214 PRML勉強会第9回 10

クリークの例

2010214 PRML勉強会第9回 11

bull 極大クリークは と

の2つ

bull また図のグラフィカルモデルにおいては

の形で分解されている必要がある

クリークを用いた分解

bull 同時分布を因数分解したときの各因子を極大クリークCが含む集合上の関数とする

bull すなわち

の形で書ける

bull ここで は極大クリーク上のポテンシャル関数でZは規格化定数 (分配関数)であり以下で与えられる

2010214 PRML勉強会第9回 12

(839)

(840)

ポテンシャル関数

bull ポテンシャル関数 は0以上であればよい(狭義に正の方が扱いやすいことが多い)

bull 確率的解釈が可能とは限らないこのため積は正しく規格化されないので(840)のような規格化定数が必要

bull 狭義に正を保障するには指数関数を用いると便利

ここで をエネルギー関数と呼びこの指数関数表現をボルツマン分布と呼ぶ

2010214 PRML勉強会第9回 13

規格化定数

bull 有向グラフの場合と違い規格化因子を陽に導入する必要がある

bull M個のK状態離散変数ノードを持つモデルの場合K^M個の状態に関する足し算が必要

bull 条件付き分布を計算する際は周辺分布の比をとるだけなので不要

2010214 PRML勉強会第9回 14

分解の正当性

bull グラフ上の分離特性から読み取れる条件付き独立性の集合と矛盾しないすべての分布集合

bull 極大クリーク上のポテンシャル関数を用いて(839)の形に因数分解される分布の集合

bull このとき (Hammersley-Clifford Theorem Clifford 1990)

2010214 PRML勉強会第9回 15

有向グラフとの関係

bull 有向グラフを無向グラフに変換する

ndashジャンクションツリーアルゴリズムなどで有用(84節)

ndash逆はあまり行われない

bull 一般に条件付き独立性は完全には保存されない

ndash リンクの追加を最小限に抑える方法モラル化

2010214 PRML勉強会第9回 16

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 2: Prml Reading Group 10 8.3

発表概要

bull マルコフ確率場とは

ndash条件付き独立性(831)

ndash分解特性(832)

bull 有向グラフとの関係(834)

bull 応用例

ndash画像のノイズ除去(833)

2010214 PRML勉強会第9回 2

マルコフ確率場 (Markov Random Field)

bull マルコフネットワーク(Markov network)無向グラフィカルモデルなどとも呼ばれる

bull 変数に対応するノード集合とノード対を接続するリンク集合から成る

bull 前節のグラフィカルモデルと違いリンクは向きを持たない

2010214 PRML勉強会第9回 3

条件付き独立性

bull 任意の集合ABCに対し Aの任意のノードとBの任意のノードを結ぶ全ての経路が集合Cのノードを必ず尐なくとも一つを通るならば

が成立する

bull このとき集合Aと集合Bは集合Cによって遮断(blocked)されている

2010214 PRML勉強会第9回 4

条件付き独立性

bull グラフ上で集合Cに属するノードを取り除いた時に集合Aの任意のノードと集合Bの任意の

ノードとを接続する経路が存在しなければ条件付き独立性が成り立つ

2010214 PRML勉強会第9回 5

A B

C

条件付き独立性

bull グラフ上で集合Cに属するノードを取り除いた時に集合Aの任意のノードと集合Bの任意の

ノードとを接続する経路が存在しなければ条件付き独立性が成り立つ

2010214 PRML勉強会第9回 6

A B

C

条件付き独立性

bull 有向グラフの場合と違って「弁明」現象は起きない

2010214 PRML勉強会第9回 7

A B

C

A B

C

マルコフブランケット

bull ノードとその隣接するノードだけで条件づけられた下で残りの全てのノードに対して条件付き独立となる(Markov property)

2010214 PRML勉強会第9回 8

図828

分解特性

bull 条件付き独立性に対応する分解を考える

bull 今直接接続されない2つのノード について見た時に

が成立する

bull この条件付き独立性が成立するためには

が 同じ因子に含まれないように同時分布が因数分解されなければならない

2010214 PRML勉強会第9回 9

クリーク

bull 分解を説明するにはクリークを導入すると便利

bull クリーク ノードの部分集合でその中で完全グラフとなっているようなもの

bull 極大クリーク クリークで新たに1つノードを追加するとクリークでなくなるもの

2010214 PRML勉強会第9回 10

クリークの例

2010214 PRML勉強会第9回 11

bull 極大クリークは と

の2つ

bull また図のグラフィカルモデルにおいては

の形で分解されている必要がある

クリークを用いた分解

bull 同時分布を因数分解したときの各因子を極大クリークCが含む集合上の関数とする

bull すなわち

の形で書ける

bull ここで は極大クリーク上のポテンシャル関数でZは規格化定数 (分配関数)であり以下で与えられる

2010214 PRML勉強会第9回 12

(839)

(840)

ポテンシャル関数

bull ポテンシャル関数 は0以上であればよい(狭義に正の方が扱いやすいことが多い)

bull 確率的解釈が可能とは限らないこのため積は正しく規格化されないので(840)のような規格化定数が必要

bull 狭義に正を保障するには指数関数を用いると便利

ここで をエネルギー関数と呼びこの指数関数表現をボルツマン分布と呼ぶ

2010214 PRML勉強会第9回 13

規格化定数

bull 有向グラフの場合と違い規格化因子を陽に導入する必要がある

bull M個のK状態離散変数ノードを持つモデルの場合K^M個の状態に関する足し算が必要

bull 条件付き分布を計算する際は周辺分布の比をとるだけなので不要

2010214 PRML勉強会第9回 14

分解の正当性

bull グラフ上の分離特性から読み取れる条件付き独立性の集合と矛盾しないすべての分布集合

bull 極大クリーク上のポテンシャル関数を用いて(839)の形に因数分解される分布の集合

bull このとき (Hammersley-Clifford Theorem Clifford 1990)

2010214 PRML勉強会第9回 15

有向グラフとの関係

bull 有向グラフを無向グラフに変換する

ndashジャンクションツリーアルゴリズムなどで有用(84節)

ndash逆はあまり行われない

bull 一般に条件付き独立性は完全には保存されない

ndash リンクの追加を最小限に抑える方法モラル化

2010214 PRML勉強会第9回 16

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 3: Prml Reading Group 10 8.3

マルコフ確率場 (Markov Random Field)

bull マルコフネットワーク(Markov network)無向グラフィカルモデルなどとも呼ばれる

bull 変数に対応するノード集合とノード対を接続するリンク集合から成る

bull 前節のグラフィカルモデルと違いリンクは向きを持たない

2010214 PRML勉強会第9回 3

条件付き独立性

bull 任意の集合ABCに対し Aの任意のノードとBの任意のノードを結ぶ全ての経路が集合Cのノードを必ず尐なくとも一つを通るならば

が成立する

bull このとき集合Aと集合Bは集合Cによって遮断(blocked)されている

2010214 PRML勉強会第9回 4

条件付き独立性

bull グラフ上で集合Cに属するノードを取り除いた時に集合Aの任意のノードと集合Bの任意の

ノードとを接続する経路が存在しなければ条件付き独立性が成り立つ

2010214 PRML勉強会第9回 5

A B

C

条件付き独立性

bull グラフ上で集合Cに属するノードを取り除いた時に集合Aの任意のノードと集合Bの任意の

ノードとを接続する経路が存在しなければ条件付き独立性が成り立つ

2010214 PRML勉強会第9回 6

A B

C

条件付き独立性

bull 有向グラフの場合と違って「弁明」現象は起きない

2010214 PRML勉強会第9回 7

A B

C

A B

C

マルコフブランケット

bull ノードとその隣接するノードだけで条件づけられた下で残りの全てのノードに対して条件付き独立となる(Markov property)

2010214 PRML勉強会第9回 8

図828

分解特性

bull 条件付き独立性に対応する分解を考える

bull 今直接接続されない2つのノード について見た時に

が成立する

bull この条件付き独立性が成立するためには

が 同じ因子に含まれないように同時分布が因数分解されなければならない

2010214 PRML勉強会第9回 9

クリーク

bull 分解を説明するにはクリークを導入すると便利

bull クリーク ノードの部分集合でその中で完全グラフとなっているようなもの

bull 極大クリーク クリークで新たに1つノードを追加するとクリークでなくなるもの

2010214 PRML勉強会第9回 10

クリークの例

2010214 PRML勉強会第9回 11

bull 極大クリークは と

の2つ

bull また図のグラフィカルモデルにおいては

の形で分解されている必要がある

クリークを用いた分解

bull 同時分布を因数分解したときの各因子を極大クリークCが含む集合上の関数とする

bull すなわち

の形で書ける

bull ここで は極大クリーク上のポテンシャル関数でZは規格化定数 (分配関数)であり以下で与えられる

2010214 PRML勉強会第9回 12

(839)

(840)

ポテンシャル関数

bull ポテンシャル関数 は0以上であればよい(狭義に正の方が扱いやすいことが多い)

bull 確率的解釈が可能とは限らないこのため積は正しく規格化されないので(840)のような規格化定数が必要

bull 狭義に正を保障するには指数関数を用いると便利

ここで をエネルギー関数と呼びこの指数関数表現をボルツマン分布と呼ぶ

2010214 PRML勉強会第9回 13

規格化定数

bull 有向グラフの場合と違い規格化因子を陽に導入する必要がある

bull M個のK状態離散変数ノードを持つモデルの場合K^M個の状態に関する足し算が必要

bull 条件付き分布を計算する際は周辺分布の比をとるだけなので不要

2010214 PRML勉強会第9回 14

分解の正当性

bull グラフ上の分離特性から読み取れる条件付き独立性の集合と矛盾しないすべての分布集合

bull 極大クリーク上のポテンシャル関数を用いて(839)の形に因数分解される分布の集合

bull このとき (Hammersley-Clifford Theorem Clifford 1990)

2010214 PRML勉強会第9回 15

有向グラフとの関係

bull 有向グラフを無向グラフに変換する

ndashジャンクションツリーアルゴリズムなどで有用(84節)

ndash逆はあまり行われない

bull 一般に条件付き独立性は完全には保存されない

ndash リンクの追加を最小限に抑える方法モラル化

2010214 PRML勉強会第9回 16

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 4: Prml Reading Group 10 8.3

条件付き独立性

bull 任意の集合ABCに対し Aの任意のノードとBの任意のノードを結ぶ全ての経路が集合Cのノードを必ず尐なくとも一つを通るならば

が成立する

bull このとき集合Aと集合Bは集合Cによって遮断(blocked)されている

2010214 PRML勉強会第9回 4

条件付き独立性

bull グラフ上で集合Cに属するノードを取り除いた時に集合Aの任意のノードと集合Bの任意の

ノードとを接続する経路が存在しなければ条件付き独立性が成り立つ

2010214 PRML勉強会第9回 5

A B

C

条件付き独立性

bull グラフ上で集合Cに属するノードを取り除いた時に集合Aの任意のノードと集合Bの任意の

ノードとを接続する経路が存在しなければ条件付き独立性が成り立つ

2010214 PRML勉強会第9回 6

A B

C

条件付き独立性

bull 有向グラフの場合と違って「弁明」現象は起きない

2010214 PRML勉強会第9回 7

A B

C

A B

C

マルコフブランケット

bull ノードとその隣接するノードだけで条件づけられた下で残りの全てのノードに対して条件付き独立となる(Markov property)

2010214 PRML勉強会第9回 8

図828

分解特性

bull 条件付き独立性に対応する分解を考える

bull 今直接接続されない2つのノード について見た時に

が成立する

bull この条件付き独立性が成立するためには

が 同じ因子に含まれないように同時分布が因数分解されなければならない

2010214 PRML勉強会第9回 9

クリーク

bull 分解を説明するにはクリークを導入すると便利

bull クリーク ノードの部分集合でその中で完全グラフとなっているようなもの

bull 極大クリーク クリークで新たに1つノードを追加するとクリークでなくなるもの

2010214 PRML勉強会第9回 10

クリークの例

2010214 PRML勉強会第9回 11

bull 極大クリークは と

の2つ

bull また図のグラフィカルモデルにおいては

の形で分解されている必要がある

クリークを用いた分解

bull 同時分布を因数分解したときの各因子を極大クリークCが含む集合上の関数とする

bull すなわち

の形で書ける

bull ここで は極大クリーク上のポテンシャル関数でZは規格化定数 (分配関数)であり以下で与えられる

2010214 PRML勉強会第9回 12

(839)

(840)

ポテンシャル関数

bull ポテンシャル関数 は0以上であればよい(狭義に正の方が扱いやすいことが多い)

bull 確率的解釈が可能とは限らないこのため積は正しく規格化されないので(840)のような規格化定数が必要

bull 狭義に正を保障するには指数関数を用いると便利

ここで をエネルギー関数と呼びこの指数関数表現をボルツマン分布と呼ぶ

2010214 PRML勉強会第9回 13

規格化定数

bull 有向グラフの場合と違い規格化因子を陽に導入する必要がある

bull M個のK状態離散変数ノードを持つモデルの場合K^M個の状態に関する足し算が必要

bull 条件付き分布を計算する際は周辺分布の比をとるだけなので不要

2010214 PRML勉強会第9回 14

分解の正当性

bull グラフ上の分離特性から読み取れる条件付き独立性の集合と矛盾しないすべての分布集合

bull 極大クリーク上のポテンシャル関数を用いて(839)の形に因数分解される分布の集合

bull このとき (Hammersley-Clifford Theorem Clifford 1990)

2010214 PRML勉強会第9回 15

有向グラフとの関係

bull 有向グラフを無向グラフに変換する

ndashジャンクションツリーアルゴリズムなどで有用(84節)

ndash逆はあまり行われない

bull 一般に条件付き独立性は完全には保存されない

ndash リンクの追加を最小限に抑える方法モラル化

2010214 PRML勉強会第9回 16

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 5: Prml Reading Group 10 8.3

条件付き独立性

bull グラフ上で集合Cに属するノードを取り除いた時に集合Aの任意のノードと集合Bの任意の

ノードとを接続する経路が存在しなければ条件付き独立性が成り立つ

2010214 PRML勉強会第9回 5

A B

C

条件付き独立性

bull グラフ上で集合Cに属するノードを取り除いた時に集合Aの任意のノードと集合Bの任意の

ノードとを接続する経路が存在しなければ条件付き独立性が成り立つ

2010214 PRML勉強会第9回 6

A B

C

条件付き独立性

bull 有向グラフの場合と違って「弁明」現象は起きない

2010214 PRML勉強会第9回 7

A B

C

A B

C

マルコフブランケット

bull ノードとその隣接するノードだけで条件づけられた下で残りの全てのノードに対して条件付き独立となる(Markov property)

2010214 PRML勉強会第9回 8

図828

分解特性

bull 条件付き独立性に対応する分解を考える

bull 今直接接続されない2つのノード について見た時に

が成立する

bull この条件付き独立性が成立するためには

が 同じ因子に含まれないように同時分布が因数分解されなければならない

2010214 PRML勉強会第9回 9

クリーク

bull 分解を説明するにはクリークを導入すると便利

bull クリーク ノードの部分集合でその中で完全グラフとなっているようなもの

bull 極大クリーク クリークで新たに1つノードを追加するとクリークでなくなるもの

2010214 PRML勉強会第9回 10

クリークの例

2010214 PRML勉強会第9回 11

bull 極大クリークは と

の2つ

bull また図のグラフィカルモデルにおいては

の形で分解されている必要がある

クリークを用いた分解

bull 同時分布を因数分解したときの各因子を極大クリークCが含む集合上の関数とする

bull すなわち

の形で書ける

bull ここで は極大クリーク上のポテンシャル関数でZは規格化定数 (分配関数)であり以下で与えられる

2010214 PRML勉強会第9回 12

(839)

(840)

ポテンシャル関数

bull ポテンシャル関数 は0以上であればよい(狭義に正の方が扱いやすいことが多い)

bull 確率的解釈が可能とは限らないこのため積は正しく規格化されないので(840)のような規格化定数が必要

bull 狭義に正を保障するには指数関数を用いると便利

ここで をエネルギー関数と呼びこの指数関数表現をボルツマン分布と呼ぶ

2010214 PRML勉強会第9回 13

規格化定数

bull 有向グラフの場合と違い規格化因子を陽に導入する必要がある

bull M個のK状態離散変数ノードを持つモデルの場合K^M個の状態に関する足し算が必要

bull 条件付き分布を計算する際は周辺分布の比をとるだけなので不要

2010214 PRML勉強会第9回 14

分解の正当性

bull グラフ上の分離特性から読み取れる条件付き独立性の集合と矛盾しないすべての分布集合

bull 極大クリーク上のポテンシャル関数を用いて(839)の形に因数分解される分布の集合

bull このとき (Hammersley-Clifford Theorem Clifford 1990)

2010214 PRML勉強会第9回 15

有向グラフとの関係

bull 有向グラフを無向グラフに変換する

ndashジャンクションツリーアルゴリズムなどで有用(84節)

ndash逆はあまり行われない

bull 一般に条件付き独立性は完全には保存されない

ndash リンクの追加を最小限に抑える方法モラル化

2010214 PRML勉強会第9回 16

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 6: Prml Reading Group 10 8.3

条件付き独立性

bull グラフ上で集合Cに属するノードを取り除いた時に集合Aの任意のノードと集合Bの任意の

ノードとを接続する経路が存在しなければ条件付き独立性が成り立つ

2010214 PRML勉強会第9回 6

A B

C

条件付き独立性

bull 有向グラフの場合と違って「弁明」現象は起きない

2010214 PRML勉強会第9回 7

A B

C

A B

C

マルコフブランケット

bull ノードとその隣接するノードだけで条件づけられた下で残りの全てのノードに対して条件付き独立となる(Markov property)

2010214 PRML勉強会第9回 8

図828

分解特性

bull 条件付き独立性に対応する分解を考える

bull 今直接接続されない2つのノード について見た時に

が成立する

bull この条件付き独立性が成立するためには

が 同じ因子に含まれないように同時分布が因数分解されなければならない

2010214 PRML勉強会第9回 9

クリーク

bull 分解を説明するにはクリークを導入すると便利

bull クリーク ノードの部分集合でその中で完全グラフとなっているようなもの

bull 極大クリーク クリークで新たに1つノードを追加するとクリークでなくなるもの

2010214 PRML勉強会第9回 10

クリークの例

2010214 PRML勉強会第9回 11

bull 極大クリークは と

の2つ

bull また図のグラフィカルモデルにおいては

の形で分解されている必要がある

クリークを用いた分解

bull 同時分布を因数分解したときの各因子を極大クリークCが含む集合上の関数とする

bull すなわち

の形で書ける

bull ここで は極大クリーク上のポテンシャル関数でZは規格化定数 (分配関数)であり以下で与えられる

2010214 PRML勉強会第9回 12

(839)

(840)

ポテンシャル関数

bull ポテンシャル関数 は0以上であればよい(狭義に正の方が扱いやすいことが多い)

bull 確率的解釈が可能とは限らないこのため積は正しく規格化されないので(840)のような規格化定数が必要

bull 狭義に正を保障するには指数関数を用いると便利

ここで をエネルギー関数と呼びこの指数関数表現をボルツマン分布と呼ぶ

2010214 PRML勉強会第9回 13

規格化定数

bull 有向グラフの場合と違い規格化因子を陽に導入する必要がある

bull M個のK状態離散変数ノードを持つモデルの場合K^M個の状態に関する足し算が必要

bull 条件付き分布を計算する際は周辺分布の比をとるだけなので不要

2010214 PRML勉強会第9回 14

分解の正当性

bull グラフ上の分離特性から読み取れる条件付き独立性の集合と矛盾しないすべての分布集合

bull 極大クリーク上のポテンシャル関数を用いて(839)の形に因数分解される分布の集合

bull このとき (Hammersley-Clifford Theorem Clifford 1990)

2010214 PRML勉強会第9回 15

有向グラフとの関係

bull 有向グラフを無向グラフに変換する

ndashジャンクションツリーアルゴリズムなどで有用(84節)

ndash逆はあまり行われない

bull 一般に条件付き独立性は完全には保存されない

ndash リンクの追加を最小限に抑える方法モラル化

2010214 PRML勉強会第9回 16

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 7: Prml Reading Group 10 8.3

条件付き独立性

bull 有向グラフの場合と違って「弁明」現象は起きない

2010214 PRML勉強会第9回 7

A B

C

A B

C

マルコフブランケット

bull ノードとその隣接するノードだけで条件づけられた下で残りの全てのノードに対して条件付き独立となる(Markov property)

2010214 PRML勉強会第9回 8

図828

分解特性

bull 条件付き独立性に対応する分解を考える

bull 今直接接続されない2つのノード について見た時に

が成立する

bull この条件付き独立性が成立するためには

が 同じ因子に含まれないように同時分布が因数分解されなければならない

2010214 PRML勉強会第9回 9

クリーク

bull 分解を説明するにはクリークを導入すると便利

bull クリーク ノードの部分集合でその中で完全グラフとなっているようなもの

bull 極大クリーク クリークで新たに1つノードを追加するとクリークでなくなるもの

2010214 PRML勉強会第9回 10

クリークの例

2010214 PRML勉強会第9回 11

bull 極大クリークは と

の2つ

bull また図のグラフィカルモデルにおいては

の形で分解されている必要がある

クリークを用いた分解

bull 同時分布を因数分解したときの各因子を極大クリークCが含む集合上の関数とする

bull すなわち

の形で書ける

bull ここで は極大クリーク上のポテンシャル関数でZは規格化定数 (分配関数)であり以下で与えられる

2010214 PRML勉強会第9回 12

(839)

(840)

ポテンシャル関数

bull ポテンシャル関数 は0以上であればよい(狭義に正の方が扱いやすいことが多い)

bull 確率的解釈が可能とは限らないこのため積は正しく規格化されないので(840)のような規格化定数が必要

bull 狭義に正を保障するには指数関数を用いると便利

ここで をエネルギー関数と呼びこの指数関数表現をボルツマン分布と呼ぶ

2010214 PRML勉強会第9回 13

規格化定数

bull 有向グラフの場合と違い規格化因子を陽に導入する必要がある

bull M個のK状態離散変数ノードを持つモデルの場合K^M個の状態に関する足し算が必要

bull 条件付き分布を計算する際は周辺分布の比をとるだけなので不要

2010214 PRML勉強会第9回 14

分解の正当性

bull グラフ上の分離特性から読み取れる条件付き独立性の集合と矛盾しないすべての分布集合

bull 極大クリーク上のポテンシャル関数を用いて(839)の形に因数分解される分布の集合

bull このとき (Hammersley-Clifford Theorem Clifford 1990)

2010214 PRML勉強会第9回 15

有向グラフとの関係

bull 有向グラフを無向グラフに変換する

ndashジャンクションツリーアルゴリズムなどで有用(84節)

ndash逆はあまり行われない

bull 一般に条件付き独立性は完全には保存されない

ndash リンクの追加を最小限に抑える方法モラル化

2010214 PRML勉強会第9回 16

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 8: Prml Reading Group 10 8.3

マルコフブランケット

bull ノードとその隣接するノードだけで条件づけられた下で残りの全てのノードに対して条件付き独立となる(Markov property)

2010214 PRML勉強会第9回 8

図828

分解特性

bull 条件付き独立性に対応する分解を考える

bull 今直接接続されない2つのノード について見た時に

が成立する

bull この条件付き独立性が成立するためには

が 同じ因子に含まれないように同時分布が因数分解されなければならない

2010214 PRML勉強会第9回 9

クリーク

bull 分解を説明するにはクリークを導入すると便利

bull クリーク ノードの部分集合でその中で完全グラフとなっているようなもの

bull 極大クリーク クリークで新たに1つノードを追加するとクリークでなくなるもの

2010214 PRML勉強会第9回 10

クリークの例

2010214 PRML勉強会第9回 11

bull 極大クリークは と

の2つ

bull また図のグラフィカルモデルにおいては

の形で分解されている必要がある

クリークを用いた分解

bull 同時分布を因数分解したときの各因子を極大クリークCが含む集合上の関数とする

bull すなわち

の形で書ける

bull ここで は極大クリーク上のポテンシャル関数でZは規格化定数 (分配関数)であり以下で与えられる

2010214 PRML勉強会第9回 12

(839)

(840)

ポテンシャル関数

bull ポテンシャル関数 は0以上であればよい(狭義に正の方が扱いやすいことが多い)

bull 確率的解釈が可能とは限らないこのため積は正しく規格化されないので(840)のような規格化定数が必要

bull 狭義に正を保障するには指数関数を用いると便利

ここで をエネルギー関数と呼びこの指数関数表現をボルツマン分布と呼ぶ

2010214 PRML勉強会第9回 13

規格化定数

bull 有向グラフの場合と違い規格化因子を陽に導入する必要がある

bull M個のK状態離散変数ノードを持つモデルの場合K^M個の状態に関する足し算が必要

bull 条件付き分布を計算する際は周辺分布の比をとるだけなので不要

2010214 PRML勉強会第9回 14

分解の正当性

bull グラフ上の分離特性から読み取れる条件付き独立性の集合と矛盾しないすべての分布集合

bull 極大クリーク上のポテンシャル関数を用いて(839)の形に因数分解される分布の集合

bull このとき (Hammersley-Clifford Theorem Clifford 1990)

2010214 PRML勉強会第9回 15

有向グラフとの関係

bull 有向グラフを無向グラフに変換する

ndashジャンクションツリーアルゴリズムなどで有用(84節)

ndash逆はあまり行われない

bull 一般に条件付き独立性は完全には保存されない

ndash リンクの追加を最小限に抑える方法モラル化

2010214 PRML勉強会第9回 16

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 9: Prml Reading Group 10 8.3

分解特性

bull 条件付き独立性に対応する分解を考える

bull 今直接接続されない2つのノード について見た時に

が成立する

bull この条件付き独立性が成立するためには

が 同じ因子に含まれないように同時分布が因数分解されなければならない

2010214 PRML勉強会第9回 9

クリーク

bull 分解を説明するにはクリークを導入すると便利

bull クリーク ノードの部分集合でその中で完全グラフとなっているようなもの

bull 極大クリーク クリークで新たに1つノードを追加するとクリークでなくなるもの

2010214 PRML勉強会第9回 10

クリークの例

2010214 PRML勉強会第9回 11

bull 極大クリークは と

の2つ

bull また図のグラフィカルモデルにおいては

の形で分解されている必要がある

クリークを用いた分解

bull 同時分布を因数分解したときの各因子を極大クリークCが含む集合上の関数とする

bull すなわち

の形で書ける

bull ここで は極大クリーク上のポテンシャル関数でZは規格化定数 (分配関数)であり以下で与えられる

2010214 PRML勉強会第9回 12

(839)

(840)

ポテンシャル関数

bull ポテンシャル関数 は0以上であればよい(狭義に正の方が扱いやすいことが多い)

bull 確率的解釈が可能とは限らないこのため積は正しく規格化されないので(840)のような規格化定数が必要

bull 狭義に正を保障するには指数関数を用いると便利

ここで をエネルギー関数と呼びこの指数関数表現をボルツマン分布と呼ぶ

2010214 PRML勉強会第9回 13

規格化定数

bull 有向グラフの場合と違い規格化因子を陽に導入する必要がある

bull M個のK状態離散変数ノードを持つモデルの場合K^M個の状態に関する足し算が必要

bull 条件付き分布を計算する際は周辺分布の比をとるだけなので不要

2010214 PRML勉強会第9回 14

分解の正当性

bull グラフ上の分離特性から読み取れる条件付き独立性の集合と矛盾しないすべての分布集合

bull 極大クリーク上のポテンシャル関数を用いて(839)の形に因数分解される分布の集合

bull このとき (Hammersley-Clifford Theorem Clifford 1990)

2010214 PRML勉強会第9回 15

有向グラフとの関係

bull 有向グラフを無向グラフに変換する

ndashジャンクションツリーアルゴリズムなどで有用(84節)

ndash逆はあまり行われない

bull 一般に条件付き独立性は完全には保存されない

ndash リンクの追加を最小限に抑える方法モラル化

2010214 PRML勉強会第9回 16

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 10: Prml Reading Group 10 8.3

クリーク

bull 分解を説明するにはクリークを導入すると便利

bull クリーク ノードの部分集合でその中で完全グラフとなっているようなもの

bull 極大クリーク クリークで新たに1つノードを追加するとクリークでなくなるもの

2010214 PRML勉強会第9回 10

クリークの例

2010214 PRML勉強会第9回 11

bull 極大クリークは と

の2つ

bull また図のグラフィカルモデルにおいては

の形で分解されている必要がある

クリークを用いた分解

bull 同時分布を因数分解したときの各因子を極大クリークCが含む集合上の関数とする

bull すなわち

の形で書ける

bull ここで は極大クリーク上のポテンシャル関数でZは規格化定数 (分配関数)であり以下で与えられる

2010214 PRML勉強会第9回 12

(839)

(840)

ポテンシャル関数

bull ポテンシャル関数 は0以上であればよい(狭義に正の方が扱いやすいことが多い)

bull 確率的解釈が可能とは限らないこのため積は正しく規格化されないので(840)のような規格化定数が必要

bull 狭義に正を保障するには指数関数を用いると便利

ここで をエネルギー関数と呼びこの指数関数表現をボルツマン分布と呼ぶ

2010214 PRML勉強会第9回 13

規格化定数

bull 有向グラフの場合と違い規格化因子を陽に導入する必要がある

bull M個のK状態離散変数ノードを持つモデルの場合K^M個の状態に関する足し算が必要

bull 条件付き分布を計算する際は周辺分布の比をとるだけなので不要

2010214 PRML勉強会第9回 14

分解の正当性

bull グラフ上の分離特性から読み取れる条件付き独立性の集合と矛盾しないすべての分布集合

bull 極大クリーク上のポテンシャル関数を用いて(839)の形に因数分解される分布の集合

bull このとき (Hammersley-Clifford Theorem Clifford 1990)

2010214 PRML勉強会第9回 15

有向グラフとの関係

bull 有向グラフを無向グラフに変換する

ndashジャンクションツリーアルゴリズムなどで有用(84節)

ndash逆はあまり行われない

bull 一般に条件付き独立性は完全には保存されない

ndash リンクの追加を最小限に抑える方法モラル化

2010214 PRML勉強会第9回 16

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 11: Prml Reading Group 10 8.3

クリークの例

2010214 PRML勉強会第9回 11

bull 極大クリークは と

の2つ

bull また図のグラフィカルモデルにおいては

の形で分解されている必要がある

クリークを用いた分解

bull 同時分布を因数分解したときの各因子を極大クリークCが含む集合上の関数とする

bull すなわち

の形で書ける

bull ここで は極大クリーク上のポテンシャル関数でZは規格化定数 (分配関数)であり以下で与えられる

2010214 PRML勉強会第9回 12

(839)

(840)

ポテンシャル関数

bull ポテンシャル関数 は0以上であればよい(狭義に正の方が扱いやすいことが多い)

bull 確率的解釈が可能とは限らないこのため積は正しく規格化されないので(840)のような規格化定数が必要

bull 狭義に正を保障するには指数関数を用いると便利

ここで をエネルギー関数と呼びこの指数関数表現をボルツマン分布と呼ぶ

2010214 PRML勉強会第9回 13

規格化定数

bull 有向グラフの場合と違い規格化因子を陽に導入する必要がある

bull M個のK状態離散変数ノードを持つモデルの場合K^M個の状態に関する足し算が必要

bull 条件付き分布を計算する際は周辺分布の比をとるだけなので不要

2010214 PRML勉強会第9回 14

分解の正当性

bull グラフ上の分離特性から読み取れる条件付き独立性の集合と矛盾しないすべての分布集合

bull 極大クリーク上のポテンシャル関数を用いて(839)の形に因数分解される分布の集合

bull このとき (Hammersley-Clifford Theorem Clifford 1990)

2010214 PRML勉強会第9回 15

有向グラフとの関係

bull 有向グラフを無向グラフに変換する

ndashジャンクションツリーアルゴリズムなどで有用(84節)

ndash逆はあまり行われない

bull 一般に条件付き独立性は完全には保存されない

ndash リンクの追加を最小限に抑える方法モラル化

2010214 PRML勉強会第9回 16

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 12: Prml Reading Group 10 8.3

クリークを用いた分解

bull 同時分布を因数分解したときの各因子を極大クリークCが含む集合上の関数とする

bull すなわち

の形で書ける

bull ここで は極大クリーク上のポテンシャル関数でZは規格化定数 (分配関数)であり以下で与えられる

2010214 PRML勉強会第9回 12

(839)

(840)

ポテンシャル関数

bull ポテンシャル関数 は0以上であればよい(狭義に正の方が扱いやすいことが多い)

bull 確率的解釈が可能とは限らないこのため積は正しく規格化されないので(840)のような規格化定数が必要

bull 狭義に正を保障するには指数関数を用いると便利

ここで をエネルギー関数と呼びこの指数関数表現をボルツマン分布と呼ぶ

2010214 PRML勉強会第9回 13

規格化定数

bull 有向グラフの場合と違い規格化因子を陽に導入する必要がある

bull M個のK状態離散変数ノードを持つモデルの場合K^M個の状態に関する足し算が必要

bull 条件付き分布を計算する際は周辺分布の比をとるだけなので不要

2010214 PRML勉強会第9回 14

分解の正当性

bull グラフ上の分離特性から読み取れる条件付き独立性の集合と矛盾しないすべての分布集合

bull 極大クリーク上のポテンシャル関数を用いて(839)の形に因数分解される分布の集合

bull このとき (Hammersley-Clifford Theorem Clifford 1990)

2010214 PRML勉強会第9回 15

有向グラフとの関係

bull 有向グラフを無向グラフに変換する

ndashジャンクションツリーアルゴリズムなどで有用(84節)

ndash逆はあまり行われない

bull 一般に条件付き独立性は完全には保存されない

ndash リンクの追加を最小限に抑える方法モラル化

2010214 PRML勉強会第9回 16

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 13: Prml Reading Group 10 8.3

ポテンシャル関数

bull ポテンシャル関数 は0以上であればよい(狭義に正の方が扱いやすいことが多い)

bull 確率的解釈が可能とは限らないこのため積は正しく規格化されないので(840)のような規格化定数が必要

bull 狭義に正を保障するには指数関数を用いると便利

ここで をエネルギー関数と呼びこの指数関数表現をボルツマン分布と呼ぶ

2010214 PRML勉強会第9回 13

規格化定数

bull 有向グラフの場合と違い規格化因子を陽に導入する必要がある

bull M個のK状態離散変数ノードを持つモデルの場合K^M個の状態に関する足し算が必要

bull 条件付き分布を計算する際は周辺分布の比をとるだけなので不要

2010214 PRML勉強会第9回 14

分解の正当性

bull グラフ上の分離特性から読み取れる条件付き独立性の集合と矛盾しないすべての分布集合

bull 極大クリーク上のポテンシャル関数を用いて(839)の形に因数分解される分布の集合

bull このとき (Hammersley-Clifford Theorem Clifford 1990)

2010214 PRML勉強会第9回 15

有向グラフとの関係

bull 有向グラフを無向グラフに変換する

ndashジャンクションツリーアルゴリズムなどで有用(84節)

ndash逆はあまり行われない

bull 一般に条件付き独立性は完全には保存されない

ndash リンクの追加を最小限に抑える方法モラル化

2010214 PRML勉強会第9回 16

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 14: Prml Reading Group 10 8.3

規格化定数

bull 有向グラフの場合と違い規格化因子を陽に導入する必要がある

bull M個のK状態離散変数ノードを持つモデルの場合K^M個の状態に関する足し算が必要

bull 条件付き分布を計算する際は周辺分布の比をとるだけなので不要

2010214 PRML勉強会第9回 14

分解の正当性

bull グラフ上の分離特性から読み取れる条件付き独立性の集合と矛盾しないすべての分布集合

bull 極大クリーク上のポテンシャル関数を用いて(839)の形に因数分解される分布の集合

bull このとき (Hammersley-Clifford Theorem Clifford 1990)

2010214 PRML勉強会第9回 15

有向グラフとの関係

bull 有向グラフを無向グラフに変換する

ndashジャンクションツリーアルゴリズムなどで有用(84節)

ndash逆はあまり行われない

bull 一般に条件付き独立性は完全には保存されない

ndash リンクの追加を最小限に抑える方法モラル化

2010214 PRML勉強会第9回 16

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 15: Prml Reading Group 10 8.3

分解の正当性

bull グラフ上の分離特性から読み取れる条件付き独立性の集合と矛盾しないすべての分布集合

bull 極大クリーク上のポテンシャル関数を用いて(839)の形に因数分解される分布の集合

bull このとき (Hammersley-Clifford Theorem Clifford 1990)

2010214 PRML勉強会第9回 15

有向グラフとの関係

bull 有向グラフを無向グラフに変換する

ndashジャンクションツリーアルゴリズムなどで有用(84節)

ndash逆はあまり行われない

bull 一般に条件付き独立性は完全には保存されない

ndash リンクの追加を最小限に抑える方法モラル化

2010214 PRML勉強会第9回 16

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 16: Prml Reading Group 10 8.3

有向グラフとの関係

bull 有向グラフを無向グラフに変換する

ndashジャンクションツリーアルゴリズムなどで有用(84節)

ndash逆はあまり行われない

bull 一般に条件付き独立性は完全には保存されない

ndash リンクの追加を最小限に抑える方法モラル化

2010214 PRML勉強会第9回 16

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 17: Prml Reading Group 10 8.3

鎖の場合

2010214 PRML勉強会第9回 17

無向グラフ化

対応付けができる Z = 1

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 18: Prml Reading Group 10 8.3

1つ以上の親を持つ場合

2010214 PRML勉強会第9回 18

無向グラフ化

有向グラフでの条件付き独立性は失われている

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 19: Prml Reading Group 10 8.3

独立性の表現

bull 与えられた変数に関する分布をPとする

bull グラフGがPに対する依存性マップ(D-map)

ndash Pが満たす条件付き独立性をグラフGがもれなく表現する場合

bull グラフGがPに対する独立性マップ(I-map)

ndash Gが表現する独立性がすべてPによって満たされる

bull D-mapかつI-map =gt 完全マップ

2010214 PRML勉強会第9回 19

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 20: Prml Reading Group 10 8.3

独立性の表現

bull 有向グラフで表現できるが無向グラフで表現できない分布が存在する(図835)

ndash逆も成立する(図836)

bull 無向グラフでも有向グラフでも表現できない分布も存在する

bull 無向グラフ+有向グラフを含んだ枠組み

=gt 連鎖グラフ(chain graph)

ndash連鎖グラフでも表現できない分布もある

2010214 PRML勉強会第9回 20

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 21: Prml Reading Group 10 8.3

具体例 画像のノイズ除去

bull ピクセル値が+1-1の2種で構成される画像のノイズ除去を考える

bull 観測画像

bull ノイズなし画像

bull 観測画像は真の画像の一部がランダムに反転したことによって得られたとする

2010214 PRML勉強会第9回 21

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 22: Prml Reading Group 10 8.3

2010214 PRML勉強会第9回 22

元画像

ノイズ画像 ICM

グラフカット

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 23: Prml Reading Group 10 8.3

マルコフ確率場モデル

2010214 PRML勉強会第9回 23

bull ノイズレベルが低い場合ノイズなし画像のピクセルと観測画像のピクセルに強い相関がある

bull 隣接ピクセルにも強い相関がある

観測画像

ノイズなし画像

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 24: Prml Reading Group 10 8.3

エネルギー関数の設計

bull 観測画像と元の画像に強い相関がある

ndash で表す同符号のとき低いエネルギー(高い確率) 異符号のとき高いエネルギーを持つ

bull 隣接ピクセル に相関がある

ndash で表す

bull ピクセル値自体の事前確率

ndash で表す

2010214 PRML勉強会第9回 24

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 25: Prml Reading Group 10 8.3

同時分布

bull エネルギー関数 (842)

bull 同時分布 (843)

2010214 PRML勉強会第9回 25

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 26: Prml Reading Group 10 8.3

条件付き分布

bull 観測値が固定された場合

より条件付き分布が暗に決定される

bull (843)を最大化する を求めればよい

ndash統計物理学でいうイジングモデルの例

ndash ICM(iterated conditional modes 反復条件付きモード)

2010214 PRML勉強会第9回 26

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 27: Prml Reading Group 10 8.3

ICM

1 変数 を初期化(例えば とする)

2 ノード を1つ選択 1 他のノードを固定した状態で の2つの可能な状態における全エネルギーを評価しエネルギーが小さくなる方に状態を設定する

3 一定の収束条件を満たすまで2を繰り返す

bull 2での選択方法は規則的でもランダムでもよい

bull 全ての点において変数値が変更されない場合局所最大点に収束している

2010214 PRML勉強会第9回 27

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 28: Prml Reading Group 10 8.3

演習 813

bull (842)から に関する項のみを取り出すと

でこれを について計算すれば良い

2010214 PRML勉強会第9回 28

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 29: Prml Reading Group 10 8.3

より効率的なアルゴリズム

bull max-productアルゴリズム (84節)

ndash ICMより良い解を与える

ndash大域的解を必ずしも得られるわけではない

bull グラフカットアルゴリズム [石川 2007]

ndash大域的最大解が得られる

ndash一般のエネルギー関数に用いることができるわけではない

2010214 PRML勉強会第9回 29

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 30: Prml Reading Group 10 8.3

Related work

bull 判別モデルへの応用

ndash Logistic回帰 CRF[鹿島2006 Laerty 2001 Sutton 2007]

bull モデルに従うデータの生成

ndashサンプリング[Salakhutdinov 2010]

2010214 PRML勉強会第9回 30

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31

Page 31: Prml Reading Group 10 8.3

参考資料 bull [石川 2007]石川 博 チュートリアル「グラフカット」情報処理学会研究報告2007

bull [鹿島 2006] 鹿島 久嗣坪井 祐太工藤 拓 言語処理における識別モデルの発展 -- HMMからCRFまで -- 言語処理学会第12回年次大会(NLP 2006)チュートリアル 2006

bull [宮川 1997] 宮川雅巳 グラフィカルモデリング (統計ライブラリー) 朝倉書店 1997

bull [Laerty 2001] J Laerty A McCallum and F Pereira Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proceedings of the 18th International Conference on Machine Learning 2001

bull [Sutton 2007] Charles Sutton Andrew McCallum An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning MIT Press 2007

bull [Salakhutdinov 2010] Ruslan Salakhutdinov Geoffrey Hinton Replicated Softmax an Undirected Topic Model In Advances in Neural Information Processing Systems 22 2010

2010214 PRML勉強会第9回 31