prml chapter5.2

49
PRML読書会復々讐レーン 5.2 ネットワーク訓練 2012/11/03 Presented by takmin

Upload: takuya-minagawa

Post on 21-Jun-2015

2.783 views

Category:

Documents


5 download

DESCRIPTION

PRML読書会発表資料。5.2章。

TRANSCRIPT

Page 1: PRML Chapter5.2

PRML読書会復々讐レーン 5.2 ネットワーク訓練

2012/11/03

Presented by takmin

Page 2: PRML Chapter5.2

5.2節の概要

ニューラルネットワークのパラメータwを求めたい!

誤差関数E(w)を最小化するwを求める。

・・・

・・・ ・・・

)1(w

)2(w

Page 3: PRML Chapter5.2

5.2節の概要

• 5.2 ネットワーク訓練

–誤差関数E(w)を定義する

• 5.2.1 – 5.2.3

– E(w)を最小化するためのアプローチ/条件/注意点

• 5.3 誤差逆伝播

– E(w)を最小化するアルゴリズム

Page 4: PRML Chapter5.2

5.2節の概要

• 5.2 ネットワーク訓練

–誤差関数E(w)を定義する

• 5.2.1 – 5.2.3

– E(w)を最小化するためのアプローチ/条件/注意点

• 5.3 誤差逆伝播

– E(w)を最小化するアルゴリズム

Page 5: PRML Chapter5.2

5.2節の目的

• 以下の5つのケースについて、誤差関数、及びその出力ユニット活性における勾配を定義する。

–回帰問題

• 1次元

• 多次元

–識別問題

• 2クラス

• 2クラス×K

• 多クラス

Page 6: PRML Chapter5.2

回帰問題(1次元)

)1(w

)2(w

x y tε

連続値 (推定値)

ノイズ

観測値

・・・

・・・

)),,(|(),|( 1 wxwx ytNtp

Page 7: PRML Chapter5.2

)),,(|(),|( 1 wxwx ytNtp

回帰問題(1次元)

)1(w

)2(w

x y tε

連続値 (推定値)

ノイズ

観測値

・・・

・・・

)2(w

M

j

jj zwa0

)2(

jza

y

ay

Page 8: PRML Chapter5.2

回帰問題(1次元)

)),,(|(),|( 1 wxwx ytNtp (5.12)

Page 9: PRML Chapter5.2

回帰問題(1次元)

Nttt ,,, 21 t NxxxX ,,, 21

学習データ

N

n

nntpp1

),,|(),,|( wxwXt

尤度を最大化するパラメータwを求める

Page 10: PRML Chapter5.2

回帰問題(1次元)

Nttt ,,, 21 t NxxxX ,,, 21

学習データ

負の対数尤度を最小化するパラメータwを求める

N

n

nntpp1

),,|(ln),,|(ln wxwXt

N

n

nn ytN1

1)),,(|(ln wx

Page 11: PRML Chapter5.2

回帰問題(1次元)

N

n

nn ytNp1

1)),,(|(ln),,|(ln wxwXt

N

n

nn yt1

22

1

)(2

exp2

ln

N

n

nn yt1

2)(22

ln2

1

2ln

2)(

2 1

2 Nyt

N

n

nn

Page 12: PRML Chapter5.2

回帰問題(1次元)

負の対数尤度を最小化するパラメータwを求める

2ln

2),(

2

),,|(ln

1

2 Nty

p

N

n

nn wx

wXt

(5.13)

N

n

nn tyE1

2),(

2

1)( wxw (5.14)

wに依存しない

誤差関数E(w) を最小化する

Page 13: PRML Chapter5.2

回帰問題(1次元)

負の対数尤度を最小化するパラメータβ を求める

2ln

2),(

2

),,|(ln

1

2 Nty

p

N

n

nn wx

wXt

(5.13)

Page 14: PRML Chapter5.2

回帰問題(1次元)

負の対数尤度を最小化するパラメータβ を求める

2ln

2),(

2

),,|(ln

1

2 Nty

p

N

n

nMLn

ML

wx

wXt

(5.13)

誤差関数E(w) を最小化するw = wML

Page 15: PRML Chapter5.2

回帰問題(1次元)

0),,|(ln

MLp wXt

02

ln2

),(2 1

2

Nty

N

n

nMLn wx

02

),(2

1

1

2

Nty

N

n

nMLn wx

N

n

nMLn

ML

tyN 1

2),(

11wx

Page 16: PRML Chapter5.2

回帰問題(1次元)

負の対数尤度を最小化するパラメータβ

(5.15)

N

n

nMLn

ML

tyN 1

2),(

11wx

Page 17: PRML Chapter5.2

回帰問題(1次元)

誤差関数の出力ユニット活性 での勾配

2),(

2

1)( ty

aE

awxw

ty

)2(w

jz

ay

ay

a

Page 18: PRML Chapter5.2

回帰問題(1次元)

• まとめ

– 誤差関数

– ノイズの分散

– 誤差の勾配

N

n

nn tyE1

2),(

2

1)( wxw (5.12)

N

n

nMLn

ML

tyN 1

2),(

11wx

(5.15)

tyEa

)(w

Page 19: PRML Chapter5.2

回帰問題(多次元)

・・・

・・・ ・・・ x y tε

ノイズ

)1(w

)2(w 連続値

(推定値) 観測値

)),,(|(),|( 1Iwxytwxt

Np (5.12)

各次元が独立/同じ分散

Page 20: PRML Chapter5.2

回帰問題(多次元)

・・・

・・・ ・・・ x y tε

ノイズ

)1(w

)2(w 連続値

(推定値) 観測値

)),,(|(),|( 1Iwxytwxt

Np (5.12)

各次元が独立/同じ分散

)2(w

M

j

jkjk zwa0

)2(

jz

kaky

kk ay

・・・

・・・

Page 21: PRML Chapter5.2

回帰問題(多次元)

N

n

nnNp1

1 )),,(|(ln),,|(ln IwxytwXt

N

n

nn

K

1

22

2exp

2ln yt

N

n

nn

K

1

2

22ln

2yt

2ln

22 1

2 NKN

n

nn

yt

演習5.2

Page 22: PRML Chapter5.2

回帰問題(多次元)

負の対数尤度を最小化するパラメータwを求める

2ln

22

),,|(ln

1

2 NK

p

N

n

nn

yt

wXt

N

n

nnE1

2),(

2

1)( twxyw

wに依存しない

誤差関数E(w) を最小化する

Page 23: PRML Chapter5.2

回帰問題(多次元)

負の対数尤度を最小化するパラメータβ を求める

N

n

nMLn

ML NK 1

2),(

11twxy

2ln

22

),,|(ln

1

2 NK

p

N

n

nn

yt

wXt

0),,|(ln

wXtp

Page 24: PRML Chapter5.2

回帰問題(多次元)

誤差関数の出力ユニット活性 での勾配

2),(

2

1)( kk

kk

tya

Ea

wxw

kk ty

)2(w

jz

kaky

kk ay

ka

Page 25: PRML Chapter5.2

回帰問題(多次元)

• まとめ

– 誤差関数

– ノイズの分散

– 誤差の勾配

N

n

nnE1

2),(

2

1)( twxyw

N

n

nMLn

ML NK 1

2),(

11twxy

(5.17)

kk

k

tyEa

)(w

Page 26: PRML Chapter5.2

識別問題(2クラス)

)1(w

)2(w

x y t

判別値 (0 or 1)

tt yytp

1

),(1),(),|( wxwxwx (5.12)

・・・

・・・

jz

出力 (0 ~1)

閾値

Page 27: PRML Chapter5.2

識別問題(2クラス)

)1(w

)2(w

x y t

判別値 (0 or 1)

tt yytp

1

),(1),(),|( wxwxwx (5.12)

・・・

・・・

jz

出力 (0 ~1)

閾値

)2(w

M

j

jj zwa0

)2(

jza

y

)exp(1

1

)(

a

ay

(5.19)

Page 28: PRML Chapter5.2

識別問題(2クラス)

)1(w

)2(w

x y t

判別値 (0 or 1)

tt yytp

1

),(1),(),|( wxwxwx (5.12)

・・・

・・・

jz

出力 (0 ~1)

閾値

)2(w

M

j

jj zwa0

)2(

jza

y

)exp(1

1

)(

a

ay

Page 29: PRML Chapter5.2

識別問題(2クラス)

尤度

N

n

t

n

t

nnn yyp

1

1),(1),(),|( wxwxwXt

負の対数尤度=誤差関数

N

n

nnnn ytyt

pE

1

1ln)1(ln

),|(ln)( wXtw

(5.21)

交差エントロピー誤差関数

Page 30: PRML Chapter5.2

識別問題(2クラス)

誤差関数の出力ユニット活性 での勾配

ytyta

Ea

1ln)1(ln)(w

ty

)2(w

jz

ay

)(ay

a

Page 31: PRML Chapter5.2

識別問題(2クラス)

演習5.6

ytyta

Ea

1ln)1(ln)(w

)(ay )1( yya

y

(4.88)

ytyt )1()1(

a

y

yt

a

y

yt

1

1)1(

1

より

ty

Page 32: PRML Chapter5.2

識別問題(2クラス)

• まとめ

–誤差関数

–誤差の勾配

N

n

nnnn ytytE1

1ln)1(ln)(w (5.21)

tyEa

)(w

交差エントロピー誤差関数

Page 33: PRML Chapter5.2

識別問題(2クラス×K)

・・・

・・・ ・・・ x

kt

閾値

)1(w

)2(w

ky

K

k

t

k

t

kkk yytp

1

1),(1),(),|( wxwxwx (5.22)

Page 34: PRML Chapter5.2

識別問題(2クラス×K)

・・・

・・・ ・・・ x

kt

閾値

)1(w

)2(w

ky

K

k

t

k

t

kkk yytp

1

1),(1),(),|( wxwxwx (5.22)

)2(w

M

j

jkjk zwa0

)2(

jz

kaky

)exp(1

1

)(

k

kk

a

ay

(5.19)

Page 35: PRML Chapter5.2

識別問題(2クラス×K )

尤度

N

n

K

k

t

nk

t

nknknk yyp

1 1

1),(1),(),|( wxwxwXt

負の対数尤度=誤差関数

N

n

K

k

nknknknk ytyt

pE

1 1

1ln)1(ln

),|(ln)( wXtw

(5.21)

交差エントロピー誤差関数

Page 36: PRML Chapter5.2

識別問題(2クラス×K )

K

k

kkkk

kk

ytyta

Ea 1

1ln)1(ln)(w

kk ty

)2(w

jz

a ky

)( kk ay

誤差関数の出力ユニット活性 での勾配 ka

Page 37: PRML Chapter5.2

識別問題(2クラス×K )

• まとめ

–誤差関数

–誤差の勾配

N

n

K

k

nknknknk ytytE1 1

1ln)1(ln)(w (5.23)

kk

k

tyEa

)(w

交差エントロピー誤差関数

Page 38: PRML Chapter5.2

識別問題(多クラス)

・・・

・・・ ・・・ x

)1(w

)2(w

y

出力

Ky

y

1

11

K

k

ky

Page 39: PRML Chapter5.2

識別問題(多クラス)

・・・

・・・ ・・・ x

)1(w

)2(w

y t

判別値 (1 of K)

出力

閾値

T]0,,1,,0[ t

Page 40: PRML Chapter5.2

識別問題(多クラス)

・・・

・・・ ・・・ x

)1(w

)2(w

K

k

t

kkyp

1

),(),|( wxwxt

y t

判別値 (1 of K)

出力

閾値

Page 41: PRML Chapter5.2

識別問題(多クラス)

・・・

・・・ ・・・ x

)1(w

)2(w

K

k

t

kkyp

1

),(),|( wxwxt

y t

判別値 (1 of K)

出力

閾値

)2(w

M

j

jkjk zwa0

)2(

jzka

ky

j

j

kk

a

ay

)exp(

)exp(

(5.25)

ソフトマックス関数

Page 42: PRML Chapter5.2

識別問題(多クラス)

尤度

N

n

K

k

t

nknkyp

1 1

),(),|( wxwXt

負の対数尤度=誤差関数

N

n

K

k

nknk yt

pE

1 1

),(ln

),|(ln)(

wx

wXtw

(5.25)

Page 43: PRML Chapter5.2

識別問題(多クラス )

K

k

kk

kk

yta

Ea 1

),(ln)( wxw

kk ty

)2(w

jz

kaky

j

j

kk

a

ay

)exp(

)exp(

誤差関数の出力ユニット活性 での勾配 ka

Page 44: PRML Chapter5.2

識別問題(多クラス)

演習5.7

)( kjkj

k

jyy

a

y

(4.107)

K

j

kjkj

j

j yyy

t1

)(1

より

K

j

jj

kk

yta

Ea 1

),(ln)( wxw

j

j

kk

a

ay

)exp(

)exp(

K

j k

j

j

ja

y

yt

1

1

Page 45: PRML Chapter5.2

識別問題(多クラス)

演習5.7 (続き)

K

j

jkkj yt1

)(

K

j

kjkj

j

j

k

yyy

tEa 1

)(1

)( w

K

j

jkj

K

j

jk tty11

kk ty

Page 46: PRML Chapter5.2

識別問題(多クラス )

• まとめ

–誤差関数

–誤差の勾配

N

n

K

k

nnknk ytE1 1

),(ln)( wxw (5.24)

kk

k

tyEa

)(w

Page 47: PRML Chapter5.2

まとめ

• 回帰問題及び識別問題について、誤差関数を負の対数尤度で定義

• 各ニューロンにおける誤差関数の出力ユニット活性による勾配は、回帰問題でも識別問題でも以下のようにかける。

kk

k

tyEa

)(w (5.18)

Page 48: PRML Chapter5.2

誤差関数まとめ

回帰問題

1次元

多次元

識別問題

2クラス

2クラス×K

多クラス

N

n

K

k

nnknk yt1 1

),(ln wx (5.24)

N

n

K

k

nknknknk ytyt1 1

1ln)1(ln (5.23)

N

n

nnnn ytyt1

1ln)1(ln (5.21)

N

n

nn

1

2

2

1ty

N

n

nn ty1

2),(

2

1wx (5.12)

Page 49: PRML Chapter5.2

以上!