情報符号理論 まとめ - 京都大学...補助定理3...

21
Information and Coding Theory, 2017 by Toyoaki Nishida 情報符号理論まとめ Copyright © 2017 Toyoaki Nishida All Rights Reserved.

Upload: others

Post on 18-Jul-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

Information and Coding Theory, 2017 by Toyoaki Nishida

情報符号理論—まとめ

Copyright © 2017 Toyoaki Nishida All Rights Reserved.

Page 2: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

本科目の構成

雑音源noise source

情報源符号器source encoder

通信路符号器channel encoder

通信路channel

情報源復号器source decoder

通信路復号器channel decoder

情報源符号(例:文字)

通信路符号(例:FAX, デジタル符号)

情報源information source

受信者destination

通報(例:アイデア)

①(離散系)情報源符号化とその限界—瞬時復号可能性を保ったまま,平均符号長をどれだけ短くできるか?

②(離散系)通信路符号化とその限界—通信路の品質から定まる通信速度の範囲内なら,復号誤りを任意に小さくできる

③離散系の誤り訂正/検出符号構成法

Page 3: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

講義骨子

1. 情報理論の枠組み情報理論の基礎となる情報量の概念を中心に,情報理論の枠組みを紹介する.

2. 情報源符号化とその限界情報源符号化法,情報源符号化定理,情報源のエントロピーについて述べる.

3. 通信路符号化とその限界情報量の概念を導入し,相互情報量,通信路容量,通信路符号化,通信路符号化定理について述べる.

4. 通信路符号化法誤り検出・訂正が可能な符号の構成法について,パリティ検査符号,ハミング符号,巡回符号,BCH符号などを中心に述べる

5. アナログ情報源の扱いフーリエ級数,フーリエ変換など,アナログ情報の扱いについて基本的事項を述べる.

Page 4: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

情報源符号化とその限界

Shannon-Fanoモデル

情報源のモデル化

情報源符号化

平均符号長

情報源符号の持つべき性質—一意復号可能性,瞬時性

瞬時性の判定—接頭条件

瞬時符号構成可能性—クラフトの不等式

一意復号可能な符号の構成可能性—マクミランの不等式

クラフトの不等式

Mlll ,,, 21

121 Mlll

qqq

長さ のM個の符号語 をもつq元瞬時符号を構成できる.Mccc ,,, 21

Page 5: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

瞬時性の判定

符号の木:符号化で使われる符号語の集合を構造的に表現したもの

C1={00,010,011,10,110,111}

1

1

1

0

0

0

00

010

10

110

1 011

0

1

1

1

0 1

010

111

01

0 0

C2={0,01,010,10,111}

0

1 111

0 10

Page 6: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

コンパクト符号

コンパクト符号:平均符号長の最も短い瞬時符号

ハフマン符号:コンパクト符号構成法

どうしてハフマン符号がコンパクト符号になるのか?

補助定理1:瞬時符号がコンパクト符号であるための必要条件

補助定理2:コンパクトな瞬時符号の十分条件

コンパクト符号は唯一とは限らない

ハフマン符号で構成されないコンパクト符号

3元符号の場合

シャノン-ファノ符号

Page 7: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

ハフマン符号化

例:情報源記号発生確率を〈A: 0.6, B : 0.2, C: 0.1, D: 0.07 , E: 0.03〉とすれば,ハフマン符号化は次のように行われる.

A(0.6)0

B(0.2)

C(0.1)

D(0.07)

0

0

1

1

(0.2)

(0.4)

(1.0)

0

10

110

1110

1

E(0.03)

0

1

(0.1)

1111

Page 8: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

平均符号長の限界と情報源符号化定理

情報源の1次エントロピー

補助定理3

情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限

拡大情報源とその1次エントロピー

ブロック符号化:情報源から発生する記号をまとめて符号化する方法.

ブロック符号化をすることによって,平均符号長を情報源エントロピーに近づけることができる.

情報源符号化定理

)(loglog1

12

1

2 SHppqpM

i

ii

M

i

ii

)()( SHLSH

M

i

ii ppSH1

21 log)(

)()( 11 SnHSH n (Sが無記憶の場合)

Page 9: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

基本的な情報源符号化法

Sのn次のハフマンブロック符号化:Sのn次拡大情報源のハフマン符号化でSの1情報源記号あたり平均符号長をH1(S)に限りなく近づけられる.

非等長情報源系列の符号化では,情報源記号の有限列のなかで出現頻度が高い順にm個を選んでブロック符号化する.→ mをハフマンブロック符号化のときほど大きくしなくてもSの1情報源記号あたり平均符号長を小さくできる.

ランレングス符号化,ランレングスハフマン符号化では,出現頻度の高い情報源記号の連続した生起(run length)に注目してブロック符号化をする.

情報源系列の累積確率に注目した算術符号は,符号化が簡単である.

Page 10: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

記憶のある情報源

記憶を持つ情報源とは?

条件付確率を使ったモデル化

マルコフ情報源モデル

エルゴード性

状態の分類,マルコフ情報源モデルの分類

マルコフ情報源の遷移確率行列表現

正規マルコフ情報源モデルの漸近的性質

正規マルコフ情報源の定常分布の計算法

一般マルコフ情報源のエントロピー計算法

マルコフ情報源のn 次エントロピー

Page 11: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

マルコフ情報源

S10

S0

S1

S9

非周期的

周期的

S2

S4

S6

S8S5

S7

S11

S3

S12

S14

S13

過渡的

Page 12: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

相互情報量と通信路モデル

情報量:メッセージが不確かさ(エントロピー)を減らす度合いを定量化

不確かなメッセージからでも情報は得られる→相互情報量として定量化

相互情報量の性質

通信路の働きは相互情報量で説明される.

通信路自体は条件付確率を使ってモデル化する→通信路行列

基本的な通信路として2元対称通信路と2元対称消失通信路がある.

通信路の(理論的)性能は通信路容量で表す.

),()()(

)|()(

)|()();(

YXHYHXH

XYHYH

YXHXHYXI

)}(),(min{);(0 YHXHYXI

Page 13: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

通信路容量

通信路容量は入力の確率分布を変化させたときの相互情報量の最大値であり,通信路に固有の値である.

一様性があるときや構造的な特徴があるときは,通信路容量は簡単に計算できる.

一般的には,最適化問題の一種として扱われ,ラグランジュの未定乗数法などで解けることもある.

記憶のない2元定常通信路一般の通信路容量は幾何学的に理解することができる.

);(max YXICp

Page 14: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

最尤復号法と通信路符号化定理

誤り検出や訂正能力を高めるためには復号領域を大きくする.

限界距離復号法では各符号語のまわりに半径t1の小球を作りt1以下の誤り訂正を行えるようにする.

符号語wiを伝送したきの受信語yがwiの復号領域に入る確率が最大になるよう復号領域を定めたのが最尤復号法.

通信路符号化定理によれば,情報伝送速度Rが通信路容量未満であれば,復号誤り率を任意に下げることができる.

通信路符号化定理は,代表的系列とランダム符号化の手法を使って証明する.

別証明もある.

Page 15: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

最尤復号法

w2

w1

wi

w2

Ω2

w1

Ω1

wi

Ωi

通信路入力 通信路出力

Page 16: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

限界距離復号法

符号Cの最小ハミング距離:

受信空間において,各符号語を中心として半径t1の球を作る.

これらの球を復号領域とすれば,この符号により,t1個以下の誤りを訂正でき, t1 +t2個以下の誤りを検出できる.

),(min,,

min vudd HCvuvu

1 2

3

3w

2w1w

1t 1t

1t

12 1min td

12 t

12 1min td であれば,これら

の球は重複することはない.

Page 17: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

通信路符号化定理

与えられた通信路の通信路容量を とする. であれば,任意の正数 に対し,復号誤り率 が を満たす情報速度の符号が存在する.しかし, であれば,そのような符号は存在しない.

C CR

eP eP

CR

通信路(通信路容量C)

X Y

情報源S0

通信路容量を達成する情報源 )|()()|()(max YXHXHYXHXHC p

代表的系列とランダム符号化の手法を使って証明する

Page 18: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

通信路符号化の枠組み

n

k個の情報ビット n-k個の検査ビット

ビット

通信路

シンドローム計算

x c y

e

s

w

受信語

シンドローム

符号語

誤り

誤り訂正

誤り検出/訂正

(n, k)符号

Page 19: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

通信路符号化—基本概念

誤り検出や訂正を行うためにはシンドロームを用いる.

単一パリティ検査は最も単純な誤り検出符号.

水平垂直パリティ検査符号を用いると,1誤りが訂正できる.

ハミング符号は水平垂直パリティ検査符号より効率のよい単一誤り訂正符号である.

生成行列と検査行列による符号化とシンドローム計算

Page 20: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

通信路符号化—巡回符号

巡回符号では,符号のブール多項式表現を使って見通し良く符号化と復号を行う.

多項式の周期,生成多項式,規約多項式.

巡回符号の符号化.

巡回符号は符号を巡回シフトしても符号である.

巡回符号は1誤り訂正可能である.

巡回符号の復号のしかた.

除算器による実現.

Page 21: 情報符号理論 まとめ - 京都大学...補助定理3 情報源記号ごとに瞬時符号を構成した場合の平均符号長の下限 ... 最尤復号法と通信路符号化定理

通信路符号化法—ガロア体とBCH符号

ガロア体

素体

素体の拡張

BCH符号

構成法

復号法

基本的性質