chapter2 intelligent agent(知的エージェント)

29
Chapter 2 知的エージェント 稲谷 壮一郎|Soichiro Inatnai 東京農工大学 大学院工学府 情報工学専攻 情報工学専修 1年 中川研究室所属 Artificial Intelligence - Modern Approach

Upload: soichiro-inatani

Post on 07-Jul-2015

449 views

Category:

Technology


5 download

DESCRIPTION

輪講で発表した Stuart Russell, Peter Norvig, "Artificial Intelligence: A Modern Approach"の2章のスライドです.

TRANSCRIPT

Page 1: Chapter2 intelligent agent(知的エージェント)

Chapter 2知的エージェント

稲谷 壮一郎|Soichiro Inatnai

東京農工大学 大学院工学府 情報工学専攻 情報工学専修 1年

中川研究室所属

Artificial Intelligence - Modern Approach

Page 2: Chapter2 intelligent agent(知的エージェント)

1はじめに

本章では,

1) 知的なエージェントが何をするか,

2) どのように環境に適応するか,

3) どのように評価するか,

4) どうやってエージェントを設計するか

について検討する.

Page 3: Chapter2 intelligent agent(知的エージェント)

2知的エージェント

エージェントとは,ある環境でセンサで知覚し,ある環境に対してエフェクタを通して動作するもの.

Environment環境

Percepts知覚

Actions動作

図1 一般的なエージェントのモデル図

Sensorsセンサ

Agentエージェント

Effectorsエフェクタ

Page 4: Chapter2 intelligent agent(知的エージェント)

3知的エージェント

ロボットをエージェントと考えると…

図2 H社のASIMO

センサ カメラ(視覚) 赤外線センサ(床面) 超音波センサ

エフェクタ 様々なモーター(関節各部)

環境物理的な現実空間

Page 5: Chapter2 intelligent agent(知的エージェント)

4本書の目的

ある環境で「うまくやる」( = do a good job of acting)エージェントを設計すること.

Q.「うまくやる」って何?

A. 何を意味するか定義して,「うまくやる」エージェントを設計する方法について学ぶ.( の部分を考える)

Sensorsセンサ

Agentエージェント

Effectorsエフェクタ

Page 6: Chapter2 intelligent agent(知的エージェント)

5どのように動作すべきか

合理的エージェント(rational agent)

⇒ 合理的に正しい動作をするエージェント.

「エージェントが最も成功する動作=正しい動作」

エージェントの成功は

”いつ,どのようにして“決定するの?

Page 7: Chapter2 intelligent agent(知的エージェント)

6エージェントの評価

性能尺度(performance measure)

… エージェントがどれくらい成功したかを客観的に評価する基準

例:汚れた床を掃除するエージェントの場合

8時間ごとに片付けたゴミの量

使われた電気の量

発生した騒音 etc

Page 8: Chapter2 intelligent agent(知的エージェント)

7合理的と全能(omniscience)

全能のロボットなら, 合理的な選択ができるか?

できる.だが,全能を実現することは不可能.

① 周りを見渡して車がいないことを確認.

② 横断歩道を横切る.

③ 空から飛行機のドアが落ちてきて潰される.

合理性は,分かっていることから

予測できる成功に関係している

不合理?

これは合理的な行動か?

Page 9: Chapter2 intelligent agent(知的エージェント)

8「合理的である」とは

どんなときも「合理的である」ことは, 4つの事柄に依存する.

成功の度合を定義する性能尺度.

エージェントが知覚したもの全て.(この完全な知覚の履歴を知覚系列と呼ぶ.)

エージェントが環境について知っていること.

エージェントがとることのできる動作.

Page 10: Chapter2 intelligent agent(知的エージェント)

9理想合理的エージェント

知覚系列のすべてに対して,知覚系列 と エージェント自身が持つ組込み知識に基づいて,性能尺度を最大にする動作を選択する.

合理性において,有用な情報を得るために動作をすることは重要.

① ②

- リスクの軽減

- 性能尺度の拡大

道路を渡るときは左右を見る.

知覚系列を持たない時計は合理的か(?)

Page 11: Chapter2 intelligent agent(知的エージェント)

10知覚系列から動作への理想的マッピング

どんな 知覚系列 に対しても,それに応じて

エージェントが取るべき動作を特定できる.

理想的エージェントを設計できる.

例:知覚 x に対する平方根 z のマッピング

知覚(Percept) x 動作(Action) z

1.0 1.00000000

1.1 1.04880884

1.2 1.09544511

1.3 1.14017542… …

Page 12: Chapter2 intelligent agent(知的エージェント)

11自律性(Autonomy)

エージェントの動作が完全に 組込み知識 に

基づいていて,知覚に注意を払う必要がないとき,

自律性 に欠けるという.

行動が自分自身の経験に基づいてなされるときに限り,

そのシステムは 自律的 である.

× 経験をほとんど持たない時は,

設計者が知識を与えなければデタラメに動作する.

Page 13: Chapter2 intelligent agent(知的エージェント)

12エージェントの構造

エージェントプログラム

… エージェントの知覚から動作へのマッピングを実現する関数

エージェント=アーキテクチャ+プログラム

エージェントを設計する前に,

エージェントの性質を理解する必要がある.

知覚 Percept

ゴール Goal

動作 Action

環境 Environment

Page 14: Chapter2 intelligent agent(知的エージェント)

13エージェントの構造

エージェントタイプ

知覚 P 動作 A ゴール G 環境 E

医療診断システム

症状,所見,

患者の応答質問,テスト,治療

健康な患者,

コストの最小化

患者, 病院

衛星画像解析システム

異なる強度のピクセル,

シーンのカテゴリの

印字

正しいカテゴリ化

人工衛星からの画像

部品移動ロボット

異なる強度のピクセル

部品を掴み,

箱に分類

部品を正しい箱に

入れる

部品を載せたベルトコ

ンベア

対話英語教師タイプされた単語列

練習問題,

示唆,

訂正の印字

学生のテストの点を最大にする

学生の集合

Page 15: Chapter2 intelligent agent(知的エージェント)

14エージェントプログラム

骨格プログラム(skeleton program)

1. 新たに知覚を得ると内部情報を更新(記憶).

2. 知覚に基づき最良の動作を選択(マッピング).

3. 選択した動作の情報も内部に記憶.

エージェントプログラムが入力として得られる知覚は一つだけ?

ゴールや性能尺度は, 骨格プログラムに含まれない.

Page 16: Chapter2 intelligent agent(知的エージェント)

15エージェントプログラムのタイプ

単純反射エージェント

記憶を持つ反射エージェント

ゴール主導エージェント

効率主導エージェント

単純低信頼

複雑高信頼

Page 17: Chapter2 intelligent agent(知的エージェント)

16単純反射エージェント

現在の状態 に適合するルールを見つけて,そのルールに見合う動作を行う

例:前の車が減速した ブレーキを踏む

単純なため,適用できる範囲がとても狭い.

条件-動作ルール(condition-action rule)

Page 18: Chapter2 intelligent agent(知的エージェント)

17単純反射エージェント

エージェント(Agent)

センサ

エフェクタ

環境

条件-動作ルール 今すべき動作は?

今の世界は?

Page 19: Chapter2 intelligent agent(知的エージェント)

18記憶を持つ反射エージェント

内部状態(internal state) を用いることで,単純反射エージェントの適用範囲を広げたもの.(内部状態を持つ反射エージェントとも呼ぶ) 時間の経過とともに内部状態は更新される.

世界がどのように変化するかに関する情報

自身の行動が世界にどのような影響を与えるかに関する情報

例:車が車線変更を行う場合

「信号が見えた 車線変更する」という瞬間的な知覚だけでは不十分.

「近くに車が無いか」という状態を内部に保持.

その状態も考慮した上で車線変更するかを決定.

Page 20: Chapter2 intelligent agent(知的エージェント)

19記憶を持つ反射エージェント

エージェント(Agent)

センサ

エフェクタ

環境

今すべき動作は?

今の世界は?

内部状態

世界の変化則

条件-動作ルール

自身の行動の影響

Page 21: Chapter2 intelligent agent(知的エージェント)

20ゴール主導エージェント

環境の情報だけで意思決定を行うのは不十分.エージェントには ゴールに関する情報 が必要.

- 例:ゴール = 乗客の目的地

- タクシーの移動方向は目的地に依存する.

探索 や プラニング により動作を決定(3章以降)

未来に関する考慮を含む(条件-動作ルールとの根本的な違い)

「もしこの動作をしたら何が起きるのだろうか」

適応性・柔軟性が高い

What will happen if I do such-and-such?

Page 22: Chapter2 intelligent agent(知的エージェント)

21ゴール主導エージェント

エージェント(Agent)

センサ

エフェクタ

環境

ゴール 今すべき動作は?

今の世界は?

行動を行うと?

内部状態

世界の変化則

自身の行動の影響

Page 23: Chapter2 intelligent agent(知的エージェント)

22効率主導エージェント

より性能尺度の高い動作(列)を決定するために,効用関数 を用いる.

矛盾する目標(e.g.安全性 vs スピード)がある場合は,適切なトレードオフを指定する.

確実に目標を達成する動作列が存在しない場合,成功の見込みをゴールの重要性に対して,重み付けする方法をとる.

状態を幸せの度合を表す実数値へマッピングする

Page 24: Chapter2 intelligent agent(知的エージェント)

23効率主導エージェント

エージェント(Agent)センサ

エフェクタ

環境

効用

今すべき動作は?

今の世界は?内部状態

世界の変化則

自身の行動の影響 行動を行うと?

その状態の幸福度は?

Page 25: Chapter2 intelligent agent(知的エージェント)

24エージェントと環境

環境(Environment) とは,

「エージェントの外部にあって, エージェントの意思によって変更できないもの全てをさす」

(参考文献[2]より)

環境(シミュレータ)プログラム

… エージェントと環境を結びつける

1. 各エージェントに知覚を与える2. エージェントから動作を受け取る3. 環境を更新

Page 26: Chapter2 intelligent agent(知的エージェント)

25環境の特徴

環境はいくつかの種類に分類できる.

アクセス可能 vs アクセス不能

決定的 vs 非決定的

エピソード的 vs 非エピソード的

静的 vs 動的

離散的 vs 連続的

異なった環境のタイプに応じて,その環境で効果的に働くためには, 異なったタイプのエージェントプログラムが必要.

右側の環境は複雑.

Page 27: Chapter2 intelligent agent(知的エージェント)

26まとめ(1)

エージェントは,環境においてセンサで知覚してエフェクタで動作する.

理想的エージェントは,知覚系列と自身の知識に基づいて,性能尺度を最大にするような動作を選択する.

エージェントは,設計者が組み込んだ環境に関する知識よりも,自らの経験に依存して動作を選択する度合を備えた自律性を持つ.

Page 28: Chapter2 intelligent agent(知的エージェント)

27まとめ(2)

エージェント=アーキテクチャ+プログラム

エージェントプログラムは,内部情報を更新しつつ,知覚から動作へのマッピングを行う.

エージェントプログラムの適切な設計は,知覚,動作,ゴール,環境 に依存する.

Page 29: Chapter2 intelligent agent(知的エージェント)

28参考文献

[1] エージェントアプローチ 人工知能

[2] マルチエージェントシステムの基礎と応用―複雑系工学の計算パラダイム 大内 東 (著), 川村 秀憲 (著), 山本 雅人 (著)