байесовские сети и их приложения

Байесовские сети и их приложения.

Смирнова Н.В.

ИПУ РАН, 20111

БС: мотивация к использованию

Для решения диагностических задач

Классификация (наивный байесовский классификатор)

ДБС

Содержание доклада

Определение БС, структура БС

Основные вероятностные вопросы к БС

Пример: наивный байесовский классификатор

БС – графическая вероятностная модель

A, B булевские (принимают значения из {true, false}(могут быть непрерывными, дискретными)

Определение БС - 1

Используемые обозначения - 1

( )P A true ( )P a

( )P A false ( )P a

( )P A - вектор,

Априорная вероятность всех возможных значений сл. величины:

( ) ( ), ( )aP A P a P

Используемые обозначения - 2

- вектор, полное совместное распределение( , , )P A B Cслучайных величин , ,A B C

( , , ) ( , , ), ( , , ),..., ( , , )c a b cP A B C P a b c P a b P

|( | ) ( | ), ( | ), ( | ), ( )a b a bP A B P a b P b P a P

Основные вероятностные вопросы к БС

«добрый»

«толстый»

( | )?P A C

( | )?P C A

( , , )?P A B C

С«любит

покушать»

«От причин к следствиям»

( | )?P B C«От следствий к причинам»

«Имеют место одновременно»

( , )?P A B( , )?P AC ( , )?P B C( )?P B ( )?P C

Таблицы условных вероятностей (параметры БС)-2

( ) 0.5P a ( ) 0.5aP

( | ) 0.9P b a ( | ) 0.3aP b ( | ) 0.1bP a ( | ) 0.7b aP

Таблицы условных или безусловных вероятностей в БСможно представить более компактно

( )P A( ) 0.5P a ( ) 0.5aP

( | )P B A

( | ) 0.9P b a ( | ) 0.3aP b ( | ) 0.1bP a ( | ) 0.7b aP

Каждому узлу БС приписывается таблица условных или безусловных вероятностей

( ) 0.5P a

( | ) 0.9P b a ( | ) 0.3aP b

БС с «компактными» таблицами условной и безусловнойвероятности

Основные формулы байесовского подхода

( , )( )

( | ) P A BP B

( , ) ( | ) ( )P A B P A B P B

( , ) ( | ) ( )P B A P B A P A

( | ) ( ) ( | ) ( )P A B P B P B A P A( | ) ( )

( )( | ) P B A P A

P BP A B

( ) ( | )( )n

P A P B AP B

(опр. усл. вер.)

(из 1)

(из 2, 3)

(теорема Байеса, из 4)

(ф-ла полн. вер., из 5)

Вероятностные вопросы к БС-1

«добрый»

«толстый»

С«любит

покушать»

( ) 0.5P a

( | ) 0.9P b a ( | ) 0.3aP b

( | ) 0.8P c b ( | ) 0.4bP c

( , )?P a b

Поскольку вероятность любого высказывания A

равна сумме вероятностей атомарных событий, где

A=true, то

A ( , )?P a b

имеем:,( , , ) ( , )( , ) P a b c P a bcP a b

Возможные события:, ,a b c , ,a b c , ,a b c

, ,a b c , ,a b c , ,a b c

, ,a b c , ,a b c

Как найти величину типа

( , , )?P a b c

1,..., ) ?(

nP x x

( , ) ( | ) ( )P a b P a b P b

Parents(X1)2X 3

С помощью

1 1 1 1 1,..., ,..., ,...,) | ) )( ( (

n n n nP x x P x x x P x x

1 1 1 2 1 1,..., ,...,) | )... | ) )( ( ( (

n n nP x x P x x x P x x P x

Поскольку в БС 1 1,...,| ) | ( ))( (

i i i iparents XP x x x P x

Теорема о декомпозиции:

1,...,

) ( | ( ))(n

P X parents XP X X

, , , ) ) ) | , ) | )( ( ( ( (A B C D A D B A D C BP P P P P

, , , ) ) ) | , ) | )( ( ( ( (a b c d a d b a d c bP P P P P

( , , , ) ( ) ( ) ( | , ) ( | )P a b c d P a P d P b a d P c b

В силу теоремы о декомпозиции,

Например, это означает, что:

Возвращаясь к нашему примеру,

имеем:,( , , ) ( , )( , ) P a b c P a bcP a b

( ) 0.5P a

( | ) 0.9P b a ( | ) 0.3aP b

( | ) 0.8P c b ( | ) 0.4bP c

( , )?P a b

, , ) ) | ) | ), , , ) ( ) ( | ) ( | )( ( ( ( (a b c a b a c b a b c P a P b a P c bP P P P P ( , ) 0.5 0.9 0.8 0.5 0.9 (1 0.8) 0.45P a b

Вероятностные вопросы к БС-6 Итак, мы вычислили, что

«добрый»

«толстый»

С«любит

покушать»

0.45( , )P a b

«добрый»

«толстый»

С«любит

покушать»

( ) 0.5P a

( | ) 0.9P b a ( | ) 0.3aP b

( | ) 0.8P c b ( | ) 0.4bP c

( | )?P a c

Согласно опр. усл. вер.,

( , )( | )( )

P a cP a cP c

( , ) ( , , ) ( , , ) ( , , )A a B C c

P a c P A B C P a b c P a b c

( | )?P a c

( ) ( , , ) ( , , ) ( , , ) ( , , ) ( , , )A B C c

P c P A B C P a b c P a b c P a b c P a b c

(полн. вер.)

Надо вычислить 6 величин видаПричем некоторые повторяются. Нельзя ли сэкономить?

( ) ( | ) ( | )P A P B A P C B

Можно. Существует прием «нормализация»

( , ) ( , , ) ( , , ) ( , , )A a B C c

P a c P A B C P a b c P a b c

( ) ( , , ) ( , , ) ( , , ) ( , , ) ( , , )A B C c

P c P A B C P a b c P a b c P a b c P a b c

Было нужно вычислить 6 величин, теперь 4:

( , )P a c ( , )P a c

Экономия вычислений очевидна.

Возвращаясь к нашему примеру,

имеем:( , ) 0.5 0.9 0.8 0.5 0.1 0.4 0.38P a c

( ) 0.5P a

( | ) 0.9P b a ( | ) 0.3aP b

( | ) 0.8P c b ( | ) 0.4bP c

( | )?P a c

( , ) 0.5 0.3 0.8 0.5 0.7 0.4 0.26P a c ( | ) 0.38/(0.38 0.26) 0.59P a c

Вероятностные вопросы к БС-11 Итак, мы вычислили, что

«добрый»

«толстый»

С«любит

покушать»

0.59( | )P a c

«добрый»

«толстый»

С«любит

покушать»

( ) 0.5P a

( | ) 0.9P b a ( | ) 0.3aP b

( | ) 0.8P c b ( | ) 0.4bP c

( | )?P c a

Согласно опр. усл. вер.,

( , )( | )( )

P c aP c aP a

( | )?P c a

Этот пример сводится к предыдущему (вычисляется аналогично)

Односвязная сеть

(сложность линейная) 25

В примере максимум понадобилось вычислить 4 величины

( | )?P c a

( | )?P a c

( , )?P a b

Основные типывопросов

Многосвязная сеть (в общем случае вывод NP-труден)26

( , )( | )( , ) ( , )

P u zP u zP u z P u z

, , , ,

( , ) ( , , , , , , )T V W X Y

P u z P u z T V W X Y

, , , ,

( , ) ( , , , , , , )T V W X Y

P u z P u z T V W X Y

Здесь нужно вычислитьуже 32 величины!

Предполагается, что независимы, т.е.

Наивный байесовский классификатор

FnF1 …

1,...,( | ) ?

nP C F F

(вероятности принадлежности наблюдения к одному из классов C при условии того, что зависимые пер-ые принимают заданные значения

1,...,

27| ,..., ) | ), ( (i j iC Ci j P F F P F

Наивный байесовский классификатор. Фильтрация спама

offer is secretclick secret linksecret sports link

play sports todaywent play sports

secret sports eventsports is today

sport costs money

Message

wnw1 …

secret is secret

w1 w2 w3

Dictionary{offer, is, secret,…,money}

12 слов

Наивный байесовский классификатор. Обучение-1

Обучение происходит с использованием следующей формулы (“Laplacian smoothing”):

( )( )| |

count x kP xN k x

- сглаживающий параметр. Задаем самиk

N - количество примеров для обучения

( )count x - количество примеров, в которых X x| |x - количество возможных значений X

sport costs money

Message

wnw1 …

( )?P spam

( )( )| |

count x kP xN k x

3 1( ) 0.48 1 2

P spam

Пусть , тогда 1k

sport costs money

Message

wnw1 …

( | )?i

P w spam

( )( )| |

count x kP xN k x

0 1(" "| ) 0.059 12

P today spam

Пусть , тогда 1k

3 1("sec "| ) 0.199 12

P ret spam

Наивный байесовский классификатор. Использование-1

Пусть получено сообщение M=«today is secret»

( | )?P spam M

M=«today is secret»

w1 w2 w3

( , )( | )( , ) ( , )

P M spamP spam MP M spam P M ham

w3w1 …

1 2 3, ,( , ) ( , )P M spam P w w w spam

аналогично вычисляется ( , )P M ham1 2 3 1 2 3

, ,( , ) ( | ) ( | ) ( | ) ( )P w w w spam P w spam P w spam P w spam P spam

Наивный байесовский классификатор. Использование-2

где M=«today is secret» ( | )?P spam M

( | ) 0.48P spam M

w3w1 …

( , ) 1/21 2/21 4/21 2/5P M spam

Пусть(" "| ) 1/21,P today spam

(" "| ) 2/21,P is spam

("sec "| ) 4/21,P ret spam (" "| ) 3/27,P today ham

(" "| ) 2/27,P is ham ("sec "| ) 2/27,P ret ham

Тогда

( ) 2/5,P spam ( ) 6/10,P ham

( , ) 3/27 2/27 2/27 6/10P M ham

СММ и БССММ определяется как БС следующего вида:

Последовательность скрытых состояний,изменяющихся с течением времени

Каждое состояние зависит только от предыдущего

Для каждого состояния известно измерение(наблюдение) в соотв. момент времени

Параметры:

1( )P S

t tP S S

( | )t t

P Z S«модель перехода»

«модель наблюдения»

Спасибо за внимание!

байесовские сети и их приложения

Documents

sibriver_мобильные приложения

Бренды + Мобильные приложения +...

Роль заказчика в процессе...

призентация приложения «paint»

l5: Л5 Байесовские алгоритмы

гоков мобильные приложения

Коллективный договор,...

Удмуртскоязычные социальные...

Михаил Черномордиков:...

Новостные приложения

Приложения теории кодирования

Изоморфные react-приложения

Пример реализации приложения

Разработка приложения...

Сверхширокополосные...

3. Приложения

и веб разработка которые - indee...

Сервисные приложения...

Руководство пользователя ardinvest...

Самообучающиеся системы, весна...