Теория игр, весна 2013: Лекция 5

43
Домашнее задание 8. Имеется два игрока, которым нужно разделить 100 долларов. Игрок 1 предлагает сумму x [0, 100] игроку 2. Если игрок 2 соглашается, то он получает x, а игрок 1 получает 1 - x. Если он не соглашается, то оба получают по 0. Найдите все равновесия по Нэшу в этой игре. И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 1 / 25

Upload: cs-center

Post on 07-Jul-2015

278 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Теория игр, весна 2013: Лекция 5

Домашнее задание

8. Имеется два игрока, которым нужно разделить 100 долларов. Игрок 1предлагает сумму x ∈ [0, 100] игроку 2. Если игрок 2 соглашается, то онполучает x, а игрок 1 получает 1− x. Если он не соглашается, то оба получаютпо 0. Найдите все равновесия по Нэшу в этой игре.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 1 / 25

Page 2: Теория игр, весна 2013: Лекция 5

Домашнее задание

9. Рассматриваем игру с постройкой магазинов, которая описывалась назанятии: жители города равномерно распределены по отрезку [A, B]. n игроковвыбирают места для постройки своих магазинов. Выигрыш игрока равен меремножества людей, для которых его магазин является ближайшим (люди, длякоторых несколько магазинов являются ближайшими, ”делятся” поровну междуэтими магазинами).а) Пусть n = 4. Найдите все равновесия по Нэшу.б) Пусть n = 5. Найдите все равновесия по Нэшу.в) Найдите все значения n, для которых в игре нет равновесия по Нэшу.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 2 / 25

Page 3: Теория игр, весна 2013: Лекция 5

Домашнее задание

10. Рассмотрим игру из предыдущей задачи в пространстве большейразмерности.а) Существует ли такое множество ненулевой меры (вместо отрезка [A, B]),чтобы для n = 3 было равновесие по Нэшу?б) Существует ли такое выпуклое множество?

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 3 / 25

Page 4: Теория игр, весна 2013: Лекция 5

Домашнее задание

11. Рассматриваем аукцион первой цены, на котором разыгрываются двеединицы товара. То есть сначала человек, назначивший макисмальную цену,покупает товар по этой цене, затем тот, кто назначил вторую по величине цену,покупает второй экземпляр товара по этой цене. Найдите хотя бы одноравновесие по Нэшу в данной игре.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 4 / 25

Page 5: Теория игр, весна 2013: Лекция 5

Задача

Придумать игру двух лиц, в которой у каждого игрока по три стратегии и парасмешанных стратегий (0.5, 0.3, 0.2), (0.5, 0, 0.5) является равновесием поНэшу.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 5 / 25

Page 6: Теория игр, весна 2013: Лекция 5

Задача

Рассматривается конечная бескоалиционная игра двух игроков, где у первого n(чистых) стратегий, а у второго m.а) Каковы минимальное и максимальное возможные количества равновесий поНэшу в чистых стратегиях?б) Тот же вопрос про смешанные стратегии.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 6 / 25

Page 7: Теория игр, весна 2013: Лекция 5

Рафинирование равновесий по Нэшу

Ситуация x∗ ( в чистых стратегиях) называется ситуацией сильного равновесия вигре Γ = ⟨N, {Xi}i∈N, {Ki}i∈N⟩, если для любой коалиции игроков S ⊂ N и любойее стратегии xS = (xi)i∈S найдется такой игрок i ∈ S, что

Ki(x∗S, xS) ≤ Ki(x

∗).

Общий смысл - никакой коалиции невыгодно отклоняться от положенияравновесия.

.Упражнение........Приведите пример игры, где нет ситуаций сильного равновесия.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 7 / 25

Page 8: Теория игр, весна 2013: Лекция 5

Рафинирование равновесий по Нэшу

Ситуация x∗ ( в чистых стратегиях) называется ситуацией сильного равновесия вигре Γ = ⟨N, {Xi}i∈N, {Ki}i∈N⟩, если для любой коалиции игроков S ⊂ N и любойее стратегии xS = (xi)i∈S найдется такой игрок i ∈ S, что

Ki(x∗S, xS) ≤ Ki(x

∗).

Общий смысл - никакой коалиции невыгодно отклоняться от положенияравновесия.

.Упражнение........Приведите пример игры, где нет ситуаций сильного равновесия.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 7 / 25

Page 9: Теория игр, весна 2013: Лекция 5

Рафинирование равновесий по Нэшу

Ситуация x∗ ( в чистых стратегиях) называется ситуацией сильного равновесия вигре Γ = ⟨N, {Xi}i∈N, {Ki}i∈N⟩, если для любой коалиции игроков S ⊂ N и любойее стратегии xS = (xi)i∈S найдется такой игрок i ∈ S, что

Ki(x∗S, xS) ≤ Ki(x

∗).

Общий смысл - никакой коалиции невыгодно отклоняться от положенияравновесия.

.Упражнение........Приведите пример игры, где нет ситуаций сильного равновесия.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 7 / 25

Page 10: Теория игр, весна 2013: Лекция 5

Рафинирование равновесий по Нэшу

Ситуация x∗ ( в чистых стратегиях) называется ситуацией сильного равновесия вигре Γ = ⟨N, {Xi}i∈N, {Ki}i∈N⟩, если для любой коалиции игроков S ⊂ N и любойее стратегии xS = (xi)i∈S найдется такой игрок i ∈ S, что

Ki(x∗S, xS) ≤ Ki(x

∗).

Общий смысл - никакой коалиции невыгодно отклоняться от положенияравновесия.

.Упражнение........Приведите пример игры, где нет ситуаций сильного равновесия.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 7 / 25

Page 11: Теория игр, весна 2013: Лекция 5

Рафинирование равновесий по Нэшу

Устойчивость по отношению к ошибкам ”дрожащей руки”.

Пусть Γ = ⟨N, {Xi}i∈N, {Ki}i∈N⟩, Xi - конечные множества, Mi - множествосмешанных стратегий игрока i ∈ N. Через M0 ⊂ Mi обозначим подмножествовполне смешанных стратегий игрока i.

Ситуация µ∗ ∈ M называется ситуацией совершенного равновесия, еслисуществует последовательность µk ∈ M0, такая что

limk→∞

µki (xi) = µ∗

i (xi), ∀i ∈ N, xi ∈ Xi, (1)

µ∗i ∈ arg max

τi∈MiKi(µ

ki, τi)∀i ∈ N. (2)

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 8 / 25

Page 12: Теория игр, весна 2013: Лекция 5

Рафинирование равновесий по Нэшу

Устойчивость по отношению к ошибкам ”дрожащей руки”.

Пусть Γ = ⟨N, {Xi}i∈N, {Ki}i∈N⟩, Xi - конечные множества, Mi - множествосмешанных стратегий игрока i ∈ N. Через M0 ⊂ Mi обозначим подмножествовполне смешанных стратегий игрока i.

Ситуация µ∗ ∈ M называется ситуацией совершенного равновесия, еслисуществует последовательность µk ∈ M0, такая что

limk→∞

µki (xi) = µ∗

i (xi), ∀i ∈ N, xi ∈ Xi, (1)

µ∗i ∈ arg max

τi∈MiKi(µ

ki, τi)∀i ∈ N. (2)

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 8 / 25

Page 13: Теория игр, весна 2013: Лекция 5

Рафинирование равновесий по Нэшу

Устойчивость по отношению к ошибкам ”дрожащей руки”.

Пусть Γ = ⟨N, {Xi}i∈N, {Ki}i∈N⟩, Xi - конечные множества, Mi - множествосмешанных стратегий игрока i ∈ N. Через M0 ⊂ Mi обозначим подмножествовполне смешанных стратегий игрока i.

Ситуация µ∗ ∈ M называется ситуацией совершенного равновесия, еслисуществует последовательность µk ∈ M0, такая что

limk→∞

µki (xi) = µ∗

i (xi), ∀i ∈ N, xi ∈ Xi, (1)

µ∗i ∈ arg max

τi∈MiKi(µ

ki, τi)∀i ∈ N. (2)

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 8 / 25

Page 14: Теория игр, весна 2013: Лекция 5

Совершенное равновесие

.Утверждение........Любая ситуация совершенного равновесия является равновесием по Нэшу.

.Теорема..

......

В любой конечной бескоалиционной игре существует ситуация совершенногоравновесия.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 9 / 25

Page 15: Теория игр, весна 2013: Лекция 5

Совершенное равновесие

.Утверждение........Любая ситуация совершенного равновесия является равновесием по Нэшу.

.Теорема..

......

В любой конечной бескоалиционной игре существует ситуация совершенногоравновесия.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 9 / 25

Page 16: Теория игр, весна 2013: Лекция 5

Позиционные игры.

Рассмотрим следующую игру:Имеются два игрока и две карты: старшая (С) и младшая (М).Игрок 1 с вероятностью 1/2 получает одну из них, видит ее, но игрок 2 не знает,какую карту получил игрок 1.Дальше ходит игрок 1: в обоих случаях он может либо спасовать, и тогда игразаканчивается, и он проигрывает 1, либо продолжить игру.Если он продолжает, то далее ходит игрок 2, который также имеет возможностьлибо спасовать, и тогда заканчивается и игрок 2 проигрывает 1, либо попроситьигрока 1 открыть карту.Если у игрока 1 оказалась карта С, то игрок 1 выигрывает 2, если оказалась картаМ, то проигрывает 2. Игра антагонистическая, то есть выигрыш одного игрокаравен проигрышу другого.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 10 / 25

Page 17: Теория игр, весна 2013: Лекция 5

Позиционные игры.

Рассмотрим следующую игру:Имеются два игрока и две карты: старшая (С) и младшая (М).Игрок 1 с вероятностью 1/2 получает одну из них, видит ее, но игрок 2 не знает,какую карту получил игрок 1.Дальше ходит игрок 1: в обоих случаях он может либо спасовать, и тогда игразаканчивается, и он проигрывает 1, либо продолжить игру.Если он продолжает, то далее ходит игрок 2, который также имеет возможностьлибо спасовать, и тогда заканчивается и игрок 2 проигрывает 1, либо попроситьигрока 1 открыть карту.Если у игрока 1 оказалась карта С, то игрок 1 выигрывает 2, если оказалась картаМ, то проигрывает 2. Игра антагонистическая, то есть выигрыш одного игрокаравен проигрышу другого.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 10 / 25

Page 18: Теория игр, весна 2013: Лекция 5

Позиционные игры.

n+ 1 тип ходов - ходы каждого из игроков и случайные ”ходы природы”.

Информационное множество - множество позиций, который не может различитьданный игрок i.

Окончательная (терминальная) позиция - позиция, в которой нет ходов.

Партией называется путь, соединяющий начальную позицию с окончательной.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 11 / 25

Page 19: Теория игр, весна 2013: Лекция 5

Игры с полной информацией

Игрой с полной информацией называется позиционная игра, всеинформационные множества которой состоят из одной позиции.

.Теорема (Цермело–Нейман)..

......

Конечные игры n лиц с полной информацией имеют ситуации равновесия вчистых стратегиях.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 12 / 25

Page 20: Теория игр, весна 2013: Лекция 5

Игры с полной информацией

Игрой с полной информацией называется позиционная игра, всеинформационные множества которой состоят из одной позиции.

.Теорема (Цермело–Нейман)..

......

Конечные игры n лиц с полной информацией имеют ситуации равновесия вчистых стратегиях.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 12 / 25

Page 21: Теория игр, весна 2013: Лекция 5

Общее знание

Игрок 1 рационален (выбирает лучшую альтернативу)

Игрок 2 знает, что игрок 1 рационален

Игрок 1 знает, что игрок 2 знает, что игрок 1 рационален

Игрок 2 знает, что игрок 1 знает, что игрок 2 знает, что игрок 1 рационален

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 13 / 25

Page 22: Теория игр, весна 2013: Лекция 5

Общее знание

Игрок 1 рационален (выбирает лучшую альтернативу)

Игрок 2 знает, что игрок 1 рационален

Игрок 1 знает, что игрок 2 знает, что игрок 1 рационален

Игрок 2 знает, что игрок 1 знает, что игрок 2 знает, что игрок 1 рационален

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 13 / 25

Page 23: Теория игр, весна 2013: Лекция 5

Общее знание

Игрок 1 рационален (выбирает лучшую альтернативу)

Игрок 2 знает, что игрок 1 рационален

Игрок 1 знает, что игрок 2 знает, что игрок 1 рационален

Игрок 2 знает, что игрок 1 знает, что игрок 2 знает, что игрок 1 рационален

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 13 / 25

Page 24: Теория игр, весна 2013: Лекция 5

Общее знание

Игрок 1 рационален (выбирает лучшую альтернативу)

Игрок 2 знает, что игрок 1 рационален

Игрок 1 знает, что игрок 2 знает, что игрок 1 рационален

Игрок 2 знает, что игрок 1 знает, что игрок 2 знает, что игрок 1 рационален

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 13 / 25

Page 25: Теория игр, весна 2013: Лекция 5

Дуополия КурноДва производителя товара. Стратегия = объем производства qi ∈ [0, a]. Затратына производство: ci(qi) = cqi, i = 1, 2. Цена на рынке P зависит от количестватовара на рынке Q = q1 + q2 и равна

P(Q) =

{a− Q, если Q < a,

0, если Q ≥ a.

Функция выигрыша каждого игрока равна прибыли:

Ki(q1, q2) = P(Q)qi − cqi, i = 1, 2.

Стратегии наилучшего ответа:

qi =1

2(a− qj − c), i, j = 1, 2, i ̸= j.

Равновесие:

qi =a− c3

, P =a+ 2c

3, Ki =

(a− c)2

9

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 14 / 25

Page 26: Теория игр, весна 2013: Лекция 5

Дуополия КурноДва производителя товара. Стратегия = объем производства qi ∈ [0, a]. Затратына производство: ci(qi) = cqi, i = 1, 2. Цена на рынке P зависит от количестватовара на рынке Q = q1 + q2 и равна

P(Q) =

{a− Q, если Q < a,

0, если Q ≥ a.

Функция выигрыша каждого игрока равна прибыли:

Ki(q1, q2) = P(Q)qi − cqi, i = 1, 2.

Стратегии наилучшего ответа:

qi =1

2(a− qj − c), i, j = 1, 2, i ̸= j.

Равновесие:

qi =a− c3

, P =a+ 2c

3, Ki =

(a− c)2

9

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 14 / 25

Page 27: Теория игр, весна 2013: Лекция 5

Дуополия КурноДва производителя товара. Стратегия = объем производства qi ∈ [0, a]. Затратына производство: ci(qi) = cqi, i = 1, 2. Цена на рынке P зависит от количестватовара на рынке Q = q1 + q2 и равна

P(Q) =

{a− Q, если Q < a,

0, если Q ≥ a.

Функция выигрыша каждого игрока равна прибыли:

Ki(q1, q2) = P(Q)qi − cqi, i = 1, 2.

Стратегии наилучшего ответа:

qi =1

2(a− qj − c), i, j = 1, 2, i ̸= j.

Равновесие:

qi =a− c3

, P =a+ 2c

3, Ki =

(a− c)2

9

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 14 / 25

Page 28: Теория игр, весна 2013: Лекция 5

Дуополия Штаккельберга

Фирмы выходят на рынок по очереди.

Вторая фирма (по рациональности) на ход q1 будет отвечать q2 =12(a− q1 − c).

Следовательно, цена будет равна P = a−Q = 12(a− q1 + c) и выигрыш первой

фирмы составит K1 = 12(a− q1 − c)q1. То есть задача сводится к максимизации

12(a− q1 − c)q1

Результат:

q1 =a− c2

, q2 =a− c4

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 15 / 25

Page 29: Теория игр, весна 2013: Лекция 5

Дуополия Штаккельберга

Фирмы выходят на рынок по очереди.

Вторая фирма (по рациональности) на ход q1 будет отвечать q2 =12(a− q1 − c).

Следовательно, цена будет равна P = a−Q = 12(a− q1 + c) и выигрыш первой

фирмы составит K1 = 12(a− q1 − c)q1. То есть задача сводится к максимизации

12(a− q1 − c)q1

Результат:

q1 =a− c2

, q2 =a− c4

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 15 / 25

Page 30: Теория игр, весна 2013: Лекция 5

Дуополия Штаккельберга

Фирмы выходят на рынок по очереди.

Вторая фирма (по рациональности) на ход q1 будет отвечать q2 =12(a− q1 − c).

Следовательно, цена будет равна P = a−Q = 12(a− q1 + c) и выигрыш первой

фирмы составит K1 = 12(a− q1 − c)q1. То есть задача сводится к максимизации

12(a− q1 − c)q1

Результат:

q1 =a− c2

, q2 =a− c4

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 15 / 25

Page 31: Теория игр, весна 2013: Лекция 5

Смешанные и поведенческие стратегии

Смешанная стратегия - выпуклая комбинаций чистых стратегий

Поведенческая стратегия говорит, с какими вероятностями надо выбирать ходы вкаждом информационном множестве.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 16 / 25

Page 32: Теория игр, весна 2013: Лекция 5

Смешанные и поведенческие стратегии

Смешанная стратегия - выпуклая комбинаций чистых стратегий

Поведенческая стратегия говорит, с какими вероятностями надо выбирать ходы вкаждом информационном множестве.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 16 / 25

Page 33: Теория игр, весна 2013: Лекция 5

Полная память

Неформально, игрок i имеет в игре полную память, если при каждом его ходе онпомнит, через в каких информационные множества он уже побывал к этомумоменту, и какие ходы он там делал. Фактически это определение означаетналичие полной информации игрока о самом себе.

.Теорема (Кун, 1953)..

......

Для того чтобы смешанная стратегия µi игрока i была эквивалентна егосоответствующей стратегии поведения βµ

i необходимо и достаточно,чтобы игрок i имел в игре полную память.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 17 / 25

Page 34: Теория игр, весна 2013: Лекция 5

Полная память

Неформально, игрок i имеет в игре полную память, если при каждом его ходе онпомнит, через в каких информационные множества он уже побывал к этомумоменту, и какие ходы он там делал. Фактически это определение означаетналичие полной информации игрока о самом себе.

.Теорема (Кун, 1953)..

......

Для того чтобы смешанная стратегия µi игрока i была эквивалентна егосоответствующей стратегии поведения βµ

i необходимо и достаточно,чтобы игрок i имел в игре полную память.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 17 / 25

Page 35: Теория игр, весна 2013: Лекция 5

Subgame perfect equilibrium

Набор поведенческих стратегий называется совершенным подыгровымравновесием (СПРН), если для любой подыгры (под-игры?) данный наборстратегий является равновесием по Нэшу.

.Теорема........В любой позиционной игре с полной информацией существует СПРН.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 18 / 25

Page 36: Теория игр, весна 2013: Лекция 5

Subgame perfect equilibrium

Набор поведенческих стратегий называется совершенным подыгровымравновесием (СПРН), если для любой подыгры (под-игры?) данный наборстратегий является равновесием по Нэшу.

.Теорема........В любой позиционной игре с полной информацией существует СПРН.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 18 / 25

Page 37: Теория игр, весна 2013: Лекция 5

Домашнее задание

12. Найти все ситуации равновесия в игре((0, 0) (2, 2)(1, 1) (0, 0)

).

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 19 / 25

Page 38: Теория игр, весна 2013: Лекция 5

Домашнее задание

13. Найти все ситуации равновесия в игре(0, 0) (5, 4) (4, 5)(4, 5) (0, 0) (5, 4)(5, 4) (4, 5) (0, 0)

.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 20 / 25

Page 39: Теория игр, весна 2013: Лекция 5

Домашнее задание

14. Найти все ситуации равновесия в игре трех лиц, в которой игрок 1 выбираетстроку, игрок 2 выбирает столбец. а игрок 3 выбирает матрицу.(

(0, 0, 0) (6, 5, 4)(5, 4, 6) (0, 0, 0)

) ((4, 6, 5) (0, 0, 0)(0, 0, 0) (0, 0, 0)

)

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 21 / 25

Page 40: Теория игр, весна 2013: Лекция 5

Домашнее задание

15. В игре трех лиц (1, 1, 1 4, 4, 03, 2, 2 3, 2, 2

) (1, 1, 1 0, 0, 40, 0, 0 0, 0, 0

)найти ситуации совершенного и несовершенного равновесия в чистыхстратегиях.

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 22 / 25

Page 41: Теория игр, весна 2013: Лекция 5

Домашнее задание

16. В игре трех лиц(1, 1, 1 1, 0, 11, 1, 1 0, 0, 1

) (1, 1, 0, 0, 0, 00, 1, 0 1, 0, 0

)найти все ситуации равновесия. Какие из них являются ситуациямисовершенного равновесия?

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 23 / 25

Page 42: Теория игр, весна 2013: Лекция 5

Домашнее задание

17. Докажите, что в любой конечной бескоалиционной игре существует ситуациясовершенного равновесия (в смешанных стратегиях).

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 24 / 25

Page 43: Теория игр, весна 2013: Лекция 5

Домашнее задание

18. Рассматривается позиционная игра. Докажите, что для того чтобысмешанная стратегия µi игрока i была эквивалентна его соответствующейстратегии поведения βµ

i необходимо и достаточно, чтобы игрок i имел в игреполную память. (Теорема Куна о полной памяти).

И.В.Кацев (СПб ЭМИ) Позиционные игры 2012 25 / 25