Лекция 5 Динамические игры с полной информацией

Содержание

1. Лекция 5 Динамические игры с полной информацией
2. Полная и совершенная информация ( ПиСИ).В динамических
3. Полная и совершенная информация ( ПиСИ).Если все
4. Динамические игры с полной информациейДинамической будем называть
5. Динамические игры с полной информациейОписание динамической игры
6. Двухходовая играПусть есть всего два игрока N={1,2},
7. Двухходовая играПредполагаем, что информация является полной, т.е.
8. Двухходовая играС учетом этого прогноза игроку 1
9. Подход Штакельберга Подход Штакельберга – доброжелательность партнера:
10. Подход Гермейера.Подход Гермейера - гарантированный результат или
11. Двухходовая играСтратегия в теории игр – это
12. Двухходовая играИгрок 2 перед выбором своего действия
13. Двухходовая играИгру удобно представить в виде диаграммы,
14. Игра «Террорист»
15. Слайд 15
16. В этой игре действия пилота несложно предсказать—он
17. Слайд 17
18. Обратная индукцияРассмотрим предфинальную позицию m. Пусть право
19.
20. Игра «Рэкет»
21. Слайд 21
22.
23.
24. В этой игре обратная индукция дает два
25. Теорема. В конечной игре с совершенной информацией алгоритм обратной индукции даёт хотя бы одно решение
26. Концепция равновесия НэшаМы рассмотрели, как находить решение
27. Концепция равновесия НэшаДля того чтобы это сделать,
28. Концепция равновесия НэшаВ игре в развернутой форме
29. Концепция равновесия НэшаПроцесс игры для динамической игры
30. Слайд 30
31. Слайд 31
32. Слайд 32
33. Слайд 33
34. Слайд 34
35. Теорема. В игре с совершенной информацией и
36. Скачать презентанцию

Полная и совершенная информация ( ПиСИ).В динамических играх различают полную и совершенную информацию.Информацию считают полной, если все игроки имеют общую информацию о правилах игры и функциях выигрыша. Это понятие относится как

Главная
Разное
Лекция 5 Динамические игры с полной информацией

Слайды и текст этой презентации

Слайд 1Лекция 5 Динамические игры с полной информацией
Полная и совершенная информация (

ПиСИ). Двухходовая игра. Подходы Штакельберга и Гермейера.
Общая модель динамической игры

с ПиСИ. Обратная индукция и рациональность игроков.
Модели, основанные на динамических играх с ПиСИ.

Лекция 5 Динамические игры с полной информациейПолная и совершенная информация ( ПиСИ). Двухходовая игра. Подходы Штакельберга и

Слайд 2Полная и совершенная информация ( ПиСИ).
В динамических играх различают полную

и совершенную информацию.
Информацию считают полной, если все игроки имеют общую

информацию о правилах игры и функциях выигрыша. Это понятие относится как к статическим так и динамическим играм.
Понятие совершенной информации относится только к динамическим играм, в которых игроки делают ходы последовательно в разные моменты времени

Полная и совершенная информация ( ПиСИ).В динамических играх различают полную и совершенную информацию.Информацию считают полной, если все

Слайд 3Полная и совершенная информация ( ПиСИ).
Если все сделанные ходы сразу

становятся известны всем игрокам, динамическая игра обладает совершенной информацией.

Полная и совершенная информация ( ПиСИ).Если все сделанные ходы сразу становятся известны всем игрокам, динамическая игра обладает

Слайд 4Динамические игры с полной информацией
Динамической будем называть такую игру, в

которой каждый игрок может сделать несколько ходов и по крайней

мере один из игроков, делая ход, знает, какой ход сделал другой игрок (возможно, он сам). В этой ситуации он стоит перед свершившимися фактами (уже сделанными ранее и известными ему ходами) и должен учитывать их при выборе своих действий.

Динамические игры с полной информациейДинамической будем называть такую игру, в которой каждый игрок может сделать несколько ходов

Слайд 5Динамические игры с полной информацией
Описание динамической игры (с совершенной информацией)

в развернутой форме должно включать :
множество вершин дерева игры, в

том числе одну начальную вершину;
для каждой вершины, кроме начальной,— единственную вершину, которая непосредственно ей предшествует; при этом цепь предшествующих вершин, построенная из любой вершины, должна заканчиваться в начальной вершине (что предполагает, в том числе, отсутствие циклов);
множество игроков;
для каждой вершины, кроме конечных,— единственного игрока, которому принадлежит ход в данной вершине;
для каждой конечной вершины, т. е. такой, которая не предшествует ни одной другой вершине,— вектор выигрышей всех игроков.

Динамические игры с полной информациейОписание динамической игры (с совершенной информацией) в развернутой форме должно включать :множество вершин

Слайд 6Двухходовая игра
Пусть есть всего два игрока N={1,2}, и игра разворачивается

во времени следующим образом:
Ход 1. Игрок 1 выбирает некоторые действия

a1 A1
Ход 2. Игрок 2, зная совершенный игроком 1 выбор a1, выбирает некоторое действие a2 A2

Двухходовая играПусть есть всего два игрока N={1,2}, и игра разворачивается во времени следующим образом:Ход 1. Игрок 1

Слайд 7Двухходовая игра
Предполагаем, что информация является полной, т.е. правила игры и

функция выигрыша известны обоим игрокам. Поэтому игрок 1 может спрогнозировать

ответные действия игрока 2 с помощью множества наилучших ответов:

В случае однозначности наилучших ответов прогноз поведения игрока2 в ответ на любые действия игрока 1 является точным.

Двухходовая играПредполагаем, что информация является полной, т.е. правила игры и функция выигрыша известны обоим игрокам. Поэтому игрок

Слайд 8Двухходовая игра
С учетом этого прогноза игроку 1 следует выбирать свое

действие из условия максимизации выигрыша u1(a1,R2(a1)).
Обозначим через a1* оптимальные действия

игрока 1 с учетом прогноза ответных действий игрока 2 в случае однозначности наилучших ответов:
max [ u1(a1,R2(a1)) ] = u1(a1* ,R2(a1* ))

Обозначим через a2* = R2(a1*) оптимальный ответ игрока 2 на оптимальное действие игрока 1.

Двухходовая играС учетом этого прогноза игроку 1 следует выбирать свое действие из условия максимизации выигрыша u1(a1,R2(a1)).Обозначим через

Слайд 9Подход Штакельберга
Подход Штакельберга – доброжелательность партнера:

max

max [ u1(a1,a2) ] = max [u1(a1* , a2)]

a1 € A1 a2 € R2(a1) a2 € R2(a1* )

В экономических приложениях чаще используется подход Штакельберга, т.к. в случае безразличия лучше пойти навстречу партнеру. ( бесплатная услуга, может потом мне это как-то зачтется)

Подход Штакельберга Подход Штакельберга – доброжелательность партнера: max max [ u1(a1,a2) ] = max

Слайд 10Подход Гермейера.
Подход Гермейера - гарантированный результат или осторожность:
max

min [ u1(a1,a2) ] = min [u1(a1* ,

a2)]
a1 € A1 a2 € R2(a1) a2 € R2(a1* )
Гермейер исходил из общего принципа гарантированного результата. Если у нас есть информация о доброжелательности партнера в случае равного для него выигрыша, то можем пользоваться подходом Штакельберга. Но если такой информации нет, то только совет к максимальному гарантированному результату

Подход Гермейера.Подход Гермейера - гарантированный результат или осторожность: max min [ u1(a1,a2) ] =

Слайд 11Двухходовая игра
Стратегия в теории игр – это план действий на

всю игру с учетом всей поступающей информации.
Игрок 1 выбирает действие,

не имея никакой дополнительной информации. Поэтому его множество стратегий S1 =A1 совпадает с множеством действий.

Двухходовая играСтратегия в теории игр – это план действий на всю игру с учетом всей поступающей информации.Игрок

Слайд 12Двухходовая игра
Игрок 2 перед выбором своего действия получает информацию о

уже совершенном действии игрока 1. Но стратегию он должен выбрать

до игры, поэтому его стратегия это отображение S2 : A1→A2 , которая каждому действию a1 игрока 1 ставит в соответствие некоторое действие s2(a1) A2
Положим u1(s1, s2)= u (s, s2 (s1 )).
Если у каждого игрока было по два возможных действия, то в двухходовой игре у игрока 1 будет две стратегии, а у игрока 2 станет четыре стратегии.

Двухходовая играИгрок 2 перед выбором своего действия получает информацию о уже совершенном действии игрока 1. Но стратегию

Слайд 13Двухходовая игра
Игру удобно представить в виде диаграммы, изображающей дерево игры

. Решение игры можно найти в предположении, что игроки рациональны

и что рациональность и структура игры являются общеизвестными фактами.
При этом естественно воспользоваться методом обратной индукции. В соответствии с этим методом игру разматывают с конца.

Двухходовая играИгру удобно представить в виде диаграммы, изображающей дерево игры . Решение игры можно найти в предположении,

Слайд 14Игра «Террорист»

Слайд 15

Слайд 16В этой игре действия пилота несложно предсказать—он полетит в Нью-Йорк,

поскольку предпочитает выигрыш 1 выигрышу −1. Таким образом, исход игры

однозначен: пилот посадит самолет в Нью-Йорке, а террорист не станет взрывать бомбу.
Изобразим полученное решение на дереве. Те действия, которые были игроком в каждой из вершин, изобразим жирными пунктирными линиями. Исход игры определяется траекторией, состоящей из выбранных действий, и идущей из начальной вершины в одну из конечных вершин

В этой игре действия пилота несложно предсказать—он полетит в Нью-Йорк, поскольку предпочитает выигрыш 1 выигрышу −1. Таким

Слайд 17

Слайд 18Обратная индукция
Рассмотрим предфинальную позицию m. Пусть право хода в этой

позиции имеет игрок i(m). В этой позиции все зависит от

только от игрока i, и он может выбрать наилучшую для себя следующую вершину m: из всего множества. Сократим дерево игры, объявив позицию m финальной, приписав ей выигрыши u(m:) . Такой процесс сокращения дерева игры можно проводить до начальной позиции. В этом и заключается суть метода обратной индукции.

Обратная индукцияРассмотрим предфинальную позицию m. Пусть право хода в этой позиции имеет игрок i(m). В этой позиции

Слайд 19

Слайд 20Игра «Рэкет»

Слайд 21

Слайд 22

Слайд 23

Слайд 24В этой игре обратная индукция дает два решения: (L1,R2) и

(L2,R1).
Если выигрыши всех игроков во всех конечных вершинах различны, то

неоднозначность при использовании обратной индукции не возникает, поэтому решение должно быть единственным.
В конечной игре с совершенной информацией алгоритм обратной индукции дает хотя бы одно решение.

В этой игре обратная индукция дает два решения: (L1,R2) и (L2,R1).Если выигрыши всех игроков во всех конечных

Слайд 25Теорема. В конечной игре с совершенной информацией алгоритм обратной индукции

даёт хотя бы одно решение

Слайд 26Концепция равновесия Нэша
Мы рассмотрели, как находить решение динамической игры с

совершенной информацией с помощью обратной индукции.
Другой подход состоит в

том, чтобы применить к динамической игре концепцию равновесия Нэша, так же как мы применяли ее к статическим играм.

Концепция равновесия НэшаМы рассмотрели, как находить решение динамической игры с совершенной информацией с помощью обратной индукции. Другой

Слайд 27Концепция равновесия Нэша
Для того чтобы это сделать, следует записать динамическую

игру в нормальной форме. Как мы помним, описание игры в

нормальной форме состоит из:
задания множества игроков,
множества стратегий каждого игрока,
функции выигрыша каждого игрока на множестве исходов.

Концепция равновесия НэшаДля того чтобы это сделать, следует записать динамическую игру в нормальной форме. Как мы помним,

Слайд 28Концепция равновесия Нэша
В игре в развернутой форме (чистая) стратегия—это полный

план действий игрока: что он будет делать в каждой из

вершин, в которой ход принадлежит ему. Это должен быть действительно полный план, т. е. в нем должно быть определено, что игрок выберет в любой своей вершине, даже если из каких-либо соображений ясно, что процесс игры вряд ли может привести в эту вершину.

Концепция равновесия НэшаВ игре в развернутой форме (чистая) стратегия—это полный план действий игрока: что он будет делать

Слайд 29Концепция равновесия Нэша
Процесс игры для динамической игры в нормальной форме

можно условно представить следующим образом. Каждый игрок до начала игры

сообщает выбранную им стратегию организатору игры.
Организатор, руководствуясь этими стратегиями, осуществляет за игроков их ходы. Когда последовательность ходов приведет организатора в конечную вершину, он раздает всем игрокам выигрыши, соответствующие этой конечной вершине. При такой интерпретации мы, по сути, имеем статическую игру в которой выигрыши определяются с помощью только что описанного алгоритма.

Концепция равновесия НэшаПроцесс игры для динамической игры в нормальной форме можно условно представить следующим образом. Каждый игрок

Слайд 35Теорема. В игре с совершенной информацией и конечным числом ходов

множество решений, получаемых обратной индукцией, совпадает с множеством СПРН (

совершенное по подыграм равновесие Нэша).

Теорема. В игре с совершенной информацией и конечным числом ходов множество решений, получаемых обратной индукцией, совпадает с

Скачать презентацию

Разделы презентаций

Лекция 5 Динамические игры с полной информацией

Содержание

Слайды и текст этой презентации

Слайд 1Лекция 5 Динамические игры с полной информациейПолная и совершенная информация (

ПиСИ). Двухходовая игра. Подходы Штакельберга и Гермейера.Общая модель динамической игры

Слайд 2Полная и совершенная информация ( ПиСИ).В динамических играх различают полную

и совершенную информацию.Информацию считают полной, если все игроки имеют общую

Слайд 3Полная и совершенная информация ( ПиСИ).Если все сделанные ходы сразу

становятся известны всем игрокам, динамическая игра обладает совершенной информацией.

Слайд 4Динамические игры с полной информациейДинамической будем называть такую игру, в

которой каждый игрок может сделать несколько ходов и по крайней

Слайд 5Динамические игры с полной информациейОписание динамической игры (с совершенной информацией)

в развернутой форме должно включать :множество вершин дерева игры, в

Слайд 6Двухходовая играПусть есть всего два игрока N={1,2}, и игра разворачивается

во времени следующим образом:Ход 1. Игрок 1 выбирает некоторые действия

Слайд 7Двухходовая играПредполагаем, что информация является полной, т.е. правила игры и