Слайд 1Лекция 5
Динамические игры с полной информацией
Полная и совершенная информация (
ПиСИ). Двухходовая игра. Подходы Штакельберга и Гермейера.
Общая модель динамической игры
с ПиСИ. Обратная индукция и рациональность игроков.
Модели, основанные на динамических играх с ПиСИ.
Слайд 2Полная и совершенная информация ( ПиСИ).
В динамических играх различают полную
и совершенную информацию.
Информацию считают полной, если все игроки имеют общую
информацию о правилах игры и функциях выигрыша. Это понятие относится как к статическим так и динамическим играм.
Понятие совершенной информации относится только к динамическим играм, в которых игроки делают ходы последовательно в разные моменты времени
Слайд 3Полная и совершенная информация ( ПиСИ).
Если все сделанные ходы сразу
становятся известны всем игрокам, динамическая игра обладает совершенной информацией.
Слайд 4Динамические игры с полной информацией
Динамической будем называть такую игру, в
которой каждый игрок может сделать несколько ходов и по крайней
мере один из игроков, делая ход, знает, какой ход сделал другой игрок (возможно, он сам). В этой ситуации он стоит перед свершившимися фактами (уже сделанными ранее и известными ему ходами) и должен учитывать их при выборе своих действий.
Слайд 5Динамические игры с полной информацией
Описание динамической игры (с совершенной информацией)
в развернутой форме должно включать :
множество вершин дерева игры, в
том числе одну начальную вершину;
для каждой вершины, кроме начальной,— единственную вершину, которая непосредственно ей предшествует; при этом цепь предшествующих вершин, построенная из любой вершины, должна заканчиваться в начальной вершине (что предполагает, в том числе, отсутствие циклов);
множество игроков;
для каждой вершины, кроме конечных,— единственного игрока, которому принадлежит ход в данной вершине;
для каждой конечной вершины, т. е. такой, которая не предшествует ни одной другой вершине,— вектор выигрышей всех игроков.
Слайд 6Двухходовая игра
Пусть есть всего два игрока N={1,2}, и игра разворачивается
во времени следующим образом:
Ход 1. Игрок 1 выбирает некоторые действия
a1 A1
Ход 2. Игрок 2, зная совершенный игроком 1 выбор a1, выбирает некоторое действие a2 A2
Слайд 7Двухходовая игра
Предполагаем, что информация является полной, т.е. правила игры и
функция выигрыша известны обоим игрокам. Поэтому игрок 1 может спрогнозировать
ответные действия игрока 2 с помощью множества наилучших ответов:
В случае однозначности наилучших ответов прогноз поведения игрока2 в ответ на любые действия игрока 1 является точным.
Слайд 8Двухходовая игра
С учетом этого прогноза игроку 1 следует выбирать свое
действие из условия максимизации выигрыша u1(a1,R2(a1)).
Обозначим через a1* оптимальные действия
игрока 1 с учетом прогноза ответных действий игрока 2 в случае однозначности наилучших ответов:
max [ u1(a1,R2(a1)) ] = u1(a1* ,R2(a1* ))
Обозначим через a2* = R2(a1*) оптимальный ответ игрока 2 на оптимальное действие игрока 1.
Слайд 9Подход Штакельберга
Подход Штакельберга – доброжелательность партнера:
max
max [ u1(a1,a2) ] = max [u1(a1* , a2)]
a1 € A1 a2 € R2(a1) a2 € R2(a1* )
В экономических приложениях чаще используется подход Штакельберга, т.к. в случае безразличия лучше пойти навстречу партнеру. ( бесплатная услуга, может потом мне это как-то зачтется)
Слайд 10Подход Гермейера.
Подход Гермейера - гарантированный результат или осторожность:
max
min [ u1(a1,a2) ] = min [u1(a1* ,
a2)]
a1 € A1 a2 € R2(a1) a2 € R2(a1* )
Гермейер исходил из общего принципа гарантированного результата. Если у нас есть информация о доброжелательности партнера в случае равного для него выигрыша, то можем пользоваться подходом Штакельберга. Но если такой информации нет, то только совет к максимальному гарантированному результату
Слайд 11Двухходовая игра
Стратегия в теории игр – это план действий на
всю игру с учетом всей поступающей информации.
Игрок 1 выбирает действие,
не имея никакой дополнительной информации. Поэтому его множество стратегий S1 =A1 совпадает с множеством действий.
Слайд 12Двухходовая игра
Игрок 2 перед выбором своего действия получает информацию о
уже совершенном действии игрока 1. Но стратегию он должен выбрать
до игры, поэтому его стратегия это отображение S2 : A1→A2 , которая каждому действию a1 игрока 1 ставит в соответствие некоторое действие s2(a1) A2
Положим u1(s1, s2)= u (s, s2 (s1 )).
Если у каждого игрока было по два возможных действия, то в двухходовой игре у игрока 1 будет две стратегии, а у игрока 2 станет четыре стратегии.
Слайд 13Двухходовая игра
Игру удобно представить в виде диаграммы, изображающей дерево игры
. Решение игры можно найти в предположении, что игроки рациональны
и что рациональность и структура игры являются общеизвестными фактами.
При этом естественно воспользоваться методом обратной индукции. В соответствии с этим методом игру разматывают с конца.
Слайд 16В этой игре действия пилота несложно предсказать—он полетит в Нью-Йорк,
поскольку предпочитает выигрыш 1 выигрышу −1. Таким образом, исход игры
однозначен: пилот посадит самолет в Нью-Йорке, а террорист не станет взрывать бомбу.
Изобразим полученное решение на дереве. Те действия, которые были игроком в каждой из вершин, изобразим жирными пунктирными линиями. Исход игры определяется траекторией, состоящей из выбранных действий, и идущей из начальной вершины в одну из конечных вершин
Слайд 18Обратная индукция
Рассмотрим предфинальную позицию m. Пусть право хода в этой
позиции имеет игрок i(m). В этой позиции все зависит от
только от игрока i, и он может выбрать наилучшую для себя следующую вершину m: из всего множества. Сократим дерево игры, объявив позицию m финальной, приписав ей выигрыши u(m:) . Такой процесс сокращения дерева игры можно проводить до начальной позиции. В этом и заключается суть метода обратной индукции.
Слайд 24В этой игре обратная индукция дает два решения: (L1,R2) и
(L2,R1).
Если выигрыши всех игроков во всех конечных вершинах различны, то
неоднозначность при использовании обратной индукции не возникает, поэтому решение должно быть единственным.
В конечной игре с совершенной информацией алгоритм обратной индукции дает хотя бы одно решение.
Слайд 25Теорема. В конечной игре с совершенной информацией алгоритм обратной индукции
даёт хотя бы одно решение
Слайд 26Концепция равновесия Нэша
Мы рассмотрели, как находить решение динамической игры с
совершенной информацией с помощью обратной индукции.
Другой подход состоит в
том, чтобы применить к динамической игре концепцию равновесия Нэша, так же как мы применяли ее к статическим играм.
Слайд 27Концепция равновесия Нэша
Для того чтобы это сделать, следует записать динамическую
игру в нормальной форме. Как мы помним, описание игры в
нормальной форме состоит из:
задания множества игроков,
множества стратегий каждого игрока,
функции выигрыша каждого игрока на множестве исходов.
Слайд 28Концепция равновесия Нэша
В игре в развернутой форме (чистая) стратегия—это полный
план действий игрока: что он будет делать в каждой из
вершин, в которой ход принадлежит ему. Это должен быть действительно полный план, т. е. в нем должно быть определено, что игрок выберет в любой своей вершине, даже если из каких-либо соображений ясно, что процесс игры вряд ли может привести в эту вершину.
Слайд 29Концепция равновесия Нэша
Процесс игры для динамической игры в нормальной форме
можно условно представить следующим образом. Каждый игрок до начала игры
сообщает выбранную им стратегию организатору игры.
Организатор, руководствуясь этими стратегиями, осуществляет за игроков их ходы. Когда последовательность ходов приведет организатора в конечную вершину, он раздает всем игрокам выигрыши, соответствующие этой конечной вершине. При такой интерпретации мы, по сути, имеем статическую игру в которой выигрыши определяются с помощью только что описанного алгоритма.
Слайд 35Теорема. В игре с совершенной информацией и конечным числом ходов
множество решений, получаемых обратной индукцией, совпадает с множеством СПРН (
совершенное по подыграм равновесие Нэша).