Слайд 1Лекция 4
Равновесие Нэша и смешанные стратегии
Существование РН и смешанные стратегии
Слайд 2Существование равновесий Нэша и смешанные стратегии
Слайд 3Игра «Совпадение монет»
Два игрока одновременно и независимо друг от друга
кладут на стол по монете каждый, прикрывая свою монету рукой.
По команде судьи они поднимают руки. Игрок 1 выигрывает, если монеты лежат по – разному, а игрок 2 выигрывает, если они лежат одинаково.
Слайд 6Очевидно, что ни одна из клеток не может быть равновесием
Нэша, поскольку ни в одной из клеток не подчеркнуты одновременно
оба выигрыша. В подобной игре каждый игрок заинтересован в том, чтобы его партнер не смог угадать, какую именно стратегию он выбрал. Этого можно достичь, внеся в выбор стратегии элемент неопределенности. Те стратегии, которые мы рассматривали ранее, принято называть чистыми стратегиями.
Слайд 7Но в некоторых играх естественно ввести в рассмотрение также смешанные
стратегии. Под смешанной стратегией понимают распределение вероятностей на чистых стратегиях.
В
частном случае, когда множество чистых стратегий каждого игрока конечно, Xi = {x1i , . . . , xni i } (соответствующая игра называется конечной), смешанная стратегия представляется вектором вероятностей соответствующих чистых стратегий: μi = (μ1i, . . . , μni i ).
Слайд 8Обозначим множество смешанных стратегий i-го игрока через Mi:
Стандартное
предположение теории игр состоит в том, что если выигрыш—случайная величина,
то игроки предпочитают действия, которые приносят им наибольший ожидаемый выигрыш.
Ожидаемый выигрыш i-го игрока, соответствующий набору смешанных стратегий всех игроков (μ1, . . . , μm), вычисляется по формуле:
Слайд 9
Ожидание рассчитывается в предположении, что игроки выбирают стратегии независимо
(в статистическом смысле). Поскольку игрок максимизирует ожидаемый выигрыш, то он
будет смешивать несколько разных стратегий, только если они дают ему одинаковый выигрыш (при данных стратегиях других игроков). Смешанные стратегии можно представить как результат рандомизации игроком своих действий, т. е. как результат их случайного выбора.
Слайд 10Набор смешанных стратегий
μ = (μ1 , .
. . , μm) является равновесием Нэша в смешанных стратегиях, если стратегия μ*i каждого игрока i = 1, . . . , n является наилучшим для него откликом на стратегии других игроков μ*−i:
Слайд 11Определение. Игра называется антагонистической, если в ней участвуют два игрока,
т.е. N={1,2}, интересы которых противоположны: u1(s1,s2)+u2(s1,s2)0
- нижняя цена игры
- верхняя
цена игры
Слайд 12Утверждение:
Теорема. В антагонистической игре РН существует тогда и только тогда,
когда v0=v0=v. В этом случае говорят, что игра имеет цену
v.
Слайд 13Определение. Смешанная стратегия игрока i – это вероятностная мера μi
на множестве его чистых стратегий si. Если все множества стратегий
конечны, μi(si) является вероятностью выбора игроком i стратегии si:
Слайд 14Определение. Смешанным расширением игры в нормальной форме
называется игра
где
множество
смешанных стратегий игрока
i;
- вероятность выбора s при независимом выборе si;
- ожидаемый выигрыш
в исходной игре,
Слайд 15Определение. РН в смешанных стратегиях μ* называют РН в смешанном
расширении Gm:
Слайд 17Функция отклика (наилучшего ответа) первого игрока на действия второго:
Слайд 18Функция отклика (наилучшего ответа) второго игрока на действия первого:
Слайд 19Игра «Семейный спор»:
максимум достигается при р=0
максимум достигается при р=1
выигрыш не
зависит от р и равен 2/3
Слайд 20максимум достигается при q=0
максимум достигается при q=1
выигрыш не зависит от
q и равен 2/3
Слайд 21Функция отклика (наилучшего ответа) первого игрока на действия второго:
Функция отклика
(наилучшего ответа) второго игрока на действия первого:
Слайд 24Теорема Нэша.
Пусть в игре
множества стратегий Si игроков конечны.
Тогда
в игре существует РН в смешанных стратегиях.
Слайд 25Вычисление РН в смешанных стратегиях