Слайд 1Дисциплина: Методы оптимальных решений
Тема: Методы теории игр
Слайд 2Основные понятия теории игр
Каждая формализованная игра характеризуется:
количеством субъектов, участвующих в
конфликте, которые называются игроками;
возможным для каждого из игроков набором действий,
называемых стратегиями;
функциями выигрыша (платежа), отражающими степень удовлетворения интересов каждого из игроков;
результатом игры, к которому приводят выигранные стратегии, и который, в свою очередь, определяет выигрыш (проигрыш) каждого из игроков.
Слайд 3Основные понятия теории игр
Один из способов описания игры состоит в
том, что рассматриваются все возможные стратегии игроков и определяются платежи,
соответствующие любой возможной комбинации стратегий игроков. Описанная таким образом игра называется игрой в нормальной форме.
Нормальная форма игры двух участников состоит из двух платежных матриц, показывающих, какую сумму получит каждый из игроков при любой из возможных пар стратегий. Обычно эти две матрицы выражают в форме единой матрицы, которую называют биматрицей.
Элементами биматрицы являются пары чисел, первое из которых определяет величину выигрыша первого игрока, а второе – величину выигрыша второго игрока.
Слайд 4Основные понятия теории игр
Первый игрок выбирает одну из m стратегий,
при этом каждой стратегии соответствует строка матрицы i ( i=1,2,..,m).
Второй игрок выбирает одну из n стратегий, при этом каждой стратегии соответствует столбец матрицы j (j=1,2,…,n).
Пара чисел на пересечении строки и столбца, которые соответствую стратегиям, выбранным игроками, показывают величину выигрыша каждого из них.
В общем случае такая биматрица будет выглядеть так:
Слайд 5Основные понятия теории игр
Игра из двух игроков называется антагонистической, если
один из игроков выигрывает ровно столько, сколько проигрывает другой. В
таких играх интересы ее участников прямо противоположны друг другу.
Например, рассмотрим игру, в которой участвуют два игрока, каждый из которых имеет по две стратегии. Выигрыши каждого из игроков определяются следующими правилами:
если оба игрока выбирают стратегии с одинаковыми номерами, то первый игрок выигрывает рубль, а второй игрок проигрывает рубль,
если оба игрока выбирают стратегии с разными номерами, та первый игрок проигрывает рубль, а второй игрок выигрывает рубль.
Слайд 6Основные понятия теории игр
В этом случае биматрица выигрышей игроков будет
иметь вид:
или
Анализ этой биматрицы показывает, что в антагонистической игре сумма выигрышей первого и второго игрока равна нулю, т.е.: h1ij+h2ij=0, (i=1,2,..,m, j=1,2,…,n).
Из-за этого свойства антагонистические игры называют играми с нулевой суммой.
Слайд 7Основные понятия теории игр
В этих играх выполняется соотношение h1ij=-h2ij, т.е.
выигрыш одного игрока равен выигрышу другого игрока, взятому с противоположным
знаком, или выигрыш одного игрока равен проигрышу другого.
Таким образом, элемент hij, с одной стороны, является выигрышем первого игрока, а с другой - проигрышем второго игрока.
Наличие этого свойства дает возможность рассматривать не биматрицу, а просто матрицу, в которой каждый из элементов характеризует выигрыши первого игрока и проигрыши второго при выборе ими соответствующих стратегий.
Процесс разыгрывания конечной антагонистической игры состоит в том, что оба игрока независимо друг от друга выбирают свои стратегии, которые определяют результат игры, отражающийся в матрице выигрышей.
Слайд 8Оптимальные стратегии и их выбор
Выбирая ту или иную стратегию, каждый
из игроков стремится удовлетворить свои интересы: первый – обеспечить себе
максимально возможный выигрыш, а второй – минимально возможный проигрыш.
Стратегия первого игрока называется оптимальной, если при ее применении выигрыш первого игрока не может быть уменьшен, какими бы стратегиями ни пользовался второй.
Стратегия второго игрока называется оптимальной, если при ее применении проигрыш второго игрока не может быть увеличен, какими бы стратегиями ни пользовался первый игрок.
Слайд 9Оптимальные стратегии и их выбор
Рассмотрим на примере два различных подхода
к выбору стратегий, применяемых игроками.
Дана платежная матрица
.
Необходимо найти оптимальные стратегии первого и второго игроков.
Первый подход. Предположим, что первый игрок, проанализировав платежную матрицу, нашел в ней максимальный элемент h22=5 и выбрал вторую стратегию (вторую строку матрицы), применение которой может привести его к получению максимального выигрыша. В этом случае второй игрок имеет возможность выбрать одну из трех своих стратегий (столбцов матрицы). Очевидно, что он выберет первую стратегию (первый элемент матрицы в выбранной второй строке), чтобы минимизировать свой проигрыш. Это элемент h21=0.
Слайд 10Оптимальные стратегии и их выбор
Таким образом, в результате выбора своих
стратегий обоими игроками реализуется ситуация, при которой как выигрыш первого
игрока, так и проигрыш второго игрока будут равны 0.
При использовании данного подхода к выбору своей стратегии выигрыш, на который рассчитывал первый игрок, может быть уменьшен за счет выбора вторым игроком наиболее выгодной для него стратегии.
Из этого следует, что применение данного подхода не привело первого игрока к выбору оптимальной стратегии.
Применяя такой же подход, второй игрок найдет в матрице минимальный элемент h21=0 и выберет первую стратегию (первый столбец матрицы):
Слайд 11Оптимальные стратегии и их выбор
В этом случае первый игрок имеет
возможность выбрать одну из трех своих стратегий (строк матрицы) стремясь
максимизировать свой выигрыш, т.е. выберет третью стратегию, т.е. элемент h13=2.
Таким образом, в результате выбора своих стратегий обоими игроками реализуется ситуация, при которой как выигрыш первого игрока, так и проигрыш второго игрока будут равны 2.
При использовании данного подхода к выбору своей стратегии проигрыш, на который рассчитывал второй игрок, может быть увеличен за счет выбора первым игроком наиболее выгодной для него стратегии.
Из этого следует, что применение данного подхода не привело второго игрока к выбору оптимальной стратегии.
Слайд 12Оптимальные стратегии и их выбор
Второй подход. Он опирается на принципе
осторожности, в соответствии с которым каждый игрок, считая своего партнера
по игре разумным противником, выбирает свои стратегии исходя из предположения, что его противник не упустит ни единой возможности использовать любую его ошибку в своих интересах.
Руководствуясь этим принципом, первый из игроков проанализирует, какой минимальный выигрыш может быть получен при использовании им каждой из трех его возможных стратегий.
Слайд 13Оптимальные стратегии и их выбор
Тогда:
если он использует первую стратегию (первую
строку матрицы), то его минимальный возможный выигрыш будет соответствовать элементу
h11=1 (минимальный элемент в первой строке),
если он использует вторую стратегию (вторую строку матрицы), то его минимальный возможный выигрыш будет соответствовать элементу h21=0 (минимальный элемент во второй строке),
если он использует третью стратегию (третью строку матрицы), то его минимальный возможный выигрыш будет соответствовать элементу h31=2 (минимальный элемент в третьей строке).
Слайд 14Оптимальные стратегии и их выбор
Затем из выделенных минимально возможных выигрышей
нужно выбрать максимально возможный, т.е. h31=2.
Таким образом, он выбирает
третью стратегию.
Очевидно, что применение такого принципа может привести первого игрока к выбору оптимальной стратегии, так как в этом случае, какую бы из своих трех стратегий ни выбрал второй игрок, он не сможет уменьшить выигрыш первого игрока.
Применяя этот же принцип, второй из игроков поступит следующим образом:
если он использует первую стратегию (первый столбец матрицы), то его максимальный возможный проигрыш будет соответствовать элементу h31=2 (максимальный элемент в первом столбце),
если он использует вторую стратегию, то его максимальный возможный проигрыш будет соответствовать элементу h22=5,
если он использует третью стратегию, то его максимальный возможный проигрыш будет соответствовать элементу h23=4.
Слайд 15Оптимальные стратегии и их выбор
Затем из выделенных максимально возможных проигрышей
нужно выбрать минимально возможный, т.е. h31=2.
Таким образом, он выбирает
первую стратегию.
Очевидно, что применение такого принципа может привести второго игрока к выбору оптимальной стратегии, так как в этом случае, какую бы из своих трех стратегий ни выбрал первый игрок, он не сможет увеличить проигрыш второго игрока.
Таким образом, применение принципа осторожности может привести и первого и второго игроков к выбору оптимальной стратегии.
Слайд 16Оптимальные стратегии и их выбор
В общем случае применение принципа осторожности
будет выглядеть так:
1) Анализируя платежную матрицу, первый игрок для каждой
своей стратегии (строки матрицы) i (i=1,…,m) найдет минимальное значение ожидаемого выигрыша, а затем среди полученных элементов выберет максимальное число, соответствующее стратегии i*, которую называют максимальной стратегией первого игрока, поскольку она соответствует величине
Величину α называют нижней ценой игры (максимином).
Эта величина показывает выигрыш, который может обеспечить себе первый игрок при выборе вторым игроком любой из его возможных стратегий.
Слайд 17Оптимальные стратегии и их выбор
2) Анализируя платежную матрицу, второй игрок
для каждой своей стратегии (столбца матрицы) j (j=1,…,n) найдет максимальное
значение ожидаемого проигрыша, а затем среди полученных элементов выберет минимальное число, соответствующее стратегии j*, которую называют минимальной стратегией второго игрока, поскольку она соответствует величине
Величину β называют верхней ценой игры (минимаксом).
Эта величина показывает проигрыш, который может обеспечить себе второй игрок при выборе первым игроком любой из его возможных стратегий.
Выбирая свои стратегии в соответствии с этим принципом, оба игрока поступают очень осторожно, стремясь получить гарантированный, т.е. не зависящий от действия другого игрока, выигрыш (проигрыш).
Слайд 18Оптимальные стратегии и их выбор
Стратегия (i*, j*) называется ситуацией равновесия
в чистых стратегиях, если для любого i=1,…,m и для любого
j=1,..,n выполняется неравенство α≤hi*j*≤β или hij* ≤hi*j*≤ hi*j.
Неравенство hij* ≤hi*j* показывает, что величина проигрыша, которую может обеспечить себе второй игрок, выбравший свою оптимальную стратегию j*, будет меньше либо равна величине того проигрыша, который получит второй игрок в том случае, если оба игрока используют свои оптимальные стратегии.
Неравенство hi*j*≤ hi*j показывает, что величина выигрыша, которую может обеспечить себе первый игрок, выбравший свою оптимальную стратегию i*, будет больше или равна величине того выигрыша, которую получит первый игрок в том случае, если оба игрока используют свои оптимальные стратегии.
Слайд 19Оптимальные стратегии и их выбор
Если ситуация равновесия в чистых стратегиях
существует, то верхняя и нижняя цена игры совпадают α=β=ν, где
величина ν называется ценой игры.
Максиминная и минимаксная стратегии i*, j*, соответствующие цене игры ν, являются оптимальными стратегиями первого и второго игроков, а их совокупность – решением игры.
Таким образом, ситуация равновесия может возникнуть в игре тогда, когда каждый из игроков выбирает свою оптимальную стратегию – максиминную или минимаксную – и получает соответственно свой максимально гарантированный выигрыш и минимально гарантированный проигрыш, величины которых совпадают и равны значению цены игры ν.
Слайд 20Оптимальные стратегии и их выбор
Если в игре существует ситуация равновесия,
то ее решение обладает устойчивостью, так как ни одному из
игроков не выгодно отклоняться от этой ситуации и применять другую стратегию, отличную от оптимальной.
Пара чистых стратегий (i*, j*) создает в игре ситуацию равновесия тогда и только тогда, когда в матрице выигрышей существует элемент hi*j*, который одновременно является наибольшим в своем столбце и наименьшим в своей строке. Этот элемент (если он существует) называется седловой точкой.
В нашем примере α=β=2, из чего следует, что в данной игре существует ситуация в чистых стратегиях, цена игры равна ν=2=h31 и достигается в седловой точке (3,1). Оптимальной стратегией первого игрока является третья стратегия, а оптимальной стратегией второго игрока – первая стратегия.
Слайд 21Смешанные стратегии
Антагонистические игры делятся на два класса:
вполне определенные игры, т.е.
те игры, в которых существует седловая точка, ситуация равновесия и
решение игры в чистых стратегиях (α=β);
не полностью определенные игры, т.е. те игры, в которых не существует седловой точки и нет решения игры в чистых стратегиях (α<β).
Смешанная стратегия – это вероятностная комбинация чистых стратегий, т.е. это сочетание чистых стратегий, взятых в случайном порядке с некоторыми вероятностями:
для первого игрока
для второго игрока
Слайд 22Смешанные стратегии
Смешанная стратегия первого игрока задается m-мерным вектором P=(p1,p2,…,pm), где
pi - вероятность выбора первым игроком стратегии i, при этом
pi≥0 и p1+p2+…+pm=1.
Смешанная стратегия второго игрока задается n-мерным вектором Q=(q1,q2,…,qn), где qj - вероятность выбора первым игроком стратегии j, при этом qj≥0 и q1+q2+…+qn=1.
Чистые стратегии игроков являются частным случаем их смешанных стратегий.
Теорема Неймана. Каждая конечная игра имеет, по крайней мере, одно оптимальное решение, возможно, среди смешанных стратегий.
Следовательно, в не полностью определенных играх существует хотя бы одно решение в смешанных стратегиях.
Слайд 23Смешанные стратегии
Выигрыш, соответствующий решению игры, называется ценой игры ν, которая
удовлетворяет неравенству α< ν
между нижней и верхней ценой игры.
Если чистая стратегия игрока входит в его оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называется активной.
Теорема. Если один из игроков придерживается своей оптимальной стратегии, то выигрыш остается неизменным и равным цене игры ν независимо от того, что делает другой игрок, если он не выходит за пределы своих активных стратегий (т.е. пользуется любой из них в чистом виде или смешивает их в любых пропорциях).
Слайд 24Смешанные стратегии
Рассмотрим платежную матрицу игры второго порядка
В соответствии с
теоремой Неймана данная игра должна иметь решение в смешанных стратегиях,
причем обе чистые стратегии каждого из игроков будут активными, т.е. их вероятности отличны от нуля. В противном случае игра будет иметь решение в чистых стратегиях.
Воспользуемся теоремой об активных стратегиях. Если игрок придерживается своей оптимальной стратегии P*, то математическое ожидание его выигрыша будет равно цене игры, какой бы активной стратегией при этом ни пользовался второй игрок.
Слайд 25Смешанные стратегии
Тогда:
если второй игрок выбирает свою первую стратегию, то
если
второй игрок выбирает свою вторую стратегию, то
p1+p2=1 .
Решая эту
систему трех уравнений, находим искомые вероятности p1, p2, и цену игры ν:
Слайд 26Смешанные стратегии
Аналогично применяется теорема об активных стратегиях для нахождения оптимальной
стратегии второго игрока.
Вероятности стратегий второго игрока удовлетворяют системе уравнений:
Решая
эту систему, получим
.
Слайд 27Смешанные стратегии
Рассмотрим приемы, позволяющие упрощение платежной матрицы.
Стратегия первого игрока i
доминирует стратегию k, если для всех j=1,2,…,n выполняется hij≥hkj. В
этом случае стратегия k называется доминируемой, а стратегия - доминирующей.
Стратегия второго игрока j доминирует стратегию s, если для всех i=1,2,…,m выполняется hij≤his. В этом случае стратегия j называется доминирующей, а стратегия s - доминируемой.
Доминирующая стратегия никогда не хуже, а в некоторых случаях лучше, чем доминируемая.
Слайд 28Смешанные стратегии
Упрощение (уменьшение размерности) платежной матрицы происходит за счет исключения
всех заведомо невыгодных чистых стратегий. Вероятности исключенных стратегий равны нулю.
Теорема.
Если платежную матрицу преобразовать по правилу , то решение игры не изменится, а цена игры новой матрицы получается из цены игры старой матрицы по тому же правилу .
Эта теорема позволяет упростить внешний вид чисел, входящих в платежную матрицу.
Слайд 29Задача 1
Рассмотрим задачу планирования выпуска продукции, имеющей матрицу игры
Эту матрицу
можно упростить:
- первая строка доминирует над четвертой строкой, следовательно, четвертую
строку можно исключить, это означает, что первый игрок не будет выбирать четвертую стратегию, т.е. вероятность р4=0;
- третий столбец доминирует над четвертым столбцом, следовательно, четвертый столбец можно исключить, это означает, что второй игрок никогда не выберет четвертую стратегию, т.е. вероятность q4=0.
В результате платежная матрица примет вид
Слайд 30Задачи 2
Рассмотрим матрицу игры
В данной матрице нет доминирующих строк и
столбцов, поэтому она не может быть упрощена.
Проверим, имеет ли она
седловую точку.
Так как нижняя цена игры не равна верхней цене игры, то конечная антагонистическая игра не имеет седловой точки и решения в чистых стратегиях.
Она решается в смешанных стратегиях.
Слайд 31Задача 3
Рассмотрим задачу планирования
выпуска продукции, имеющей матрицу игры
Эту матрицу
можно упростить к виду
Проверим, имеет ли она седловую точку:
Так как
нижняя цена игры не равна верхней цене игры, то конечная антагонистическая игра не имеет седловой точки, задача решается в смешанных стратегтиях.
Слайд 32Тестовые вопросы
1. Каждая формализованная игра характеризуется:
1) биматрицей
2) матрицей
3) количеством игроков,
наборами стратегий, функциями выигрыша, результатом игры
4) выигрышем
2. Игра, заключающаяся в
том, что рассматриваются все возможные стратегии игроков и определяются платежи, соответствующие любой возможной комбинации стратегий игроков, называется …
1) игрой в произвольной форме
2) игрой в стандартной форме
3) игрой в канонической форме
4) игрой в нормальной форме
Слайд 33Тестовые вопросы
3. Нормальная форма игры двух участников состоит из ________
платежных (ой) матриц(ы), показывающих(ей), какую сумму получит каждый из игроков
при любой из возможных пар стратегий.
1) трех
2) одной
3) двух
4) четырех
4. Игра из двух игроков называется ________, если один из игроков выигрывает ровно столько, сколько проигрывает другой. В таких играх интересы ее участников прямо противоположны друг другу.
1) антагонистической
2) стратегической
3) тактической
4) оперативной
Слайд 34Тестовые вопросы
5. В антагонистической игре сумма выигрышей первого и второго
игрока равна _____
1) одному
2) нулю
3) двум
4) трем
6. Стратегия
________ игрока называется оптимальной, если при ее применении выигрыш первого игрока не может быть уменьшен, какими бы стратегиями ни пользовался второй.
1) первого
2) второго
Слайд 35Тестовые вопросы
7. Стратегия ________ игрока называется оптимальной, если при ее
применении проигрыш второго игрока не может быть увеличен, какими бы
стратегиями ни пользовался первый игрок.
1) первого
2) второго
8. Как называется принцип, в соответствии с которым каждый игрок, считая своего партнера по игре разумным противником, выбирает свои стратегии исходя из предположения, что его противник не упустит ни единой возможности использовать любую его ошибку в своих интересах?
1) принцип оптимальности
2) принцип эквивалентности
3) принцип осторожности
4) принцип системности
Слайд 36Тестовые вопросы
9. Величина
называется …
1) верхней
ценой игры
2) нижней ценой игры
3) выигрышем
4) ценой игры
10. Величина называется …
1) верхней ценой игры
2) нижней ценой игры
3) выигрышем
4) ценой игры
Слайд 37Тестовые вопросы
11. Величина α=β=ν называется …
1) верхней ценой игры
2) нижней
ценой игры
3) выигрышем
4) ценой игры
12. Пара чистых стратегий
создает в игре ситуацию равновесия тогда и только тогда, когда в матрице выигрышей существует элемент , который одновременно является наибольшим в своем столбце и наименьшим в своей строке. Этот элемент (если он существует) называется ________ точкой.
1) оптимально
2) седловой
3) выигрышной
4) проигрышной