Разделы презентаций


Игровые методы принятия решений

Содержание

Теория игрНеопределенными могут быть не только условия, в которых работает предприятие и принимаются решения, но и действия противников или других лиц, от которых зависит успех, или результат.

Слайды и текст этой презентации

Слайд 1 Теория принятия решений
Игровые методы

ПР

Теория принятия решений     Игровые методы ПР

Слайд 2Теория игр
Неопределенными могут быть не только условия, в которых работает

предприятие и принимаются решения, но и действия противников или других

лиц, от которых зависит успех, или результат.
Теория игрНеопределенными могут быть не только условия, в которых работает предприятие и принимаются решения, но и действия

Слайд 3Теория игр
ЛПР приходится считаться не только со своими собственными целями,


но и с теми целями, которые ставят перед собой его

партнеры.
И учитывать, кроме объективных, известных ему обстоятельств конфликта, еще и решения, которые принимают его противники, и которые ему, вообще говоря, неизвестны.
Теория игрЛПР приходится считаться не только со своими собственными целями, но и с теми целями, которые ставят

Слайд 4Теория игр
Теория принятия решений в условиях конфликта
или математическая теория конфликтных

ситуаций

Теория игрТеория принятия решений в условиях конфликтаили математическая теория конфликтных ситуаций

Слайд 5Физическая и социальная природа конфликта
юридические лица,
воюющие стороны,
спортивные

команды,
конкурирующие фирмы,
биологические виды в борьбе за существование,
борьба

технологий,
дележи рынков,…
Физическая и социальная природа конфликта юридические лица, воюющие стороны, спортивные команды, конкурирующие фирмы, биологические виды в борьбе

Слайд 6Задача теории игр
выработка рекомендаций по рациональному образу действий участников конфликта

Задача теории игрвыработка рекомендаций по рациональному образу действий участников конфликта

Слайд 7Конфликтная ситуация
Чтобы сделать возможным математический анализ ситуации, надо

построить упрощенную, схематизированную модель ситуации.
Такую модель принято называть игрой.

Конфликтная ситуация  Чтобы сделать возможным математический анализ ситуации, надо построить упрощенную, схематизированную модель ситуации. Такую модель

Слайд 8Игра – это модель конфликта
Принятие решений во взаимосвязанных

ситуациях:
большинство проблем в экономических и социальных науках (стратегическое поведение,

конкуренция, кооперация, риск и неопределенность)
приложения в области разработки новых технологий, ведения военных действий и т.д.
Игра – это модель конфликта  Принятие решений во взаимосвязанных ситуациях: большинство проблем в экономических и социальных

Слайд 9Конфликт
Любое явление, применительно к которому имеет смысл говорить

о том,
кто и как в этом конфликте участвует,
каковы

его возможные исходы,
кто и как в этих исходах заинтересован,
в чем состоит эта заинтересованность.
Конфликт  Любое явление, применительно к которому имеет смысл говорить о том, кто и как в этом

Слайд 10Элементы игры
I - множество игроков

Kd ⊂ I –

коалиции действий, xi ∈ Ωi

S=(x1,x2,…,xn) - исход

конфликта, или ситуация
S⊂ Π Ωi
i
Элементы игрыI - множество игроков Kd ⊂ I – коалиции действий,  xi ∈ Ωi S=(x1,x2,…,xn) -

Слайд 11Элементы игры
Коалиции интересов - КI ⊂ I

Заинтересованность fK(А) –


каждая из коалиций предпочитает одни исходы другим -




если fК(A)>fК(B)



Элементы игрыКоалиции интересов - КI ⊂ I Заинтересованность fK(А) – каждая из коалиций предпочитает одни исходы другим

Слайд 12Классификация игр
1) KI≥2 –
не менее 2-х заинтересованных сторон
2) Kd=1

– игра нестратегическая (неопределенности природы),
3) Kd ≥ 2

– игра стратегическая

Классификация игр 1) KI≥2 – не менее 2-х заинтересованных сторон2) Kd=1 – игра нестратегическая (неопределенности природы),

Слайд 13Классификация игр
по количеству игроков - игры 2 и n игроков


по количеству стратегий –
конечные и бесконечные;
по характеру

взаимодействия игроков коалиционные и бескоалиционные;
по характеру выигрышей - игры с нулевой суммой и игры с ненулевой суммой;
по виду функций выигрыша –
матричные, биматричные, непрерывные, выпуклые, типа дуэлей и др.
Классификация игрпо количеству игроков - игры 2 и n игроков по количеству стратегий –  конечные и

Слайд 14Классификация игр
Антагонистическая игра – игра двух лиц с нулевой суммой.

Матричная

игра – конечная игра двух лиц с нулевой суммой, или


конечная антагонистическая игра.

Биматричная игра – конечная игра двух игроков с ненулевой суммой.
Классификация игрАнтагонистическая игра – игра двух лиц с нулевой суммой.Матричная игра – конечная игра двух лиц с

Слайд 15Матричные игры
I={I,II} I: X={xi}m

II: Y={yj}n

f1(x,y) – функция выигрыша
первого игрока
f2(x,y) – функция выигрыша
второго игрока
f1(x,y)=-f2(x,y)

Матричные игры  I={I,II}      I: X={xi}m

Слайд 16Матричные игры
Матрица игры:

Матричные игрыМатрица игры:

Слайд 17Функция выигрыша
f1(xi,yj) – результат 1-го игрока,
когда он сделал

ход xi, а 2-ой игрок – ход yj,
т.е. в

ситуации (xi,yj )
Функция выигрыша f1(xi,yj) – результат 1-го игрока, когда он сделал ход xi, а 2-ой игрок – ход

Слайд 18В антагонистической игре цели игроков противоположны:
Цель первого игрока


выиграть как можно больше,

цель второго -
проиграть как можно меньше
В антагонистической игре цели игроков противоположны:  Цель первого игрока – выиграть как можно больше,

Слайд 19Решить игру
Найти оптимальные стратегии каждого игрока и

оценить результат,
т.е. выигрыш первого игрока

Решить игру  Найти оптимальные стратегии каждого игрока и  оценить результат,  т.е. выигрыш первого игрока

Слайд 20Пример






(х1,y2)→(x2,y2)
(x2,y2) – ситуация равновесия
Х1
Х2
Х3
y1 y2 y3

Пример(х1,y2)→(x2,y2)(x2,y2) – ситуация равновесияХ1Х2Х3y1  y2  y3

Слайд 21Ситуация равновесия
Если один игрок придерживается стратегии, соответствующей

ситуации равновесия,
то второму игроку невыгодно отступать

от своей стратегии, соответствующей ситуации равновесия
Ситуация равновесия   Если один игрок придерживается стратегии, соответствующей ситуации равновесия,    то второму

Слайд 22Ситуация равновесия
Пусть (x*,y*) – ситуация равновесия
f1(x,y) - выигрыш 1-го игрока
f2(x,y)

- выигрыш 2-го игрока

тогда
f1(x,y*) ≤ f1(x*,y*)

f2(x*,y) ≤ f2(x*,y*)

Ситуация равновесия Пусть (x*,y*) – ситуация равновесияf1(x,y) - выигрыш 1-го игрокаf2(x,y) - выигрыш 2-го игрокатогдаf1(x,y*) ≤ f1(x*,y*)f2(x*,y)

Слайд 23Ситуация равновесия
f1(x,y*) ≤ f1(x*,y*)
f2(x*,y) ≤ f2(x*,y*) ,

*(-1):

-f2(x*,y) ≥ -f2(x*,y*), но
f1(x,y) = -f2(x,y),

f1(x*,y) ≥ f1(x*,y*)

f1(x,y*) ≤ f1

(x*,y*) ≤ f1(x*,y)

Ситуация равновесияf1(x,y*) ≤ f1(x*,y*)f2(x*,y) ≤ f2(x*,y*) ,    *(-1):-f2(x*,y) ≥ -f2(x*,y*), ноf1(x,y) = -f2(x,y),f1(x*,y) ≥

Слайд 24Ситуация равновесия
Точка, выигрыш в которой первого


игрока минимален по y и максимален по x:



Ситуация равновесия   Точка, выигрыш в которой первого    игрока минимален по y и

Слайд 25Гарантированный результат
ν1= maxx miny fij –

гарантированный результат
1-го

игрока
Гарантированный результат   ν1= maxx miny fij –   гарантированный результат

Слайд 26Гарантированный результат
ν2= min max fij -

y x
гарантированный результат
2-го игрока

5 2 4
Гарантированный результатν2= min max fij -     y      xгарантированный

Слайд 27Гарантированные результаты
ν1=ν –

нижняя цена игры,
ν2= –


верхняя цена игры



Гарантированные результаты ν1=ν –       нижняя цена игры,  ν2=

Слайд 28Th. Неравенство минимаксов
ν ≤ ,

или





Th. Неравенство минимаксовν ≤   ,    или ≤

Слайд 29Доказательство



- по свойству с.р.
Но если

f(x)то min f(x)





Доказательство          ≤    - по свойству

Слайд 30Неравенство минимаксов
Если функция ограничена сверху константой, то и

максимум этой функции ограничен ею же



ч.т.д.

Неравенство минимаксов  Если функция ограничена сверху константой, то и максимум этой функции ограничен ею же

Слайд 31Ситуация равновесия
ν1= maxx miny fij

ν2= miny maxx

fij

Если ν1= ν2 -

седловая точка


Ситуация равновесия  ν1= maxx miny fij ν2= miny maxx fij Если    ν1= ν2

Слайд 32Седловая точка

Седловая точка

Слайд 33Пример

ν1=2
ν2=2

Пример ν1=2ν2=2

Слайд 34Седловая точка

Седловых точек в игре может быть

несколько, причем цена игры в каждой одинакова

Седловая точка   Седловых точек в игре может быть несколько, причем цена игры в каждой одинакова

Слайд 35Принцип достижимости целей
Стремление игроков к ситуации равновесия,

описываемой седловой точкой,
т.к. только ситуации равновесия

могут быть предметом договоров, которые будут соблюдаться (игрокам невыгодно отступать от такой ситуации).
Принцип достижимости целей   Стремление игроков к ситуации равновесия, описываемой седловой точкой,    т.к.

Слайд 36Существуют ли оптимальные решения в играх без седловых точек?
Теорема

Неймана гарантирует,
что каждая антагонистическая игра имеет
оптимальные

стратегии
Существуют ли оптимальные решения в играх без седловых точек?  Теорема Неймана гарантирует, что  каждая антагонистическая

Слайд 37Пример


6 8
__________________
2
4
= 4;

=6.
ν∈ [4;6]
ν – цена

игры




Пример 6  8__________________24   = 4;   =6.     ν∈ [4;6]ν

Слайд 38Игры с закрытой информацией
В играх без седловой

точки свои ходы надо тщательно скрывать.
Однако интервал

[4,6] каждый из игроков хочет перераспределить в свою пользу,
и это выгодно им обоим.
Значит, надо придумать такую процедуру поведения, чтобы
ν∈[4,6].



Игры с закрытой информацией   В играх без седловой точки свои ходы надо тщательно скрывать.

Слайд 39Идея использования смешанных стратегий
Правильное поведение состоит в том,

чтобы стратегию выбирать случайно –
не на основании

каких-то разумных
соображений, -
но сама схема рандомизации
должна выбираться
разумно
Идея использования смешанных стратегий  Правильное поведение состоит в том, чтобы стратегию выбирать случайно –

Слайд 40Смешанная стратегия
Случайная величина, значениями которой являются

чистые стратегии игрока.
Это сложная стратегия, состоящая

в случайном чередовании двух или более чистых стратегий с определенными частотами.
В теории игр доказано, что
устойчивое решение в играх без седловой точки лежит в области смешанных стратегий.
Смешанная стратегия   Случайная величина, значениями которой являются чистые стратегии игрока.   Это сложная стратегия,

Слайд 41Смешанная стратегия

Р=

- смешанная



стратегия первого игрока,


или вероятностное распределение
на множестве чистых стратегий
Р = (р1, р2, …, рm),
причем ∑ pi=1.

Смешанная стратегия Р=

Слайд 42Смешанная стратегия

Q=

- cмешанная
стратегия
второго игрока,
Q = (q1, q2,

…, qn),

∑ qj=1.

Смешанная стратегияQ=- cмешанная стратегия второго игрока, Q = (q1, q2, …, qn), ∑ qj=1.

Слайд 43Смешанная стратегия
Применение смешанной стратегии - это гибкая

тактика,
при которой противник не знает и не может

знать заранее, с чем ему придется встретиться
Смешанная стратегия   Применение смешанной стратегии - это гибкая тактика,  при которой противник не знает

Слайд 44Смешанная стратегия
Любая чистая стратегия является частным случаем

смешанной:
например, х1=Р(1,0,…,0).

Таким образом, для любой игры существует пара (P,Q) смешанных стратегий.
Платеж, соответствующий паре (P,Q), называется ценой игры ν.
Стратегии, которые входят в оптимальную смешанную стратегию (им соответствуют ненулевые вероятности), называются
активными стратегиями.
Смешанная стратегия   Любая чистая стратегия является частным случаем смешанной:    например,

Слайд 45Алгоритм решения игры
Упростить игру.
Найти гарантированные результаты для каждого игрока.
Если существует

седловая точка, то найти решение игры в чистых стратегиях.
Если седловой

точки нет, то найти решение игры в смешанных стратегиях.

Алгоритм решения игрыУпростить игру.Найти гарантированные результаты для каждого игрока.Если существует седловая точка, то найти решение игры в

Слайд 46Решение игр 2х2

А=

- платежная матрица
Решение игры будем искать
в

смешанных стратегиях:
P=(p1,p2) - для первого игрока и
Q=(q1,q2) –

для второго.
Решение игр 2х2А=- платежная матрица Решение игры будем искать в смешанных стратегиях: P=(p1,p2) - для первого игрока

Слайд 47Решение игр 2х2
Это значит, что первый игрок будет применять свою

первую стратегию
х1 с вероятностью р1,


а свою вторую стратегию
х2 – с вероятностью р2,

причем р1+р2=1.

Решение игр 2х2Это значит, что первый игрок будет применять свою первую стратегию     х1

Слайд 48Пример
P1

p2
q1 q2

Мν=6p1q1+2p1q2+4p2q1+8p2q2
p2=1-p1, q2=1-q1
Мν= 6p1q1+2p1(1-q1)+4(1-p1)q1+8(1-p1)(1-q1)=
ν∈ [4;6]

ПримерP1p2q1    q2Мν=6p1q1+2p1q2+4p2q1+8p2q2p2=1-p1, q2=1-q1Мν= 6p1q1+2p1(1-q1)+4(1-p1)q1+8(1-p1)(1-q1)=ν∈ [4;6]

Слайд 49=-6p1-4q1+8+8p1q1=
=8(p1-1/2)(q1-3/4)+5

Ответ:
P={1/2; 1/2}; Q={3/4; 1/4}; ν=5

=-6p1-4q1+8+8p1q1==8(p1-1/2)(q1-3/4)+5Ответ:P={1/2; 1/2}; Q={3/4; 1/4}; ν=5

Слайд 50Решение игр 2х2
Решим игру в общем виде с точки зрения

второго игрока
Перепишем матрицу игры
в следующем

виде:




Найдем средний проигрыш второго игрока:
а11⋅q1+a12⋅q2=ν - при первой стратегии первого игрока,
а21⋅q1+a22⋅q2=ν - при второй стратегии первого игрока,


Решение игр 2х2Решим игру в общем виде с точки зрения второго игрока  Перепишем матрицу игры

Слайд 51Решение игр 2х2
(а11-а21)⋅q1+(a12-а22)⋅q2=0,
затем, учитывая, что q2=1-q1,
получим


(а11-а21-а12+а22)⋅q1+(a12-а22)=0.
Отсюда
q1=-(a12-а22)/(а11-а21-а12+а22).
Подставляя это значение

q1 в любое
из уравнений, получим значение цены игры ν
Решение игр 2х2(а11-а21)⋅q1+(a12-а22)⋅q2=0,  затем, учитывая, что q2=1-q1,  получим (а11-а21-а12+а22)⋅q1+(a12-а22)=0.   Отсюда q1=-(a12-а22)/(а11-а21-а12+а22).  Подставляя

Слайд 52С точки зрения первого игрока
а11⋅p1+a21⋅p2=ν - при

первой стратегии второго

игрока,
а12⋅p1+a22⋅p2=ν - при второй стратегии второго
игрока.

p1(a11-a12) +(a21-a22)(1-p1)=0
p1= (a22-a21)
(a11-a12+a22-a21)


С точки зрения первого игрока  а11⋅p1+a21⋅p2=ν - при первой стратегии второго

Слайд 53Пример
Матрица игры А=

Составим систему уравнений

для второго игрока:
6q1+2q2=ν
4q1+8q2=ν

решая совместно, получим 2q1-6(1-q1)=0, или 8q1=6, или q1=3/4.
Отсюда Q=(3/4;1/4).
Цена игры ν = 6⋅3/4+2⋅1/4 = 5 ∈[4,6].




ПримерМатрица игры      А=Составим систему уравнений для второго игрока:   6q1+2q2=ν

Слайд 54Пример
Найдем оптимальную стратегию первого игрока.

Поскольку цена игры уже известна, то достаточно написать только одно

уравнение для среднего выигрыша первого игрока:
6p1+4p2=5,
p2=1-p1,
после подстановки получим
2p1+4=5,
откуда р1=1/2.
Следовательно,
Р=(1/2;1/2).


Пример  Найдем оптимальную стратегию первого игрока.   Поскольку цена игры уже известна, то достаточно написать

Слайд 55
Ответ:
P=(1/2;1/2), Q=(3/4;1/4),

ν =5.

Ответ: P=(1/2;1/2), Q=(3/4;1/4),        ν =5.

Слайд 56Решение примера методом Крамера
А=

,


ее определитель ⏐А⏐=6⋅8-4⋅2=40.


Тогда q1= , q2=

Поскольку q1+q2=1, то из 8ν/40=1 следует

ν=5, значит, Q={3/4;1/4}



Решение примера методом Крамера     А=

Слайд 57Решение примера методом Крамера
Вероятности P можно найти

аналогично,

но из транспонированной матрицы

А*= , 6p1 +4p2=ν
2p1 +8p2 =ν

тогда p1= =4ν/40.


ν=5 P={1/2;1/2}.





Решение примера методом Крамера   Вероятности P можно найти аналогично,

Слайд 58Решение игр 2×n и m×2

Если один из игроков
имеет 2

стратегии,
а другой игрок -
больше двух стратегий,
то игра решается
графическим способом
Решение игр 2×n и m×2     Если один из игроков    имеет

Слайд 59Решение игр 2×n
У первого игрока - 2

стратегии,
у второго игрока - n стратегий.

Если в игре нет седловой точки,
то будем искать решение игры
в смешанных стратегиях.
Решаем игру с точки зрения
того игрока,
у которого две стратегии.
Решение игр 2×n   У первого игрока - 2 стратегии, у второго игрока - n стратегий.

Слайд 60Решение игр 2×n
Матрица игры:


p2=1-p1
ν1=a11

p1+a21 p2= a21+(a11-a21)p1
ν2=a12 p1+a22 p2= a22+(a12-a22)p1
….
νn=a1n p1+a2n p2= a2n+(a1n-a2n)p1


p1
p2

Решение игр 2×nМатрица игры:

Слайд 61Графо-аналитический метод
Линейные функции ν1, ν2,…,νn отражают

зависимость
среднего выигрыша 1-го игрока
от вероятности р1


при различных стратегиях 2-го игрока.
Для анализа ситуации необходимо изобразить их графически в осях ν1–p1, имея в виду, что областью определения функций ν1, ν2,…,νn является интервал [0,1]
Графо-аналитический метод   Линейные функции ν1, ν2,…,νn отражают  зависимость  среднего выигрыша 1-го игрока от

Слайд 62Гарантированный результат первого игрока


ν= max min{a2j+(a1j – a2j)p1}

i

j
Гарантированный результат первого игрокаν= max min{a2j+(a1j – a2j)p1}

Слайд 63Чтобы обеспечить себе гарантированный результат,
первый игрок должен выделить


нижнюю границу среднего выигрыша
при любой

стратегии второго игрока,

а затем найти максимальное значение среднего результата на этой границе
Чтобы обеспечить себе гарантированный результат,  первый игрок должен выделить  нижнюю границу среднего выигрыша  при

Слайд 64Решение игры
Соответствующая абсцисса равна вероятности применения первым игроком
его первой

стратегии,
а ордината равна цене игры

Решение игрыСоответствующая абсцисса равна вероятности применения первым игроком его первой стратегии, а ордината равна цене игры

Слайд 65Пример
Решить игру А=




=1,
=3
Решаем ее с точки

зрения I игрока

ν1=2р1+4р2=2р1+4(1-р1)=4-2р1 ν2=3р1+р2=1+2р1
ν3= р1+6р2=6-5р1
ν4=5р1+0р2=5р1

p1
p2

Пример Решить игру     А=       =1, =3 Решаем

Слайд 666
5
4
3
2
1
0
ν 4
ν2
ν3
ν1
0 Р1*

1

р1

ν

Решение игры

6543210ν 4ν2ν3ν10        Р1*     1

Слайд 67Верхняя точка границы
образована пересечением прямых ν3 и ν2

(р1*, ν)∈ ν3∩ν2.


Координаты точки пересечения найдем из равенства 1+2р1=6-5р1,
Отсюда 7р1=5 и

р1*= , р2= ⇒
ν=1+ 2*5/7=17/7





Верхняя точка границы образована пересечением прямых ν3 и ν2

Слайд 68Для 2-го игрока
стратегии y1 и y4 – неактивные,

т.к. не используются в смешанной стратегии.
Тогда смешанную

стратегию второго игрока найдем из

q1= = = ⇒

Q= (0; ; ;0).

Ответ: P=(5/7; 2/7), ν=17/7; Q=(0; 5/7; 2/7; 0).







Для 2-го игрока  стратегии y1 и y4 – неактивные, т.к. не используются в смешанной стратегии.

Слайд 69Решение игр m×2
У 1-го игрока m стратегий,


у 2-го игрока – 2 стратегии

Матрица

игры


Решение игр m×2   У 1-го игрока m стратегий,   у 2-го игрока – 2

Слайд 70Решаем с точки зрения того игрока, который имеет 2 стратегии,

т.е. второго.
Р= (р1,…, рm) – смешанная стратегия 1-го игрока
Q=

(q1, q2) – смешанная стратегия
2-го игрока
Решаем с точки зрения того игрока, который имеет 2 стратегии, т.е. второго. Р= (р1,…, рm) – смешанная

Слайд 71Средний проигрыш 2-го игрока
ν1=a11 q1+a12 q2=a11+(a11 - a12)q1

νm=am1q1+am2q2=am1+(am1 -

am2)q1

q1 q2

Средний проигрыш 2-го игрока ν1=a11 q1+a12 q2=a11+(a11 - a12)q1…νm=am1q1+am2q2=am1+(am1 - am2)q1 q1   q2

Слайд 72Гарантированный результат второго игрока

Гарантированный результат второго игрока

Слайд 73Средний проигрыш 2-го игрока
В семействе прямых, описывающих средний проигрыш

2-го игрока,
отмечаем верхнюю границу и выбираем на ней

самую нижнюю точку.
Ее координаты определяют искомую вероятность q1 и цену игры ν.
Средний проигрыш 2-го игрока В семействе прямых, описывающих средний проигрыш 2-го игрока,  отмечаем верхнюю границу и

Слайд 74Смешанная стратегия 1-го игрока
Активными стратегиями первого игрока

будут те, которые соответствуют прямым, образующим точку пересечения (q1,ν).

Оптимальные стратегии первого игрока определим из матрицы 2х2
Смешанная стратегия 1-го игрока   Активными стратегиями первого игрока будут те, которые соответствуют прямым, образующим точку

Слайд 75Пример
Матрица игры

Средний проигрыш 2-го игрока

ν1=4q1+2q2 = 4q1 +2(1-q1)= 2+2q1,


ν2=2 q1+5q2= 5-3q1,
ν3=3q1+4q2=4-q1

ПримерМатрица игрыСредний проигрыш 2-го игрокаν1=4q1+2q2 = 4q1 +2(1-q1)= 2+2q1,  ν2=2 q1+5q2= 5-3q1,ν3=3q1+4q2=4-q1

Слайд 76Смешанная стратегия 2-го игрока

(q1*, ν) ∈ ν1∩ν3 ⇒

2+2q1=4-q1,

0 1 q1

5
4
3
2
1

q1*=


ν= 2+2*2/3=10/3

Смешанная стратегия 2-го игрока            (q1*, ν)

Слайд 77Смешанная стратегия 1-го игрока
Из матрицы А*

p1=
=
=
Ответ: Q=(2/3; 1/3), ν=10/3,

P=(1/3; 0; 2/3).
А=

Смешанная стратегия 1-го игрокаИз матрицы А*p1= ==Ответ: Q=(2/3; 1/3), ν=10/3, P=(1/3; 0; 2/3).А=

Слайд 78Решение игр mxn
X={xi}m – стратегии 1-го игрока
Y={yj}n – стратегии

2-го игрока

Р=(р1, р2, …, рm) и Q=(q1, q2, …, qn)


их смешанные стратегии,
причем Σpi=1, Σqj=1.
Решение игр mxn X={xi}m – стратегии 1-го игрокаY={yj}n – стратегии 2-го игрокаР=(р1, р2, …, рm) и Q=(q1,

Слайд 79Первый игрок
Найдем сначала оптимальную стратегию Р.

Она должна обеспечить выигрыш
≥ν при любой стратегии противника


и =ν при его оптимальном поведении Q.
Первый игрок   Найдем сначала оптимальную стратегию Р.  Она должна обеспечить выигрыш ≥ν при любой

Слайд 80Пусть ν>0
Чтобы это выполнялось, достаточно, чтобы

все элементы матрицы aij >0.
В противном

случае можно прибавить ко всем элементам матрицы А достаточно большое число М,
тогда цена игры увеличится на М,
а вероятности останутся теми же
Пусть ν>0   Чтобы это выполнялось, достаточно, чтобы все элементы матрицы aij >0.   В

Слайд 81
для любого j
Введем обозначения: xi=pi/ν, тогда


Выбор должен быть максимально возможным,

следовательно, 1/ν принимает минимальное значение.

для любого jВведем обозначения: xi=pi/ν, тогдаВыбор должен быть максимально возможным, следовательно, 1/ν принимает минимальное значение.

Слайд 82Второй игрок
Все аналогично решению игры для первого игрока,

только второй игрок стремится не максимизировать, а минимизировать свой проигрыш

ν, а значит, максимизировать величину 1/ν.
Второй игрок  Все аналогично решению игры для первого игрока, только второй игрок стремится не максимизировать, а

Слайд 83для любого i.


для любого i.
Заменим yj=qj/ν, тогда

Σyj=1/ν


Требуется так выбрать переменные yj, чтобы максимизировать функцию


или, что то же самое,
минимизировать функцию L’=-L:



для любого i. для любого i. Заменим yj=qj/ν, тогда Σyj=1/ν Требуется так выбрать переменные yj, чтобы максимизировать

Слайд 84Симметричные игры
Опр. Квадратная матрица А={aij} называется кососимметричной, если

aij= - aji

для любого i.
Симметричные игры Опр. Квадратная матрица А={aij} называется кососимметричной, если  aij= - aji

Слайд 85Tеорема
Значение симметричной игры равно нулю.
Кроме

того, если х – оптимальная стратегия первого игрока,

то х также оптимальная стратегия для второго.

т.е. P=Q; ν=0.
Tеорема  Значение симметричной игры равно нулю.   Кроме того, если х – оптимальная стратегия первого

Слайд 86Пример

По теореме ν=0;


т.к. P=Q,
то
найдем P.


Р1
Р2
Р3

Пример             По теореме ν=0;

Слайд 87Средний выигрыш 1-го игрока
-р2+2р3=0

→ р2=2р3
р1 -3р3=0

→ р1 =3р3
-2р1+3р2 =0
р1+ р2+ р3=1


2р3 +3р3 +р3=1
6р3=1; р3=1/6; р2=1/3; р1=1/2

P=Q=(1/2; 1/3; 1/6)

Средний выигрыш 1-го игрока      -р2+2р3=0  →  р2=2р3  р1

Слайд 88Метод итераций Брауна-Джонсона
Разыгрывается мысленный эксперимент, в котором 1-ый и 2-ой

применяют друг против друга свои стратегии:
1-ый – xi, 2-ой -

yj , который минимизирует aij

Метод итераций Брауна-ДжонсонаРазыгрывается мысленный эксперимент, в котором 1-ый и 2-ой применяют друг против друга свои стратегии:1-ый –

Слайд 89Смешанная стратегия
игрока в разных случаях имеет разный смысл.



Иногда конфликт должен быть разрешен всего за

один ход противников.

Смешанная стратегия  игрока в разных случаях имеет разный смысл.    Иногда конфликт должен быть

Слайд 90Например,
размещение заказа на разных предприятиях
установление цены на продукцию
оснащение производства

современным оборудованием
ведение боевых действий с применением разных стратегий и т.д.

Например, размещение заказа на разных предприятияхустановление цены на продукциюоснащение производства современным оборудованиемведение боевых действий с применением разных

Слайд 91Тактические задачи
- В задачах поиска наилучших способов использования

потенциала системы («тактических»)
оптимальные смешанные стратегии реализуются путем

неожиданных переходов от одного способа действий к другому в соответствии с pi и qj.
Тактические задачи  - В задачах поиска наилучших способов использования потенциала системы («тактических»)   оптимальные смешанные

Слайд 92Физическая смесь стратегий
В задачах выбора рациональных параметров («технических»)

случайный подбор технических показателей недопустим.
Физическая смесь стратегий предполагает реализацию сразу

нескольких технических решений
в определенных пропорциях.
Физическая смесь стратегийВ задачах выбора рациональных параметров («технических»)  случайный подбор технических показателей недопустим.Физическая смесь стратегий предполагает

Слайд 93 - создание уникальных систем;
строительство капитальных сооружений;
крупносерийное производство и
другие

долгосрочные мероприятия, требующие значительных затрат

- создание уникальных систем;строительство капитальных сооружений;крупносерийное производство и другие долгосрочные мероприятия, требующие значительных затрат

Слайд 94Модель комплектации вычислительного центра
Предполагается организовать ВЦ коллективного

пользования, который может быть оснащен ЭВМ 4-х типов.
На обработку принимаются

данные, относящиеся к одному из пяти видов задач:
- календарное планирование;
- распределение материальных
ресурсов;
- статистическая отчетность и т.д.
Модель комплектации вычислительного центра   Предполагается организовать ВЦ коллективного пользования, который может быть оснащен ЭВМ 4-х

Слайд 95 Обработка требует определенного времени, зависящего от характеристик

используемой ЭВМ, сложности и объема вычислений и т.д.

Расходы оплачивают заказчики:


Обработка требует определенного времени, зависящего от характеристик используемой ЭВМ, сложности и объема вычислений и

Слайд 96Цели
1 –ый игрок (организаторы ВЦ)
стремится увеличить приток

средств от заказчика за счет ускорения обработки заказов и применения

дорогостоящих ЭВМ

2 –ой игрок (заказчики-пользователи)
старается разумно расходовать свои средства (требования к срокам, корректная постановка, ранжирование задач)
Цели 1 –ый игрок (организаторы ВЦ)  стремится увеличить приток средств от заказчика за счет ускорения обработки

Слайд 97
400р3+700р4=ν1= 700-300р3
500р3+200р4=ν4= 200+300р3
800р3+100р4=ν5= 100+700р3

400р3+700р4=ν1=   700-300р3500р3+200р4=ν4=   200+300р3800р3+100р4=ν5=   100+700р3

Слайд 98Решение
Р=(0; 0; 5/6; 1/6)
ν=450
Количество ЭВМ оценивается с помощью методов

ТМО

РешениеР=(0; 0; 5/6; 1/6)ν=450 Количество ЭВМ оценивается с помощью методов ТМО

Слайд 99Замечание
Антагонистические игры описывают конфликты
весьма частного вида

Замечание Антагонистические игры описывают конфликты  весьма частного вида

Слайд 100 После того, как с помощью матричной игры оценили

личные стратегические возможности ЛПР (1-ый игрок)
при полном

антагонизме сторон,
целесообразно продолжить исследование ситуации на основе дополнительной информации о предпочтениях субъектов
После того, как с помощью матричной игры оценили личные стратегические возможности ЛПР (1-ый игрок)

Слайд 101Обоснование решений с использованием биматричных игр
Антагонистические игры не описывают конфликты

с числом сторон >2.
Интересы сторон даже с двумя участниками не

обязательно противоположны f1 ≠ -f2.
Различие в оценках ситуации оставляет место для соглашений, договоров и кооперации
Для ЛПР цена игры имеет незначительную ценность.
Обоснование решений с использованием биматричных игрАнтагонистические игры не описывают конфликты с числом сторон >2.Интересы сторон даже с

Слайд 102Игры двух лиц с произвольной суммой (бескоалиционные)
1-ый игрок:

{хi}m=Х
2-ой игрок: {yj}n=Y

A={aij} – выигрыш 1-го
B={bij} –

выигрыш 2-го
P=(p1, p2, …, pm)
Q=(q1, q2,…, qn)
Игры двух лиц с произвольной суммой (бескоалиционные)1-ый игрок:   {хi}m=Х2-ой игрок:    {yj}n=YA={aij} –

Слайд 103Решение игры
С точки зрения первого игрока его

средний выигрыш (матрица А) должен быть больше или равен среднему

выигрышу второго игрока при любой стратегии 2-го.


Решение игры  С точки зрения первого игрока его средний выигрыш (матрица А) должен быть больше или

Слайд 104Решение игры

A=
Средний выигрыш первого игрока:
Мν1=

Решение игрыA=Средний выигрыш первого игрока: Мν1=

Слайд 105∑aij qj ≤ ∑∑aijpiqj ,
j

i j
n
∑qj=1,

для любых i, j
j=1

,

∑aij qj ≤ ∑∑aijpiqj , j          i

Слайд 106Средний выигрыш второго игрока:

Мν2=
M

m n

m
∑bij pi ≤ ∑∑bijpiqj , ∑pi=1 для любых j
i=1 i j i=1


B=

Средний выигрыш второго игрока: Мν2=M        m n

Слайд 107Существование с.р. в бескоалиционных играх не определяет их решений
Однозначные рекомендации

для сторон пока отсутствуют

Существование с.р. в бескоалиционных играх не определяет их решенийОднозначные рекомендации для сторон пока отсутствуют

Слайд 108Пример
А=

В=



р1= =

р2= = ν1= - 4/7

Р=(1/7; 6/7).







ПримерА=           В=

Слайд 109Для 2-го игрока
Матрица В содержит выигрыши 2-го игрока,

цель которого – тоже выиграть как можно больше!
Это равносильно

тому, что он играет как первый игрок, т.е.
по транспонированной матрице В

q1= = ; q2= = ⇒ ⇒

ν= 1/3 ; Q=(2/9; 7/9).






Для 2-го игрока  Матрица В содержит выигрыши 2-го игрока, цель которого – тоже выиграть как можно

Слайд 110A={aij}, B={bij}

(A,B)={(aij,bij)}
ОБОЗНАЧЕНИЯ

A={aij}, B={bij}  (A,B)={(aij,bij)} ОБОЗНАЧЕНИЯ

Слайд 111Редко удается предсказать исходы Б. игр
Отсутствие связи между платежами сторон

(нет влияния сторон друг на друга)


Возможность действовать самостоятельно, независимо

Редко удается предсказать исходы Б. игрОтсутствие связи между платежами сторон (нет влияния сторон друг на друга)Возможность действовать

Слайд 112В неантагонистической игре отклонение игрока от с.р. может по-разному повлиять

на выигрыш другого

В неантагонистической игре отклонение игрока от с.р. может по-разному повлиять на выигрыш другого

Слайд 113Теорема Нэша
Каждая биматричная игра имеет по крайней мере

одну ситуацию равновесия.
Равновесный по Нэшу результат не меньше,

чем максиминный для каждого игрока
Теорема Нэша  Каждая биматричная игра имеет по крайней мере одну ситуацию равновесия.  Равновесный по Нэшу

Слайд 114Только равновесные ситуации могут быть предметом результативных переговоров
Необходим анализ

игры
с целью
установления
таких ситуаций

Только равновесные ситуации могут быть предметом результативных переговоров  Необходим анализ игры с целью установления таких ситуаций

Слайд 115Пример 1. Переговоры по сокращению объема продукции

y1 y2
x1
x2
1 –

настаивать на принятии своих предложений
2 – принять предложения конкурента
Если стороны не придут к соглашению, то полезность переговоров = 0

Стрелка направляется на более предпочтительную альтернативу при фиксированной стратегии конкурента

Пример 1.  Переговоры по сокращению объема продукции     y1

Слайд 116Пример 2. Переговоры о масштабах сокращения объема продукции
Альтернативы
1 –

выпуск на прежнем уровне;
2 – существенное сокращение выпуска

А. Действенных мер

контроля нет

(3;3) (10;0)

(0;10) (9;9)



Пример 2.  Переговоры о масштабах сокращения объема продукцииАльтернативы1 – выпуск на прежнем уровне;2 – существенное сокращение

Слайд 117 В отсутствие контроля
ни одна из

сторон не пойдет на сокращение выпуска продукции

В отсутствие контроля  ни одна из сторон не пойдет на сокращение выпуска продукции

Слайд 118 Б. Действенные меры контроля
(разработана система штрафов

за нарушение договоренностей)
(3;3) (7;0)

(0;7)

(8;8)

х1
х2

y1 y2

Игра с предпочтениями:
смешанные стратегии не применяются

Б. Действенные меры контроля (разработана система штрафов за нарушение договоренностей)(3;3)    (7;0)(0;7)

Слайд 119Ситуация Равновесия по Нэшу -
схема анализа, когда

никакое кооперирование не допускается.

Если равновесный по Нэшу

выигрыш участников не устраивает, то следует начать обмениваться информацией и договариваться о совместном поведении в игре
Ситуация Равновесия по Нэшу -   схема анализа, когда никакое кооперирование не допускается.   Если

Слайд 120Во многих случаях полезны и даже необходимы контакты и соглашения

между участниками, поэтому модели, допускающие возможность кооперирования, более предпочтительны

Во многих случаях полезны и даже необходимы контакты и соглашения между участниками, поэтому модели, допускающие возможность кооперирования,

Слайд 121Кооперативная игра
Разрешено заключать совместные соглашения
Допускается совместный выбор стратегий
Допускается передавать полезность

от одного игрока к другому
Принцип групповой рациональности

Кооперативная играРазрешено заключать совместные соглашенияДопускается совместный выбор стратегийДопускается передавать полезность от одного игрока к другомуПринцип групповой рациональности

Слайд 122«Справедливый дележ» по Нэшу
«начало отсчета» - (ν1*, ν2*) - минимальный

результат, ниже которого игрок не согласится получить ни при каких

обстоятельствах
(наибольший гарантированный результат в антагонистической игре)
(ν1, ν2) – согласованный дележ.
Δν1= ν1-ν1*, Δν2=ν2- ν2*
φ(ν1, ν2)= Δν1 Δν2→max

(ν1°, ν2°): max φ(ν1, ν2)
{ν1, ν2}
«Справедливый дележ» по Нэшу«начало отсчета» - (ν1*, ν2*) - минимальный результат, ниже которого игрок не согласится получить

Слайд 123 Мультипликативная целевая функция φ(ν1, ν2) моделирует допустимую компенсацию уменьшения

одних значений частных компонентов за счет увеличения других

Мультипликативная целевая функция φ(ν1, ν2) моделирует допустимую компенсацию уменьшения одних значений частных компонентов за счет увеличения

Слайд 124 Если кто-то из игроков не удовлетворен компромиссным решением,

он может исследовать свои стратегические возможности
по применению


стратегии угроз
Если кто-то из игроков не удовлетворен компромиссным решением, он может исследовать свои стратегические возможности

Слайд 125 Применение стратегии угроз
(реальная или провозглашенная в качестве возможной

альтернатива поведения:
склонить противника к мысли, что ему выгоднее пойти на

уступки при дележе;
изменить мнение относительно ситуаций конфликта, суждение о пропорциях дележа)


Применение стратегии угроз (реальная или провозглашенная в качестве возможной альтернатива поведения:склонить противника к мысли, что ему

Слайд 126Эффективность стратегии угрозы
определяется
результатом истинного воздействия на физический объект

(изменение состояния объекта)
психологическим воздействием на субъекта, которому угрожают (изменяется мнение

о ситуации, о пропорциях дележа и т.д.)
правдоподобностью и обдуманностью (нет сомнений, что угрозу приведут в исполнение)
Эффективность стратегии угрозы  определяетсярезультатом истинного воздействия на физический объект (изменение состояния объекта)психологическим воздействием на субъекта, которому

Слайд 127Пример
(1;4) (-2;-4)
(-3;-1) (4;1)


4
-3
-4
1
4
Пусть стратегия угроз 1-го –

х2
Тогда 2-ой будет угрожать y1
(ν1’, ν2’) – результаты угроз
Ситуация угрозы

(-3;-1)

N-E

ν1

ν2

(ν1’, ν2’)

φ(ν1,ν2)=[ν1-(-3)][(5- ν1)-(-1)]=- (ν1)↑2+3 ν1+18

ν1+ν2=5

Пример (1;4)  (-2;-4) (-3;-1) (4;1)4-3-414Пусть стратегия угроз 1-го – х2Тогда 2-ой будет угрожать y1(ν1’, ν2’) –

Слайд 128Решение
φ(ν1,ν2)=- (ν1)↑2+3ν1+18

φ’(ν1)=-2ν1+3=0

ν’1=1,5; ν’2=3,5

Решениеφ(ν1,ν2)=- (ν1)↑2+3ν1+18       φ’(ν1)=-2ν1+3=0      ν’1=1,5; ν’2=3,5

Слайд 129Теория кооперативных игр продолжает развиваться, привлекая к себе внимание исследователей

прикладных проблем, в частности, проблем АСОиУ

Теория кооперативных игр продолжает развиваться, привлекая к себе внимание исследователей прикладных проблем, в частности, проблем АСОиУ

Слайд 130Противоречия и конфликты, разрешаемые путем разумных компромиссов, влияют на характер

деятельности сложных систем, стремящихся к совершенствованию

Противоречия и конфликты, разрешаемые путем разумных компромиссов, влияют на характер деятельности сложных систем, стремящихся к совершенствованию

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика