Разделы презентаций


Теория игр.ppt

Содержание

Теория игрТеория игр — математический метод изучения оптимальных стратегий в играх. Под игрой понимается процесс, в котором участвуют две и более сторон, ведущих борьбу за реализацию своих интересов. Каждая из сторон

Слайды и текст этой презентации

Слайд 1Теория игр
Методы решения

Теория игрМетоды решения

Слайд 2Теория игр
Теория игр — математический метод изучения оптимальных стратегий в

играх. Под игрой понимается процесс, в котором участвуют две и

более сторон, ведущих борьбу за реализацию своих интересов. Каждая из сторон имеет свою цель и использует некоторую стратегию, которая может вести к выигрышу или проигрышу — в зависимости от поведения других игроков. Теория игр помогает выбрать лучшие стратегии с учётом представлений о других участниках, их ресурсах и их возможных поступках.
Теория игр — это раздел прикладной математики. Чаще всего методы теории игр находят применение в экономике, чуть реже в других общественных науках — социологии, политологии, психологии, этике и других. Начиная с 1970-х годов её взяли на вооружение биологи для исследования поведения животных и теории эволюции. Очень важное значение она имеет для искусственного интеллекта и кибернетики, особенно с проявлением интереса к интеллектуальным агентам.
Теория игрТеория игр — математический метод изучения оптимальных стратегий в играх. Под игрой понимается процесс, в котором

Слайд 3Представление игр
Игры представляют собой строго определённые математические объекты. Игра образуется

игроками, набором стратегий для каждого игрока и указания выигрышей, или

платежей, игроков для каждой комбинации стратегий. Большинство кооперативных игр описываются характеристической функцией, в то время как для остальных видов чаще используют нормальную или экстенсивную форму.
Игры в экстенсивной, или расширенной, форме представляются в виде ориентированного дерева, где каждая вершина соответствует ситуации выбора игроком своей стратегии. Каждому игроку сопоставлен целый уровень вершин. Платежи записываются внизу дерева, под каждой листовой вершиной.
В нормальной, или стратегической, форме игра описывается платёжной матрицей. Каждая сторона (точнее, измерение) матрицы — это игрок, строки определяют стратегии первого игрока, а столбцы — второго. На пересечении двух стратегий можно увидеть выигрыши, которые получат игроки.
Кооперативные игры используют так называемую характеристическую функцию, определяющую выигрыш каждой коалиции игроков. При этом предполагается, что выигрыш пустой коалиции равен нулю.
Представление игрИгры представляют собой строго определённые математические объекты. Игра образуется игроками, набором стратегий для каждого игрока и

Слайд 4Типы игр
Игра называется кооперативной, или коалиционной, если игроки могут объединяться

в группы, беря на себя некоторые обязательства перед другими игроками

и координируя свои действия. Этим она отличается от некооперативных игр, в которых каждый обязан играть за себя.

Игра будет симметричной тогда, когда соответствующие стратегии у игроков будут равны, то есть иметь одинаковые платежи. Иначе говоря, если игроки могут поменяться местами и при этом их выигрыши за одни и те же ходы не изменятся. Многие изучаемые игры для двух игроков — симметричные.
Типы игрИгра называется кооперативной, или коалиционной, если игроки могут объединяться в группы, беря на себя некоторые обязательства

Слайд 5Типы игр
Игры с нулевой суммой (антагонистические) – особая разновидность игр

с постоянной суммой, то есть таких, где игроки не могут

увеличить или уменьшить имеющиеся ресурсы, или фонд игры. В этом случае сумма всех выигрышей равна сумме всех проигрышей при любом ходе. Многие изучаемые математиками игры иного рода: в играх с ненулевой суммой выигрыш какого-то игрока не обязательно означает проигрыш другого, и наоборот. Исход такой игры может быть меньше или больше нуля. Такие игры могут быть преобразованы к нулевой сумме — это делается введением фиктивного игрока, который «присваивает себе» излишек или восполняет недостаток средств.
В параллельных играх игроки ходят одновременно, или, по крайней мере, они не осведомлены о выборе других до тех пор, пока все не сделают свой ход. В последовательных, или динамических, играх участники могут делать ходы в заранее установленном либо случайном порядке, но при этом они получают некоторую информацию о предшествующих действиях других.
Типы игрИгры с нулевой суммой (антагонистические) – особая разновидность игр с постоянной суммой, то есть таких, где

Слайд 6Типы игр
Важное подмножество последовательных игр составляют игры с полной информацией.

В такой игре участники знают все ходы, сделанные до текущего

момента, равно как и возможные стратегии противников, что позволяет им в некоторой степени предсказать последующее развитие игры. Полная информация не доступна в параллельных играх, так как в них неизвестны текущие ходы противников.
Игры в реальном мире или изучаемые в экономике игры, как правило, длятся конечное число ходов. Математика не так ограничена, и в частности, в теории множеств рассматриваются игры, способные продолжаться бесконечно долго. Причём победитель и его выигрыш не определены до окончания всех ходов.
Типы игрВажное подмножество последовательных игр составляют игры с полной информацией. В такой игре участники знают все ходы,

Слайд 7Типы игр
Большинство изучаемых игр дискретны: в них конечное число игроков,

ходов, событий, исходов и т. п. Однако эти составляющие могут

быть расширены на множество вещественных чисел. Игры, включающие такие элементы, часто называются дифференциальными. Они связаны с какой-то вещественной шкалой (обычно — шкалой времени), хотя происходящие в них события могут быть дискретными по природе. Дифференциальные игры также рассматриваются в теории оптимизации, находят своё применение в технике и технологиях, физике.
Метаигры - это такие игры, результатом которых является набор правил для другой игры (называемой целевой или игрой-объектом). Цель метаигр — увеличить полезность выдаваемого набора правил. Теория метаигр связана с теорией оптимальных механизмов.
Типы игрБольшинство изучаемых игр дискретны: в них конечное число игроков, ходов, событий, исходов и т. п. Однако

Слайд 8Платежная матрица
Рассмотрим конечную игру, в которой первый игрок А имеет

m стратегий, а второй игрок B-n стратегий. Такая игра называется

игрой m×n. Обозначим стратегии A1, А2, ..., Аm; и В1, В2, ..., Вn. Предположим, что каждая сторона выбрала определенную стратегию: Ai или Bj. Если игра состоит только из личных ходов, то выбор стратегий однозначно определяет исход игры — выигрыш одной из сторон aij. Если игра содержит кроме личных случайные ходы, то выигрыш при паре стратегий Ai и Bj является случайной величиной, зависящей от исходов всех случайных ходов. В этом случае естественной оценкой ожидаемого выигрыша является математическое ожидание случайного выигрыша, которое также обозначается за aij.
Предположим, что нам известны значения aij при каждой паре стратегий. Эти значения можно записать в виде прямоугольной таблицы (матрицы), строки которой соответствуют стратегиям Ai, а столбцы — стратегиям Bj.
Тогда, в общем виде матричная игра может быть записана следующей платежной матрицей
Платежная матрицаРассмотрим конечную игру, в которой первый игрок А имеет m стратегий, а второй игрок B-n стратегий.

Слайд 9Платежная матрица

Платежная матрица

Слайд 10Орлянка
Простейшим примером антагонистической игры является игра "Орлянка". Первый игрок прячет

монету орлом или решкой вверх, а второй пытается угадать, как

она спрятана. Если он не угадывает - он платит первому одну денежную единицу, если угадывает - первый платит ему одну денежную единицу.
В данной игре каждый участник имеет две стратегии: "орел" и "решка". Множество ситуаций в игре состоит из четырех элементов. В строках таблицы указаны стратегии первого игрока х, в столбцах - стратегии второго игрока y. Для каждой из ситуаций указаны выигрыши первого и второго игроков.
ОрлянкаПростейшим примером антагонистической игры является игра

Слайд 11Орлянка
В аналитическом виде функция выигрыша первого игрока имеет следующую форму:



где

x X и y Y - стратегии первого и второго

игроков, соответственно.
Так как выигрыш первого игрока равен проигрышу второго, то F2(x,y) = − F1(x,y).
ОрлянкаВ аналитическом виде функция выигрыша первого игрока имеет следующую форму:где x X и y Y - стратегии

Слайд 12Дилемма заключенного
Двое преступников, А и Б, попались примерно в одно

и то же время на сходных преступлениях. Есть основания полагать,

что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок лишения свободы (10 лет). Однако иных доказательств их вины у следствия нет. Если оба молчат, их деяние квалифицируется как неоказание помощи следствию, и они приговариваются к 6 месяцам. Если оба свидетельствуют против друг друга, они получают минимальный срок (по 2 года). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт?
Дилемма заключенногоДвое преступников, А и Б, попались примерно в одно и то же время на сходных преступлениях.

Слайд 13Дилемма заключенного

Дилемма заключенного

Слайд 14Дилемма заключенного
Дилемма появляется, если предположить, что оба заботятся только о

минимизации собственного срока заключения.
Представим рассуждения одного из заключённых. Если партнёр

молчит, то лучше его предать и выйти на свободу (иначе — полгода тюрьмы). Если партнёр свидетельствует, то лучше тоже свидетельствовать против него, чтобы получить 2 года (иначе — 10 лет). Стратегия «свидетельствовать» строго доминирует над стратегией «молчать». Аналогично другой заключённый приходит к тому же выводу.
Дилемма заключенногоДилемма появляется, если предположить, что оба заботятся только о минимизации собственного срока заключения.Представим рассуждения одного из

Слайд 15Обмен закрытыми сумками
Два человека встречаются и обмениваются закрытыми сумками, понимая,

что одна из них содержит деньги, другая — товар. Каждый

игрок может уважать сделку и положить в сумку то, о чём договорились, либо обмануть партнёра, дав пустую сумку.

В этой игре обман всегда будет наилучшим решением, означая также, что рациональные игроки никогда не будут играть в неё, и что рынок обмена закрытыми сумками будет отсутствовать.
Обмен закрытыми сумкамиДва человека встречаются и обмениваются закрытыми сумками, понимая, что одна из них содержит деньги, другая

Слайд 16Примеры из реальной жизни
Обе страны, вовлечённые в гонку вооружений, будут

заявлять, что у них есть две возможности: либо увеличить расходы

на военные нужды, либо сокращать вооружения. Ни одна из сторон не может быть уверена, что другая будет соблюдать договорённость, следовательно, обе будут стремиться к военной экспансии.
Похожие явления наблюдаются и в автоспорте — «Формула-1», где последние 20 лет происходит гонка бюджетов команд. Из-за этого число машин-участников сократилось с 36 в 1990 году до 20 в 2003.
В велогонках дилемма заключённого возникает, когда два сильных гонщика оторвались от общей группы. Каждый из них может либо предоставить соседу слипстрим («сотрудничать»), либо ехать сзади («предать»). Для обоих идеалом будет, когда они по очереди «висят» друг у друга на хвосте — но всегда есть желание не дать соседу слипстрима (тогда тот постепенно устаёт и «скатывается» в пелотон, а ты финишируешь с большим отрывом).
Случай дилеммы заключённого может быть найден в бизнесе. Две конкурирующие фирмы должны определиться, сколько средств тратить на рекламу. Эффективность рекламы и прибыль каждой фирмы уменьшается с ростом расходов на рекламу у конкурента. Обе фирмы принимают решение увеличить расходы на рекламу, при этом их доли рынка и, возможно, объёмы продаж остаются неизменными, а прибыль сокращается.
Примеры из реальной жизниОбе страны, вовлечённые в гонку вооружений, будут заявлять, что у них есть две возможности:

Слайд 17Минимакс
Найти максиминные стратегии 1 игрока, минимаксные стратегии 2 игрока, седловые

точки, цену игры.
Платежная матрица А=

МинимаксНайти максиминные стратегии 1 игрока, минимаксные стратегии 2 игрока, седловые точки, цену игры.Платежная матрица А=

Слайд 18Отбрасывание стратегий
Найти решение игры аналитическим методом, комбинируя его с отбрасыванием

доминируемых стратегий.

Отбрасывание стратегийНайти решение игры аналитическим методом, комбинируя его с отбрасыванием доминируемых стратегий.

Слайд 19Решение игры 2×n

Решение игры 2×n

Слайд 20Решение игры 2×n

Решение игры 2×n

Слайд 21Графический метод
Найти решение графо-аналитическим методом.

Графический методНайти решение графо-аналитическим методом.

Слайд 22Графический метод

Графический метод

Слайд 23Графический методы

Графический методы

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика