КАТЕГОРИИ:

Астрономия Биология География Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Механика Образование Охрана труда Педагогика Политика Право Психология Риторика Социология Спорт Строительство Технология Физика Философия Финансы Химия Черчение Экология Экономика Электроника

РАВНОВЕСНАЯ СИТУАЦИЯ

⇐ ПредыдущаяСтр 6 из 13Следующая ⇒

Как уже отмечалось выше, одной из основных задач теории игр является выработка принципов оптимальности, то есть правил, которые позволяют установить, какое поведение игроков следует считать разумным (целесообразным) с точки зрения самих игроков.

Поскольку все возможные действия игроков в матричной игре описываются множеством стратегий и , то задача заключается в выборе такой стратегии, которая способствует достижению поставленной цели – максимизации выигрыша для игрока или минимизации проигрыша для игрока .

Рассмотрим методику поиска решения на следующем примере матричной игры, повторяемой многократно:

№ 2.3. Найти решение матричной игры :

Решение. Попробуем определить оптимальные стратегии игроков. Начнем со стратегии первого игрока, который стремится максимизировать свой выигрыш, учитывая то, что второй игрок будет пытаться свести выигрыш первого игрока к минимуму. Если первый игрок выберет стратегию , то второй ответит стратегией , при которой выигрыш первого равен наименьшему значению -2. На стратегию будет ответом или с минимальным выигрышем 1, а на стратегию - с минимальным выигрышем -3.

Запишем эти минимальные выигрыши в правый столбец:

Таблица 2.1


-2		-1	-2

	-3		-3

Естественно, что первый игрок выбирает стратегию , при которой его минимальный выигрыш максимален:

Таким образом, если первый игрок выберет стратегию , ему гарантирован выигрыш не меньший, чем 1, при любом поведении второго игрока.

Рассмотрим теперь поведение второго игрока. Если он выберет стратегию , то первый может ответить стратегией , при которой он получит максимальный выигрыш 3, на ответит , и на - или .

Запишем эти максимальные выигрыши в нижней строке.

Таблица 2.2.


-2		-1	-2

	-3		-3

Естественно, что второй игрок выбирает стратегию , при которой максимальный выигрыш первого игрока минимален:

То есть, если второй игрок будет придерживаться стратегии , то при любом поведении первого игрока он не проиграет больше, чем 1.

В этом примере числа и совпали:

Это означает, что стратегии и являются оптимальными стратегиями игроков в том смысле, что при многократном повторении игры, отказ от выбранной стратегии любым из игроков уменьшает его шансы на выигрыш (увеличивает его шансы на проигрыш).

И в самом деле. Если первый игрок будет придерживаться, например, стратегии , то не стоит думать, что второй этого не заметит. Конечно же заметит и тут же ответит стратегией и выигрыш первого игрока уменьшится.

Таким образом, мы получили так называемую равновесную ситуацию .

Рассмотрим теперь произвольную матричную игру:

, (2.1)

и опишем общий алгоритм, с помощью которого можно определить, есть ли в этой игре ситуация равновесия. При этом мы предполагаем, что оба игрока действуют разумно, то есть стремятся к получению максимального выигрыша, считая, что соперник действует наилучшим для себя образом.

Рассмотрим действия первого игрока:

1. В каждой строке матрицы находится минимальный элемент:

и полученные числа запишем в виде добавочного правого столбца к матрице :

То есть, выбирая некоторую стратегию первый игрок рассчитывает выиграть не меньше при любых действиях второго игрока.

2. Среди чисел выбирается наибольшее число:

. (2.2)

То есть, выбрав описанную стратегию (2), первый игрок гарантирует себе выигрыш не меньший . Число (2) называют нижней ценой игры.

Таким образом, действуя наиболее осторожно и рассчитывая на наиболее разумное поведение соперника, первый игрок должен остановиться на той стратегии, при которой число будет максимальным.

Принцип построения стратегии игрока, основанный на формуле (2) называется принципом максимина, а выбранная стратегия называется максиминной стратегией первого игрока.

Рассмотрим теперь поведение второго игрока.

1. В каждом столбце матрицы находится максимальный элемент:

и полученные числа запишем в виде нижней добавочной строки:

. (2.3)

То есть, выбрав некоторую стратегию , второй игрок рассчитывает на то, что в результате любых действий первого игрока он проиграет не больше .

Среди чисел выбирается наименьшее число

. (2.4)

То есть, выбрав стратегию (4) второй игрок гарантирует себе проигрыш, не превышающий . Число называется верхней ценой игры.

Таким образом, действуя наиболее осторожно и рассчитывая на наиболее разумное поведение соперника, второй игрок должен остановиться на стратегии, при которой будет минимальным.

Принцип построения стратегии второго игрока, основанный на правиле (4), называется принципом минимакса, а выбранная стратегия называется минимаксной стратегией второго игрока.

Отметим, что нижняя и верхняя цена игры всегда связаны соотношением:

. (5)

Если , то ситуация называется равновесной, и ни один из игроков не заинтересован в том, чтобы ее нарушить.

В случае, если , то их общее значение называют ценой игры :

. (6)

В этом случае цена игры совпадет с соответствующим элементом матрицы , который называется точкой равновесия или седловой точкой матрицы . Или, седловой точкой является элемент матрицы , максимальный в своем столбце и минимальный в своей строке.

Стратегии и , соответствующие седловой точке, называются оптимальными, а совокупность пары оптимальных решений и цены игры называется решением матричной игры с седловой точкой.

Если , то речь пойдет уже об игре без седловой точки. В этом случае предложенный выбор стратегий к равновесной ситуации не приводит, и при многократном повторении игры у игроков могут возникнуть мотивы к нарушению рекомендаций, приведенных выше.

№ 2.4. Найти нижнюю и верхнюю цены игры для следующей матричной игры:

Решение. Определим максиминную стратегию первого игрока, выбрав наименьшие значения выигрышей в каждой строке:

Определим минимаксную стратегию второго игрока, выбрав наибольшие значения проигрышей для второго игрока в каждом столбце матрицы выигрышей:

Здесь уже нет седловой точки, так как .

Допустим, что первому игроку стало известно, что второй игрок принял минимаксную стратегию , тогда оптимальной для первого игрока будет не максиминная стратегия , а стратегия , дающая ему выигрыш .

Это означает, что бывают ситуации, когда первый игрок может получить выигрыш, превосходящий максиминный, если ему известны намерения второго игрока (при многократном повторении игры в сходных условиях).

Дата добавления: 2015-01-29; просмотров: 360; Мы поможем в написании вашей работы!; Нарушение авторских прав

⇐ Предыдущая 1 2 3 4 567 8 9 10 Следующая ⇒

lektsii.com - Лекции.Ком - 2014-2026 год. (0.195 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты