![]() КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Итерационный метод решения матричных игр
Этот метод решения матричной игры отражает, в некоторой степени, реальную ситуацию накопления опыта по поиску игроками хороших стратегий в результате многократного повторения конфликтных ситуаций. На каждом шаге игрок выбирает наиболее выгодную для себя стратегию, опираясь на предыдущий выбор противника. То есть игрок на собственном опыте прощупывает способ поведения другого игрока и старается отвечать на него наиболее выгодным для себя образом. Таким образом, происходит практическое «обучение» игроков в ходе самой игры. Проиллюстрируем итерационный метод на следующем примере.
№ 2.8.Найти итерационным методом решение матричной игры
Решение. Вычислим Найдем сначала точное решение геометрическим способом:
Теперь опишем правила выбора ходов (чистых стратегий) игроками, предположив для определености, что начинает первый игрок. Пусть первый игрок выберет стратегию
Второй игрок ответит стратегией
В ответ первый игрок выберет стратегию
Второй игрок выбирает свою стратегию так, чтобы “накопленный” выигрыш первого игрока
был минимален - это стратегия Первый игрок выбирает свою стратегию так, чтобы его «накопленный» выигрыш при стратегиях
это стратегия Второй игрок выбирает свою стратегию снова из условия минимума «накопленного» выигрыша первого игрока:
например, эта стратегия Разобьем последовательные ходы игроков на пары Таблица 2.4
Дадим пояснения по составлению таблицы: 1 - ый столбец – номер пары ходов игроков. 2 -ой столбец – номер стратегии 3 - ий, 4 – ый и 5 - ый столбцы – «накопленный» суммарный выигрыш первого игрока за первые n шагов, при выборе вторым игроком стратегий 6 - ой столбец – минимальный средний выигрыш первого игрока за первые n ходов. 7 - ой столбец – номерстратегии 8 – ой и 9 - ый столбцы – «накопленный» суммарный выигрыш первого игрока за первые n шагов при выборе им стратегий 10 - ый столбец – максимальный средний выигрыш первого игрока за первые n ходов. 11 - ый столбец – среднее арифметическое минимального и максимального среднего выигрышей первого игрока.
Считая, что смешанные стратегии игроков оцениваются частотами появлений чистых стратегий, можем на каждом шаге найти приближенно эти стратегии: Таблица 2.5
Видно, что с увеличением числа шагов приближенные значения вероятностей все меньше отличаются от точных значений. Отметим два основных преимущества данного метода: 1) Метод прост и универсален. 2) Объем и сложность вычислений сравнительно слабо растут при увеличении числа стратегий
|