КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Нижняя и верхняя цена игрыПоставим задачу: определить наилучшую среди наших стратегий А , А2, Ат. Условимся рассматривать только чистые стратегии. Затем проанализируем последовательно каждую из них от Л, до/1^. Выбирая А, следует рассчитывать, что противник ответит на нее той из стратегий б, для которой наш выигрыш минимален. Найдем минимальное из чисел а в /-й строке и обозначим его б(: Естественно, что осторожный игрок должен выбрать ту стратегию, для которой число б,максимально. Обозначим это максимальное значение б: А,- - max Щ Принимая во внимание формулу для 6i, можно записать a-max min«,y 16; Величина б называется нижней ценой игры, максиминным выигрышем или максимином. Соответствующая стратегия называется мак-симинной стратегией. Очевидно, что аналогичное рассуждение можно провести и за сторону В, которая заинтересована в том, чтобы обратить наш выигрыш в минимум, тоесть максимизировать свой выигрыш. Поэтому будут выделены максимальные значения выигрыша по столбцам: Вj - max Щ Затем ищется минимальное значение Bj: = min^/ или 5'=minmaxv Величина В' называется верхней ценой игры, иначе - минимаксным выигрышем или минимаксом. Соответствующая выигрышу В' стратегия называется его минимаксной стратегией. Принцип осторожности, диктующий игрокам выбор соответствующих стратегий (максиминной и минимаксной), является в теории игр основным принципом и называется принципом минимакса. В платежной матрице игры существует элемент, являющийся одновременно минимальным в своей строке и максимальным в своем столбце. Такой элемент называют седловой точкой. Седловая точка в игре имеет место тогда, когда наблюдается равенство б = В'. При этом значение б= В' = V называют чистой ценой игры. В этом случае решение игры (совокупность оптимальных стратегий игроков) обладает следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной стратегии. Поэтому для игры с седловой точкой минимаксные стратегии обладают устойчивостью. Критерий Вальда. Критерием Вальда («рассчитывай на худшее* — критерий крайнего пессимизма) называют критерий, предписывающий обеспечить значение параметра эффекта равного б, тоесть. a = maxmina(y Этот критерий ориентирует лицо, принимающее решение, на наихудшие условия и рекомендует выбрать ту стратегию, для которой выигрыш максимален. В других, более благоприятных условиях, использование этого критерия при водит к потере эффективности системы или операции. Критерий минимаксного риска Сэвиджа. При использовании этого критерия обеспечивается наименьшее значение максимальной величины риска: S = min max г где риск определяется выражением = гц = В) - , — максимально возможный выигрыш игрока при состоянии природы П) (или стратегии противника с номером j), тоесть.
|