Игра предполагает, что игрок А смешивает стратегии Атл А2с соответствующими вероятностями я, и 1 - я,, 0 < 1. Игрок В смешивает стратегии Blt В2, Вп с вероятностями ух, у2, уп, где i/.>0, ;= 1, 2, п, и I/, + у2 + ... + (/„ = 1. В этом случае ожидаемый выигрыш игрока А, соответствующий j-й чистой стратегии игрока В, вычисляется в виде
(aXj - a2j) хх - a2j, у =1,2.....п.
Следовательно, игрок А ищет величину хх, которая максимизирует минимум ожидаемых выигрышей
max min j(a,y -a2j)xl
Пример 14.4.3
Рассмотрим следующую игру 2x4, в которой платежи выплачиваются игроку Л.
В\ Вг Вз 64
2 2 3 -1
4 3 2 6
Игра не имеет решения в чистых стратегиях, и, следовательно, стратегии должны быть смешанными. Ожидаемые выигрыши игрока А, соответствующие чистым стратегиям игрока В, приведены в следующей таблице.
Чистые стратегии игрока В | Ожидаемые выигрыши игрока А |
| -2xi + 4 |
| -x] + 3 |
| xt +2 |
| -7xi + 6 |
На рис. 14.9 изображены четыре прямые линии, соответствующие чистым стратегиям игрока В. Чтобы определить наилучший результат из наихудших, построена нижняя огибающая четырех указанных прямых (изображенная на рисунке толстыми линейными сегментами), которая представляет минимальный (наихудший) выигрыш для игрока А независимо от того, что делает игрок В. Максимум (наилучшее) нижней огибающей соответствует максиминному решению в точке х\ - 0,5 . Эта точка
определяется пересечением прямых 3 и 4. Следовательно, оптимальным решением для игрока А является смешивание стратегий Ах и А2 с вероятностями 0,5 и 0,5 соответственно. Соответствующая цена игры v определяется подстановкой х, = 0,5 в уравнение либо прямой 3, либо 4, что приводит к следующему.
- + 2 = - из уравнения прямой 3, -7 + 6 = -- из уравнения прямой 4.
Рис. 14.9. Графическое решение игры двух лиц с нулевой суммой из примера 14.4.3
Оптимальная смешанная стратегия игрока В определяется двумя стратегиями, которые формируют нижнюю огибающую графика. Это значит, что игрок В может смешивать стратегии В3 и В4, в этом случае у, =у2 = О и у4 = 1 - у3. Следовательно, ожидаемые платежи игрока В, соответствующие чистым стратегиям игрока А, имеют такой вид.
Чистые стратегии игрока А Ожидаемые платежи игрока В
1 4у3 - 1
2 -4у3 + 6
Наилучшее решение из наихудших для игрока В представляет собой точку минимума верхней огибающей заданных двух прямых (построение прямых и определение верхней огибающей будет для вас поучительным). Эта процедура эквивалентна решению уравнения
4>3-1 = -4у3 + 6.
Его решением будету3 = 7/8, что определяет цену игры v = 4 х (7/8) - 1 = 5/2.
Таким образом, решением игры для игрока А является смешивание стратегий Л, иА2 с равными вероятностями 0,5 и 0,5, а для игрока В - смешивание стратегий Вг и й, с вероятностями 7/8 и 1/8. (В действительности игра имеет альтернативное решение для игрока В, так как максиминная точка на рис. 14.9 определяется более чем двумя прямыми. Любая выпуклая линейная комбинация этих альтернативных решений также является решением задачи.)
Для игры, в которой игрок Л имеет т стратегий, а игрок В - только две, решение находится аналогично. Главное отличие состоит в том, что здесь строятся графики функций, представляющих ожидаемые платежи второго игрока, соответствующие чистым стратегиям игрока А. В результате ведется поиск минимаксной точки верхней огибающей построенных прямых.
УПРАЖНЕНИЯ 14.4.2
1. Решите графически игру с подбрасыванием монет из примера 14.4.2.
2. Робин часто ездит между двумя городами. При этом есть возможность выбрать один из двух маршрутов: маршрут А представляет собой скоростное шоссе в четыре полосы, маршрут В - длинную обдуваемую ветром дорогу. Патрулирование дорог осуществляется ограниченным числом полицейских. Если все полицейские расположены на одном маршруте, Робин с ее страстным желанием ездить очень быстро, несомненно, получит штраф в 100 долл. за превышение скорости. Если полицейские патрулируют на двух маршрутах в соотношении 50 на 50, то имеется 50 % -ная вероятность, что Робин получит штраф в 100 долл. на маршруте А и 30 % -ная вероятность, что она получит такой же штраф на маршруте В. Кроме того, маршрут В длиннее, поэтому бензина расходуется на 15 долл. больше, чем на маршруте А. Определите стратегию как для Робин, так и для полиции.
3. Решите графически следующие игры, в которых платежи выплачиваются игрокуА.
-3 4
4. Дана следующая игра двух лиц с нулевой суммой.
a) Проверьте, что смешанные стратегии с вероятностями (1/6,0,5/6) для игрока А и с вероятностями (49/54, 5/54, 0) для игрока В являются оптимальными, и определите цену игры.
b) Покажите, что цена игры равна
3 3