При этом значение х получается равным Хо =1/2. Это же значение получается из решения уравнения
. . 7г(х-\-у) V2 шш sm--- = -,
о>122
так как минимум достигается при > = О, и это уравнение превращается в следующее:
. пх л/2 sin- = -, 2 2
откуда следует, что х =1/2.
Заметим, что если в функции выигрышей (5.15) поменять местами х и у, то она не изменится, а следовательно, эта функция выпукла и по > при всех X е [0;1]. Поэтому к ней применима та же теория, т.е. у игрока 2 существует оптимальная чистая стратегия уо, определяемая из уравнения (5.14)
. 7г(х-\-у) л/2 maxsm--- = -.
одг122
Очевидно, максимум по х достигается при л: =1/2, и последнее уравнение примет вид
Решением последнего уравнения будет у о = 0. Следовательно, игрок 2 имеет оптимальную чистую стратегию у о = 0.
Замечание. В приведенном выше примере мы могли определить оптимальную стратегию игрока 1, а игрока 2- только случайно, в силу "удачного" вида М{х, у).
Рассмотрим теперь метод определения оптимальных стратегий того игрока, для которого функция выигрьш1ей не обязательно выпукла. Пусть непрерывная функция Л/(х, у\ заданная на единичном квадрате, выпукла по>. Нас будет интересовать вопрос нахождения оптимальных стратегий 1 игрока. Предположим также, что для л: е [0; 1], > е [0; 1] существует частная производная функции М(х, у) по у, причем в точках > = 0 и дМ{х,у) ду
У= 1 Му(х,у)=-понимается как правая и левая производная.
соответственно. Обозначим через уо одну из оптимальных чистых стратегий игрока 2 (эта стратегия существует в соответствии с теоремой 4).
Согласно теореме 2 чистые стратегии х игрока 1 могут входить в его оптимальную стратегию с положительной вероятностью, если для них выполняется равенство М(х, уо) = V.
Такие чистые стратегии х называются существенными. Теорема 11. Пусть дана бесконечная антагонистическая игра с непрерывной и дифференцируемой по у на единичном квадрате при любом х функцией выигрышей М(х, у), с оптимальной чистой стратегией уо игрока 2 и ценой игры V, тогда:
1)если>о = 1, то среди оптимальных стратегий игрока 1 имеется существенная чистая стратегия хи для которой м(хи \) < \ ;
2)если Уо = О, то среди оптимальных стратегий игрока 1 имеется существенная чистая стратегия Х2, для которой Myixi, 0) > 0;
3)если О <>о < 1, то среди оптимальных стратегий игрока 1 найдется такая, которая является смесью двух существенных стратегий х\ и Х2. Для этих стратегий Му{хи у о) О, М(х2, у о) О, стратегия хх употребляется с вероятностью а, стратегия хг- с вероятностью (1 - а), где а находится из уравнения
а Л/; (хь >о) + (1 - а) М; (Х2, Уо) = 0,(5.16)
Пример. Пусть функция выигрышей в бесконечной антагонистической игре задана на единичном квадрате и равнаМ{х,у) = (х -yf =х -2ху + у.
Эта функция непрерывна по х и и поэтому эта игра имеет решение. Кроме того.
Следовательно, М(х, у) выпукла по у, и поэтому согласно теореме 10 цена игры определяется по формуле (5.11), игрок 2 имеет чистую оптимальную стратегию у о, определяемую из уравнения (5.12). Таким образом, имеем V = min max(x - у),
у x
Для определения тах(х-2ху + У ) последовательно найдем дМ
= 2х - 2> = О => X = >
= 2 > О при X = у функция М имеет минимум для любого у.
А, следовательно, максимум достигается в одной из крайних точек х = О и (или) X = 1
Мф;у)=/
М(1;>) = 1 - 2>; + / = (у - 1) F = minтах{/;(1
Данный minmaxj...} достигается в том случае, если у = (1 - yf, т.е. у=\12.
Следовательно, F= - при>о = - • 42
Определим теперь оптимальные стратегии для игрока 1. Поскольку у о =1/2, то О <>о< 1. Согласно теореме 11 рассмотрим третий случай.
Определим х из уравнения М{х, у о) = F, т.е.
Решая последнее уравнение, получим х\=0,Х2 = \. Теперь необходимо определить величину а - вероятность применения чистой стратегии лг] = 0. С этой целью используем уравнение (5.16):
-(l-a)M;fli
= 0.
Нетрудно найти
М/оф = -2(х-7)
jc=0,
= +1,
М/1;1) = -2(х->)
= -1.
дг=1
Тогда уравнение для а примет вид:
а-(1-а) = 0, откуда а = 1/2 . Следовательно, стратегия игрока 1
f(x) = iy„(x) + i/,{x).