игры V, Тогда, если Q(y) - оптимальная стратегия игрока 2 и для некоторого Хо
]Mix,,y)dQ(y)<V, о
то Хо не может входить в точки спектра оптимальной стратегии игрока 1; если F(x) - оптимальная стратегия игрока 1и для некоторого
]M(x,yJdF(x)>V,
то у о не может быть точкой спектра оптимальной стратегии игрока 2.
Из теоремы 8 следует, что если один из игроков применяет оптимальную стратегию, а другой - чистую, при том что средний выигрыш игрока 1 отличается от цены игры, то эта чистая стратегия не может войти в его оптимальную стратегию (или она входит в нее с вероятностью нуль).
Теорема 9. Пусть в бесконечной антагонистической игре функция выигрышей М(х, у) непрерывная для х е [0; \], у е [0; 1] и М(х,у) = = -М(у, х), тогда цена игры равна нулю и любая оптимальная стратегия одного игрока будет также оптимальной стратегией другого игрока.
Сформулированные свойства оптимальных смешанных стратегий и цены игры помогают находить или проверять решения, но они еще не дают в общем виде приемлемых методов решения игры. Более того, не существует общих методов для точного нахождения решения БАИ, и в том числе непрерывных игр на единичном квадрате. Поэтому рассматриваются частные виды антагонистических бесконечных игр.
5.2.10. Игры с выпуклыми функциями выигрыша. Игры с выпуклыми непрерьгоными функциями выигрышей называются выпуклыми.
Напомним, что вьшуклой функцией / действительной переменной х на интервале (а, Ь) называется такая функция, для которой выполняется неравенство f{ai Х] + «2 2) «i y(xi) + «2 Ai), где Xl и Х2 - любые две точки из интервала (а, Ь); а\, а2> О,
Если функция выигрышей М(х,у) непрерывна по обоим аргументам и строго выпукла по у при любом X, то в этом случае игрок 2 имеет единственную оптимальную чистую стратегию.
Если функция выигрышей М{х,у) непрерывна по обоим аргументам и строго вогнута по х при любом у, то в этом случае игрок 1 имеет единственную оптимальную чистую стратегию.
Если для «190, а20 всегда имеет место строгое неравенство/ai xi + «2 Х2) < axf(x]) + «2/2), то функция / называется строго выпуклой на (а; Ь). Геометрически выпуклая функция изображает дугу, график которой расположен ниже стягивающей ее хорды (рис. 5.3).
Напомним, что непрерывная и строго выпуклая функция / на замкнутом интервале принимает минимальное значение только в одной точке интервала. Для нахождения решения выпуклой игры можно воспользоваться следующей теоремой.
Fix)
Рис 53
Теорема 10. Пусть М{х, у) - непрерывная функция выигрышей игрока 1 на единичном квадрате и строго выпуклая по у для любого х. Тогда имеется единственная оптимальная чистая стратегия у=уо [0;1] для игрока 2, цена игры определяется по формуле
V = min max М(х, у),(5.11)
значение у о определяется как решение следующего уравнения
тахМ(х,>,)=К(5.12)
Замечание. Если в теореме 10 не предполагать строгую выпуклость функции М(х, у) по у, а просто выпуклость, то теорема остается в силе с тем отличием, что у игрока 2 оптимальная чистая стратегия не будет единственной.
Замечание, Выпуклые игры называют часто выпукло-вогнутыми, так как игра в них имеет седлообразное ядро, а так как ядро седлообразное, то игра имеет седловую точку в чистых стратегиях.
Таким образом, если М(х, у) непрерывна и выпукла по у, то цена игры определяется по формуле (5.11), и игрок 2 имеет оптимальную чистую стратегию, определяемую из уравнения (5.12).
Аналогично и для игрока 1: если функция выигрышей М{х, у) непрерывна по обоим аргументам и строго вогнута по х при любом у, то в этом случае игрок 1 имеет единственную оптимальную стратегию.
Цена игры определяется по формуле
V = max min у\(5.13)
X у
а чистая оптимальная стратегия Хо игрока 1 определяется из уравнения
mmM{xo,y)=V,(5.14)
Пример. Пусть на квадрате [0;1] задана функция
M(x,>.)=sin.(5.15)
Решение. Так как
£ sin£<0 длях€[0;1],7е(0;1), 2)2
то М{х, у) строго вогнута по х для любого у е (0;1). Следовательно, цена игры находится по формуле (5.13)
V = max mm sm --,
X у2
Отметим, что при О < х <1/2 справедливо равенство
. . л:(х + у) , я X mm sm--- = sm-,
о<><122
а при 0,5 < X < 1
{ттаЛ-- = sm--
Ч<«22
Поэтому
F= max [max mm sm---\ max mm sm---] =
o<x<\y2 l<x<xy2
, .Tlx. я(х + 1),,V2 V2, V2
= max [ max sm-: max sm--1- max [- ;- 1 = -
o.,.i 2 i,,,, 2 222