Пример. Игрок 1 выбирает х е X = (0; 1% игрок 2 выбирает у е У = (0;1). После этого игрок 1 получает сумму
М(х,у) = х+у
за счет игрока 2. Поскольку X и У- открытые интервалы, то на них V\ и V2 не существуют. Если быХи Убыли замкнутые интервалы, то было бы следующее:
Vi = F2= 1,прихо= 1,Уо=0.
С другой стороны, выбирая х достаточно близкое к 1, игрок 1 будет уверен, что он получит выигрыш не меньше, чем число, близкое к цене игры V= \; выбирая> близкое к нулю, игрок 2 не допустит, чтобы выигрыш игрока 1 значительно отличался от цены игры К= 1.
Степень близости к цене игры может характеризоваться числом 8 > 0. Поэтому в описываемой игре можно говорить об оптимальности чистых стратегий Хо = \, уо = О соответственно игроков 1 и 2 с точностью до произвольного числа 8 > 0. В связи с этим введем следующие определения.
Определение. Точка (х,у), где х е X, у е Y, в антагонистической непрерывной игре G называется точкой е-равновесия, если для любых стратегийх е Xигрока \,у е Yигрока 2 имеет место неравенство
М(х, у-г<М(х, yJ<M(x,y) + e,
Точка 8-равновесия {х,у) называется также s-седловой точкой функции М{х, у), а стратегии и у называются 8-оптимальными стратегиями. Эти стратегии являются оптимальными с точностью до 8 в том смысле, что если отклонение от оптимальной стратегии никакой пользы игроку принести не может, то его отклонение от 8-оптимальной стратегии может увеличить его выигрыш не более чем на 8.
Чтобы функция М имела 8-седловые точки для любого 8 > О необходимо и достаточно, чтобы
sup inf М(х,у) = inf supM(x,>).
X уУх
Если игра О не имеет седловой точки (s-седловой точки) в чистых стратегиях, то оптимальные стратегии можно искать среди смешанных стратегий. Однако в качестве вероятностной меры здесь вводятся функ-
ции распределения вероятностей применения игроками чистых стратегий.
Пусть F(x)- функция распределения вероятностей применения чистых стратегий игроком 1. Если число - чистая стратегия игрока 1, то
где < х) означает вероятность того, что случайно выбранная чистая стратегия не будет превосходить числа х. Аналогично рассматривается функция распределения вероятностей применения чистых стратегий г игроком 2 Q(y) = Р(г <у).
Функции F{x) и 0(у) назьгоаются смешанными стратегиями соответственно игроков 1 и 2. Если F(x) и Q(y) дифференцируемы, то существуют их производные, обозначаемые, соответственно, через fix) и q(y) (функции плотности распределения).
В общем случае дифференциал функции распределения dF(x) выражает вероятность того, что стратегия находится в промежутке х<Е,<х + dx. Аналогично для игрока 2: dQ(y) означает вероятность того, что его стратегия ц находится в интервале у < ц < у + dy. Тогда выигрыш игрока 1 составит Л/(х, у) dF(x), а выигрыш игрока 2 равен Mix,y)dQ(y).
Средний выигрыш игрока 1 при условии, что игрок 2 применяет свою чистую стратегию у, получим, если проинтегрируем вьшгрыш по всем возможным значениям х, т.е.
E{F,y)=]M(x,y)dF(x).
Напомним, что множество Гдля;; является замкнутым промежупсом [0; 1].
Если игрок 1 применяет свою чистую стратегию х, а игрок 2 - то выигрыш игрока 1 составит М(х, у) dP{x) dQ(y),
Средний выигрыш игрока 1 при условии, что оба игрока применяют свои смешанные стратегии F{x) и Q(y), будет равен
EiF,Q) = ]]M(x,y)dF(x)dQ(yl
По аналогии с матричньпли играми определяются оптимальные смешанные стратегии игроков и цена игры: в антагонистической непрерыв-134
ной игре G(X,YM) пара смешанных стратегий и Q*(y) соответственно для игроков 1 и 2 образует седловую точку в смешанных стратегиях, если для любых смешанных стратегий F(x) и Q(y) справедливы соотношения< E(F*,Q*) < E(FQ),
Из левой части последнего неравенства следует, что если игрок 1 отступает от своей стратегиито его средний выигрыш не может
увеличиться, но может уменьшиться за счет лучших действий игрока 2, поэтому F*(x) называется оптимальной смешанной стратегией игрока 1.
Из правой части последнего неравенства следует, что если игрок 2 отступит от своей смешанной стратегии Q*(y), то средний выигрыш игрока 1 может увеличиться, а не уменьшиться, за счет более разумных действий игрока 1, поэтому Q*(y) называется оптимальной смешанной стратегией игрока 2. Средний выигрыш E(F*,Q% получаемый игроком 1 при применении игроками оптимальных смешанных стратегий, называется ценой игры.
По аналогии с матричными играми рассматривается нижняя цена непрерывной игры в смешанных стратегиях V\ = max min E{F,Q) и верхняя
F Q
цена игры V2 - min max E(F,Q).
Если существуют такие смешанные стратегии и Q*(y) соответственно для игроков 1 и 2, при которых нижняя и верхняя цены непрерывной игры совпадают, то и Q*(y) естественно назвать оптимальными смешанными стратегиями соответствующих игроков, а Vi = V2 = V- ценой игры.
Можно доказать, что существование седловой точки в смешанных стратегиях игры G{X,Y,M) равносильно существованию верхней V2 и нижней V\ цен игры в смешанных стратегиях и их равенству Vi = V2 = V.
Таким образом, решить игру G(X,Y,M) означает найти седловую точку или такие смешанные стратегии, при которых нижняя и верхняя цены игры совпадают.
Теорема 7 (существования). Всякая антагонистическая бесконечная игра двух игроков G с непрерывной функцией выигрышей М(х,у) на единичном квадрате имеет решение (игроки имеют оптимальные смешанные стратегии).
Теорема 8. Пусть имеется бесконечная антагонистическая игра с непрерывной функцией выигрышей М{х, у) на единичном квадрате и ценой