§ 31. БОРЬБА ЗА ВСТРЕЧУ СЛУЧАЙНО ПОЯВЛЯЮЩЕГОСЯ ОБЪЕКТА
31.1.Один из источников возникновения разрывов функции выигрыша антагонистической игры заключается в следующем.
Пусть каждый из двух игроков намерен выполнить некоторое действие (произвести выстрел, выбросить на рынок партию товара, внести на совещании предложение и т.д.). При этом обстоятельства часто складьюаются так, что, во-первых, целесообразно выполнить это действие как можно позже, а, во-вторых, желательно своим действием упредить сходное действие противника. Такой конфликт в условиях противоположных интересов его участников естественно моделировать антагонистической игрой на единичном квадрате, в которой функция вьшгрыша Н имеет вид
К{х, у) при х<у,
кр{х)при х = у,(31.1)
L(x, у) при х>у,
где каждая из функций К и L
а)непрерывна по обеим переменным;
б)монотонно возрастает по х при любом значении у,
в)монотонно убывает по у при любом значении х;
г)удовлетворяет условию
Цх, X) х) < К(х, х) (рис. 2.21).
Определение. Игра Г с функцией вьшгрыша Н вида (31.1), удовлехворяющая перечисленным условиям, называется игрой с выбором момента времени, а также игрой типа дуэли.
Игры с выбором момента времени имеют достаточно сложную и разработанную теорию. Мы ограничимся рассмотрением лишь одного примера, который будем интерпретировать как борьбу за встречу случайно появляющегося объекта.
31.2.Пусть игроки I и II выбирают соответственно числа л: и > из сегмента [0,1 ]. Эти числа будут пониматься как моменты времени прихода игроков в заданный пункт. Пусть t - время появления в этом пункте некоторого объекта, который достается игроку, приходящему нерв ы м после г. Игрок, обладающий объектом, получает выигрыш, равный 1,
Рис. 2.21
Рис. 2.22
а его противник эту единицу теряет. Если ни один из игроков не получит объекта, то вьшгрыш каждого из игроков принимается равным нулю. Предполагается, что время появления объекта в пункте встречи является случайной величиной, распределенной равномерно на сегменте [О, ] ].
31.3.Запишем условия данной игры более формально.
Рассмотрим ситуацию (х, у), в которой х<у. В этом случае игрок 1 выигрывает единицу, если
t<x,(31.2)
проигрывает единицу, если
x<t<y,(31.3)
и не получает ничего, если
y<t.(31.4)
Вероятности событий (31.2), (31.3) и (31.4) равны соответственно х, у - X и I -у. Таким образом, при х< у мы имеем
Н(х,у)= I х+(АКу-х) = 2х-у.(31.5)
Аналогичным образом мы находим, что при х> у
Щх,у)=1(х у)-{~Л)у=х - 2у.(31.6)
Наконец, естественно полагать, что при х у должно быть Я(х, у) = 0.
Схематическое описание функции Н(х, у) приведено на рис. 2.22.
Тем самым антагонистическая игра Г задана. Она уже фигурировала в примере 3 в п. 6.3.
31.4.Заметим, что игра Г является симметричной. Действительно, рассмотрим выражение Н(у, х). При х < у второй аргумент принимает большее значение, чем первый, так что значение функции выигрыша следует вычислять по формуле (31.6):
Щу> х)=у - 2х = -Н{х, у).
Аналогично при л: > О, применяя формулу (31.5), мы имеем: Н{у, х) = 2у -х = ~Н(х.у). Наконец, при х = у Н(у, х) =0 = ~Н(х,у).
Отсюда и из сказанного в § 5 следует, что Up = 0. Кроме того, оптимальные стратегии игрока 1, как вероятностные распределения, должны совпадать с оптимальными стратегиями игрока 2. Поэтому для решения нашей игры достаточно найти оптимальные стратегии игрока 1.
31.5.Существование в этой игре седловых точек в смешанных стратегиях может быть доказано, однако доказательство соответствующей теоремы довольно сложно. Поэтому мы просто предположим, что в игре Г игроки имеют смешанные оптимальные стратегии. Предположим, кроме того, что одна из оптимальных стратегий каждого из игроков является распределением, имеющим дифференцируемую плотность /. Эти предположе-
ния накладывают на нас обязательство после нахождения интересующих нас стратегий проверить, что они действительно являются оптимальными и обладают предположенными свойствами. Мы далее будем называть искомую стратегию стратегией /. Если игрок 2 употребляет эту стратегию, то
Н{х,П = f H(x,y)f{y)dy. о
Перепишем последний интеграл с учетом формул (31.5) и (31.6):
H{xJ) = / (X - 2y)f{y)dy +/ {2x-y)f{y)dy.(31.7)
Те точки, в которых плотность / положительна, являются по определению точками спектра оптимальной стратегии, определяющей /. Ввиду симметричности игры значения х, для которых /(х) > О, также должны быть точками спектра некоторой оптимальной стратегии игрока 1. Поэтому и в силу непрерьюности функции Н вне диагонали квадрата ситуаций согласно лемме п. 5.8 для таких значений х должно быть Н(х, f ) =Vy = 0. Следовательно, Н(х, f ), как функция х, остается на всем спектре / постоянной и равной нулю. Кроме того, ввиду предположенной непрерывности/, каждую точку х, в которой /(х) > О, окружает окрестность точек х с этам же свойством, так что и для всех этих точек будет Н(х ,f) =0. Так как в этих окрестностях функция Я( • ,/) постоянна, все ее производные по X также должны в них обращаться в нуль. Дифференцируя тождество (31.7) по х, мы имеем
ЭЯ(х,/)X1
;-- = (х - 2х)/(х) + / ny)dy - (2х - х)/(х) + 2 / fb)dy =
ЭхоJC
= -2xf(x) + } ny)dy+f f(y)dy = -2хПх) + 1} f(y)dy.(31.8)
Второе дифференцирование дает нам
! = --2/(.)lv/(x)-/(.) = о, Эх
т.е.
f(x)2 X
Интегрируя это дифференциальное уравнение, мы получаем In /(х) = =--1пх + с, откуда
fix) = Cx-f.(31.9)
Мы видим, что там, где плотность / дифференцируема и положительна,
она должна представляться в виде (31.9). Однако интеграл f x"dx
расходится (не существует). Следовательно, плотность / не может быть дифференцируемой и положительной на всем сегменте [0,1].