Тогда условием минимума (по о82) будет:
(19:8) Для каждой пары s2, j, для которой у)2 не достигает минимума
(по / *)), должно быть of = 0. Следовательно, характеристика оптимальной стратегии - минимиза-ция при о1 = р1, . . gs = ps - состоит в следующем:
-У -У -у -
(19:А) р1, . . ., ps описывают оптимальную стратегию, т. е. £
в том и только том случае, если для каждой пары s2, 1, Для которой yf не достигает минимума (по / х)), имеем of = 0. На основе матричных схем табл. 15-17 выпишем, наконец, явные
выражения для yf:
S2 - 1
<19:9:а) Ysi2 = 4" { 2 (~flP?~а№~Ь№)~Ъ№ +
«i=i
+ 2 faPF + ep!1-6??)}.
Sl=s2 + 1
S2-1
<19:9:b) yf = -i- { S (~ «P?1-&PI1 - &P11) +
Si=l
+ S (ЙР!1 + &Р1+6Р1)} » Si=S2+l 82-1
< 19:9:c) yf = 4" { 2 (&P?X~ 6P?- bP?) + &P?2 +
si=l S
+ 2 (&PSl1 + &Pi1 + &PS31)}.
si=s2+l
19.7. Переход от дискретной задачи к непрерывной
19.7.1. Критерий (19:А) из п. 19.6 вместе с формулами (19:7), (19:9:а), (19:9:Ь) и (19:9:с) можно использовать для нахождения всех оптимальных стратегий 2). Эти рассуждения носят несколько утомительный комбинаторный характер и содержат анализ ряда возможностей. Получающиеся при этом результаты качественно сходны с результатами, получаемыми далее при несколько измененных предположениях. Различие между ними касается лишь некоторых деликатных вопросов, которые можно назвать «тонкой структурой» стратегии. Более подробно мы остановимся на этом в п. 19.12.
Нас сейчас интересуют главным образом основные характеристики решения, а не эти вопросы «тонкой структуры». Сначала обратим внимание на дискретную структуру последовательности возможных раскладов.
х) Имеется в виду минимум по /, а не по s2, /!
2) Это нахождение было уже проделано одним из нас и будет опубликовано в другом месте.
Если мы попытаемся изобразить старшинство всех возможных раскладов на шкале от 0% до 100% или лучше в виде дробей от 0 до 1, то «самый младший из возможных раскладов, 1, будет соответствовать нулю, а самый старший из них будет соответствовать единице. Поэтому расклад s
(= 1, . . ., S) следует заменить на величину z - ~ * , принадлежащую
этой шкале. Итак, мы получаем табл. 18.
Таблица 18
Возможные , | | Старая шкала | | | | | | | |
расклады | | Новая | | | | | | S - 2 | |
| | шкала | | S - 1 | . - 1 | | S - 1 | |
Таким образом, хотя значения z заполняют интервал <19:10) Ozl
весьма плотно х), но все-таки они составляют дискретную последовательность. Это и есть упомянутая выше дискретная структура. Перейдем теперь от этого случая к непрерывному.
Будем предполагать, что случайный ход, выбирающий расклад s (т. е. число z), может воспроизвести любое z из интервала (19:10). Предположим, что вероятность любой части интервала (19:10) равна длине этой части, т. е. что величина z распределена 2) на интервале (19:10) равномерно. Обозначим расклады игроков 1 и 2 соответственно через z4 и z2.
19.7.2. Это изменение влечет за собой замену векторов psi, о62
-> ->
($i> 52 = 1, . . ., S) на векторы р21, а22 (0 z4, z2 1); при этом, конечно, они по-прежнему являются вероятностными векторами (той же природы, что и раньше, т. е. принадлежат 53). Поэтому компоненты (вероятности)
pi1, of (sb 52= 1, ..., S; г, 7 = 1, 2, 3) переходят в компоненты pf1, о)2 (OZi, z2rgl; i, /=1,2, 3). Аналогично величины yf (в формулах <19:9:а), (19:9:Ь), (19:9:с) из п. 19.6) переходят в yf.
Перепишем теперь выражения для К и у* в формулах (19:7), (19:9:а), (19:9:Ь), (19:9:с) из п. 19.6. Ясно, что все суммы
Si= 1 S2= 1
надо заменить интегралами
j .. . dzx, j ... dz2,
г) Напомним (ср. сноску 4 на стр. 219), что S есть примерно 2,5 миллиона. 2) Это так называемая геометрическая вероятность.
а суммы
- интегралами
82-1
Si=l S1=S2+1
j ... dzj, j ... dzj,
0 z2
в то время как отдельные слагаемые, стоящие в скобках с коэффициентом IIS, можно опустить \\2). Понятно, что формулы для К и у* (т. е., у)) превращаются в
(19:7*) K2j7faf2,
з о
z2 1
(19:9:а*) у? = j (- apfi - api - &pi).dz! + j (ар? + ар? - bp?) dzu
0 22
22 1
(19:9:Ь*) Т? = j (- ар? - bp? - bp?) dzt + j (ар? + bp? + bp?) dzu
0 22
Z2 1
(19:9:c*) yf = j (bp? - bp? - bp?) dz, + j (bp? + bp? + bp?) dz,,
0 22
a характеристика (19:A) из п. 19.6 переходит в следующую:
->
(19:В) Векторы pz (0 z 1) (все они принадлежат 3) описывают оптимальную стратегию в том и только том случае, когдасправедливо утверждение:
Для каждой пары z, /, для которой у) не достигает минимума (по 7 3)), должно быть р) - 0.
Замечание. Формулы (19:7*), (19:9:а*), (19:9:Ь*), (19:9:с*) и этот критерий можно было бы получить также и непосредственно из рассмотрения «непрерыв-
ного» случая с р г, а22 вместо £, т], с которых мы начинали. Мы предпочли более длинную и явную процедуру, вытекающую из пп. 19.4-19.7, чтобы сделать строгость и полноту нашего подхода очевидной. Хорошим упражнением для читателя будет осуществить более короткое и непосредственное рассмотрение этого случая.
Соблазнительно построить теорию игр, в которой систематически и непосредственно встречаются такие непрерывные параметры, т. е. с общностью, достаточной для приложимости этой теории к случаям, подобным только что рассмотренному, и без использования процессов предельного перехода от дискретных игр.
Интересный шаг в этом направлении сделан Биллем в работе, указанной в замечании на стр. 177 (см. стр.110-113 упомянутой работы). Однако сделанные там предположения о непрерывности являются, по-видимому, слишком жесткими для многих приложений и, в частности, для рассматриваемого здесь.
х) Конкретно мы имеем в виду средние члены - &pf2 и bp{2 в (19:9:а) и (19:9:с).
2) Эти члены соответствуют случаю st = s2> или, в новых обозначениях, zt = z2. Но, поскольку zi9 z2 - непрерывные случайные величины, вероятность их случайно го-совпадения равна 0.
При математическом описании этого процесса можно сказать, что мы теперь осуществляем предельный переход при S оо.
3) Мы подразумеваем по у, но не по z, /!