15.3. Точное условие (индуктивный переход)
15.3.1. Как было указано в конце п. 15.1.2, мы стремимся вывести свойства игры Г из свойств игр Г- , а4 = 1, . . ., а4: в случае успеха это и будет типичным индуктивным переходом.
К настоящему моменту тем не менее единственный класс игр, свойства (математические) [которого нам известны, состоит из игр двух лиц с нулевой суммой: для них мы имеем величины v4 и v2 (см. п. 15.1.1). Предположим поэтому, что Г - игра двух лиц с нулевой суммой.
Покажем теперь, что величины v4 и v2, определенные для игры Г, могут быть выражены с помощью соответствующих величин для Г,
o~i == 1, . . ., (Xi (см. п. 15.1.2). Это обстоятельство пробуждает желание проводить «индукцию» и дальше, т. е. строить таким же способом игры
Га Ъ Га Ъ о * Га а а Существенно ЗДвСЬ ТО, ЧТО ЧИСЛО
шагов в этих играх последовательно убывает от v (для Г), v - 1 (для Г), принимая значения v - 2, v - 3, . . ., до 0 (для игры Г-х -g ~v); здесь Г~1 -2 -v - «пустая» игра (похожая на игру, упомянутую в замечании на странице 102). Она не содержит ходов: игрок к получает фиксированный выигрыш
"д(alf ..., av).
Это - терминология из пп. 15.1.2. 15.1.3, т. е. из §§ 6 и 7. В терминах пп. 15.2.1 и 15.2.2, т. е. из §§ 9, 10, мы сказали бы, что Q (для Г) последовательно ограничивается С4 (а4) из Jh2 (для Г-), далее С2 (ои а2) из Лг (для Г-1Г(Т2), C3(oi, a2, a3) из (для Г-ь-з) и т. д. и, наконец,
Сх (Oi, a2, . . ., av) из v+i (Для -2 -). Но это последнее множество состоит из единственного элемента ((10:l:g) из п. 10.1.1), скажем л. Следовательно, исход игры Г- ~2 ~v оказывается фиксированным. Игрок к получает фиксированный выигрыш k (я).
Следовательно, природа игры Г- ~2 ~v очевидна: понятно, что является ее значением для каждого игрока. Поэтому процесс, ведущий от Г- к Г, если его удастся построить, может быть использован для работы и в обратном направлении: от Г-х - к - ,
к Г-ь - 2 и т. д., и т. д., к Г-ь-2, к Г- и, наконец, к Г.
Однако все это возможно только в том случае, когда мы в состоянии построить все игры последовательности Г- -2, Г-у ~2 -g , ... . . ., Г- -v, т. е. если для всех этих игр выполняются последние условия из п. 15.1.3 или из п. 15.2.2. Это требование можно снова сформулировать для произвольной общей игры п лиц Г, и мы опять возвращаемся к таким Г.
15.3.2. Нужное требование (в терминах пп. 15.1.2, 15.1.3, т. е. из §§ 6 и 7) состоит в том, что ход g#! должен предварять все ходы оМ2, . . . . . ., gMv, ход оМ2 должен предварять все оМг, . . ., ©#v и т. д., и т. д., т. е. предварение должно совпадать с предшествованием.
г) Oi = 1, . . :, a4; а2 = 1, . . ., а2, где а2 = а2 (а4); а3 = 1, . . ., а3, где а3 = = а3 (а4, а2), и т. д.
То же самое можно, конечно, сформулировать и в терминах пп. 15.2.1 и 15.2.2. Именно все 3)к(к), к 2, должны быть подразбиениями А2, все 3)у (к), к 3, должны быть подразбиениями А3 и т. д., и т. д., т. е. все 3) (к) должны быть подразбиениями Ах при % X 1).
Поскольку АК всегда является подразбиением Ах (см. п. 10.4.1), достаточно потребовать, чтобы все 3) (к) были подразбиениями А у Однако А у является подразбиением 3)К(к) в i?x (к) (см. (10:l:d) в п. 10.1.1); следовательно, наше требование равносильно тому, что 3)% (к) является частью Ау лежащей в ВК (к) 2). Согласно (10:В) из п. 10.4.1 это как раз означает то, что в игре Г предварение совпадает с предшествованием.
В результате всех этих рассуждений мы установили следующее:
(15:В) Для того чтобы можно было достроить полную последовательность игр
состоящих соответственно из
v, v -1, V -2, ..., 0
ходов, необходимо и достаточно, чтобы в игре Г предварение и предшествование совпадали, т. е. чтобы имела место полная информация. (См. п. 6.4.1 и конец п. 14.8.)
Если Г - игра двух лиц с нулевой суммой, то сказанное позволяет проанализировать игру Г путем движения в обратном направлении вдоль последовательности (15.1): от тривиальной игры ~2 -v к Г, пользуясь на каждом шаге способом, ведущим от Г- к Г, так, как это будет показано в п. 15.6.2.
15.4. Точное исследование индуктивного перехода
15.4.1. Перейдем теперь к выводу индуктивного перехода от Га1 3) к Г. Игра Г должна лишь удовлетворять последним условиям из п. 15.1.3 или п. 15.2.2, но она должна быть при этом игрой двух лиц с нулевой суммой.
Следовательно, мы можем построить все Г, а4 = 1, . . ., а4, и они также будут играми двух лиц с нулевой суммой. Обозначим стратегии обоих игроков в Г соответственно через SJ, . . ., 2fi и 2*, . . ., 22, а «математическое ожидание» выигрыша каждого из игроков в партии при использовании ими стратегий 2J1, 22 - через
йГ± (Tlt TaJssSJTfa, т2)3 fiF8(Ti, т2)-- (т4, та) (см. пп. 11.2.3 и 14.1.1). Обозначим соответствующие величины в игре Га1 через 21, . . ., и 2£l/2, • • .» и при использовании страте-
гий 21/!, 2;/2 положим .
SToj/i (/1, т<у2/2) = $%ai (tci/i, tci 2),
5/2 (г/1, /2) = - (Jj (т/i, Tol/2).
*) Мы уже установили это для Я = 2, 3, . . .; для Я = 1 это выполняется автоматически: каждое разбиение является подразбиением А и поскольку состоит из единственного множества (см. (10-1 -j) в п. 10.1.1).
2) По поводу обоснования, если таковое потребуется, см. сноску 3 на стр. 89.
3) Начиная с этого места, будем писать aif а2, . . *v вместо <г4, а2, • • •» o"v, так как ни к каким недоразумениям это не приведет,
| max min (xlf T2)f | |
| = min max Ж (ть т2), *2 ti | |
| = max min *ax/l /2 | cr4/2)i |
va4/2 | = min max Ж01 (та1/ь %1/2%4/1 | /2). |
Наша задача состоит в выражении vi и v2 через vai/i и v0l/2.
Индекс fci из пп. 15.1.2, 15.2.1, который определяет характер хода <Мь будет играть существенную роль. Поскольку п == 2, &i может принимать только значения 0, 1 и 2. Мы рассмотрим каждый из этих трех случаев отдельно.
15.4.2. Рассмотрим сначала случай kt = 0, т. е. оМ± является случайным ходом. Вероятности альтернатив а4=1, . . >, а4 равны Pi (1), . . ., Pi (ai) (pi ((Ti) равно Pi (Ci) из (10:A:h) в п. 10.1.1 при с{ = = a (at) в п. 15.2.1).
Стратегия игрока 1 состоит, очевидно, в выборе стратегии 2jT1
игрока 1 в игре Га1 для каждого из значений случайной величины а4 = = 1, . . ., di1); таким образом, 2J1 соответствует совокупности
Sl/l1, . . ., ai/l1 ДЛЯ всевозможнЫХ Комбинаций Ti/i, . . ., Taj/i.
Аналогично стратегия игрока 2 в Г состоит в выборе стратегии 2а*/2 игрока 2 в Га1 для каждого из значений (случайной величины a4 = 1, ... « . ., сц; таким образом, 2J2 соответствует совокупности 21/22, . . ., 2Ta.i/2
ai/ z
для всевозможных комбинации Ti/2, . . ., Tai/2.
«Математические ожидания» выигрыша в играх Г и Га1 связываются очевидной формулой
Ж(ти Т2)= 2 Pl(Gi)&£Gi(l<5JU Ta /2).
Следовательно, выражение для v4 принимает вид
v4 = max min Ж (ть т2) = ti т2
= max min 2 л (а4) ЙГа (тад/1, та/2).
П/1, . . .,Tai/1 т1/2, . .., ха/2 о4=1
Соответствующе индексу а4 в стоящей справа сумме 2 слагаемое
Pi fal) (Tat/i, tai/2)
содержит только две переменные: tai/lf t<ji/2. Таким образом, пары
Т1/Ь т1/2; та4/1» Tai/2
г) Интуитивно это очевидно. Читатель может показать это и формально, применяя определения п. 11.1.1 и (11 :А) из п. 11.1.3 к ситуации, описанной в п. 15.2.1.
10 Дж. Нейман, О. Моргенштерн
Составим выражения для vlf v2 из п. 14.4.1 в игре Г и в игре Г0а, обозначая их в последнем случае через va /1, va /2. Такимобразом,