назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [ 46 ] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]


46

(15:8) Mffa)-

Тогда

2 аЫ/Ы при Л4 = 0,

ai=l

max / (сх4) при kt = 1,

min/(a4) при &4 = 2.

Vfe = М\уо1/к при к = 1, 2.

Подчеркнем некоторые простые свойства введенных операций Mq\. Во-первых, Мо\ связывает переменную о4 : М%[ / (di) не зависит более от о4. Для kt = 1, 2, т. е. для max, min, это было обнаружено

CTl CTl

в п. 13.2.3. Для ki = 0 это очевидно; эта операция, таким образом, аналогична операции интегрирования, упомянутой в качестве иллюстрации в сноске 1 на стр. 117.

Во-вторых, Мо{ явно зависит от игры Г. Это очевидно, поскольку Ма\ зависит от kt, а о4 принимает значения 1, . . ., а4. Дальнейшая зависимость появляется ввиду использования рх (1), . . ., р4 (а4) в случае ki = 0.

В-третьих, зависимость Yh от vGi/k одна и та же при к = 1, 2 для всех значений &4.

Мы закончим замечанием, что можно было бы легко сделать эти фор-

мулы - охватывающие математическое ожидание 2 Р\ (ai) / (ai) Для СЛУ"

чайного хода, максимум для личного хода первого игрока и минимум для хода его противника - достаточно правдоподобными при помощи чисто словесных (нематематических) рассуждений. Тем не менее представляется необходимым дать точное математическое описание, чтобы полностью отдать должное роли v4 и v2. Чисто словесная аргументация, которая могла бы это осуществить, неизбежно окажется настолько сложной (если вообще понятной), что не будет представлять большой ценности.

15.6. Результат для случая полной информации

15.6.1. Возвратимся к ситуации, описанной в конце п. 15.3.2, и примем все упомянутые там допущения; предположим, что игра Г является игрой двух лиц с нулевой суммой с полной информацией. Вместе с формулой (15:8) из п. 15.5.3, обеспечивающей индуктивный переход, приведенная

Как было показано в п. 14.6, эта перемена приводит к замене v4 и v2 на -v2 и -Vi и, следовательно, vai/4 и vai/2 на -vGl/2 и -vai/i. При подстановке полученных после замены значений в формулы (15:4) и (15:5) становится очевидной замена шах на min, и мы получаем

(15:6) v4 = min vai/4,

(15:7) v2 = min vai/2.

15.5.3- Формулы (15.2)-(15:7) из пп. 15.4.2, 15.5.1 и 15.5.2 можно объединить следующим образом.

Для произвольной функции / (а4) переменной а4 (= 1, . . ., а4) определим операции М%\, &4 = О, 1, 2, полагая



там схема даст нам возможность определить некоторые важные свойства игры Г.

Докажем прежде всего, не вдаваясь в дальнейшие подробности, что игра Г вполне определена. Доказательство проведем полной индукцией по длине игры v (см. п. 15.1.2). Оно будет состоять в доказательстве двух утверждений: «

(15:С:а) Это справедливо для игр минимальной длины, т. е. для случая v = 0.

(15:С:Ь) Из того, что это справедливо для игр длины v - 1 при некотором v =1, . . ., 2, . . ., следует его справедливость для игр длины V.

Доказательство (15:С:а). Если длина игры Г равна нулю, то игра не содержит ни одного хода и состоит в выплате игрокам 1 и 2 некоторых фиксированных сумм w и -w г). Следовательно, р4 = 32 =.1> Xi = х2 =1, Ж (ti, т2) =w2), и, таким образом,

Vi = v2 = w;

т. е. игра Г вполне определена, и v == w 3).

Доказательство (15:С:Ь). Пусть Г имеет длину v. Тогда каждая из игр Га1 имеет длину v - 1. Следовательно, по предположенному игры Га1 вполне определены. Поэтому vai/i = vai/2. Теперь формула (15:8) из п. 15.5.3 показывает 4), что v4 = v2. Следовательно, игра Г также вполне! определена, и доказательство завершено.

15.6.2. Перейдем теперь к более подробному и явному выводу равенства v4 = v2 = v для игры Г. Для этого нам не понадобится даже результат п. 15.6.1.

Составим, как мы это делали в конце п. 15.3.2, последовательность игр

(15:9) Г, Г, Га1)(72, Гаь о2, стз> •••» Vb...» <jv 5)»

длины которых соответственно равны

v, V - 1, V -2, . .., 0. Обозначим величины v4 и v2 для этих игр через

Vfe, vai/fe, vai, (j2/fe, vais аг,.. ., crv/k

Для проведения индуктивного перехода, описанного в конце п. 15.3.2, применим формулу (15:8), заменив при любом к =1, . . ., v выражения ai, Г, Г01 из п. 15.5.3 на а„, Гаь .... ок ±, TGl.....<Vi» V Тогда

kt из п. 15.5.3 относится к первому ходу в Гаь а 4, т. е. к ходу оМу игры Г. Поэтому его удобно обозначить через кн(ои . . ., 0Х 4) (см. п. 7.2.1). Следовательно, заменяя М*\ из п. 15.5.3, сконструируем

х) См. игру из замечания на странице 102 или Г - - из п. 15.3.1. В тер-

минах разбиений и множеств (10:l:f), (10:ljg) из п. 10.1.1 показывают, что при v=0 множество Q содержит только один элемент я. Таким образом, w = Si (я), -w = 2 (я) играют указанную выше роль.

2) То есть каждый игрок имеет по одной стратегии, состоящей в том, чтобы ничего не делать.

3) Это, разумеется, очевидно. Существенным шагом является (15:С:Ь).

4) См. замечание в конце п. 15.5.3. Формула при любых значениях к± одна и та же для к = 1, 2.

5) См. сноску 3 на странице 144.



операцию MG • На этом пути мы получим

(15:10) v0lf..., o/k = А*£*(<ТЬ"" Ч*...., crx/fc Для Л = 1, 2.

Рассмотрим теперь последний член последовательности (15:9), игру Гаь...,суу- Она подпадает под рассмотрение (15:С:а) из п 15.5.1; эта игра вовсе не содержит ходов. Обозначим единственную возможную в ней партию через л = я (о1? . . ., crv) х). Следовательно w в ней фиксировано 2) и равно 3Fi (я (аь . . ., crv))- Таким образом, мы получаем

(15:11) vaif...>av/i = v(yif...f(yv/2 = ri(Ji(alf av)).

Применим теперь (15:10) при x = v к (15:11; и далее последовательно к к = у- 1, 2, 1. Таким способом мы получим

(15:12) Vl = v3 = v = M(ai) ... Jlf£(ei""ffv-l)jF1(n(<rJ, <rv)).

Это еще раз доказывает, что игра Г вполне определена и дает в то же время явное выражение для значения игры.

15.7. Применение к шахматам

15.7.1. Рассуждения п. 6.4.1 и утверждения п. 14.8 об играх двух лиц с нулевой суммой, в которых предварение эквивалентно предшествованию, т. е. об играх, в которых имеет место полная информация, теперь уже обоснованы. Мы ссылались там на распространенное мнение, что такие игры обладают некоторыми свойствами рациональности; теперь мы придали этой расплывчатой точке зрения точный смысл, показав, что такие игры вполне определены. Мы показали также, что это справедливо и для игр, содержащих случайные ходы,- факт, в меньшей степени основанный на «общих соображениях».

В п. 6.4.1 были приведены примеры игр с полной информацией: шахматы (без случайных ходов) и трик-трак (со случайными ходами). Таким образом, для всех этих игр мы установили существование определенного значения (для партии) и определенных оптимальных стратегий. Однако существование таких стратегий доказано в абстрактном виде, и метод их построения в большинстве случаев слишком громоздок для эффективного применения 3).

В связи с этим стоит рассмотреть более подробно игру в шахматы.

Исходы игры в шахматы, т. е. множество значений функций из п. 6.2.2 или п. 9.2.4, ограничиваются тремя числами 1, 0, -1 4). Таким образом, функции &ь из п. 11.2.2 принимают те же значения, и, поскольку случайные ходы отсутствуют, то же самое верно и для функций Жъ. из п. 11.2.3 5). Далее мы будем пользоваться функцией Ж = Ж± из

г) См. замечания по поводу Г- - в п. 15.3.1.

cTi.....аг

2) См. (15.С:а) из п. 15.6.1, в частности, сноску 1 на стр. 150.

3) В основном это связано с тем, что v чудовищно велико. По поводу шахмат см. соответствующую часть замечания 1 на стр. 85. Фигурирующее там v* совпадает с нашим v; см. конец п. 7.2.3.

4) Это наиболее простой способ интерпретации понятий «выигрыш», «ничья», «проигрыш».

5) Каждое значение Sft является также значением cFk, каждое значение при отсутствии случайных ходов является значением При наличии случайных ходов значением Жк была бы вероятность «выигрыша» минус вероятность «проигрыша», т. е. некоторое число, лежащее между 1 и -1.

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [ 46 ] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]