назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [ 56 ] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]


56

и фактически К(, ц) заменяется на К (£, r\) - w. Следовательно, у[ и у2 заменяются на у[ - w и у2-w *). Применяя утверждение (17:7) к уг - w, у2 -w, мы получаем:

(17:8) Невозможно vi < w < v2.

Заметим теперь, что число w было выбрано совершенно произвольно. Вместе с тем при v < у2 можно будет выбрать w так, чтобы было у[ < w < v2, однако это противоречит (17:8). Итак, неравенство v < v2 невозможно, и мы доказали v = v2, что и требовалось. Доказательство завершено.

17.7. Сравнение подходов для чистых и для смешанных стратегий

17.7.1. Прежде чем двинуться дальше, обсудим еще раз смысл равенства

Его существенной чертой является то, что всегда имеет место v = v2, но не всегда v4 = v2, т. е. всегда имеет место полная определенность в общем и не всегда вполне определенность в частном (см. начало п. 17.6).

Выразим сказанное математически.

Всегда имеет место равенство

-> -у -у -у

(17:9) max min К (£, rj) = minmaxK(g, г]),

-У -у -у -у

£ л ч I

т. е.

Pi Зз 3i 32

(17:10) max min 2 2 (тА, т2) £tlr]t2 = min max 2 2 (ть тг) Sti%2-

- Ti=i Т2=1 -- Ti=l Т2=1

Используя (17:А), можно даже написать, что

Pi 32

(17:11) maxmin 2j Ж (ть т2) Xl = min max V $К (тА, т2) т]Т2.

1 Т2 Ti=l Ti X2Z=1

Однако не всегда выполняется

(17:12) max min (т4, т2) = min max Ж* (т15 т2).

Ti Т2 t2 Tl

Сравним (17:9) с (17:12). Равенство (17:9) верно всегда, чего нельзя сказать о (17:12). Единственно, чем они отличаются, это величинами г], К и т4, т2, Ж. Почему же подстановка одних на место других превращает неправильное утверждение (17:12) в правильное (17:9)?

Причина этого заключается в том, что Ж (т4, т2) из (17:12) является совершенно произвольной функцией своих переменных тА и т2 (см. п. 14.1.3),

-у -у

тогда как К (£, г\) в (17:9) является функцией весьма частного вида пере-

-У -у

менных и т), т. е.

Ii> • • •» 3i» %> • • •» ПЗг»

а именно билинейной формой. (См. первую часть п. 17.6.) Большая общность Ж (Ti, т2) делает невозможным доказательство (17:12), в то время

х) Это становится очевидным, если вспомнить интерпретацию из сноски 1 на стр. 178.;



как частная, билинейная природа К (£, т]) составляет основу приведенного в п. 17.6 доказательства равенства (17.9),

-у -у

Замечание. Билинейность К (£, г\) происходит оттого, что она является «математическим ожиданием» выигрыша. Представляется существенным, что линейность этой функции связана с существованием решения в том смысле, в котором мы его нашли. С математической точки зрения это открывает нам довольно интересные перспективы: можно исследовать, какие иные понятия, кроме «математического ожидания», не будут противоречить нашему решению, т. е. получению результата п. 17.6 для игр двух лиц с нулевой суммой.

Понятие «математического ожидания» является фундаментальным со многих точек зрения. Его значимость с точки зрения теории полезности обсуждалась в п. 317.1.

17.7.2. При всей правдоподобности может показаться парадоксальным, -у -у

что функция К (£, т]) имеет более частный вид, чем ё% т2), несмотря на то что первая получена из второй с помощью процесса, имеющего все признаки обобщения: мы получили ее заменой понятия чистой стратегии на понятие смешанной стратегии, как это было описано в п. 17.2,

-у -у

т. е. заменой хх и т2 на £ и г].

Однако более пристальное рассмотрение разрешает этот парадокс.

-у -у

К (£, г]) является функцией очень частного вида по сравнению с (т4, т2), однако ее переменные имеют значительно более широкую область изменения, чем первоначальные переменные %х и т2. Действительно, т4 имеет

областью значений конечное множество 1, . . ., р4, тогда как \ изменяется во всем множестве Spv которое является (pi - 1)-мерной поверхностью в ргмерном линейном пространстве Spt (см. конец п. 16.2.2 и п. 17.2).

Аналогичное справедливо по отношению к т2 и т).

Замечание. Заметим, что вектор g == . . ., с компонентами gTl, где т4 = 1, . . ., Pi, также содержит т4; однако здесь имеется существенное отличие. В Ж (т1? т2) само Tt является переменной. В К Й, т]) переменной является £, в то время

как т4 оказывается как бы переменной внутри переменной. \ фактически является функцией от %i (см. конец п. 16.1.2), и эта функция как таковая является переменной

-у -у

в К (£, г)). То же относится и к т2, т].

Выразим то же в терминах тА итг : Ж (т4, т2) является функцией от т4 и/г2, в то

-у -у

время как К (£, г\) является функцией от функции от переменных ть т2 (т. е. тем, что в математике называется функционалом).

Среди точек из находятся точки, фактически соответствующие различным Ti из 1, . . ., Pi- Для каждого хх можно построить (как это

делалось в п. 16.1.3 и в конце п. 17.2) координатный вектор g = 6Т*, выражающий выбор стратегии 2** при исключении всех остальных стратегий. Таким же способом каждой чистой стратегии т2 из 1, . . ., р2

можно поставить в соответствие некоторый вектор г) из S$2. Для этого

-У -У

по данному т2 можно построить координатный вектор г) = 6Т2, выражающий выбор стратегии 2J2 с исключением всех остальных. Теперь очевидно, что

01 02

К (в*1, бТ2) = 2 S «Г К* т2) &ritAit* = ЙГ (Tlf т2)!).

*) Смысл этой формулы очевиден; достаточно только вспомнить, как выборы

стратегий осуществляют 6 1ибТ2.



Таким образом, несмотря на свой частный вид, функция К (£, г]) содержит функцию Ж (Ti, т2) и поэтому является более общей. Она действи-

тельно шире, чем Ж (т, т2), поскольку не все п, имеют вид oTl, ot2, т. е. не все смешанные стратегии являются чистыми *). Можно сказать, что

К (£, г)) является продолжением Ж (хи т2) с более узкой области опреде-

-> -> -> ->

ления Ti, т2 (т. е. с STl, 8Т2) на более широкую область £, г) (т. е. на все S$v S$2): с области чистых стратегий на область смешанных стратегий.

Билинейность функции К (£, т) выражает лишь тот факт, что это продолжение осуществляется путем линейной интерполяции. То, что пришлось применить именно этот процесс, объясняется линейным характером «математического ожидания» 2).

17.7.3. Возвращаясь к равенствам (17:9) - (17:12), мы видим теперь, что можно следующим образом выразить справедливость (17:9) -(17:11) и неправильность (17:12).

(17:9) и (17:10) выражают тот факт, что каждый из игроков полностью защищен от раскрытия его стратегии противником в том случае, если

он пользуется смешанными стратегиями т вместо чистых тА, т2. (17:11) утверждает, что это остается в силе и в том случае, когда игрок, раскрывший стратегию противника, использует ть т2, в то время как противник

продолжает использовать т). Наконец, неверность (17:12) показывает,

что оба игрока - ив особенности тот, стратегия которого окажется

раскрытой,- не могут, вообще говоря, безнаказанно обойтись без исполь-

-> -у

зования смешанных стратегий г).

17.8. Исследование полной определенности в общем случае

17.8.1. Переформулируем содержание п. 14.5, как указывалось в конце п. 17.4, особо подчеркивая тот установленный в п. 17.6 результат, что всякая игра двух лиц с нулевой суммой Г вполне определена в общем.

Согласно этому результату мы можем определить

v = max min К (£, г]) = min max К (g, т]) = Sa >-> К (g, т]) I л л £

(см. также (13:С*) в п. 13.5.2 и конец п. 13.4.3).

Построим теперь по аналогии с множествами А и В в (14:D:a), (14:D:b) из п. 14.5.1 множества А и 5, являющиеся соответственно подмножествами Sfa и Sр2• Это будут множества Аф и Вч> из п. 13.5.1 (здесь ф соответствует нашему К). Таким образом, мы определяем:

(17:В:а) А есть множество тех £ 5, для которых min К (£, г\)

принимает свое максимальное значение, т. е. тех, для которых

-у -> -> -+

min К (£, т)) = max min К (g, г)) = v.

-> ->->-

л I л

х) То есть с положительными вероятностями могут использоваться несколько стратегий.

2) Фундаментальная связь между понятием числовой полезности и линейным «математическим ожиданием» была отмечена в конце п. 3.7.1.

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [ 56 ] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]