и фактически К(, ц) заменяется на К (£, r\) - w. Следовательно, у[ и у2 заменяются на у[ - w и у2-w *). Применяя утверждение (17:7) к уг - w, у2 -w, мы получаем:
(17:8) Невозможно vi < w < v2.
Заметим теперь, что число w было выбрано совершенно произвольно. Вместе с тем при v < у2 можно будет выбрать w так, чтобы было у[ < w < v2, однако это противоречит (17:8). Итак, неравенство v < v2 невозможно, и мы доказали v = v2, что и требовалось. Доказательство завершено.
17.7. Сравнение подходов для чистых и для смешанных стратегий
17.7.1. Прежде чем двинуться дальше, обсудим еще раз смысл равенства
Его существенной чертой является то, что всегда имеет место v = v2, но не всегда v4 = v2, т. е. всегда имеет место полная определенность в общем и не всегда вполне определенность в частном (см. начало п. 17.6).
Выразим сказанное математически.
Всегда имеет место равенство
-> -у -у -у
(17:9) max min К (£, rj) = minmaxK(g, г]),
-У -у -у -у
£ л ч I
т. е.
Pi Зз 3i 32
(17:10) max min 2 2 (тА, т2) £tlr]t2 = min max 2 2 (ть тг) Sti%2-
- Ti=i Т2=1 -- Ti=l Т2=1
Используя (17:А), можно даже написать, что
Pi 32
(17:11) maxmin 2j Ж (ть т2) Xl = min max V $К (тА, т2) т]Т2.
1 Т2 Ti=l Ti X2Z=1
Однако не всегда выполняется
(17:12) max min (т4, т2) = min max Ж* (т15 т2).
Ti Т2 t2 Tl
Сравним (17:9) с (17:12). Равенство (17:9) верно всегда, чего нельзя сказать о (17:12). Единственно, чем они отличаются, это величинами г], К и т4, т2, Ж. Почему же подстановка одних на место других превращает неправильное утверждение (17:12) в правильное (17:9)?
Причина этого заключается в том, что Ж (т4, т2) из (17:12) является совершенно произвольной функцией своих переменных тА и т2 (см. п. 14.1.3),
-у -у
тогда как К (£, г\) в (17:9) является функцией весьма частного вида пере-
-У -у
менных и т), т. е.
Ii> • • •» 3i» %> • • •» ПЗг»
а именно билинейной формой. (См. первую часть п. 17.6.) Большая общность Ж (Ti, т2) делает невозможным доказательство (17:12), в то время
х) Это становится очевидным, если вспомнить интерпретацию из сноски 1 на стр. 178.;
как частная, билинейная природа К (£, т]) составляет основу приведенного в п. 17.6 доказательства равенства (17.9),
-у -у
Замечание. Билинейность К (£, г\) происходит оттого, что она является «математическим ожиданием» выигрыша. Представляется существенным, что линейность этой функции связана с существованием решения в том смысле, в котором мы его нашли. С математической точки зрения это открывает нам довольно интересные перспективы: можно исследовать, какие иные понятия, кроме «математического ожидания», не будут противоречить нашему решению, т. е. получению результата п. 17.6 для игр двух лиц с нулевой суммой.
Понятие «математического ожидания» является фундаментальным со многих точек зрения. Его значимость с точки зрения теории полезности обсуждалась в п. 317.1.
17.7.2. При всей правдоподобности может показаться парадоксальным, -у -у
что функция К (£, т]) имеет более частный вид, чем ё% т2), несмотря на то что первая получена из второй с помощью процесса, имеющего все признаки обобщения: мы получили ее заменой понятия чистой стратегии на понятие смешанной стратегии, как это было описано в п. 17.2,
-у -у
т. е. заменой хх и т2 на £ и г].
Однако более пристальное рассмотрение разрешает этот парадокс.
-у -у
К (£, г]) является функцией очень частного вида по сравнению с (т4, т2), однако ее переменные имеют значительно более широкую область изменения, чем первоначальные переменные %х и т2. Действительно, т4 имеет
областью значений конечное множество 1, . . ., р4, тогда как \ изменяется во всем множестве Spv которое является (pi - 1)-мерной поверхностью в ргмерном линейном пространстве Spt (см. конец п. 16.2.2 и п. 17.2).
Аналогичное справедливо по отношению к т2 и т).
Замечание. Заметим, что вектор g == . . ., с компонентами gTl, где т4 = 1, . . ., Pi, также содержит т4; однако здесь имеется существенное отличие. В Ж (т1? т2) само Tt является переменной. В К Й, т]) переменной является £, в то время
как т4 оказывается как бы переменной внутри переменной. \ фактически является функцией от %i (см. конец п. 16.1.2), и эта функция как таковая является переменной
-у -у
в К (£, г)). То же относится и к т2, т].
Выразим то же в терминах тА итг : Ж (т4, т2) является функцией от т4 и/г2, в то
-у -у
время как К (£, г\) является функцией от функции от переменных ть т2 (т. е. тем, что в математике называется функционалом).
Среди точек из находятся точки, фактически соответствующие различным Ti из 1, . . ., Pi- Для каждого хх можно построить (как это
делалось в п. 16.1.3 и в конце п. 17.2) координатный вектор g = 6Т*, выражающий выбор стратегии 2** при исключении всех остальных стратегий. Таким же способом каждой чистой стратегии т2 из 1, . . ., р2
можно поставить в соответствие некоторый вектор г) из S$2. Для этого
-У -У
по данному т2 можно построить координатный вектор г) = 6Т2, выражающий выбор стратегии 2J2 с исключением всех остальных. Теперь очевидно, что
01 02
К (в*1, бТ2) = 2 S «Г К* т2) &ritAit* = ЙГ (Tlf т2)!).
*) Смысл этой формулы очевиден; достаточно только вспомнить, как выборы
стратегий осуществляют 6 1ибТ2.
Таким образом, несмотря на свой частный вид, функция К (£, г]) содержит функцию Ж (Ti, т2) и поэтому является более общей. Она действи-
тельно шире, чем Ж (т, т2), поскольку не все п, имеют вид oTl, ot2, т. е. не все смешанные стратегии являются чистыми *). Можно сказать, что
К (£, г)) является продолжением Ж (хи т2) с более узкой области опреде-
-> -> -> ->
ления Ti, т2 (т. е. с STl, 8Т2) на более широкую область £, г) (т. е. на все S$v S$2): с области чистых стратегий на область смешанных стратегий.
Билинейность функции К (£, т) выражает лишь тот факт, что это продолжение осуществляется путем линейной интерполяции. То, что пришлось применить именно этот процесс, объясняется линейным характером «математического ожидания» 2).
17.7.3. Возвращаясь к равенствам (17:9) - (17:12), мы видим теперь, что можно следующим образом выразить справедливость (17:9) -(17:11) и неправильность (17:12).
(17:9) и (17:10) выражают тот факт, что каждый из игроков полностью защищен от раскрытия его стратегии противником в том случае, если
он пользуется смешанными стратегиями т вместо чистых тА, т2. (17:11) утверждает, что это остается в силе и в том случае, когда игрок, раскрывший стратегию противника, использует ть т2, в то время как противник
продолжает использовать т). Наконец, неверность (17:12) показывает,
что оба игрока - ив особенности тот, стратегия которого окажется
раскрытой,- не могут, вообще говоря, безнаказанно обойтись без исполь-
-> -у
зования смешанных стратегий г).
17.8. Исследование полной определенности в общем случае
17.8.1. Переформулируем содержание п. 14.5, как указывалось в конце п. 17.4, особо подчеркивая тот установленный в п. 17.6 результат, что всякая игра двух лиц с нулевой суммой Г вполне определена в общем.
Согласно этому результату мы можем определить
v = max min К (£, г]) = min max К (g, т]) = Sa >-> К (g, т]) I л л £
(см. также (13:С*) в п. 13.5.2 и конец п. 13.4.3).
Построим теперь по аналогии с множествами А и В в (14:D:a), (14:D:b) из п. 14.5.1 множества А и 5, являющиеся соответственно подмножествами Sfa и Sр2• Это будут множества Аф и Вч> из п. 13.5.1 (здесь ф соответствует нашему К). Таким образом, мы определяем:
(17:В:а) А есть множество тех £ 5, для которых min К (£, г\)
принимает свое максимальное значение, т. е. тех, для которых
-у -> -> -+
min К (£, т)) = max min К (g, г)) = v.
-> ->->-
л I л
х) То есть с положительными вероятностями могут использоваться несколько стратегий.
2) Фундаментальная связь между понятием числовой полезности и линейным «математическим ожиданием» была отмечена в конце п. 3.7.1.