Если игрок 1 захочет играть только стратегию то он должен в качестве выбрать координатный вектор 6Tl (см. п. 16.1.3); аналогично, если игрок 2 захочет играть стратегию 2£2, то он должен в качестве г\ выбрать бТ2.
Мы предполагаем, что игрок 1 производит выбор независимо от выбора игрока 2, и наоборот.
Смысл этого состоит, конечно, в том, что после того, как выборы сделаны, игрок 1 фактически использует каждую из стратегий т4 = 1, . . ., Pi с вероятностями gTl, а игрок 2 использует стратегии т2 = 1, . . ., Р2 с вероятностями r]t2. Поскольку выборы игроков независимы, математическое ожидание выигрыша равно
-> -> 1 32
(17:2) К (g, т)= 2 2 (2)2.
Ti=l т2=1
Иными словами, мы заменили первоначальную игру Г некоторой новой игрой, которая имеет, по существу, такую же структуру, но обладает, однако, и некоторыми формальными отличиями.Числа Ti и т2 (выборы игроков) заменены теперь векторами и т). Функция $К (т4, т2) - выигрыш или, точнее, «математическое ожидание» выигрыша в игре -
-у ->
заменена на К (£, п). Все это указывает на идентичность нашей данной
точки зрения на игру Г с той, которая была изложена в п. 14.1.2 (с един-
-> ->
ственной разницей, заключающейся в замене т4, т2, Ж(хх, т2) на £, п, -> ->
К (£, У])). Этот изоморфизм указывает нам на возможность приложения тех же самых методов, которыми мы пользовались для исследования первоначальной игры Г, а именно сравнения с мажорантной и минорант-ной играми Ti и Г2, как это было описано в пп. 14.2, 14.3.1, 14.3.3.
17.4.2. Таким образом, в игре Г4 игрок 1 выбирает свой вектор
первым, а игрок 2 выбирает г\ после него, имея уже полную информацию
о векторе , выбранном противником. В Г2 порядок выбора изменен на противоположный. Поэтому рассуждения из п. 14.3.1 здесь применимы
дословно. Игрок 1, выбирая £, может ожидать, что игрок 2 будет выбирать т] с целью минимизировать К (£, п), т. е. что выбор игроком 1 I ведет к min К (£, Г]). Это функция только от £; следовательно, игрок 1 должен
выбрать так, чтобы максимизировать min К (£, п). Таким образом,
->
значение для партии игры Г4 (для игрока 1) равно
-У -У
v[ = max min К (g, n). If л
Аналогично мы получаем, что значение для партии игры Г2 (для игрока 1) равно
, -> -у
v2 = min max К (£, n).
(Очевидное допущение о рациональном поведении противника не играет в действительности никакой роли, поскольку утверждения (14:А: а) - (14:А:е), (14:В:а) - (14:В:е) из пп. 14.3.1 и 14.3.3 применимы здесь дословно.)
Как это делалось в п. 14.4.1, можно обосновать тот очевидный факт, что игра Ti менее благоприятна для игрока 1, чем Г2, т. е. что
Если в справедливости этого возникнут какие-либо сомнения, то напомним, что строгое доказательство содержится в (13:А *) в п. 13.4.3. Употреб-
-> ->.
ляемые там выражения х, у, ф соответствуют нашим т), К *). Если окажется, что
то рассуждения из п. 14.5 применимы дословно. Утверждения (14:С:а) -
->
(14:C:f), (14:D:a), (14:D:b) определяют понятия оптимальных £ и г и устанавливают «значение» партии (для игрока 1):
v=v;=v;2).
Согласно (13:В) в п. 13.4.3, все это происходит в том и только в том случае, когда существует седловая точка функции К (переменные х, у, ф
-»- ->
соответствуют нашим £, ц, К).
17.5. Полная определенность в общем случае
17.5.1. Мы заменили v4 и v2 из (14:А:с) и (14:В:с) на vh и предыдущее обсуждение показывает, что последние могут играть роль первых. Однако мы теперь в такой же степени зависим от равенства vj - v2, как раньше от v4 = v2. Естествен поэтому вопрос: приобрели ли мы что либо в результате такой замены?
Очевидно, что приобрели, если, имея равенство у[ = v2 (для любой заданной игры Г), мы располагаем лучшими перспективами, чем имея равенство v4 = v2. Мы называли игру Г вполне определенной, если имели v4 = v2. Нам представляется целесообразным фиксировать теперь различие и называть игру Г в случае v4 = v2 вполне определенной в частном, а в случае = v2 вполне определенной в общем. Такая терминология будет правомерной только в том случае, когда из первого будет следовать второе.
С точки зрения здравого смысла эта импликация вполне правдоподобна. Введение смешанных стратегий увеличивает возможность игрока обороняться против раскрытия его стратегии противником; поэтому можно ожидать, что числа у[ и v2 действительно лежат между v4 и v2. Иными словами, можно утверждать, что (17:3) v4 <; v; v: v2
(это неравенство гарантирует, конечно, правомерность использования только что упомянутой импликации).
г) Хотя и г) - векторы, т. е. последовательности вещественных чисел . . . и (%, ..., Лз2Ь но кажДЬ1И из них можно рассматривать как переменную в операциях max и min. Областями их изменения являются, конечно, и введенные нами в п. 17.2.
2) Подробное повторение рассматриваемых доводов дано в п. 17.8.
Чтобы устранить все возможные сомнения, дадим строгое доказательство неравенства (17:3). Это удобно сделать как следствие другого утверждения.
17.5.2. Докажем вначале такую лемму:
(17:А) Для любого lSfil
Pi Р2 Pi
min К (1, т]) = min 2 2 fa, т2) £Tlnt2 = min 2 SK fa, т2) gTl.
~+ Ti=l T2=l Т2 Ti=l
Для любого r\£Sp2
Pi 32 32
max К (£, г]) = max 2 2 < fa, т2) gTl%2 = max 2 fa, т2) Лт2-
1 > Т2-1 Ti Т2=1
Доказательство. Докажем только первую из этих формул; доказательство второй в точности такое же, надо только заменить max
на min, а также на > .
->-
Если в качестве т] взять вектор б 2 (см. п. 16.1.3 и конец п. 17.2), то мы получим
3l 32 01 32
min 2 2 fa, r2) Sti%2=S 2 2 ж fa» т2) StA2tJ =
-> T1==lT2=l Ti==lT2=l
= 2 fa, т2) ?tr
Ti=l
Посколько это верно для всех т2, то
3i 32 3 i
(17:4:а) min 2 2 fa> тг) ЪххЧх2=кыт 2 fa, т2) gTl.
-> Ti=lT2==l Т2 Ti=l
С другой стороны, для всех т2
3i 3i
2 Ж fa. Т2) ETl min 2 fa, т2) En-
Ti=l Т2 Ti=l
Возьмем произвольное т] £ S$2, умножим обе стороны этого % нера-
венства на т]Т2 и просуммдруем по т2=1, 32. Поскольку 2 Лт*-1»
т2=1
мы получим
3l 32 01
2 2 fa, т2) tXlv)x2 min 2 fa, та) £Tl.
Ti=l T2=l Т2 Ti=l
->
Так как это верно для всех т), то должно быть
(17:4:Ь) min § % Ж (т„ т2) gTliT2 min 2 Ж (т,, т2) tl.
Т] Tl= 1 Т2= 1 Т2 Ti= 1
Теперь (17:4:а) и (17:4:Ь) дают требуемое соотношение.