назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [ 54 ] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]


54

Если игрок 1 захочет играть только стратегию то он должен в качестве выбрать координатный вектор 6Tl (см. п. 16.1.3); аналогично, если игрок 2 захочет играть стратегию 2£2, то он должен в качестве г\ выбрать бТ2.

Мы предполагаем, что игрок 1 производит выбор независимо от выбора игрока 2, и наоборот.

Смысл этого состоит, конечно, в том, что после того, как выборы сделаны, игрок 1 фактически использует каждую из стратегий т4 = 1, . . ., Pi с вероятностями gTl, а игрок 2 использует стратегии т2 = 1, . . ., Р2 с вероятностями r]t2. Поскольку выборы игроков независимы, математическое ожидание выигрыша равно

-> -> 1 32

(17:2) К (g, т)= 2 2 (2)2.

Ti=l т2=1

Иными словами, мы заменили первоначальную игру Г некоторой новой игрой, которая имеет, по существу, такую же структуру, но обладает, однако, и некоторыми формальными отличиями.Числа Ti и т2 (выборы игроков) заменены теперь векторами и т). Функция $К (т4, т2) - выигрыш или, точнее, «математическое ожидание» выигрыша в игре -

-у ->

заменена на К (£, п). Все это указывает на идентичность нашей данной

точки зрения на игру Г с той, которая была изложена в п. 14.1.2 (с един-

-> ->

ственной разницей, заключающейся в замене т4, т2, Ж(хх, т2) на £, п, -> ->

К (£, У])). Этот изоморфизм указывает нам на возможность приложения тех же самых методов, которыми мы пользовались для исследования первоначальной игры Г, а именно сравнения с мажорантной и минорант-ной играми Ti и Г2, как это было описано в пп. 14.2, 14.3.1, 14.3.3.

17.4.2. Таким образом, в игре Г4 игрок 1 выбирает свой вектор

первым, а игрок 2 выбирает г\ после него, имея уже полную информацию

о векторе , выбранном противником. В Г2 порядок выбора изменен на противоположный. Поэтому рассуждения из п. 14.3.1 здесь применимы

дословно. Игрок 1, выбирая £, может ожидать, что игрок 2 будет выбирать т] с целью минимизировать К (£, п), т. е. что выбор игроком 1 I ведет к min К (£, Г]). Это функция только от £; следовательно, игрок 1 должен

выбрать так, чтобы максимизировать min К (£, п). Таким образом,

->

значение для партии игры Г4 (для игрока 1) равно

-У -У

v[ = max min К (g, n). If л

Аналогично мы получаем, что значение для партии игры Г2 (для игрока 1) равно

, -> -у

v2 = min max К (£, n).



(Очевидное допущение о рациональном поведении противника не играет в действительности никакой роли, поскольку утверждения (14:А: а) - (14:А:е), (14:В:а) - (14:В:е) из пп. 14.3.1 и 14.3.3 применимы здесь дословно.)

Как это делалось в п. 14.4.1, можно обосновать тот очевидный факт, что игра Ti менее благоприятна для игрока 1, чем Г2, т. е. что

Если в справедливости этого возникнут какие-либо сомнения, то напомним, что строгое доказательство содержится в (13:А *) в п. 13.4.3. Употреб-

-> ->.

ляемые там выражения х, у, ф соответствуют нашим т), К *). Если окажется, что

то рассуждения из п. 14.5 применимы дословно. Утверждения (14:С:а) -

->

(14:C:f), (14:D:a), (14:D:b) определяют понятия оптимальных £ и г и устанавливают «значение» партии (для игрока 1):

v=v;=v;2).

Согласно (13:В) в п. 13.4.3, все это происходит в том и только в том случае, когда существует седловая точка функции К (переменные х, у, ф

-»- ->

соответствуют нашим £, ц, К).

17.5. Полная определенность в общем случае

17.5.1. Мы заменили v4 и v2 из (14:А:с) и (14:В:с) на vh и предыдущее обсуждение показывает, что последние могут играть роль первых. Однако мы теперь в такой же степени зависим от равенства vj - v2, как раньше от v4 = v2. Естествен поэтому вопрос: приобрели ли мы что либо в результате такой замены?

Очевидно, что приобрели, если, имея равенство у[ = v2 (для любой заданной игры Г), мы располагаем лучшими перспективами, чем имея равенство v4 = v2. Мы называли игру Г вполне определенной, если имели v4 = v2. Нам представляется целесообразным фиксировать теперь различие и называть игру Г в случае v4 = v2 вполне определенной в частном, а в случае = v2 вполне определенной в общем. Такая терминология будет правомерной только в том случае, когда из первого будет следовать второе.

С точки зрения здравого смысла эта импликация вполне правдоподобна. Введение смешанных стратегий увеличивает возможность игрока обороняться против раскрытия его стратегии противником; поэтому можно ожидать, что числа у[ и v2 действительно лежат между v4 и v2. Иными словами, можно утверждать, что (17:3) v4 <; v; v: v2

(это неравенство гарантирует, конечно, правомерность использования только что упомянутой импликации).

г) Хотя и г) - векторы, т. е. последовательности вещественных чисел . . . и (%, ..., Лз2Ь но кажДЬ1И из них можно рассматривать как переменную в операциях max и min. Областями их изменения являются, конечно, и введенные нами в п. 17.2.

2) Подробное повторение рассматриваемых доводов дано в п. 17.8.



Чтобы устранить все возможные сомнения, дадим строгое доказательство неравенства (17:3). Это удобно сделать как следствие другого утверждения.

17.5.2. Докажем вначале такую лемму:

(17:А) Для любого lSfil

Pi Р2 Pi

min К (1, т]) = min 2 2 fa, т2) £Tlnt2 = min 2 SK fa, т2) gTl.

~+ Ti=l T2=l Т2 Ti=l

Для любого r\£Sp2

Pi 32 32

max К (£, г]) = max 2 2 < fa, т2) gTl%2 = max 2 fa, т2) Лт2-

1 > Т2-1 Ti Т2=1

Доказательство. Докажем только первую из этих формул; доказательство второй в точности такое же, надо только заменить max

на min, а также на > .

->-

Если в качестве т] взять вектор б 2 (см. п. 16.1.3 и конец п. 17.2), то мы получим

3l 32 01 32

min 2 2 fa, r2) Sti%2=S 2 2 ж fa» т2) StA2tJ =

-> T1==lT2=l Ti==lT2=l

= 2 fa, т2) ?tr

Ti=l

Посколько это верно для всех т2, то

3i 32 3 i

(17:4:а) min 2 2 fa> тг) ЪххЧх2=кыт 2 fa, т2) gTl.

-> Ti=lT2==l Т2 Ti=l

С другой стороны, для всех т2

3i 3i

2 Ж fa. Т2) ETl min 2 fa, т2) En-

Ti=l Т2 Ti=l

Возьмем произвольное т] £ S$2, умножим обе стороны этого % нера-

венства на т]Т2 и просуммдруем по т2=1, 32. Поскольку 2 Лт*-1»

т2=1

мы получим

3l 32 01

2 2 fa, т2) tXlv)x2 min 2 fa, та) £Tl.

Ti=l T2=l Т2 Ti=l

->

Так как это верно для всех т), то должно быть

(17:4:Ь) min § % Ж (т„ т2) gTliT2 min 2 Ж (т,, т2) tl.

Т] Tl= 1 Т2= 1 Т2 Ti= 1

Теперь (17:4:а) и (17:4:Ь) дают требуемое соотношение.

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [ 54 ] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]