назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [ 52 ] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]


52

Комбинируя (16:18:а) и (16:18:с), с одной стороны, и (16:18:Ь) и (16:18:с), с другой, мы получаем более простое, однако более слабое утверждение ** 2):

->

(16:F) Либо существует вектор х = {хи ..., xm}£Sm, для которого

(16:19:а) 2 a(h 1) Xj=0 Для i= 1, ..., п,

либо существует вектор w = {w1, ..., wn}£Sn, для которого

(16:19:Ь) 2 a(h i)wt0 для ; = 1, яг.

16.4.4. Рассмотрим теперь кососимметрическую матрицу a(i, 7), т. е. такую матрицу, которая совпадает со своей отрицательно транспонированной в смысле п. 16.4.2; в этом случае должно быть п = т и

a(i, ])= - а(7, i), £,/=1, гс.

Тогда условия (16:19:а) и (16:19:Ь) из п. 16.4.3 выражают одно и то же. Действительно, (16:19:Ь) записывается как

2 a (i, 7) wt 0;

это можно переписать как

- 2 а (/» 0 = 0 ИЛИ 2 а (h /) = 0.

i=l i=l

Нам остается взять 7, £ вместо i, j 3), и мы получаем

2 я (£> /) wj = 0» а затем взять л: вместо о?, и мы получаем 2 а (U j) Xj =э 0=1 . 3=1

0. Мы установили (16:19:а). Таким образом, мы можем заменить дизъюнкцию неравенств (16:19:а) и (16:19:Ь) на одно из них, например на (16:19:Ь). В результате мы получаем:

(16:G) Если матрица a(i, 7) является кососимметрической (поэтому

п = т), то существует вектор w = {w1, ..., wn) mSn, для которого

2 a (U ]) ЩО для 7 = 1, ..., п.

г) Альтернативы (16:19:а), (16:19:Ь) не исключают друг друга: их конъюнкция равносильна (16:18:с).

2) Этот результат мог бы быть получен непосредственно из окончательного результата п. 16.4.1. Действительно, (16:19:а) равносильно (16:16:а), а (16:19:Ь) является слабой формой (16:16:Ь). Мы привели более подробный вывод, так как он проясняет общее положение дел.

3) Заметим, что теперь при п = т это просто изменение обозначений!



§ 17. СМЕШАННЫЕ СТРАТЕГИИ. РЕШЕНИЕ ВСЕХ ИГР 17.1. Два элементарных примера

17.1.1. Для того чтобы преодолеть трудности в случае неполной определенности, который мы рассматриваем, в частности, в п. 14.7, лучше всего возвратиться к простейшим примерам. Это игра в «орлянку», а также игра «камень, мешок и ножницы» (см. пп. 14.7.2 и 14.7.3). Поскольку существует основанное на здравом смысле отношение к «проблемам», возникающим в этих играх, мы надеемся получить ключ к нахождению решения в случае неполной определенности игры двух лиц с нулевой суммой, рассматривая и анализируя это отношение.

Уже было замечено, что при игре в «орлянку» ни один из способов игры (ни выбор «герба», ни выбор «решетки является лучшим»), не и единственное, что имеет смысл,- это раскрыть намерения противника. Это, на первый взгляд, преграждает путь к решению, так как правила игры запрещают игрокам получать информацию* о выборах противника в момент совершения хода. Однако это обстоятельство не соответствует реальному положению дел: в игре в «орлянку» против мало-мальски разумного противника игрок не будет стремиться обнаружить намерения противника, а постарается скрыть свои собственные намерения, выбирая в последовательных партиях «герб» и «решетку» без какой-либо, закономерности. Таким образом, если мы попытаемся описать стратегию в одной партии - так как в действительности нам приходится рассматривать одну партию, а не целую их последовательность, - то предпочтительнее всего выразить это следующим образом. Стратегия игрока состоит не в выборе «герба» и не в выборе «решетки», а в выборе «герба» с вероятностью 1/2 и «решетки» с вероятностью 1/2.

17.1.2. Можно представить себе, что рациональный способ игры в «орлянку» состоит в том, чтобы перед совершением выбора в партии выбрать решение играть «герб» или «решетку» г) с помощью некоторого случайного устройства 50:50. Дело в том, что такая процедура предохраняет игрока от потерь. Действительно, что бы ни делал противник, ожидаемый выигрыш игрока равен нулю 2). Это верно, в частности, и тогда, когда противник играет «герб», и тогда, когда он играет «решетку», и тогда, когда он играет «герб» и «решетку» с некоторыми вероятностями 3).

Следовательно, если мы разрешим игроку в игре в «орлянку» использовать «статистическую» стратегию, т. е. «смешивать» возможные способы игры с некоторыми вероятностями (выбираемыми им самим), то он сможет избежать потерь. Действительно, выше мы определили статистическую стратегию, применяя которую игрок не может проиграть независимо от того, что бы ни делал его противник. То же самое верно и для противника, т. е. он может применять статистическую стратегию, которая не даст игроку выиграть независимо от его действий 4).

г) Например, игрок может бросить игральную кость так, чтобы противник не видел результата бросания, и выбирать «герб», если получившееся в результате бросания число четное, и «решетку» в противном случае.

2) Именно вероятность его выигрыша равна вероятности проигрыша, потому что в указанных условиях вероятность угадать, равно как и вероятность не угадать, равна 1/2, что бы противник ни предпринял.

3) Скажем р, 1 - р. Для самого игрока мы приняли вероятности 1/2, 1/2.

4) Все это, конечно, следует понимать в статистическом смысле: то, что игрок не может проиграть, означает, что вероятность проигрыша вероятности выигрыша. То, что он не может выиграть, означает, что первая вероятность не меньше второй. В действительности каждая партия будет заканчиваться выигрышем или проигрышем, поскольку «орлянка» не знает ничьих.



Читатель может заметить большое сходство этих рассуждений с рассуждениями из п. 14.5 1). С этой точки зрения является вполне законным рассматривать нуль как значение партии для игры в «орлянку», а статистическую смесь «герба» и «решетки» в пропорции 50:50 - как оптимальную стратегию.

Ситуация в игре «камень, мешок и ножницы» вполне аналогична. Здравый смысл подсказывает, что оптимальный способ игры заключается в выборе каждой из трех альтернатив с вероятностями 1/3 2). Значение партии, как и обоснование качества такой стратегии, может быть мотивировано так же, как и в предыдущем случае 3).

17.2. Обобщение изложенной точки зрения

17.2.1. Представляются правдоподобными попытки распространить результаты, полученные для игр в «орлянку» и в «камень, мешок и ножницы», на все игры двух лиц с нулевой суммой.

Мы будем иметь дело с нормальной формой игры, принимая, как и раньше, т4 = 1, . . ., Pi и т2 = 1, . . ., Р2 в качестве возможных выборов игроков и считая выигрыш игрока 1 равным Ж т2). Мы не делаем здесь предположений о полной определенности игры.

Попытаемся повторить процедуру, оказавшуюся успешной в п. 17.1. Это значит, что мы будем рассматривать игроков, для которых «теория» игры заключается не в выборе определенных, стратегий, а в выборе нескольких стратегий с определенными вероятностями 4). Таким образом, игрок 1 будет выбирать не число т4 = 1, . . ., р1? т. е. не стратегию 2*1, a Pi чисел £1? . . ., \§х - соответственно вероятности стратегий 2}, . . ., 2J*1. Аналогично игрок 2 будет выбирать не число т2 = = 1, . . ., р2, т. е. не стратегию 2J2, а р2 чисел tji, . . ., г)з2, которые являются вероятностями стратегий 22, . . ., 2f2. Поскольку эти вероятности относятся к попарно несовместимым и единственно возможным альтернативам, числа £Т1 и %2 подчиняются условиям

(17:1:а) gTl0, Sgtl = l,

(17:l:b) тьО, 2 Лт2 = 1

т2=1

и никаким другим.

Образуем векторы \ = . . ., и т] = {г]!, . . ., щ2}. Только

-> ->

что выписанные условия означают, что £ £ S$v a rj £ S$2 (см. п. 16.2.2).

При таком положении дел игрок выбирает не стратегии, как раньше, а только вероятности, с которыми он использует их в партии. Это

А) Имеются в виду утверждения (14:C:d) и (14:С:е) из п. 14.5.1.

2) Как и ранее, здесь можно использовать случайное устройство. Одним из возможных является прием, упомянутый в сноске 1 на стр. 168. Например, игрок может выбрать «камень», если на кости выпадают 1 или 2, «мешок», если выпадают 3 и 4, и «ножницы», если выпадают 5 или 6.

3) В игре «камень, мешок и ножницы» ничья существует, однако проигрыш не означает, что вероятность проигрыша 2 вероятности выигрыша, и выигрыш не означает обратного. См. сноску 4 на стр. 168.

4) То, что эти вероятности одни и те же для всех стратегий (в примерах предыдущего пункта 1/2, 1/2 или 1/3, 1/3, 1/3), является, конечно, случайностью. Можно ожидать, что это равенство появилось ввиду симметричности появления в этих играх различных альтернатив. Теперь мы переходим к допущению, что существенным в формировании стратегии было появление самих вероятностей, тогда как их конкретные значения носят второстепенный характер.

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [ 52 ] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]