назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [ 76 ] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]


76

(см. рис. 29) на интервале и z rg v соответствует аналогичной нерегулярной части кривой а = о\ (на рис. 27) на том же самом интервале,

->

т. е. характеризует сложность оптимальных стратегий о*. Ограничение, наложенное на часть исследуемой кривой о = of (см. обсуждение после рис. 27), означает, что эта часть кривой б = 6* - 6* должна лежать в заштрихованном треугольнике (см. рис. 29).

19.15.3. Сравнение рис. 26 с рис. 28 и рис. 27 с рис. 29 показывает, что наши стратегии действительно являются оптимальными, т. е. они удовлетворяют (19:Н). Мы предоставляем читателю проверить это, аналогично тому как это было сделано при сравнении рис. 24 и рис. 25 в п. 19.9.

Из рис. (19:30*) или (19:32*) в п. 19.14.6 можно получить также и значение К. Оно таково *):

v , (а - 6)62 а (а + Зб)

Таким образом, игрок 1 имеет положительное Ожидаемое значение-партии - преимущество, являющееся правдоподобным следствием обладания инициативой 2).

19.16. Интерпретация решений. Заключение

19.16.1. Точно так же как в п. 19.10 обсуждались результаты, полученные в пп. 19.8, 19.9, следовало бы обсудить и результаты, полученные в п. 19.15. Мы не хотим этого делать в полном объеме и поэтому сделаем лишь несколько замечаний.

Мы видели, что на рис 26 и 27 появляются три зоны вместо двух зон на рис 24. На всех этих рисунках (т. е. для обоих игроков) наивысшая зона (крайняя справа) соответствует только высоким ставкам. Однако поведение в других зонах не столь единообразно.

Для игрока 2 (рис 27) средняя зона описывает тот тип блефа, который мы имели в самой низкой зоне на рис 24 - случайным образом чередуются высокая и низкая Ставки при одном и том же раскладе. Но соответствующие этим ставкам вероятности выбираются хотя и не произвольно, но* и не однозначно, как на рис 24 3). Существует низшая зона (на рис. 27), в которой игрок 2 всегда должен ставить мало, т. е. зона, где его расклад; слишком плох для смешанного поведения.

Кроме того, в средней зоне игрока 2 величины у* как на рис. 25, так и на рис. 28 так же несущественны, как и разность у* - у\ == 0 на< рис. 25. Таким образом, мотивы поведения в этой зоне столь же косвенны, как и те, которые обсуждались в последней части п. 19.10. Действительно, эти высокие ставки являются более действенной защитой от блефа, чем

г) Для количественной ориентировки: если а/Ь = 3, что соответствует отноше нию, при котором построены все наши рисунки, то и = 1/9, v = 7/9, К = 6/9.

2) При а/Ь ~ 3 оно равно примерно 6/9 (см. сноску выше), т. е. около 11% от низкой ставки.

3) См. обсуждение после рис. 27. Действительно, эти требования могут встретиться только при о\ = 0 и 1; например, o~f = 0 для меньшей дроби и aj = 1 для большей дроби Ь/а для среднего интервала.

Существование такого решения (т. е. никогда af Ф 0 или 1, а в силу рис. 26 такж& никогда р5 =т= 0 или 1) означает, конечно, что этот вариантявляется вполне определенным. Но рассуждение на этой основе (т. е. с чистыми стратегиями) не позволяет* построить решений, подобных фактически построенному на рис. 27.



просто блеф. Поскольку этой ставкой игрока 2 игра заканчивается, для последующих действий действительно нет никаких причин, в то время как блефу партнера необходимо противопоставить высокие ставки, вынуждая его тем самым к раскрытию.

Для игрока 1 (рис. 26) эта ситуация не такова. В высшей зоне он должен назначать высокие ставки, и ничего более; в средней зоне он должен назначать низкие ставки, и только. Эти высокие ставки на самых плохих раскладах - в то время как на средних раскладах делаются низкие ставки - являются агрессивным блефом в своем наиболее чистом виде. Значения 8? совсем не безразличны в этой зоне блефа (т. е. в низшей зоне): 6f - 6f > 0 на рис. 29, т. е. любое отступление от блефа в этих условиях приводит к немедленным потерям.

19.16.2. Итак, в нашем новом варианте покера можно различать два типа блефа: чисто агрессивный, используемый игроком, который владеет инициативой, и защитный (состоящий в том, чтобы время от времени раскрывать противника, подозреваемого в блефе, даже имея на руках скромные карты), используемый игроком, который ставит вторым. Наш исходный вариант, где инициатива поделена между двумя игроками - потому что они ставят одновременно,- содержит процедуру, которую теперь можно было бы назвать смесью этих двух поведений х).

Все это дает ценное эвристическое указание, как следует подходить к реальному покеру - с последовательностью (попеременных) ставок и повышений. Математическая задача сложна, но, по-видимому, использован еще не весь доступный аппарат. Это будет сделано в других наших работах.

*) Рассмотренный Э. Борелем вариант покера, упоминавшийся в замечании на стр. 208, порождает процедуру, имеющую некоторое сходство с нашей. Используя нашу терминологию, ход рассуждений Э. Бореля можно описать следующим образом.

Максимин (максимум для игрока 1, минимум для игрока 2) определяется как для чистых, так и для смешанных стратегий. Они идентичны, т. е. этот вариант является вполне определенным. Получающиеся при этом оптимальные стратегии несколько напоминают наши стратегии на рис. 27. Поэтому характеристики блефа не проявляются столь отчетливо, как на наших рис. 24 и 26. См. аналогичные рассуждения в приведенном выше тексте.



Глава V

ИГРЫ ТРЕХ ЛИЦ С НУЛЕВОЙ СУММОЙ

§ 20. ПРЕДВАРИТЕЛЬНЫЙ ОБЗОР

20.1. Общие соображения

20.1.1. Поскольку теория игр двух лиц с нулевой суммой уже завершена, мы сделаем следующий шаг по пути, намеченному в п. 12.4: построим теорию игр трех лиц с нулевой суммой. Это потребует совершенно новых точек зрения. Типы игр, обсуждавшихся до сих пор, также имели свои собственные характерные проблемы. Мы видели, что игра с одним игроком характеризовалась появлением задачи максимизации, а игра двух лиц с нулевой суммой - четко выраженной противоположностью интересов, которая уже не могла быть описана задачей максимизации. И так же, как переход от игры с одним игроком к игре двух лиц с нулевой суммой изменил чисто максимизационный характер проблемы, так переход от игры двух лиц с нулевой суммой к игре трех лиц с нулевой суммой уничтожает отчетливую противоположность интересов.

20.1.2. В самом деле, очевидно, что взаимоотношения между двумя игроками в игре трех лиц с нулевой суммой могут быть разнообразны. В игре двух лиц с нулевой суммой все, что выигрывает один игрок, необходимо проигрывает другой, и наоборот. Поэтому такой игре всегда присущ абсолютный антагонизм интересов. В игре трех лиц с нулевой суммой некоторый конкретный ход игрока, который простоты ради предполагается несомненно выгодным для него, может быть невыгодным для обоих других игроков. Но он может быть также выгодным для одного из противников и (тем более) невыгодным для другого х). Таким образом, у некоторых игроков время от времени могут быть совпадающие интересы, и можно догадаться, что понадобится более сложная теория даже для того, чтобы решить, является ли это совпадение интересов полным, частичным и т. д. С другой стороны, в игре должна существовать противоположность интересов (это игра с нулевой суммой), и, таким образом, теория должна будет распутывать сложные ситуации, которые могут встретиться.

Может случиться, в частности, что игрок имеет выбор среди различных линий поведения. Он может управлять своим поведением так, чтобы оно соответствовало интересам другого игрока или же противоречило им, а также выбирать, с каким из двух других игроков ему установить контакт и (возможно) в какой именно степени.

20.1.3. Как только появляется возможность совпадения интересов, встает вопрос о выборе союзника. Когда союз создан, следует ожидать, что будут необходимы некоторого рода взаимные £ соглашения между двумя игроками, входящими в него. Это можно сформулировать следующим образом. Совпадение интересов делает кооперацию желательной

г) Все это, конечно, связано с теми же трудностями, которые мы уже рассмотрели и преодолели в случае игры двух лиц с нулевой суммой: является ли отдельный ход выгодным или невыгодным для некоторого игрока, может зависеть не только от его хода, но также от того, что делают другие игроки. Однако сначала мы попытаемся выделить новые трудности и анализировать их в наиболее чистой форме. Затем мы обсудим их связь со старыми.

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [ 76 ] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]