назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [ 73 ] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]


73

(С) Каждому игроку надо предоставить возможность многократно делать ставки; следовало бы также рассмотреть случай, когда игроки делают ставки по очереди, а не одновременно (см. п. 19.3).

Задача, в которой учитываются одновременно все эти требования (А), (В) и (С) и требуется найти оптимальные стратегии, не решена. Поэтому сейчас мы должны удовлетвориться раздельным добавлением требова-ний (А), (В), (С).

Для (А) и (В) известны полные решения, в то время как для (С) полученные результаты очень незначительны. Подробное рассмотрение всех этих математических построений завело бы нас слишком далеко, поэтому мы сжато приведем эти результаты для (А), (В), (С).

19.12. Дискретные расклады

19.12.1. Рассмотрим сначала (А), т. е. вернемся к дискретной шкале раскладов s = 1, . . . , 5, которая была введена в конце п. 19.1.2 и использована в пп. 19.4-19.7. В этом случае решение во многом похоже на решение, описанное на рис. 24.

Вообще, р = 0 и существует такое s°, что pf = 1 для s > Д в то время как pf Ф 0 для s < s°. Кроме того, если мы изменим шкалу z (см. табл. 18), то величина (s° - l)/(S - 1) будет очень близка к (а - Ъ)1а *). Далее, точно так же как на рис. 24, мы имеем зону блефа, а выше нее зону высоких ставок.

Но числа pf для s < s°, т. е. в зоне блефа, не все равны или хотя бы близки к Ъ1(а + Ъ) на рис. 24 2). Они отклоняются от этого значения на величины, зависящие от некоторых арифметических особенностей числа S, но не стремящиеся к нулю при £->- оо. Однако, средние значения pf стремятся к --т-г3)- Иными словами:

а-\-Ь

Оптимальная стратегия дискретной игры очень похожа на оптимальную стратегию непрерывной, игры. Это справедливо для всех деталей, что касается разбиения на две зоны (зону блефа и зону высоких ставок); то же относится к положениям и размерам этих зон и к явлениям, происходящим в зоне высоких ставок. Однако в зоне блефа это применимо только к формулировкам «в среднем» (относительно нескольких раскладов примерно равной силы). Точные процедуры для отдельных раскладов могут сильно отличаться от приведенных на рис. 24 и зависят от арифметических особенностей чисел s и S (по отношению к alb) 4).

19.12.2. Таким образом, стратегия, соответствующая стратегии на

рис. 24 для s < s°, т. е. стратегия pf = для всех s< s°, не является

оптимальной и отличается от нее значительно. Тем не менее можно показать, что максимальные потери, которые можно понести, играя эту «среднюю» стратегию, невелики. Более точно, они стремятся к нулю при

S -> оо б).

2) Точнее говоря, (s° - 1)1 (S - 1) -> (а - Ь)/а при S -> оо.

2) То есть числа pf не стремятся к b/(a + Ь) при S оо, как бы ни изменялось s.

3) Фактически i/2 (pf + pf+1) = Ъ/(а + b) для большинства s < s°.

4) Таким образом, если говорить о рис. 24, левая часть графика не будет прямой

линией ( р = -в0 z --I , но она будет колебаться около нее как около

\ а + Ь ш ) J

среднего.

5) Фактически эта сходимость имеет порядок 1/S. Напомним, что в реальном покере S имеет порядок 2,5 миллиона (см. сноску 4 на стр. 209).



Итак, мы видим, что в дискретной игре корректное использование блефа является очень сложным и деликатным делом, которое предоставляет весьма небольшие преимущества блефующему игроку.

Возможно, что этоявление типичное и встречается в более сложных реальных играх. Оно показывает, сколь осторожным следует быть при формулировке предположений или утверждений, затрагивающих непрерывность в этой теории х). Но практическая значимость - т. е. размер выигрыша или проигрыша - по-видимому, не велика, и все это, вероятно, является «белым пятном» даже для самых опытных игроков.

19.13. т возможных ставок

19.13.1. Рассмотрим второй случай, (В), т.е. предположим, что расклады по-прежнему непрерывны, но допускается назначение ставок более чем двумя способами. Иными словами, мы заменяем две ставки

а>6(>0)

на ряд, скажем, из т ставок

«i > а2 > ... > tfm-i > ат (> 0).

В этом случае решение также напоминает решение, описываемое на рис. 24 2). Существует такое 3) z°, что для z > z° игроку не следует делать ничего, кроме назначения самых высоких ставок, в то время как при z<z° ему следует случайным образом с определенными вероятностями варьировать ставки (назначать различные ставки, всегда включая самую большую аг). Какие ставки и с какими вероятностями следует делать, определяется значением z.

Замечание. Если ставки, которые он должен назначить, суть ар, aq, ... . . ., ап (1 < р < д< . . . <с п), то можно показать, что вероятности, с которыми эти ставки следует назначать, должны быть соответственно равны

ill J (с==±+±+ + ±\

cat сар caq * сап \ at ~ ар* * " ~ ап )

Иными словами, вероятность каждой ставки, которая может быть назначена, должна быть обратно пропорциональна ее величине.

Какие именно ар, aq, . . . , ат следует выбирать на самом деле при данном z, определяется более сложным критерием, который мы не будем здесь рассматривать.

Заметим, что величина с необходима только для того, чтобы сумма всех вероятностей была равна 1. Читатель может сам проверить, что вероятности на рис. 24 равны этим значениям.

Итак, мы имеемзону блефа и выше нее зону высоких ставок - фактически же только зону наивысших ставок,- именно так, как на рис. 24. Но блеф - в его собственной зоне z z° - имеет более сложную и изменяющуюся структуру, чем на рис. 24.

Мы не будем вдаваться в детальный анализ этой структуры, хотя это и представляет определенный интерес. Однако одну из ее особенностей мы упомянем.

J) В связи с этим напомним проблему, сформулированную во второй части замечания на стр. 220.

2) На самом деле это верно только при некотором дополнительном ограничении, запрещающем раскрытие при более высокой ставке. Иными словами, предполагается, что каждый игрок сразу делает свою последнюю наивысшую ставку и пасует (соглашаясь с последствиями), если ставка противника превзойдет его собственную.

3) Аналог величины ъ ~--на рис. 24.



19.13.2. Пусть даны два числа

а>6>0.

Возьмем их в качестве высшей и низшей ставок:

ai = a, ат - Ъ.

Далее, пусть т-> оо и выберем оставшиеся ставки а2, . ...am-i так, чтобы они заполняли интервал

с неограниченно возрастающей плотностью (см. приведенные ниже в сноске 1 на этой стр. два примера). Если теперь описанная выше оптимальная стратегия стремится к пределу, т. е. к асимптотической стратегии при т -> оо, то предельную стратегию можно интерпретировать как оптимальную стратегию для игры, в которой размеры ставок лежат между верхней и нижней границами (а и Ъ) и могут быть любыми числами между ними (т. е. в (19:24)). Тем самым снимается упомянутое в начале п. 19.3 требование минимального интервала между ставками.

Теперь этого нет. Например, мы можем вставить между ах = а и ат = Ъ числа а2, . . . , am i как в арифметической, так и в геометрической прогрессии1). В обоих случаях при т -> оо получаются некоторые асимптотические стратегии, но эти две стратегии отличаются многими существенными деталями.

Если мы рассмотрим игру, в которой все ставки (19:24) допустимы и в этом смысле являются равноправными, то в этом случае возможно непосредственное нахождение оптимальных стратегий. При этом оказывается, что оптимальными будутчне только обе упомянутые выше стратегии, но и многие другие.

Это показывает, к каким осложнениям можно прийти, отказавшись от минимального интервала между ставками. Именно оптимальная стратегия предельного случая не может служить приближением для оптимальных стратегий всех близких случаев с конечным числом ставок. Тем самым еще раз подчеркивается значимость заключительных замечаний

19.14.1. Рассмотрим третий, последний случай, (С). Единственный полученный пока результат в этом направлении состоит в том, что мы можем заменить одновременные ставки обоих игроков на две последовательные, т. е. договориться, что сначала назначает ставку игрок 1, а затем игрок 2.

Таким образом, формулированные в п. 19.4 правила модифицируются следующим образом.

х) В первом случае они определяются по формуле

(19:24)

в п. 19.12.

19.14. Чередующиеся ставки

((га-р)а-\-(р-1) Ь) для р = 1,2,...,т - 1, /п,

во втором случае-по формуле

ар=т угат-РЫ>-1ъ для р=\, 2,

т - \, т.

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [ 73 ] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]