назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [ 71 ] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]


71

промежуточных z; следовательно, мы имеем в интервале 0 :g z :g z либо всюду pf s== 0, либо всюду pf = 1. Первая производная от у% - -yf, т. е. от левой части (19jl5), равна, очевидно, 2 (а + 6) pf - 26. Поэтому в интервале 0 z < z эта производная равна 2 (а + 6)-О - 26 = -26 < <0, если pf = 0, и 2 (а + 6)-1 - 26 = 2а >J3, если pf = 1; таким образом, разность у* - yf в интервале 0 rg z < z или монотонно убывает, или монотонно возрастает. Поскольку на правом конце (промежуточная точка z) ее значение равно нулю, мы имеем соответственно у\ - у\> О или < 0, т. е. соответственно Yf < 4l или Tf > Vl ВСЮДУ на интервале О fg z <С z. Тогда из первого неравенства мы заключаем, что в интервале О rg z < z должно быть pf = 0, pf = 1, а из последнего, что pf == 0. Но вначале мы предположили, что на этом интервале соответственно pf == 0 или pf = 1. Таким образом, в каждом из случаев получено противоречие.

Следовательно,

(19:19) ? = 0.

19.8.6. Теперь для определения z" воспользуемся тождеством (19:15), лодставив туда промежуточное z = z = 0. Мы получаем

Но (19:17), (19:18), (19:19) дают 1

•(а + Ь) j pfidz1 + 2b==0,

Таким образом, мы имеем

,1 а -„ 2Ъ 1--rrZ

a-\-b a-\-b

а -„ л 2b а - b Z = 1

т. е.

(19:20) , ?==-

Воспользовавшись (19:17), (19:18), (19:19), (19:20), получаем

для Org zgi-,

<19:21) рг=<

1 для -<С z = 1

Вместе с (19:12), (19:13) это полностью описывает стратегию.



19.9. Детальный анализ решения

Рис. 24>

19.9.1. Полученные в п. 19.8 результаты показывают, что для рассматриваемой формы покера существует одна и только одна оптимальная стратегия х). Она описывается формулами (19:21), (19:12), (19:13) из п. 19.8. Мы изобразили эту стратегию графически, что облегчит последующее ее обсуждение. (См. рис. 24. Фактические пропорции этого чертежа соответствуют отношению alb ~ 3.)

Сплошная линия описывает кривую р = pf. Таким образом, высота этой линии над линией р = 0 равна вероятности высокой ставки pf; превышение линии р = 1 над сплошной линией равно вероятности низкой ставки (с обязательным последующим пасованием): pf = 1 - pf.

19.9.2. Формулы (19:9:а*), (19:9:Ь*), (19:9:с*) из п. 19.7 позволяют вычислить теперь коэффициенты у). Вместо формул мы дадим графическую интерпретацию, предоставляя читателю элементарную проверку. (См. рис. 25. Фактические пропорции остались здесь теми же, что и

на рис. 24, т. е. alb ~ 3.) Сплошная линия соответствует кривой у = Yf, точечная линия - кривой у = у*, а пунктирная?линия - кривой у = у На рисунке видно, что сплошная и пунктирная линии (т. е. yl и у*) совпадают на интервале 0 z (а - \р)1а, а линии точечная и пунктирная (т. е. у\ и у\) - на интервале (а - Ъ)1а z 1. Каждая из трех кривых составлена из двух отрезков, с общим концом в точке

z = а-- . Фактические значения

величин у) в критических точках z = О, (а - Ь)/а, 1 можно увидеть на рисунке 2).

19.9.3. Сравнение рис. 24 и 25 показывает, что наша стратегия дей-Рис. 25. ствительно является оптимальной,

т. е. что она удовлетворяет условию (19:В) из п. 19.7. В самом деле, на интервале 0 g z fg (а - Ь)/а, где выполняются оба неравенства pf =0, pf Ф 0, как кривая у\, так и

х) Фактически мы доказали только следующее утверждение. Никакая стратегия, отличная от стратегии, определенной в п. 19.8, не может быть оптимальной. То, что эта стратегия на самом деле является оптимальной, можно было бы заключить из существования (по крайней мере) одной оптимальной стратегии, хотя наш переход к «непрерывному» случаю и может вызвать некоторое сомнение. Далее мы убедимся в том, что рассматриваемая нами стратегия является оптимальной, т. е. что она удовлетворяет условию (19:В) из п. 19.7.

2) Проверку этих результатов мы предоставляем читателю.

b(3a-b) а+Ь

Ь(ЗЬ-а)

a-b\ а \

b(3a-b)

a-hb



кривая yl являются нижними, т. е. их ординаты равны min yj. На интервале

(а - Ъ)1а < z rg 1, где только pf Ф 0, только одна кривая у\ оказывается

нижней, т. е. ее ординаты равны min у]. (Поведение у\ несущественно,

поскольку всегда pf = 0.)

Формула (19:7*) из п. 19.7 позволяет вычислить также значение партии К. Очевидно, К = 0. Именно этого значения и следовало ожидать,, поскольку игра симметрична.

19.10. Интерпретация решения

19.10.1. Хотя результаты из пп. 19.8 и 19.9 являются математически завершенными, они, однако, требуют некоторых комментариев и интерпретации, изложением которых мы сейчас и займемся.

Во-первых, изображение оптимальной стратегии, представленное на рис. 24, показывает, что для достаточно высокого расклада оказывается pf = 1, т. е. игрок должен назначать обязательно высокую ставку.

Этот случай соответствует раскладам z > - Для младших раскладов,

однако, pf = » Рз - 1 ~~ Pf = цп так что как Pi так и Рз отличны от нуля, т. е. игроку следует назначать беспорядочно высокие и низкие ставки (с определенными вероятностями). Этот случай соответствует

раскладам z rgj ~~ъ • Высокие ставки (в этом случае) будут более редкими,,

чем низкие; действительно, £ = у , а а > 6. Эта последняя формула

показывает также, что последний тип высоких ставок становится все более редким, если размер высокой ставки (по сравнению с низкой) возрастает.

Теперь эти высокие ставки при младших раскладах, которые делаются беспорядочно (с определенными вероятностями) и которые становятся все более редкими с ростом цены высокой ставки, получают очевидную интерпретацию: они являются блефом в обычном покере.

Благодаря большим упрощениям, которые мы приняли при нашем анализе покера, блеф вошел в самом зачаточном виде, но тем не менее признаки его несомненны. Игроку целесообразно всегда назначать высокую ставку при старшем раскладе (z > (а - Ъ)1а) и, как правило, назначать низкую ставку (с вероятностью а/(а + Ь)) при младшем раскладе (z <С (а - Ъ)1а)\ вместе с тем иногда надо беспорядочно блефовать

(с вероятностью •

19.10.2. Во-вторых, условия в зоне блефа, 0 rg z rg а-- , также

проливают некоторый свет на другие факты - на такие последствия отхода от оптимальной стратегии, как «перманентная оптимальность», «защита», «нападение», как это рассматривалось в пп. 17.10.1, 17.10.2.

Предположим, что игрок 2 отклоняется от своей оптимальной стратегии, т. е. использует вероятности о*, которые могут отличаться от чисел pj, полученных выше. Кроме того, предположим, что игрок 1 тем не менее продолжает использовать вероятности pf, т. е. применяет оптимальную стратегию. Тогда мы можем воспользоваться gформулами (19:9:а*), (19:9:Ь*), (19:9:с*) из п. 19.7 для определения чисел у), графически пред-

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [ 71 ] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]