(19:30*) К=2 J У?*?***
о о
22 1
(19:31 :а*) Y?2 = j (- ар\1 - Ър?) dzt + J (ap2i + 6p2i) dzu
0 22
22 1
(19:31:Ь*) y22 = j (6p2i - 6p2i) dzt + j (bp? - bpp) dz>
*) Имеется в виду по / (i), но не по s2, j (su i)l
Поскольку эта игра уже не симметрична, нам нужны такие модификации формул, в которых роли двух игроков меняются. Это следующие формулы:
(19:32) К(р\ ..., ps а1, .. .,os) = -jr 2 W.
8Ь г
с коэффициентами
~s~ б*х=ж 2 <si-s2) (*> /) °?
S2,i
или, если использовать матричные схемы табл. 20 - 21,
81-1 8
(19:33:а) fiji = -L { 2 (оо? + 6о*2) + бор + 2 (- оо? + бор)} ,
S2=l 82=Si~{-l
81-1 S
(19:33:Ь) вр = { 2 (6*?2 +62) + 2 (-Ьо?-Ьо?)} .
S2== 1 S2=Si+l
Далее, критерии того, что стратегии оптимальны, остаются, по существу,, теми же, что и в.п. 19.6. Это значит, что, благодаря асимметричности, рассматриваемого сейчас варианта, наш критерий будет получен из общего-критерия (17:D) в п. 17.9, точно так же, как можно было бы из симметричного критерия в конце п. 17.11.2 получить критерий в п. 19.6.
-> -> -> -+•
(19 :G) Векторы р1, . . . , ps и о\ . . . , os (все они принадлежат $2}
описывают оптимальную стратегию в том и только том случае,
когда справедливо следующее:
Для каждой пары s2l jf, для которой yf не достигает минимума
(по У *)), имеем of2 = 0. Для каждой пары su i, для которой б®1
не достигает максимума (по i*)), имеем pf1 = 0.
19.14.6. Заменим теперь дискретные расклады sA, s2 на непрерывные в смысле п. 19.7. (См., в частности, табл. 18.) Это приводит, как было
-► -У
описано в п. 19.7, к замене векторов p8i, aS2 (su s2 = 1, . . - , S) на векторы
р21, a22 (0 zi9 z2 1), которые по-прежнему являются вероятностными векторами той же самой природы, т. е. принадлежат S2. Так вместо компонент pf1, of появляются компоненты р\1 о)9. Аналогично величины
б?1, yf переходят в б?1, yf. Суммы в наших формулах (19:30), (19:31 :а), (19:31 :Ь) и (19:32), (19:33:а), (19:33:Ь) переходят в интегралы, подобна тому как это было с (19:7*), (19:9:а*), (19:9:Ь*), (19:9:с*) в п. 19.7. Итак, мы получаем
{19:32*) <19:33:а*)
(19:33:Ь*)
к=2 $ W1!,
г О
6fi= (aaf2 + baj2)dz2+ j ( - ao\2-\-bof) dz2,
0 zi
6*i = j (baf» + bo?) dz2 + j (- 6af2 - bof)dz2.
Соответственно преобразуется теперь и наш критерий для оптимальных стратегий. (Подобно тому как был осуществлен переход от дискретного критерия в п. 19.6 к непрерывному критерию в п. 19.7.) Мы получаем:
-> ->
(19:Н) Векторы pzi и о22 (О zu z2 rg 1), принадлежащие £2, описывают оптимальную стратегию й том и только том случае, если: Для всех z2, /, для которых yf не достигает минимума (по *)), будет of = 0. Для всех zb i, для которых б!1 не достигает максимума (по г *)), будет р!1 = 0.
19.15. Математическое описание всех решений
19.15.1. Нахождение оптимальных стратегий р2 и о2, т. е. решений, определяемых неявным условием, установленным в конце п. 19.14, может быть осуществлено полностью. Математические методы, которые позволяют это сделать, аналогичны тем, которые были использованы для нахождения в п. 19.8 оптимальных стратегий в нашем исходном варианте покера,
V 1 z
V J 2
Рис. 26.
Рис. 27.
т. е. решений, задаваемых неявным условием, сформулированным в конце п. 19.7.
Мы не будем цриводить здесь математического рассмотрения, но опи-
-V -у
шем оптимальные стратегии pz и az, которые оно дает.
Существует одна и только одна оптимальная стратегия pz, в то время
как оптимальные стратегии oz образуют обширное семейство. См. рис. 26, 27. Фактические пропорции этих рисунков соответствуют случаю alb ~ 3. Здесь
(а - 6)6 д2 + 2д& -62
и- а(а + ЗЬ) V~ а(а + ЗЬ)
г) Имеется в виду по / (£), а не по z2, / (zu i)\
Сплошные линии изображают соответственно кривые р = pf и о = = of. Таким образом, превышение ординат сплошной линии над линией: р =0 (а - 0) равно вероятности высокой ставки pf (af), а превышение ординат линии р = 1 (а = 1) над сплошной линией равно вероятности низкой ставки pf = 1 - pf (of = 1 - of). Неправильная часть кривой
о = af (см. рис. 27) в интервале и 5g z v представляет сложность опти-
->
мальных стратегий az. Действительно, эта часть кривой а = of удовлетворяет следующим (необходимым и достаточным) условиям:
- (о?
V-ZQ J 1
если z0 - u,
> - , если m<Cz0<z;.
Это означает, что между и я v среднее значение af равно b/а, а на правом конце каждого такого интервала среднее значение af Ыа.
Таким образом, как рг, так и <тг соответствуют трем различным типам поведений на этих трех интервалахх).
Первый: Oz <. и. Второй: и <; z 5g у. Третий: i; < z <; 1. Длины этих интервалов соответственно равны и, и - и л I - у, а довольно сложные выражения для и ж v лучше всего запомнить с помощью следующих, легко проверяемых пропорций:
и а - Ъ
а + Ъ
1-и b
19.15.2. Формулы (19:31:а*), (19:31:Ь*) и (19:33:а*), (19:33:Ь*) позвр-ляют теперь вычислить коэффициенты у), б*. Вместо формул (как и в п. 19.& на рис. 25) мы дадим графическое представление, оставляя элементарную-
проверку читателю. Для проверки, являются ли pz, az оптимальными стратегиями, нужны только разности 6f - 6f, yl - у\. Действительног критерий в конце п. 19.14 можно переформулировать следующим образом..
Рис. 28.
Рис. 29.
Как только разность >0, должно быть pf = 0 или соответственно af = 0,, и как только разность <0, то pf = 0 или соответственно af = 0. Поэтому мы приводим графики этих разностей. (См. рис. 28, 29. Фактические пропорции этих рисунков соответствуют пропорциям рис. 26, 28, т. е. alb ~ 3. Здесь tg a = 2а, tg fi = 2Ь, tg у = 2 (а - Ь).)
Линия на рис. 28 изображает кривую у = yl - у\, а линия на рис. 29> изображает кривую б = 8f - 6f. Нерегулярная часть кривой б = 6f - Ь%
г) О граничных точках этих интервалов см. замечание на стр. 223.