19.8. Математическое построение решения
~>
19.8.1. Приступим теперь к построению оптимальных стратегий р2, т. е. решения, определяемого условием (19:В) из п. 19.7.
Предположим сначала, что всегда р > О х). Для такого z необходимо min у2- = у2; следовательно, у* у*, т. е.
Подстановка сюда выражений из (9:9:а*), (19:9:b*) дает
Z 1 1
(19:11) (а-Ь) ( \ pji&i- J pjid) +26 { pjufeO.
0 z z
Обозначим, далее, через z° верхний предел тех z, для которых р£ > 0 2).
Тогда в силу непрерывности неравенство (19:11) справедливо также и для
z = z°. Поскольку для Zi > z° не может иметь места неравенство pf1 >*0
(по предположению), интеграл £ р2* cfei в (19:11) равен нулю. Поэтому
можно поставить перед ним знак «+» вместо знака «-», тогда из (19:11) мы получаем
{а-Ь)\ p?dZi + 2b j pjidzO.
О zo
Но по предположению р21 всегда Ои иногда >0; следовательно, первое слагаемое всегда3»4) >0. Понятно, что второе слагаемое ;>0. Таким образом, получено противоречие, т. е. мы показали, что 5)
{19:12) р*-0.
19.8.2. Исключив / = 2, проанализируем теперь связь между / = 1 и у = 3. Поскольку pf = 0, должно быть р2 + р = 1, т. е.
(19:13) P5=l-tf,
и, следовательно,
(19:14) Opfl.
г) То есть что рассматриваемая оптимальная стратегия осуществляется при 7 = 2, т. е. при низкой ставке с последующим (предполагаемым) раскрытием при определенных условиях.
2) То есть наибольшее z°, для которого справедливо неравенство р > 0 при z, сколь угодно близких к 2° (мы не требуем выполнения неравенства pf > 0 для всех z<z°). Такое 2° заведомо существует, если .существует z, для которого р > 0.
3) Конечно, а - Ъ > 0.
4) Нет необходимости, по-видимому, прибегать к детальным и точным положениям теории интегрирования, меры и т. д. Мы предполагаем, что наши функции достаточно гладки, и поэтому положительная функция имеет положительный интеграл И т. д. Не составляет труда дать строгое обоснование, если воспользоваться упомянутыми выше математическими теориями.
5) Читателю следует переформулировать это словесно. Мы исключили низкие ставки с последующим (предполагаемым) раскрытием посредством анализа условий для гипотетического верхнего предела раскладов, для которых они могли бы быть сделаны, и показали, что для случаев, по крайней мере близких к таким, предпочтительнее сразу высокая ставка. Это обусловлено, конечно, нашим упрощением, которое запрещает «переторговывание».
Далее, на интервале 0 z 1 могут существовать подинтервалыг для которых всегда pf = О или всегда р* = 1 х). Всякое z, не принадлежащее ни одному из подинтервалов такого типа, т. е. вблизи которого справедливо как pf Ф О, так и pf Ф 1, мы будем называть промежуточными. Поскольку из pf == 0 или из pf == 1 (т. е. из pf Ф 0) вытекает, что minyf =
= yf или Yf соответственно, мы видим, что вблизи любого промежуточного z выполняется как неравенство yf yf, так и неравенство yyf Следовательно, для таких z в силу непрерывности мы имеем 2) у\ = у, т. е*.
Подставляя (19:9:а*), (19:9:с*) и вспоминая (19:12), (19:13), мы получаем:
2 1 1
(а + 6) j pji dz± - (а - 6) j р? dz4 + 26 j (1 - pji) dz* = 0,
0 2 2
т. е.
(19:15) (a+ 6) ( j pf1- ( pj1) + 26(1 -z)=0.
Рассмотрим теперь два промежуточных z, z". Подставляя в (19:15) z = zr и z = z" и вычитая, мы получим
2"
2(a + b) j pfidz4 - 26(z" - z) = 0;
отсюда
2"
(19:16) F=FjpP&i = ST?-
Словесно это означает, что между двумя промежуточными ъ1 и z" среднее-
значение р\ равно -р .
Далее, ни одно из тождеств pf = 0 и pf = 1 не может выполняться на всем интервале
zzz",
поскольку среднее значение было бы тогда равно 0 или 1. Следовательно, этот интервал должен содержать еще хотя бы одно промежуточное z, т. е. между любыми двумя промежуточными z лежит хотя бы одно третье промежуточное z. Повторение этих рассуждений показывает, что между двумя промежуточными z и z" другие промежуточные z лежат всюду плотно. Поэтому z и z", для которых выполняется (19:16), лежат всюду плотно* между z и z". Но тогда в силу непрерывности соотношение (19:16) должно* иметь место для всех z, z" 3) между z и z". Это не оставляет иной возможности, кроме как утверждать, что р\ = всюду между z и z".
г) То есть когда стратегия предписывает игроку делать всегда высокую ставку либо всегда делать низкую ставку (с последующим пасованием).
2) Величины у\ определяются интегралами (19:9:а*), (19:9:Ь*), (19:9:с*); поэтому они заведомо непрерывны.
3) Интеграл в (19:16), конечно, непрерывен.
Замечание. Очевидно, при этом допускаются изолированные исключения,, составляющие область z меры 0, т. е. область общей нулевой вероятности (например, конечное число фиксированных значений z). Они не влияют на интегралы. Легко провести точное математическое рассуждение, но, по-видимому, оно здесь не требуется (см. сноску 4 на стр. 221). Таким образом, наиболее простым будет, по-видимому г
предположение, что pf = в интервале z z z", без каких бы то ни было
исключений.
Это следует иметь в виду при рассмотрении формул на следующих страницах,, где, с одной стороны, имеется интервал ъ z z" h, с другой стороны, интервалы О < z <с z и z" <С ъ 1. Иначе говоря, точки, z и z" отнесены к первому из названных интервалов. Это, конечно, не является существенным: две фиксированные изолированные точки - в данном случае z и z" - можно рассмотреть произвольным, образом (см. выше).
Читатель должен заметить, однако, что, в то время как при сравнении между собой значений z нет существенных , различий между случаями << и , для у2- дело* обстоит иначе. Мы видели, что из неравенства yf > Уз вытекало pf = 0. Однако из неравенства yf = Уз аналогичных заключений сделать нельзя. (Ср. также обсуждение рис. 25 и рис. 28, 29.)
19.8.3. Далее, если промежуточные z существуют, то существуют также наименьшее и наибольшее среди них; обозначим их через z, z" Мы имеем:
(19:17) pz==-р. всюду в zfzz\
Если промежуточных z нет, то должно быть pf == 0 (для всех z) или pf = 1 (для всех z). Легко видеть, что ни одно из них не является решением *). Поэтому промежуточные z заведомо существуют, а с ними существуют и V, z", так что формула (19:17) справедлива.
19.8.4. Левая часть в (19:15) равна у* - у* при всех z; следовательно, для z = 1 мы имеем
У1-У\ = (а + Ъ) Jp?tfei>0
(поскольку случай pf1 = 0 исключен). В силу непрерывности неравенство* Уз ~~~ 7i > 0 или yl <С 7з остается справедливым даже при значениях z, близких к 1. Тогда для этих z будет pf. = 0, т. е. pf =1. Таким образом, из (19:17) с необходимостью вытекает, что z" <С 1. Далее, пусть в интервале z" z 1 не существует промежуточных z; тогда во всем этом интервале мы имеем pf = 0 или же pf = 1. Первую из этих возможностей наши предыдущие результаты исключают. Следовательно,
(19:18) = 1 всюду в ?z<;l.
19.8.5. Рассмотрим, наконец, нижнюю границу z в (19:17). Если z > 0, то мы имеем интервал 0 z z. Этот интервал не содержит
х) Иначе говоря, ни высокая ставка, ни низкая ставка (с последующим пасованием) не будут при всех условиях оптимальными стратегиями.
Математическое доказательство. Пусть pf = 0. Находим: Y? = - Ь, Уз = +&; следовательно, у? < УЬ что противоречит р = 1 Ф 0. Пусть pz = 1. Находим: у\ = а, уЕ = Ь; следовательно, yl < Y?»что противоречит pf = 1 Ф 0~