Числа Si, s2 появляются в результате случайных ходов, как это описано выше. Поэтому1)
Ж (i ... ,i& I 7i, • - •» 7s) - "i" 2 sign(si-s2) 7*82)-
81» S2=l
19.5.2. Перейдем теперь к смешанным стратегиям в смысле п.17.2. -у ->
Они являются векторами т), принадлежащими множеству iSp. Имея в виду используемые сейчас обозначения, мы должны задать компоненты этих векторов также по-новому. Мы должны писать 1ц.....is, 1\Н,-*з8 вместо
Напишем формулу (17:2) из п.17.4.1, оценивающую ожидаемый выигрыш игрока 1:
к(1» Л)= 2 - • - * *s 17±» - - - .7s) Eii..........is =
ii, ...,is, ii, .... js
~~£2~ 2 2 sign(si-s2) (?8ц *s2) in, • i8.
h.....*Si ii..... is si, s2
Изменим здесь порядок суммирования, тогда
К(Е» Г0=~2~~2 2 sign(si-s2) (*sn *s2) lii, igHil, ;s-
81, S2 H, is, ii, js
Если теперь положить
(19:1) рГ= S Ьх.....is,
ii, is, исключая iSl *si=*
(19:2) o?=. . S . r,ix.....is,
3i, •••» Jg* исключая jS2
то наше равенство можно переписать в виде
(19:3) К(Гч)42 2 ЯШЫ-н) (i, ]) РМ
si, s2 i, i
Целесообразно пояснить смысл равенств (19:1) - (19:3).
Равенство (19:1) показывает, что pf1 есть вероятность того, что игрок 1, использующий смешанную стратегию £, выберет i, имея расклад sA; равенство (19:2) показывает, что of есть вероятность того, что игрок 2, использующий смешанную стратегию ц, выберет /, имея 2) расклад s2.
г) Читатель может проверить, что тождество
Ж . . ., is I /1, • • /s) = - Ж (/i, . . ., is I ii, • • is) является следствием соотношений в конце сноски 3 на стр. 214, т. е. матрица
Ж {ц, . . ., is I /V, • • .» 7s)
является кососимметрической, что еще раз подчеркивает симметричность игры.
2) Из п. 19.4 нам известно, что i или/ = 1 соответствует «высокой» ставке, i = 2,3 соответствует низкой ставке с последующим раскрытием или пасованием.
Теперь интуитивно ясно, что ожидаемое значение К (I, ц) зависит только от этих вероятностей pf1, of и не зависит от отдельных вероятностей
Замечание. Это означает, что две различные смешанные (чистые) стратегии могут с точки зрения фактического эффекта быть одинаковыми.
Для иллюстрации этого рассмотрим простой пример. Пусть S - 2, т. е. имеются только высокий и низкий расклады. Рассмотрим i = 2, 3 как один случай, т. е. пусть имеется только высокая и низкая ставки. Тогда будут существовать четыре возможные (чистые) стратегии, которым мы дадим специальные имена.
«Отважная»: при каждом раскладе высокая ставка.
«Осторожная»: при каждом раскладе низкая ставка.
«Нормальная»: высокая ставка при высоком раскладе и низкая при низком.
«Блеф»: высокая ставка при низком раскладе и низкая при высоком.
Тогда (50-50)-смесь отважной и осторожной стратегий эквивалентна (50-50)-
смеси нормальной стратегии и блефа, поскольку в каждом из этих случаев игрок будет,
в соответствии с исходом случайного испытания, назначать 50-50 высокую или низкую
ставку при любом раскладе.
Тем не менее в принятых нами обозначениях эти смешанные стратегии оказыва-
->
ются различными, т. е. они оказываются различными векторами £.
Это означает, конечно, что наши обозначения, будучи полностью подходящими в общем случае, оказываются для многих конкретных игр избыточными. Это частое явление при математических рассмотрениях, преследующих общие цели. Пока мы разрабатывали общую теорию, у нас не было причин принимать во внимание эту избыточность. Но сейчас, при рассмотрении конкретной игры, мы от нее избавимся.
Легко видеть, как непосредственно интерпретируется формула (19:3). Дляэтого достаточно вспомнить смысл функции Xsign (si-s2) (&» 1) и интерпретацию величин pf1, of.
19.5.3. Понятно, что как по своему смыслу, так и в силу формальных определений (19:1), (19:2) числа pf1, of удовлетворяют условиям
(19:4) все р?0, Spfl,
все ofO, 5Х2 = 1-
С другой стороны, любые pf1, of, удовлетворяющие этим условиям*
можно получить из соответствующих £, г] по формулам (19:1), (19:2). Это понятно как математически х), так и интуитивно. Любая система таких чисел pf1, of является набором вероятностей, определяющих возможный способ поведения. Поэтому они должны соответствовать некоторой смешанной стратегии.
Соотношения (19:4) и (19:5) дают возможность составлять трехмерные векторы
Тогда условия (19:4), (19:5) утверждают, что все pSl, принадлежат S3.
Это показывает, каких больших упрощений мы добились благодаря
-у ->-
введению этих векторов. Именно вектор (или т]) принадлежал S$,
*) Положим, например, £ib f ig = р1. . . pfg, т];ь . . is == ah а% и проверим, что (17:1:а) и (17:1:Ь) из п. 17.2.1 являются следствием условий (19:4),, (19:5).
(19:5)
т. е. зависел от р - 1 = 3s - 1 числовых параметров; psi (или о82) составляют множество, состоящее из S векторов в 53, т. е. каждый из них зависит от двух числовых констант. Число 3 - 1 много больше числа 2S даже при умеренных *) S.
19.6. Формулировка задачи
19.6. Поскольку мы имеем дело с симметричной игрой, мы можем
использовать характеристику оптимальных (смешанных) стратегий,
-> -
т. е. характеристику £ £ А, указанную в (17:Н) из п. 17.11.2. Она состоит
в следующем: стратегия £ должна быть оптимальной против самой себя, т. е. предполагается, что min К (g, ц) должен достигаться при ц =
~> ->
Далее, в п. 19.5 мы видели, что функция К (g, rj) фактически зависит -> -> ->-»>->->
OTpS1, aS2. Поэтому можно переписатьее в виде К (р1, . . ., psj а1, . . . , os).-Тогда формула (19:3) из п. 19.5.2 утверждает (мы несколько изменили порядок суммирования), что
(19:6) К (р\ ..., ps а\ ..., 0s) ==-L" 2 2 2Wn(Sl-82) (i, j) p!xaf,
si, г S2, j
и p1, ..., ps для оптимальной стратегии характеризуется тем, что
-> -* -> -> min К (р1, ..., ps a1, ..., os)
ai, a s
достигается при a1 = p1, . . ., as = ps. Можно найти и явные условия для этого, используя, по существу, тот же метод, который был применен
к аналогичной задаче в п. 17.9.1; мы сжато изложим его.
-> ->
Минимум по (а1, . . ., as) функции (19:6) равен минимуму, взятому
-> ->
отдельно по каждой из переменных а1, . . ., as. Рассмотрим поэтому
->
некоторую переменную oS2. Единственное ограничение, которому она удовлетворяет, состоит в принадлежности ее к £3, т. е.
все afO, 2о52=1. j=i
Функция (19:6) линейна по этим трем компонентам а®2, а2, в**. Следовательно, минимум по aS2 будет находиться там, где обратятся в нуль все те компоненты af, коэффициенты которых (по /, см. ниже) не достигают наименьшего возможного значения.
Обозначая через -- yf коэффициент при of, равный
~С2 2 <sign(s1-s2) {U /) рЛ
мы из (19:6) получаем
8i, г
(19:7) К (р1, ..., ps о1.....с*) = -±- 2 Yfor;
S2. J
*) В действительности £ равно приблизительно 2,5-10е (см. сноску 4 на стр. 209); поэтому оба числа 3s - 1 и 2S большие, но первое из них несравненно больше.