назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [ 68 ] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]


68

Числа Si, s2 появляются в результате случайных ходов, как это описано выше. Поэтому1)

Ж (i ... ,i& I 7i, • - •» 7s) - "i" 2 sign(si-s2) 7*82)-

81» S2=l

19.5.2. Перейдем теперь к смешанным стратегиям в смысле п.17.2. -у ->

Они являются векторами т), принадлежащими множеству iSp. Имея в виду используемые сейчас обозначения, мы должны задать компоненты этих векторов также по-новому. Мы должны писать 1ц.....is, 1\Н,-*з8 вместо

Напишем формулу (17:2) из п.17.4.1, оценивающую ожидаемый выигрыш игрока 1:

к(1» Л)= 2 - • - * *s 17±» - - - .7s) Eii..........is =

ii, ...,is, ii, .... js

~~£2~ 2 2 sign(si-s2) (?8ц *s2) in, • i8.

h.....*Si ii..... is si, s2

Изменим здесь порядок суммирования, тогда

К(Е» Г0=~2~~2 2 sign(si-s2) (*sn *s2) lii, igHil, ;s-

81, S2 H, is, ii, js

Если теперь положить

(19:1) рГ= S Ьх.....is,

ii, is, исключая iSl *si=*

(19:2) o?=. . S . r,ix.....is,

3i, •••» Jg* исключая jS2

то наше равенство можно переписать в виде

(19:3) К(Гч)42 2 ЯШЫ-н) (i, ]) РМ

si, s2 i, i

Целесообразно пояснить смысл равенств (19:1) - (19:3).

Равенство (19:1) показывает, что pf1 есть вероятность того, что игрок 1, использующий смешанную стратегию £, выберет i, имея расклад sA; равенство (19:2) показывает, что of есть вероятность того, что игрок 2, использующий смешанную стратегию ц, выберет /, имея 2) расклад s2.

г) Читатель может проверить, что тождество

Ж . . ., is I /1, • • /s) = - Ж (/i, . . ., is I ii, • • is) является следствием соотношений в конце сноски 3 на стр. 214, т. е. матрица

Ж {ц, . . ., is I /V, • • .» 7s)

является кососимметрической, что еще раз подчеркивает симметричность игры.

2) Из п. 19.4 нам известно, что i или/ = 1 соответствует «высокой» ставке, i = 2,3 соответствует низкой ставке с последующим раскрытием или пасованием.



Теперь интуитивно ясно, что ожидаемое значение К (I, ц) зависит только от этих вероятностей pf1, of и не зависит от отдельных вероятностей

Замечание. Это означает, что две различные смешанные (чистые) стратегии могут с точки зрения фактического эффекта быть одинаковыми.

Для иллюстрации этого рассмотрим простой пример. Пусть S - 2, т. е. имеются только высокий и низкий расклады. Рассмотрим i = 2, 3 как один случай, т. е. пусть имеется только высокая и низкая ставки. Тогда будут существовать четыре возможные (чистые) стратегии, которым мы дадим специальные имена.

«Отважная»: при каждом раскладе высокая ставка.

«Осторожная»: при каждом раскладе низкая ставка.

«Нормальная»: высокая ставка при высоком раскладе и низкая при низком.

«Блеф»: высокая ставка при низком раскладе и низкая при высоком.

Тогда (50-50)-смесь отважной и осторожной стратегий эквивалентна (50-50)-

смеси нормальной стратегии и блефа, поскольку в каждом из этих случаев игрок будет,

в соответствии с исходом случайного испытания, назначать 50-50 высокую или низкую

ставку при любом раскладе.

Тем не менее в принятых нами обозначениях эти смешанные стратегии оказыва-

->

ются различными, т. е. они оказываются различными векторами £.

Это означает, конечно, что наши обозначения, будучи полностью подходящими в общем случае, оказываются для многих конкретных игр избыточными. Это частое явление при математических рассмотрениях, преследующих общие цели. Пока мы разрабатывали общую теорию, у нас не было причин принимать во внимание эту избыточность. Но сейчас, при рассмотрении конкретной игры, мы от нее избавимся.

Легко видеть, как непосредственно интерпретируется формула (19:3). Дляэтого достаточно вспомнить смысл функции Xsign (si-s2) (&» 1) и интерпретацию величин pf1, of.

19.5.3. Понятно, что как по своему смыслу, так и в силу формальных определений (19:1), (19:2) числа pf1, of удовлетворяют условиям

(19:4) все р?0, Spfl,

все ofO, 5Х2 = 1-

С другой стороны, любые pf1, of, удовлетворяющие этим условиям*

можно получить из соответствующих £, г] по формулам (19:1), (19:2). Это понятно как математически х), так и интуитивно. Любая система таких чисел pf1, of является набором вероятностей, определяющих возможный способ поведения. Поэтому они должны соответствовать некоторой смешанной стратегии.

Соотношения (19:4) и (19:5) дают возможность составлять трехмерные векторы

Тогда условия (19:4), (19:5) утверждают, что все pSl, принадлежат S3.

Это показывает, каких больших упрощений мы добились благодаря

-у ->-

введению этих векторов. Именно вектор (или т]) принадлежал S$,

*) Положим, например, £ib f ig = р1. . . pfg, т];ь . . is == ah а% и проверим, что (17:1:а) и (17:1:Ь) из п. 17.2.1 являются следствием условий (19:4),, (19:5).

(19:5)



т. е. зависел от р - 1 = 3s - 1 числовых параметров; psi (или о82) составляют множество, состоящее из S векторов в 53, т. е. каждый из них зависит от двух числовых констант. Число 3 - 1 много больше числа 2S даже при умеренных *) S.

19.6. Формулировка задачи

19.6. Поскольку мы имеем дело с симметричной игрой, мы можем

использовать характеристику оптимальных (смешанных) стратегий,

-> -

т. е. характеристику £ £ А, указанную в (17:Н) из п. 17.11.2. Она состоит

в следующем: стратегия £ должна быть оптимальной против самой себя, т. е. предполагается, что min К (g, ц) должен достигаться при ц =

~> ->

Далее, в п. 19.5 мы видели, что функция К (g, rj) фактически зависит -> -> ->-»>->->

OTpS1, aS2. Поэтому можно переписатьее в виде К (р1, . . ., psj а1, . . . , os).-Тогда формула (19:3) из п. 19.5.2 утверждает (мы несколько изменили порядок суммирования), что

(19:6) К (р\ ..., ps а\ ..., 0s) ==-L" 2 2 2Wn(Sl-82) (i, j) p!xaf,

si, г S2, j

и p1, ..., ps для оптимальной стратегии характеризуется тем, что

-> -* -> -> min К (р1, ..., ps a1, ..., os)

ai, a s

достигается при a1 = p1, . . ., as = ps. Можно найти и явные условия для этого, используя, по существу, тот же метод, который был применен

к аналогичной задаче в п. 17.9.1; мы сжато изложим его.

-> ->

Минимум по (а1, . . ., as) функции (19:6) равен минимуму, взятому

-> ->

отдельно по каждой из переменных а1, . . ., as. Рассмотрим поэтому

->

некоторую переменную oS2. Единственное ограничение, которому она удовлетворяет, состоит в принадлежности ее к £3, т. е.

все afO, 2о52=1. j=i

Функция (19:6) линейна по этим трем компонентам а®2, а2, в**. Следовательно, минимум по aS2 будет находиться там, где обратятся в нуль все те компоненты af, коэффициенты которых (по /, см. ниже) не достигают наименьшего возможного значения.

Обозначая через -- yf коэффициент при of, равный

~С2 2 <sign(s1-s2) {U /) рЛ

мы из (19:6) получаем

8i, г

(19:7) К (р1, ..., ps о1.....с*) = -±- 2 Yfor;

S2. J

*) В действительности £ равно приблизительно 2,5-10е (см. сноску 4 на стр. 209); поэтому оба числа 3s - 1 и 2S большие, но первое из них несравненно больше.

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [ 68 ] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]