назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [ 69 ] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]


69

Тогда условием минимума (по о82) будет:

(19:8) Для каждой пары s2, j, для которой у)2 не достигает минимума

(по / *)), должно быть of = 0. Следовательно, характеристика оптимальной стратегии - минимиза-ция при о1 = р1, . . gs = ps - состоит в следующем:

-У -У -у -

(19:А) р1, . . ., ps описывают оптимальную стратегию, т. е. £

в том и только том случае, если для каждой пары s2, 1, Для которой yf не достигает минимума (по / х)), имеем of = 0. На основе матричных схем табл. 15-17 выпишем, наконец, явные

выражения для yf:

S2 - 1

<19:9:а) Ysi2 = 4" { 2 (~flP?~а№~Ь№)~Ъ№ +

«i=i

+ 2 faPF + ep!1-6??)}.

Sl=s2 + 1

S2-1

<19:9:b) yf = -i- { S (~ «P?1-&PI1 - &P11) +

Si=l

+ S (ЙР!1 + &Р1+6Р1)} » Si=S2+l 82-1

< 19:9:c) yf = 4" { 2 (&P?X~ 6P?- bP?) + &P?2 +

si=l S

+ 2 (&PSl1 + &Pi1 + &PS31)}.

si=s2+l

19.7. Переход от дискретной задачи к непрерывной

19.7.1. Критерий (19:А) из п. 19.6 вместе с формулами (19:7), (19:9:а), (19:9:Ь) и (19:9:с) можно использовать для нахождения всех оптимальных стратегий 2). Эти рассуждения носят несколько утомительный комбинаторный характер и содержат анализ ряда возможностей. Получающиеся при этом результаты качественно сходны с результатами, получаемыми далее при несколько измененных предположениях. Различие между ними касается лишь некоторых деликатных вопросов, которые можно назвать «тонкой структурой» стратегии. Более подробно мы остановимся на этом в п. 19.12.

Нас сейчас интересуют главным образом основные характеристики решения, а не эти вопросы «тонкой структуры». Сначала обратим внимание на дискретную структуру последовательности возможных раскладов.

х) Имеется в виду минимум по /, а не по s2, /!

2) Это нахождение было уже проделано одним из нас и будет опубликовано в другом месте.



Если мы попытаемся изобразить старшинство всех возможных раскладов на шкале от 0% до 100% или лучше в виде дробей от 0 до 1, то «самый младший из возможных раскладов, 1, будет соответствовать нулю, а самый старший из них будет соответствовать единице. Поэтому расклад s

(= 1, . . ., S) следует заменить на величину z - ~ * , принадлежащую

этой шкале. Итак, мы получаем табл. 18.

Таблица 18

Возможные ,

Старая шкала

расклады

Новая

S - 2

шкала

S - 1

. - 1

S - 1

Таким образом, хотя значения z заполняют интервал <19:10) Ozl

весьма плотно х), но все-таки они составляют дискретную последовательность. Это и есть упомянутая выше дискретная структура. Перейдем теперь от этого случая к непрерывному.

Будем предполагать, что случайный ход, выбирающий расклад s (т. е. число z), может воспроизвести любое z из интервала (19:10). Предположим, что вероятность любой части интервала (19:10) равна длине этой части, т. е. что величина z распределена 2) на интервале (19:10) равномерно. Обозначим расклады игроков 1 и 2 соответственно через z4 и z2.

19.7.2. Это изменение влечет за собой замену векторов psi, о62

-> ->

($i> 52 = 1, . . ., S) на векторы р21, а22 (0 z4, z2 1); при этом, конечно, они по-прежнему являются вероятностными векторами (той же природы, что и раньше, т. е. принадлежат 53). Поэтому компоненты (вероятности)

pi1, of (sb 52= 1, ..., S; г, 7 = 1, 2, 3) переходят в компоненты pf1, о)2 (OZi, z2rgl; i, /=1,2, 3). Аналогично величины yf (в формулах <19:9:а), (19:9:Ь), (19:9:с) из п. 19.6) переходят в yf.

Перепишем теперь выражения для К и у* в формулах (19:7), (19:9:а), (19:9:Ь), (19:9:с) из п. 19.6. Ясно, что все суммы

Si= 1 S2= 1

надо заменить интегралами

j .. . dzx, j ... dz2,

г) Напомним (ср. сноску 4 на стр. 219), что S есть примерно 2,5 миллиона. 2) Это так называемая геометрическая вероятность.



а суммы

- интегралами

82-1

Si=l S1=S2+1

j ... dzj, j ... dzj,

0 z2

в то время как отдельные слагаемые, стоящие в скобках с коэффициентом IIS, можно опустить \\2). Понятно, что формулы для К и у* (т. е., у)) превращаются в

(19:7*) K2j7faf2,

з о

z2 1

(19:9:а*) у? = j (- apfi - api - &pi).dz! + j (ар? + ар? - bp?) dzu

0 22

22 1

(19:9:Ь*) Т? = j (- ар? - bp? - bp?) dzt + j (ар? + bp? + bp?) dzu

0 22

Z2 1

(19:9:c*) yf = j (bp? - bp? - bp?) dz, + j (bp? + bp? + bp?) dz,,

0 22

a характеристика (19:A) из п. 19.6 переходит в следующую:

->

(19:В) Векторы pz (0 z 1) (все они принадлежат 3) описывают оптимальную стратегию в том и только том случае, когдасправедливо утверждение:

Для каждой пары z, /, для которой у) не достигает минимума (по 7 3)), должно быть р) - 0.

Замечание. Формулы (19:7*), (19:9:а*), (19:9:Ь*), (19:9:с*) и этот критерий можно было бы получить также и непосредственно из рассмотрения «непрерыв-

ного» случая с р г, а22 вместо £, т], с которых мы начинали. Мы предпочли более длинную и явную процедуру, вытекающую из пп. 19.4-19.7, чтобы сделать строгость и полноту нашего подхода очевидной. Хорошим упражнением для читателя будет осуществить более короткое и непосредственное рассмотрение этого случая.

Соблазнительно построить теорию игр, в которой систематически и непосредственно встречаются такие непрерывные параметры, т. е. с общностью, достаточной для приложимости этой теории к случаям, подобным только что рассмотренному, и без использования процессов предельного перехода от дискретных игр.

Интересный шаг в этом направлении сделан Биллем в работе, указанной в замечании на стр. 177 (см. стр.110-113 упомянутой работы). Однако сделанные там предположения о непрерывности являются, по-видимому, слишком жесткими для многих приложений и, в частности, для рассматриваемого здесь.

х) Конкретно мы имеем в виду средние члены - &pf2 и bp{2 в (19:9:а) и (19:9:с).

2) Эти члены соответствуют случаю st = s2> или, в новых обозначениях, zt = z2. Но, поскольку zi9 z2 - непрерывные случайные величины, вероятность их случайно го-совпадения равна 0.

При математическом описании этого процесса можно сказать, что мы теперь осуществляем предельный переход при S оо.

3) Мы подразумеваем по у, но не по z, /!

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [ 69 ] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232]