назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [ 23 ] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90]


23

19.2. В основе описьгоаемых далее графоаналитических методов лежит следующее соображение, основанное на том, что согласно теореме п. 15.1 в матричной игре должно быть

(19.1)

D = maxminX4.; = min max Л/. Y,

причем внешние экстремумы достигаются на оптимальных стратегиях игроков.

Рис. 1.16

Рис. 1.17

Опишем способ нахождения оптимальных стратегий игрока 1 в тХп-игре. Рассмотрим для этого т-мерную призму, основанием которой является (т- 1)-мерный симплекс Xстратегий игрока 1 в Г, а вдоль образующей откладываются значения функции выигрыша Я (рис. 1.16). Графиком каждой из функции XA.j является гиперплоскость, а графиком функции minX4.y - "минимальная" огибающая всех таких гиперплоскостей. Эта

огибающая ограничивает сверху некоторое "обелискообразное" тело (см. рис. 1.17). Наибольшая Я-координата точек этого тела есть согласно (19.1) v, а проекции этих точек на основание призмы - оптимальные стратегии игрока 1.

Разумеется, при больших значениях т такой способ неприменим, но при т=2 он представляется достаточно практичным. Воспроизведем в деталях рассуждения в этом случае.

19.3. Рассмотрим игру, в которой игрок 1 имеет две чистые стратегии, а игрок 2 - произвольное число п чистых стратегий. Матрица выигрышей этой игры имеет вид

(19.2)

Фундаментальный симплекс смешанных стратегий игрока I представляет собой в рассматриваемом случае сегмент [О, 1 ], в котором координата точки, описывающей смешанную стратегию игрока 1, есть вероятность использования им первой чистой стратегии.

Пусть игрок 2 выбирает свою чистую стратегию/. Тогда вьшгрыш игрока 1 будет зависеть от выбранной им смешанной стратегии X, т.е. фактически от вероятности J выбора им первой чистой стратегии: XA.j -%aij +

+ (1-?)«2/.



Графически зависимость этого выигрыша от J изображается прямой линией. Каждой чистой стратегии / игрока 2 соответствует своя прямая (рис. 1.18). Ясно, что если матрица (19.1) имеет одинаковые столбцы, то прямые, соответствующие таким стратегиям игрока 2, будут совпадать. Ради простоты будем все совпадающие столбцы считать одной стратегией.

Графиком функции

minXA.j = min (aij + (1 - )a2j) ii

будет нижняя огибающая всех прямых, соответствующих стратегиям игрока 2 (на рис. 1.18 она выделена жирной линией). Очевидно, этот график представляет собой ломаную, обращенную выпуклостью вверх. Наивысшая точка этой ломаной будет соответствовать тому значению, на котором достигается

шах min ХА.: = maxmin(fli,- + (1 - 1)2/)-X i j

Абсцисса этой точки является, таким образом, оптимальной смешанной стратегией игрока 1, а ее ордината - значением игры. Если же таких высших точек будет более одной, то, очевидно, огибающая ломаная будет иметь горизонтальный участок (рис. 1.19). Множество оптимальных стратегий игрока 1 будет состоять из всех абсцисс этих точек.

19.4. Описанное построение позволяет находить также оптимальные стратегии игрока 2. Здесь может представиться несколько различных случаев.

Пусть сначала огибающая ломаная имеет верхний горизонтальный участок, соответствующий чистой стртегии /о игрока 2. Очевидно, это может быть }шшь при aj =2/о- В этом случае игрок 2 имеет единственную оптимальную стратегию, которая является чистой.

Предположим теперь, что огибающая ломаная завершается "пиком".

Если абсциссой "пиковой" точки является О или 1 (рис. 1.20), то оптимальная стратегия первого игрока - чистая (в случае, изображенном на рис. 1.20, это точка 0), а оптимальными стратегиями игрока 2 будут те его чистые стратегии, которые соответствуют прямым, подходящим к

Рис. 1.18

Рис. 1.19



Рис. 1.20

Рис. 1.21

ПИКОВОЙ точке с положительным наклоном. Разумеется, все их смеси также будут оптимальными стратегиями игрока 2.

Аналогичная картина наблюдается в том случае, когда "пик" имеет абсциссу 1.

Пусть, наконец, абсцисса пика отлична как от нуля, так и от единицы. Это значит, что в верхней ,ее точке пересекается не менее двух прямых, из которых одна имеет положительный наклон, а другая - отрицательный (рис. 1.21). Пусть

- эти прямые. Если игрок 2 откажется от использования всех своих остальных стратегий, то в получившейся 2 X 2-игре как значение, так и единственная оптимальная стратегия игрока 1 будут теми же, что и в первоначальной игре. Это значит, что, пользуясь только двумя стратегиями Л и /2, игрок 2 может воспрепятствовать игроку 1 получить больше, чем . Следовательно, оптимальная стратегия игрока 2 в исходной игре может быть получена путем смешивания только двух его чистых стратегий j\ и /2. Таким образом, оптимальная стратегия игрока 2 в новой 2 X 2-игре является оптимальной его стратегией и в исходной 2 X «-игре. Для ее вычисления можно воспользоваться формулой (18.12), которая в данном случае приобретает вид

2/2 -«1/2

«1 -«1/2 ~«2Д +«2/,

§ 20. ГРАФОАНАЛИТИЧЕСКИЙ МЕТОД РЕШЕНИЯ т X 2-ИГР

20.1 Пусть теперь в матричной игре две чистые стратегии имеет игрок 2, а игрок 1 - произвольное их число т. Это значит, что матрица выигрышей такой игры имеет вид

«11«12

«21«22

"m2 -I

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [ 23 ] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90]