назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [ 39 ] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147]


39

тегию можно исключить, заменив ее смешанной стратегией с соответствующими частотами использования чистых стратегий. В качестве иллюстрации рассмотрим матрицу игры:

Для первых двух чистых стратегий игрока 1 возьмем частоты их применения (вероятности) равными 0,25 и 0,75.

Третья стратегия игрока 1 доминируется линейной вьшуклой комбинацией первой и второй чистых стратегий, взятых с частотами 0,25 и 0,75 соответственно, т.е. смешанной стратегией:

24 . 0,25 + О . 0,75 = 6 > 4,

О . 0,25 + 8 . 0,75 = 6 > 5.

Поэтому третью стратегию игрока 1 можно исключить, используя вместо нее указанную смешанную стратегию.

Аналогично если каждый элемент некоторого столбца больше или равен некоторой вьшуклой линейной комбинации соответствующих элементов некоторых других столбцов, то этот столбец можно исключить из рассмотрения (вычеркнуть из матрицы). Например, для матрицы

10 О 6 .0 10 7,

третья стратегия игрока 2 доминируется смешанной стратегией из первой и второй его чистых стратегий, взятых с частотами 0,5 и 0,5:

10. 0,5+ 0-0,5 = 5 <6,

0.0,5 + 10. 0,5 = 5 <7.

Таким образом, исходная матрица игры эквивалентна матрице следующего вида:

10 О .0 10

Как видно, возможности доминирования смешанными стратегиями в отличие от чистых значительно менее прозрачны (нужно должным обра-124



зом подобрать частоты применения чистых стратегий), но такие возможности есть, и ими полезно уметь пользоваться.

5.2.7. Графическое решение игр вида (2x/i) и (тх2). Этот метод применим только к играм, в которых хотя бы один игрок имеет только две стратегии. Рассмотрим следующую игру вида 2хп (табл. 5.7).

Таблица 5.7

«12

«1«

«21

«22

«2«

Предполагается, что эта игра не имеет седловой точки. Поскольку первый игрок имеет только две стратегии, то = 1 - Xj, xj > 0,х2 > 0. Ожидаемые выигрыши первого игрока, соответствующие чистым стратегиям второго игрока, представлены в табл. 5.8.

Таблица 5.8

Чистые стратегии

Ожидаемые выигрыши

второго игрока

первого игрока

1«11 + (1 - 1 )«21 = («11 - «21 К + «21

х,а,2 +(1-х, )а22 = (а,2 - «22 >i + «22

х,а,„ +{\-х, )а2„ = - )i + «2«

Отсюда видно, что ожидаемый выигрыш первого игрока линейно зависит от Xj .

В соответствии с критерием минимакса для игр в смешанных стратегиях первый игрок должен выбирать х\ так, чтобы максимизировать

свой минимальный ожидаемый выигрыш. Эта задача может быть решена графически построением прямых линий, соответствующих линейным функциям от переменной xj. Такая процедура иллюстрируется ниже на

конкретном примере.

Пример. Рассмотрим игру вида 2x4 (табл. 5.9).

Таблица 5.9

Стратегия 1

Стратегия 2

Стратегия 3

Стратегия 4

Стратегия 1

Стратегия 2



Решение.

Эта игра не имеет седловой точки. Ожидаемые выигрыши первого игрока, соответствующие чистым стратегиям второго игрока, представлены в табл. 5.10.

Таблица 5.10

Чистые стратегии

Ожидаемые выигрыши

второго игрока

первого игрока

-21+4

xi+2

-7x1+6

На рис. 5.1 изображены четыре прямые, являющиеся графиками этих функций от переменной . Максимин достигается при х* = 1/2. В этой точке пересекаются любые две из прямых 2, 3 и 4. Следовательно, оптимальной стратегией первого игрока является (xl =1/2, = 1/2) и

Среднеожидаемый выигрыш первого игрока

\ -7д:,+6

Рис. 5.1

значение ифы находится подстановкой переменной л:, в уравнение любой из прямых, проходящих через максиминную точку. Это дает

-1/2 + 3 = 5/2, v*=]l/2 + 2 = 5/2,

-7(1/2)+ 6 = 5/2.

Интересно отметить, что при определении оптимальных стратегий второго игрока три прямые проходят через максиминную точку. Это оз-

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [ 39 ] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147]