назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [ 43 ] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147]


43

игры V, Тогда, если Q(y) - оптимальная стратегия игрока 2 и для некоторого Хо

]Mix,,y)dQ(y)<V, о

то Хо не может входить в точки спектра оптимальной стратегии игрока 1; если F(x) - оптимальная стратегия игрока 1и для некоторого

]M(x,yJdF(x)>V,

то у о не может быть точкой спектра оптимальной стратегии игрока 2.

Из теоремы 8 следует, что если один из игроков применяет оптимальную стратегию, а другой - чистую, при том что средний выигрыш игрока 1 отличается от цены игры, то эта чистая стратегия не может войти в его оптимальную стратегию (или она входит в нее с вероятностью нуль).

Теорема 9. Пусть в бесконечной антагонистической игре функция выигрышей М(х, у) непрерывная для х е [0; \], у е [0; 1] и М(х,у) = = -М(у, х), тогда цена игры равна нулю и любая оптимальная стратегия одного игрока будет также оптимальной стратегией другого игрока.

Сформулированные свойства оптимальных смешанных стратегий и цены игры помогают находить или проверять решения, но они еще не дают в общем виде приемлемых методов решения игры. Более того, не существует общих методов для точного нахождения решения БАИ, и в том числе непрерывных игр на единичном квадрате. Поэтому рассматриваются частные виды антагонистических бесконечных игр.

5.2.10. Игры с выпуклыми функциями выигрыша. Игры с выпуклыми непрерьгоными функциями выигрышей называются выпуклыми.

Напомним, что вьшуклой функцией / действительной переменной х на интервале (а, Ь) называется такая функция, для которой выполняется неравенство f{ai Х] + «2 2) «i y(xi) + «2 Ai), где Xl и Х2 - любые две точки из интервала (а, Ь); а\, а2> О,

Если функция выигрышей М(х,у) непрерывна по обоим аргументам и строго выпукла по у при любом X, то в этом случае игрок 2 имеет единственную оптимальную чистую стратегию.

Если функция выигрышей М{х,у) непрерывна по обоим аргументам и строго вогнута по х при любом у, то в этом случае игрок 1 имеет единственную оптимальную чистую стратегию.



Если для «190, а20 всегда имеет место строгое неравенство/ai xi + «2 Х2) < axf(x]) + «2/2), то функция / называется строго выпуклой на (а; Ь). Геометрически выпуклая функция изображает дугу, график которой расположен ниже стягивающей ее хорды (рис. 5.3).

Напомним, что непрерывная и строго выпуклая функция / на замкнутом интервале принимает минимальное значение только в одной точке интервала. Для нахождения решения выпуклой игры можно воспользоваться следующей теоремой.

Fix)

Рис 53

Теорема 10. Пусть М{х, у) - непрерывная функция выигрышей игрока 1 на единичном квадрате и строго выпуклая по у для любого х. Тогда имеется единственная оптимальная чистая стратегия у=уо [0;1] для игрока 2, цена игры определяется по формуле

V = min max М(х, у),(5.11)

значение у о определяется как решение следующего уравнения

тахМ(х,>,)=К(5.12)

Замечание. Если в теореме 10 не предполагать строгую выпуклость функции М(х, у) по у, а просто выпуклость, то теорема остается в силе с тем отличием, что у игрока 2 оптимальная чистая стратегия не будет единственной.

Замечание, Выпуклые игры называют часто выпукло-вогнутыми, так как игра в них имеет седлообразное ядро, а так как ядро седлообразное, то игра имеет седловую точку в чистых стратегиях.

Таким образом, если М(х, у) непрерывна и выпукла по у, то цена игры определяется по формуле (5.11), и игрок 2 имеет оптимальную чистую стратегию, определяемую из уравнения (5.12).



Аналогично и для игрока 1: если функция выигрышей М{х, у) непрерывна по обоим аргументам и строго вогнута по х при любом у, то в этом случае игрок 1 имеет единственную оптимальную стратегию.

Цена игры определяется по формуле

V = max min у\(5.13)

X у

а чистая оптимальная стратегия Хо игрока 1 определяется из уравнения

mmM{xo,y)=V,(5.14)

Пример. Пусть на квадрате [0;1] задана функция

M(x,>.)=sin.(5.15)

Решение. Так как

£ sin£<0 длях€[0;1],7е(0;1), 2)2

то М{х, у) строго вогнута по х для любого у е (0;1). Следовательно, цена игры находится по формуле (5.13)

V = max mm sm --,

X у2

Отметим, что при О < х <1/2 справедливо равенство

. . л:(х + у) , я X mm sm--- = sm-,

о<><122

а при 0,5 < X < 1

{ттаЛ-- = sm--

Ч<«22

Поэтому

F= max [max mm sm---\ max mm sm---] =

o<x<\y2 l<x<xy2

, .Tlx. я(х + 1),,V2 V2, V2

= max [ max sm-: max sm--1- max [- ;- 1 = -

o.,.i 2 i,,,, 2 222

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [ 43 ] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147]