назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [ 42 ] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147]


42

Пример. Игрок 1 выбирает х е X = (0; 1% игрок 2 выбирает у е У = (0;1). После этого игрок 1 получает сумму

М(х,у) = х+у

за счет игрока 2. Поскольку X и У- открытые интервалы, то на них V\ и V2 не существуют. Если быХи Убыли замкнутые интервалы, то было бы следующее:

Vi = F2= 1,прихо= 1,Уо=0.

С другой стороны, выбирая х достаточно близкое к 1, игрок 1 будет уверен, что он получит выигрыш не меньше, чем число, близкое к цене игры V= \; выбирая> близкое к нулю, игрок 2 не допустит, чтобы выигрыш игрока 1 значительно отличался от цены игры К= 1.

Степень близости к цене игры может характеризоваться числом 8 > 0. Поэтому в описываемой игре можно говорить об оптимальности чистых стратегий Хо = \, уо = О соответственно игроков 1 и 2 с точностью до произвольного числа 8 > 0. В связи с этим введем следующие определения.

Определение. Точка (х,у), где х е X, у е Y, в антагонистической непрерывной игре G называется точкой е-равновесия, если для любых стратегийх е Xигрока \,у е Yигрока 2 имеет место неравенство

М(х, у-г<М(х, yJ<M(x,y) + e,

Точка 8-равновесия {х,у) называется также s-седловой точкой функции М{х, у), а стратегии и у называются 8-оптимальными стратегиями. Эти стратегии являются оптимальными с точностью до 8 в том смысле, что если отклонение от оптимальной стратегии никакой пользы игроку принести не может, то его отклонение от 8-оптимальной стратегии может увеличить его выигрыш не более чем на 8.

Чтобы функция М имела 8-седловые точки для любого 8 > О необходимо и достаточно, чтобы

sup inf М(х,у) = inf supM(x,>).

X уУх

Если игра О не имеет седловой точки (s-седловой точки) в чистых стратегиях, то оптимальные стратегии можно искать среди смешанных стратегий. Однако в качестве вероятностной меры здесь вводятся функ-



ции распределения вероятностей применения игроками чистых стратегий.

Пусть F(x)- функция распределения вероятностей применения чистых стратегий игроком 1. Если число - чистая стратегия игрока 1, то

где < х) означает вероятность того, что случайно выбранная чистая стратегия не будет превосходить числа х. Аналогично рассматривается функция распределения вероятностей применения чистых стратегий г игроком 2 Q(y) = Р(г <у).

Функции F{x) и 0(у) назьгоаются смешанными стратегиями соответственно игроков 1 и 2. Если F(x) и Q(y) дифференцируемы, то существуют их производные, обозначаемые, соответственно, через fix) и q(y) (функции плотности распределения).

В общем случае дифференциал функции распределения dF(x) выражает вероятность того, что стратегия находится в промежутке х<Е,<х + dx. Аналогично для игрока 2: dQ(y) означает вероятность того, что его стратегия ц находится в интервале у < ц < у + dy. Тогда выигрыш игрока 1 составит Л/(х, у) dF(x), а выигрыш игрока 2 равен Mix,y)dQ(y).

Средний выигрыш игрока 1 при условии, что игрок 2 применяет свою чистую стратегию у, получим, если проинтегрируем вьшгрыш по всем возможным значениям х, т.е.

E{F,y)=]M(x,y)dF(x).

Напомним, что множество Гдля;; является замкнутым промежупсом [0; 1].

Если игрок 1 применяет свою чистую стратегию х, а игрок 2 - то выигрыш игрока 1 составит М(х, у) dP{x) dQ(y),

Средний выигрыш игрока 1 при условии, что оба игрока применяют свои смешанные стратегии F{x) и Q(y), будет равен

EiF,Q) = ]]M(x,y)dF(x)dQ(yl

По аналогии с матричньпли играми определяются оптимальные смешанные стратегии игроков и цена игры: в антагонистической непрерыв-134



ной игре G(X,YM) пара смешанных стратегий и Q*(y) соответственно для игроков 1 и 2 образует седловую точку в смешанных стратегиях, если для любых смешанных стратегий F(x) и Q(y) справедливы соотношения< E(F*,Q*) < E(FQ),

Из левой части последнего неравенства следует, что если игрок 1 отступает от своей стратегиито его средний выигрыш не может

увеличиться, но может уменьшиться за счет лучших действий игрока 2, поэтому F*(x) называется оптимальной смешанной стратегией игрока 1.

Из правой части последнего неравенства следует, что если игрок 2 отступит от своей смешанной стратегии Q*(y), то средний выигрыш игрока 1 может увеличиться, а не уменьшиться, за счет более разумных действий игрока 1, поэтому Q*(y) называется оптимальной смешанной стратегией игрока 2. Средний выигрыш E(F*,Q% получаемый игроком 1 при применении игроками оптимальных смешанных стратегий, называется ценой игры.

По аналогии с матричными играми рассматривается нижняя цена непрерывной игры в смешанных стратегиях V\ = max min E{F,Q) и верхняя

F Q

цена игры V2 - min max E(F,Q).

Если существуют такие смешанные стратегии и Q*(y) соответственно для игроков 1 и 2, при которых нижняя и верхняя цены непрерывной игры совпадают, то и Q*(y) естественно назвать оптимальными смешанными стратегиями соответствующих игроков, а Vi = V2 = V- ценой игры.

Можно доказать, что существование седловой точки в смешанных стратегиях игры G{X,Y,M) равносильно существованию верхней V2 и нижней V\ цен игры в смешанных стратегиях и их равенству Vi = V2 = V.

Таким образом, решить игру G(X,Y,M) означает найти седловую точку или такие смешанные стратегии, при которых нижняя и верхняя цены игры совпадают.

Теорема 7 (существования). Всякая антагонистическая бесконечная игра двух игроков G с непрерывной функцией выигрышей М(х,у) на единичном квадрате имеет решение (игроки имеют оптимальные смешанные стратегии).

Теорема 8. Пусть имеется бесконечная антагонистическая игра с непрерывной функцией выигрышей М{х, у) на единичном квадрате и ценой

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [ 42 ] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147]