назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [ 44 ] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147]


44

При этом значение х получается равным Хо =1/2. Это же значение получается из решения уравнения

. . 7г(х-\-у) V2 шш sm--- = -,

о>122

так как минимум достигается при > = О, и это уравнение превращается в следующее:

. пх л/2 sin- = -, 2 2

откуда следует, что х =1/2.

Заметим, что если в функции выигрышей (5.15) поменять местами х и у, то она не изменится, а следовательно, эта функция выпукла и по > при всех X е [0;1]. Поэтому к ней применима та же теория, т.е. у игрока 2 существует оптимальная чистая стратегия уо, определяемая из уравнения (5.14)

. 7г(х-\-у) л/2 maxsm--- = -.

одг122

Очевидно, максимум по х достигается при л: =1/2, и последнее уравнение примет вид

Решением последнего уравнения будет у о = 0. Следовательно, игрок 2 имеет оптимальную чистую стратегию у о = 0.

Замечание. В приведенном выше примере мы могли определить оптимальную стратегию игрока 1, а игрока 2- только случайно, в силу "удачного" вида М{х, у).

Рассмотрим теперь метод определения оптимальных стратегий того игрока, для которого функция выигрьш1ей не обязательно выпукла. Пусть непрерывная функция Л/(х, у\ заданная на единичном квадрате, выпукла по>. Нас будет интересовать вопрос нахождения оптимальных стратегий 1 игрока. Предположим также, что для л: е [0; 1], > е [0; 1] существует частная производная функции М(х, у) по у, причем в точках > = 0 и дМ{х,у) ду

У= 1 Му(х,у)=-понимается как правая и левая производная.



соответственно. Обозначим через уо одну из оптимальных чистых стратегий игрока 2 (эта стратегия существует в соответствии с теоремой 4).

Согласно теореме 2 чистые стратегии х игрока 1 могут входить в его оптимальную стратегию с положительной вероятностью, если для них выполняется равенство М(х, уо) = V.

Такие чистые стратегии х называются существенными. Теорема 11. Пусть дана бесконечная антагонистическая игра с непрерывной и дифференцируемой по у на единичном квадрате при любом х функцией выигрышей М(х, у), с оптимальной чистой стратегией уо игрока 2 и ценой игры V, тогда:

1)если>о = 1, то среди оптимальных стратегий игрока 1 имеется существенная чистая стратегия хи для которой м(хи \) < \ ;

2)если Уо = О, то среди оптимальных стратегий игрока 1 имеется существенная чистая стратегия Х2, для которой Myixi, 0) > 0;

3)если О <>о < 1, то среди оптимальных стратегий игрока 1 найдется такая, которая является смесью двух существенных стратегий х\ и Х2. Для этих стратегий Му{хи у о) О, М(х2, у о) О, стратегия хх употребляется с вероятностью а, стратегия хг- с вероятностью (1 - а), где а находится из уравнения

а Л/; (хь >о) + (1 - а) М; (Х2, Уо) = 0,(5.16)

Пример. Пусть функция выигрышей в бесконечной антагонистической игре задана на единичном квадрате и равнаМ{х,у) = (х -yf =х -2ху + у.

Эта функция непрерывна по х и и поэтому эта игра имеет решение. Кроме того.

Следовательно, М(х, у) выпукла по у, и поэтому согласно теореме 10 цена игры определяется по формуле (5.11), игрок 2 имеет чистую оптимальную стратегию у о, определяемую из уравнения (5.12). Таким образом, имеем V = min max(x - у),

у x

Для определения тах(х-2ху + У ) последовательно найдем дМ

= 2х - 2> = О => X = >



= 2 > О при X = у функция М имеет минимум для любого у.

А, следовательно, максимум достигается в одной из крайних точек х = О и (или) X = 1

Мф;у)=/

М(1;>) = 1 - 2>; + / = (у - 1) F = minтах{/;(1

Данный minmaxj...} достигается в том случае, если у = (1 - yf, т.е. у=\12.

Следовательно, F= - при>о = - • 42

Определим теперь оптимальные стратегии для игрока 1. Поскольку у о =1/2, то О <>о< 1. Согласно теореме 11 рассмотрим третий случай.

Определим х из уравнения М{х, у о) = F, т.е.

Решая последнее уравнение, получим х\=0,Х2 = \. Теперь необходимо определить величину а - вероятность применения чистой стратегии лг] = 0. С этой целью используем уравнение (5.16):

-(l-a)M;fli

= 0.

Нетрудно найти

М/оф = -2(х-7)

jc=0,

= +1,

М/1;1) = -2(х->)

= -1.

дг=1

Тогда уравнение для а примет вид:

а-(1-а) = 0, откуда а = 1/2 . Следовательно, стратегия игрока 1

f(x) = iy„(x) + i/,{x).

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [ 44 ] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147]