назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [ 34 ] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90]


34

Тем самым, учитывая лемму п. 4.9 и предыдущую теорему, мы имеем Vy = тшЯ(л:*,у) sup infН(х,y)Vr,(5.3)

так что

иг = inf Н(х*, у) = sup inf Н{х, у).

уX у

Следовательно, стоящий справа внешний экстремум достигается (именно, при х= х*),и

Vr=m2LxmfH(x,y).(5.4)

X у

Теперь (5.3) и (5.4) дают нам (5.2). □

5.4.Теорема. Пусть - значение игры Г = < х, у,Я >, д и - произвольное число. Если Xq - некоторая стратегия игрока \,тоиз

ийЩХоу) для любого yGY(5.5)

следует

vvr.(5.6)

Если Уо - стратегия игрока 2, то из Н{х, Yq) v для любого х G х следует иг

Доказательство проводится для первой части теоремы. Применяя к (5.5) переход к смешанным стратегиям, мы получаем для любой смешанной стратегии Y игрока 2 v H{Xq, Y). Следовательно, и inf H{Xq, Г), и

тем самым

l;supinfЯ(X, Y).(5.7)

X у Но по теореме 5.2..

supinfЯ(X, r)i;r.(5-)

X Y

Из (5.7) и (5.8) следует (5.6). □

5.5.Теорема. Пусть vy - значение игры Г = (х,у,Я >. Для того чтобы стратегия X* игрока 1 была оптимальной, необходимо и достаточно, чтобы было

H(X\y)vy при всех уеу.(5.9)

Аналогично формулируется критерий оптимальности стратегии игрока 2. Доказательство. Необходимость. Из оптимальности X* следует, что

inf Я(Х*, Y) = sup inf Я(Х, Y) = vr.

YX Y

и поэтому выполняется (5.9).

Достаточность. Переходя к (5.9) к смешанным стратегиям, получаем для любой смешанной стратегии F игрока 2Н(Х*, Y) г , и, следовательно,

inf Я(Х*, Y) = sup inf Я(Х, Y).



т.е. на X* достигается максимум функции inf Н{Х, что ввиду теоремы

п. 6.1. гл. 1 и означает оптимальность стратегии X*, □

5.6.Как и в случае матричных игр (см. § 17 гл. 1), для общих антагонистических игр важную роль играет понятие спектра смешанной стратегии, которому здесь, однако, приходится дать более общее определение.

Определение. Пусть Г - антагонистическая игра. Чистая стратегия Z о игрока в ней назьшается точкой концентрации его смешанной стратегии Z , если Z (z о) > 0.

Очевидно, точки спектра любой смешанной стратегии в матричной игре (см. п. 8.5 гл. 1) суть ее точки концентрации.

Пусть теперь множество стратегий игрока в игре Г является топологическим пространством. Тогда чистая стратегия Zq назьшается точкой спектра смешанной стратегии Z, если для любой измеримой окрестности со точки Z о имеет место соотношение Z (со) = / cfZ (z ) > 0. □

Очевидно, в топологических играх точки концентрации смешанных стратегий являются точками их спектров. Обратное, вообще говоря, неверно. Точки (чистые стратегии), в которых смешанная стратегия имеет положительную плотность, являются ее точками спектра, но не являются ее точками концентрации.

Множество всех точек спектра смешанной стратегии Z будет, как и в случае матричной игры, обозначаться через supp Z.

5.7.Для случая точек концентрации смешанных стратегий теорема п. 17.3 гл. 1 (свойство дополняющей нежесткости) переносится на общие антагонистические игры дословно.

Теорема. Пусть Г - антагонистическая игра, имеющая значение Ur. Тогда если XqGx, Г е(Г) и

Н(хо, Y)<vr.(5.10)

то Хо не может быть точкой концентрации какой-либо оптимальной стратегии игрока 1.

Очевидно, справедливо и двойственное утверждение о точках концентрации оптимальных стратегий игрока 2.

Доказательство. В силу оптимальности стратегии У G Y для всех л: G X должно быть

H{x,Y)Vy.(5.11)

Почленное интегрирование этого неравенства помере X на множестве \\xq дает нам

; H{x,Y)dX{x)Vr f dX(x).(5.12)

X =XqX Ф Xq

Кроме ТОГО, (5.10) дает

Я(хо, Y)X{xo) < VrX(xo)(5.13)

(здесь Х(хо) ф О, так как в противном случае точка Xq заведомо не могла бы быть точкой концентрации). Складьшая (5.12) и (5.13), мы получаем

JH(x, Y)dX{x)=n(X/Y) = Vr < vrSdX(x) = vr,

чего не может быть. Значит, Х(хо) = 0. □



5.8. Для произвольных точек спектра оптимальной стратегии свойство дополняющей нежесткости имеет место лишь в том случае, когда функция выигрыша обладает свойством непрерывносш, хотя бы ограниченным.

Лемма. Пусть Г - антагонистическая игра <х,у,Я) со значением v.

Если F* - некоторая оптимальная стратегия игрока 2, а чистая стратегия Xq игрока 1 такова, что

H{xo,Y*)<v.(5.14)

и функция Я(-, у*) непрерывна в точке Xq, то Xq не может быть точкой спектра какой-либо оптимальной стратегии игрока 1 в Г.

Доказательство. Пусть X* - некоторая оптимальная стратегия игрока 2. Тогда

Я(Х*, Y*) = v= шах Н(Х, Г* ). X

Следовательно, по лемме п. 4.8 для множества со всех х, для которых

Я(х, Г*)<п ,(5.15)

должно быть

Х*(со) = 0.(5.16)

Далее, по условию функция Н(х, Y*) в точке Xq непрерывна. Поэтому из (5.14) следует, что найдется такая окрестность со о точки Xq, что для всех л: G ojq вьшолняется (5.15). Так как соо Ссо, из (5.16) следует, что и

Х*(соо) = 0.(5.17)

Но если бы Xq бьша точкой спектра стратегии X*, то бьшо бы Х*(соо) >0, и противоречие с (5.17) доказьшает лемму. □

5.9. Как следствие этой леммы мы получаем следующую теорему.

Теорема. Пусть Г * - антагонистическая игра с непрерывной функцией выигрыша И и значением v.

1)Если Y* - некоторая оптимальная стратегия игрока 2, а чистая стратегия Xq игрока 1 такова, что Н(хо, Y*) <v г, то Xq не может быть точ кой спектра какой-либо оптимальной стратегии игрока 1 в Г.

2)Если X* - некоторая оптимальная стратегия игрока 1, а чистая стратегия у игрока 2 такова, что Н(Х*, уо) > г. то уо не может быть точкой спектра какой-либо оптимо/гьной стратегии игрока \ в Г.

Доказательство. Из непрерывности функции Я следует непрерывность функций Я(., F *) и Я(Х *, .), и нам остается сослаться на лемму п. 5.8. □

§ 6. ЕСТЕСТВЕННАЯ МЕТРИКА НА МНОЖЕСТВАХ СТРАТЕГИЙ

6.1. Истинное отличие в игре одной стратегии игрока от другой его стратегии состоит не во внешних содержательных чертах этих стратегий, а в различии между последствиями, к которым эти стратегии приводят, т.е. в различии между вьшгрышами, которые получит игрок, употребляя ту или иную стратегию. Это дает основание ввести на множестве пар стратегий игрока 1 в антагонистической игре Г = (х, у, Я) следующую функ-104

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [ 34 ] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90]