назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [ 33 ] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90]


33

Аналогично, какова бы ни была смешанная стратегия X игрока 1, должно быть

ЫН{Х,у)ЫН{Х, Г),

где инфимум слева распространяется на все чистые стратегии игрока 2, а справа - на все его смешанные стратегии.

Доказательство проводим только для первой части леммы.

Поскольку область смешанных стратегий шире области чистых, должно быть (см. п. 3.6 гл. 1)

5ирЯ(л:, Y)u supH(X, У),[4,3)

Предположим, что здесь имеет место строгое неравенство 5ирЯ(д:, Y) < supH(X, Y).

Это значит, что при некотором малом е > О будет и 8ирЯ(;с, Y) < supH(X, Г)-е,

Т.е. при всех хЕ х

Н(х, Y) < 8ирЯ(Х, Г)-е.

Но тогда, переходя к смешанным стратегиям, мы получаем $ирЩХ, Y) < 8ирЯ(Х, F)-e,

а этого не может быть. Следовательно, в (4.3) имеет место равенство. □ 4.8. Утверждение о том, что если среднее значение совпадает с максимальным, то и все усредняемые значения также совпадают спим, представляется достаточно естественным; однако оно несколько нетривиально и требует специального доказательства.

Лемма. Пусть Г = <х,у,Я > - антагонистическая игра, Y- произвольная смешанная стратегия игрока 2, а супремум supH(X, Y.) дости-

гается на (вообще говоря, смешанной) стратегии Х. Тогда множество со тех xG х для которых

Н(х, Y) < Я(Х. Г),(4.4)

в условиях распределения Х реализуется с вероятностью О, т, е. Х(ск>) = 0.

Аналогично, для произвольной стратегии Xигрока 1 и достигаемости ин-

фимума inf И (X, Y) на стратегии Y множество тех у Gy, для которых у

H(X,Y)<H(X,y),

в условиях Y реализуется с вероятностью 0.

Доказательство. Возьмем исчезающую (т.е. убьшающую и сходящуюся к нулю) последовательность ej > 62 > ... > е„ >... > О и обозначим 7*99



через со„ множество тех х, для которых выполняется неравенство

H(x,Y) < H(x\Y)-e„.(4.5)

Очевидно, g;i С С ... С g;„ С ... и U со„ = со. В силу непрерьюности

п = 1

вероятностного распределения отсюда следует, что lim Z(o;„) = = Х(со).

Если теперь предположить, что Х(со) > О, то должно найтись такое п, что и (со„) > 0. Далее мы имеем:

Я(Z Г)=/Я(х, Y)dX\y) =

а;„ .X \ а;„

В пределах множества со„ выполняется (4.5), а на остальной части х -неравенство (4.4). Следовательно,

Я(Z ¥)£ f (Н{Х\ Y)-€rг)dX\x)\- / Я(X Y)dX\x) = = -6„ / JXЧx)+Я(Z Г)( / dX\x) S dX\x)) =

oJrtа;„X \ ojn

= -6„ / Х(Х)+Я(ХУ),

Я(Х У) + еХ(а;„)Я(Х Г),

чего не может быть, поскольку е > О и (а;„) > 0. Вторая часть леммы доказьшается аналогично. □

4.9. Лемма. В антагонистической игре Г = < х, ууЯ > при любой смешанной стратегии Y игрока 2 максимумы

тахЯ(х, Y) и шахЯ(Х, Y)(4.6)

существуют или не существуют одновременно, и если существуют, то равны.

Точно так же при любой смешанной стратегии X игрока 1 минимумы minHiX,у) и ш1пЯ(Х, Y.) существуют или не существуют одновремен-

НО, и если существуют, то равны.

Доказательство. Рассмотрим равенство (4.2). Если в нем достигается левый супремум, то тем самым достигается и правый, ибо всякая чистая стратегия является и смешанной.

Предположим, что в (4.2) достигается правый супремум. Тогда мы находимся в условиях леммы п. 4.8, согласно которой множество тех х, для которых вьшолняется равенство Я(л:, Y.) = шахЯ(Х, У.), имеет полную

меру и потому непусто. Следовательно, достигается и левый супремум. 100



Значит, максимумы (4.6) действительно существуют или не существуют одновременно. Если же они существуют, то они равны соответствующим супремумам, которые согласно лемме п. 4.7 равны друг другу.

Вторая часть леммы доказьшается аналогично. □

§5. СВОЙСТВА ЗНАЧЕНИЯ ИГРЫ И ОПТИМАЛЬНЫХ СТРАТЕГИЙ ИГРОКОВ

5.1.Приводимые в этом параграфе утверждения по существу повторяют аналогичные высказывания, сделанные в § § 15 и 18 гл. 1 по поводу матричных игр.

Определение. Если имеет место равенство 8иршГЯ(Х, r) = inf 5ирЯ(Х, Y),

X YY X

ТО общее значение этих смешанных экстремумов назьшается значением игры с функцией выигрыша Я. □

Из теоремы § 3 следует, что для существования у игры значения необходимо и достаточно, чтобы при любом е > О в ней бьша бы е-седловая точка (в смешанных стратегиях).

5.2.Теорема. Для любой антагонистической игры Г = <х,у,Я > , имеющей значение Vy ,

sup inf Н(х, y)vy S inf sup H(x, y).(5.1)

X уух

Доказательство. Согласно лемме п. 4.7 для любой стратегии X игрока 1 inf Н(Х,у) = inf Н(Х, У.). Поэтому

sup inf Я(х, у) й sup inf Я(Х, у) = sup inf Я(Х, Г ) = ir,

X у X уX Y

И левая сторона (5.1) доказана. Правая сторона этого неравенства доказывается аналогично. □

5.3.Теорема. Если в антагонистической игре Г = < х, у,Я > игрок 1 имеет чистую оптимальную стратегию х*, а игрок 2 - произвольную (т.е., вообще говоря, смешанную) оптимальную стратегию, то

Vy = max inf Н(х, у) - тшН(х *, у).(5.2)

X уу

Аналогично, если игрок 2 имеет чистую оптимальную стратегию у*, а игрок 1 - произвольную оптимальную стратегию, то

Vy = min sup Н(х, у) = шахН(х,у*).

Доказательство мы проведем для первой части теоремы. Пусть У* - оптимальная стратегия игрока 2. По определению оптимальных стратегий

Vy=H(x\ У*) = ттН(х\ У).

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [ 33 ] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90]