назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [ 31 ] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90]


31

уравнений анализом интегральных уравнений, которые в благоприятных случаях поддаются сведению к системам дифференциальных уравнений).

1.3. Определение. Если х и у - топологические пространства, то игра Г = (X,у,Я)назьшается топологической. Если при этом функция вьшгрыша Я непрерьюна на пространстве ситуаций х X у (в смысле топологии произведения, т.е. по двум переменным сразу), то топологическая игра Г назьшается непрерывной. □

Упомянем специально класс антагонистических игр, в которых х = у = = [0,1]. В этих играх ситуации суть пары чисел (х, у), где у G [0> 1] •

Рис. 2.1

Такие пары естественно понимать как точки единичного квадрата. Поэтому описьшаемые игры назьшаются играми на единичном квадрате (рис. 2.1).

1.4. Как и во всякой вообще антагонистической игре, принципом оптимального поведения игрока можно считать его следование "максиминному" образу действий. Как бьшо установлено в § 6 гл. 1, этот принцип реапизует-ся в игре Г = < X, у,Я> тогда и только тогда, когда существуют и равны смешанные экстремумы

шах inf Н(х,у) и min 8ирЯ(д:,>).(1.2)

Для конечных антагонистических (матричных) игр существование этих экстремумов было нами доказано в §10 гл. 1, и все дело заключалось в установлении их равенства или хотя бы в нахождении путей преодоления их неравенства.

§ 2. СИТУАЦИИ 6-РАВНОВЕСИЯ, 6-СЕДЛОВЫЕ ТОЧКИ И 6-ОПТИМАЛЬНЫЕ СТРАТЕГИИ

2.1. Для бесконечных антагонистических игр даже существование смешанных экстремумов (1.2), вообще говоря, не обязательно имеет место.

Рассмотрим в качестве примера игру Г = <х,у,Я>, в которой х = у = = (О, 1), а Я(д:, >) =х-\-у (см. пример из п. 2 введения, проиллюстрированный рис. 1.2 в п. 4.3 гл. 1) .

Здесь, очевидно, седдовой точкой "бьша бы" ситуация (1, 0), если бы 1 и О входили в число стратегий игроков. Именно на этих стратегиях игроков и могут достигаться внешние экстремумы в выражениях из (1.2). Значением игры в этом случае бьшо бы число 1. Поскольку, однако, в



действительности внешние экстремумы в (1.2) здесь не достигаются, все эти возможности непосредственно не реализуются. Ясно вместе с тем, что игрок, выбирая в качестве cвcfёй стратегии число, достаточно близкое к единице, уверенно получит вьшгрьпп, достаточно близкий к значению игры. Точно так же игрок 2, выбирая число, достаточно близкое к нулю, сделает свои потери сколь угодно близкими к значению игры. Поэтому в описьшаемой игре можно говорить об оптимальности стратегий игроков "с точностью до произвольного е > О". Соответствующие понятия поддаются точной формализации.

2.2.Определение. Ситуация (Хе,Je) в антагонистической игре Г = ( X, у, Я > назьшается ситуацией е-равновесия, если для любых стратегий хи у соответственно игроков 1 и 2 имеет место неравенство

Я(х, у,)-е Н(х, ,Уе)Н(х„у) + е.(2.1)

Точку (х,у), ддя которой вьшолняется соотношение (2.1), назьшают также е-седловой точкой функции Я. □

2.3.Определение. Стратегии хиу, составляющие ситуацию е-равновесия в антагонистической игре, называются е-оптимальными стратегиями. □

Этот термин отражает тот факт, что такие стратегии являются оптимальными "с точностью до е ". Именно, если отклонение от оптимальной стратегии никакой пользы игроку принести не может, то его отклонение от е-оптимальной стратегии может увеличить его выигрыш, но не более чем пае.

2.4.Пусть игры Г = (X, у, Я) и Г = (х, у, Я) аффинно эквивалентны, т.е. имеет место Н = кН + а, где > 0. Тогда из (2.1) следует, что всякая ситуация €-равновесия в игре Г является ситуацией А:е-равновесия в игре г.

2.5.Из (2.1) и определения изоморфизма антагонистических игр (см. п. 1.4 гл. 1) следует, что изоморфные игры имеют одни и те же ситуации е-равновесия.

Точно так же из (2.1) и определения зеркального изоморфизма следует, что если (х , Уе) является ситуацией е-равновесия в некоторой игре, то (Уее) будет ситуацией е-равновесия в зеркально изоморфной к ней игре.

§ 3. е-ОПТИМАЛЬНЫЕ СТРАТЕГИИ И МИНИМАКСЫ

3.1. Связь е-седловых точек общих антагонистических игр с минимакса-ми есть обобщение описанной в п. 6.1 гл. 1 связи с ними седловых точек матричных игр.

Критерий существования у функции выигрыша е-седловых точек при любом е > О напоминает критерий существования седловых точек.

Теорема. 1) Если (х, Уе) - е-седловая точка функции Я: хХ у ->

1п{Н{х,,у)г2е sup ЫН{х,у),(3.1)

уX у

sup Я(х, Уе)-2е inf sup Я(х, у).(3.2)

Xу X



2)Если при всяком б > О функция Н имеет е<едловые точки, то

sup inf Н{х, у) = inf sup Н{х, у),(3.3)

X уух

3)Если выполняются соотношения (3.1), (3.2) и (3.3), го {х,у) является Ае-седловой точкой функции Н.

4)Если имеет место равенство (3.3), то при любом б > О функция Н имеет е-седловую точку.

Обратим внимание на следующую особенность доказываемых фактов. Согласно части 1) теоремы, на компонентах б-седловых точек внешние экстремумы минимаксов достигаются не с точностью до б, а лишь с точностью до 2б. В свою очередь, согласно части 3) теоремы, погрешность в достижении внешних экстремумов минимаксов при оценке седловой точки также должна увеличиваться вдвое.

Доказательство. Пусть (х, Уе) - б-седловая точка функции Я. Это означает, что

Я(Х, у,) - б ЩХ„ Уе)йтХе.У) + 6.(3.4)

Кроме того, при любом х, очевидно,

inf Я(д:, у) - ейН{х, Уе)-е,(3.5)

Из (3.4) и (3.5) следует, что

inf Я(х, у) - б Я(х, у,) - б Я(Хе, >) + б.

Переход в этом неравенстве к супремуму по х и к инфимуму по у дает нам sup inf Я(х, jv) - е

X у

sup Я(х, >J - б < inf Я(л:е, J) + 6.(3.6)

Сравнение крайних частей последнего неравенства дает нам сразу (3.1). Сходным образом получается и (3.2), и первая часть теоремы доказана.

Перейдем теперь в правой части неравенства (3.6) от значений функций на х ну к. экстремумам:

inf sup Н{х, j) - б sup inf Н{х, j) + б.

ухX у

Ввиду произвольности б > о отсюда следует inf sup Н{х, J) sup inf Я(л:, у).

ухX у

Но обратное неравенство имеет место всегда (см. п. 4 § 6 гл. 1), так что справедливо (3.3) и тем самым - вторая часть теоремы. Далее, из (3.1), (3.2) и (3.3) следует, что

supН{х, Je) - 2б inf Я(х, j) + 2б,

т.е. при всех хну

Н{х, у,) - 2б Н{х„у) + 2б.(3.7)

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [ 31 ] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90]