назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [ 40 ] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90]


40

12.6. Выпуклые функции имеют достаточно простые аналитические свойства. Лемма Если выпуклая функция является дифференцируемой, то ее производная не убывает.

Доказательство. Мы установим даже несколько более точные факт: если в некоторой точке z выпуклая функция имеет левую и правую производные, то значение левой производной не превосходит значения правой.

f(b-O)

Рис. 2.4

Действительно, пусть значение левой производной в точке z больше значения правой производной. Это значит, что найдется столь малое А > О, что

V?(z) - «(z - А) «(z + А) - <p(z) АА

откуда

I ((z- Д)+ <(z +A)>.(z) = ,Q (z-A)+l (z + A)j,

ЧТО противоречит вьшуклости . □

12.7.Следствие. Если производная выпуклой функции обращается в некоторой точке в нуль, то функция в этой точке достигает своего аналитического минимума, являющегося при этом наименьшим ее значением.

Если выпуклая функция является дважды дифференцируемой, то ее вторая производная неотрицательна.

12.8.Лемма. Если функция кр выпукла на сегменте [а,Ь], aZ - произвольная вероятностная мера на [а,Ь], то

(fzdZiz)) ){z)dZ{2), аа

Доказательство следует из леммы п. 12.2 и непрерывности вьшуклой функции путем предельного перехода. □

12.9.Лемма. Если функция р{х,у) выпукла по у при любом значении д: G е [с; Ъ], а X - произвольная вероятностная мера на [а\ Ь], то интеграл

Ф(У) {Х, у)= f (х, y)dXix) а

также является выпуклой функцией.

Доказательство. Возьмем произвольное \е [О, 1]. На основании выпуклости функции fi мы имеем для любых Ух, у2 Ь

ф(Ху, +а -Х)У2)= Ifix. \у, +a-X)y2)dX(x) а

1 (Я>(х, у,) + а-Х) {х, у 2 ))dX(x) = а

= {x,y)dX{x) + {l-X) S{x,y2)dX{x) = Xylj{yy) + {l-X)(y2),(12.3)

а это и требовалось. □ 120



12.10.Лемма. Если функция ip{x, у) строго выпукла по у при любом значении [а,Ь], а X ~ произвольная вероятностная мера на [а,Ь], то интеграл Ф{у) =

- f (х, y)dXix) также является строго выпуклой функцией, а

Доказательство этой леммы аналогично доказательству предыдущей. Выполнение в формуле (12.3) строгого неравенства обеспечивается тем, что

{х, Ху +(1 ~Х)у)<Х{х,у,) + а -Х)<р(х,у)

для всех значений х, а множество всех х имеет в смысле X положительную меру. □

12.11.Л е м м а. Если функция ip{x, у) выпукла по у при любом значении х, то верхняя огибающая функций -, у) sup «(х, у) также является выпуклой.

Доказательство. Для любых х,у,у и \G[0, 1] мы имеем {х, Ху, {1~Х)у)<Х{х,у,){1-Х){х,у),

или, переходя к супремумам,

suip{x, Ху +(1 - Х)у)ъщ{Х{х,у)-(Х - Х)(х,у)

\ sup (p(x, J) + (1 - \) sup (р(Х, J2 ),

а. это и требовалось. □

§ 13. ВЫПУКЛЫЕ ИГРЫ НА ЕДИНИЧНОМ КВАДРАТЕ. ЧИСТЫЕ ОПТИМАЛЬНЫЕ СТРАТЕГИИ ИГРОКА 2

13.1.Определение. Непрерьшная антагонистаческая игра на единичном квадрате с функцией выигрьппа Я назьшается выпуклой, если функция Я(х, •): y->R вьшуклапри любом значении л: Ex. □

Как и во всякой непрерьюной игре на единичном квадрате (см. последнее следствие в п. 11.4), в выпуклой игре игроки имеют смешанные опта-мальные стратегии. В этом и в следующих параграфах будут описаны строение и способы нахождения оптимальных стратегий игроков в выпуклых играх на единичном квадрате.

Ясно, что все теоретако-игровые утверадения, относящиеся к играм на ехшничном квадрате, могут быть перенесены на игры, в которых пространствами чистых суратегий игроков являются произвольные сегменты.

13.2.Согласно принципу двойственно ста для антагонистаческих игр (см. п. 5.4 гл. 1) вьшуклым играм соответствуют вогнутые в смысле следующего определения.

Определение. Непрерьюная игра на единичном квадрате с функцией вьшгрыша Я назьюается вогнутой, если функция Н{, у): X -R вогнута при любом значении уЕу.П

Далее нами будет строиться теория вьшуклых игр. Очевидно, теория вогнутых игр будет двойственной к ней, и ее положения получаются естественным образом из соответствующих положений теории вьшуклых игр.

13.3.Теорема. 5 выпуклой игре на единичном квадрате игрок 2 имеет чистые оптимальные стратегии. Множество всех таких стратегий составляет сегмент.

Доказательство. Рассмотрим вьшуклую игру Г с функцией вьшгрьппа Я. Пусть Vy - значение Г, X * - одна из оптамальных стратегий игро-



ка1,а F* -игрока 2. Тогда

H(x,Y*)H(X\Y*) = Vj. длялюбого xG[0,1].(13.1)

В условиях смешанной статегий Y* игрока 2 чистая его стратегиями оказьшается случайной величиной, принимающей к тому же числовые значения. Поэтому можно говорить о математическом ожидании этой случайной величины:

y*=fydY*(x).(13.2)

На основании леммы п. 12.8 мы 1меем при любом л: G [0,1 ] H{x,y)=H(XyfydY*(y))<

1(13.3)

UIH(x,y)dY*(y)=H{x, Г*), о

Вместе с (13.1) это дает намЯ(л:, у*) для всех х G [О, 1]. Следовательно, по теореме п. 5.5 у* является оптимальной стратегией игрока 2.

Если теперь у и у" - чистые оптимальные стратегии игрока 2, то по теореме п. 5.5 должно быть

H(x,y)vr. H(x,y")<vr

при любых X G [о, 1 ]. Отсюда ввиду выпуклостн функции Н(х, •) при любом [0,1]

Я(х,Х;; + (1 -Х)у)<\Н{х,у)-{1 -X)H(x,y")Vr

для всех X. Последнее означает оптимальность чистой стратегии \у +

+ (1-Х)У.

Наконец, в силу непрерьюности функции Н(х, •) множество тех значений у, для которых Н(х, у) i;r, должно бьггь замкнутым.

Остается заметить, - что вьшуклое замкнутое подмножество сегмента само должно быть сегментом. □

13.4.Следствие. В выпуклой игре

Vy =тштахЯ(д:, ) = тахЯ(х, j*),(13.4)

где у* - оптимальная чистая стратегия игрока 2.

Это вьггекает из теоремы п. 5.2, причем достижимость внутреннего максимума обеспечивается непрерьюностью функции Я по х □

13.5.Следствие. Чистые оптимальные стратегии у * игрока 2 в выпуклой игре суть решения уравнения

Vr =тгхН(х,у*).(13.5)

Действительно, для того чтобы стратегия игрока 2 бьша решением уравнения (13.5), необходимо и достаточно, чтобы бьшо Я(х, у*) для всех X. Но ввиду теоремы п. 5.4 это равносильно оптимальности стратегии игрока 2. □

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [ 40 ] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90]