назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [ 47 ] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90]


47

функция Н(х, •) является максимальной огибающей семейства выпуклых функций и поэтому (см. п. 12.11 и 21.2) также выпуклой. Таким образом, антагонистическая игра

Г = <х,у,Я>(24.3)

является выпуклой игрой.

24.2. В вьшуклой игре Г из (24.3) игрок 2 обладает чистой оптимальной стратегией д*, и мы имеем

= min sup Н {х, у) = sup Я (х, j* ) = sup max F. (jc у Л.

у XXX lin

Вспомним, что одноименные экстремумы можно переставлять. Поэтому vr= max supFiiXi,y*),

11 <W X

a так как каждая из функций F/( • ,7,) возрастает, то

Vr = min max F/ (sup jc/, yi) = max F/(sup x/, у *).(24.4)

у lin Xlw X

Отсюда видно, что значение ир игры Г и оптимальная стратегия у* игрока 2 в ней зависят не от множества х стратегий игрока 1 в целом, а разве лишь от набора супремумов

(sup Xl,. .., sup X,,),

д: exдс ex

который далее будем для краткости обозначать через х = (х?, (рис. 2.8).

Рис. 2.8

В частности, v и у* будут здесь теми же, что и в тривиальной вспомогательной "игре" = <{х°} , у,Я>,в которой игрок 1 имеет единственную стратегию .

Формула (24.4) приобретает здесь вид

Уг = тш max F/(x?,j/)= max Fi(xi,yr).

у linl<i<n

(24.5)

24.3. Сделаем замечание, аналогичное замечанию из п. 18.6. Эффект, оказьюаемый неопределенностью с областью х, при выборе распределения у с целью минимизации функции Я из (24.4), оказывается равносильным тому, что каждое из требований /начинает предъявляться к системе в своей максимальной интенсивности х?. Иными словами, "минимакс-



ном" распределении ресурсов следует предполагать, будто каждая доля ресурсов воспримет "свои" максимальные требования, а "оглядьюаться" на фактические резервы по восприятию других требований не следует.

24.4. Естественно предположить, что при полном отсутствии ресурсов по обеспечению какого-либо из требований напряженность работы системы становится большей, чем при оптимальном распределении ресурсов. Это значит, что дпя оптимального распределения у * все компоненты j* должны быть положительными.

В условиях сделанного предположения справедлива следующая лемма.

Лемма. Для каждого / = !,...,« должно быть

VT=F,{xlyr).(24.6)

Доказательство. Предположим, что для некоторого к

F,ixl,y*,)<vr.(24.7)

Согласно сделанному выше допущению у > 0. Возьмем теперь столь малое 6 > О, что и Fixl, yl..- е)<иг, и составим новую стратегию у игрока 2, положив

у*-е для / =к,

(24.8)

+ -7 для гФк. п - \

Тогда по строгой монотонности каждой из функций F/(x, • ) для i Ф к будет

F,(xlyb<FAAyb.(24.9)

так что

шах Fi(xly\)< шах F.ixlyr). 1Фк1Фк

Последнее неравенство вместе с (24.7) дает

max F,(xf,yf)<ur,

а это противоречит (24.5). □

24.5. Теперь мы можем найти оптимальную стратегию у* игрока 2 в игре Г (она та же, что и в "игре" Г°).

Каждая из функций Fx, • ) строго монотонна и непрерьшна. Поэтому она имеет обратную, также строго монотонную и непрерьшную фунюшю, которую мы обозначим через i-. Из (24.6) следует, что

у1-Фт\(24.10)

Эта формула имеет достаточно естественный содержательный смысл. Функция ставит в соответствие достигнутому по линии требования i результату затраченные на удовлетворение этого требования ресурсы у*. Она характеризует как бы "ресурсоемкость" требования /. При этом оптимальное распределение ресурсов по требованиям должно быть таким, чтобы все требования обеспечивали в соответствии с их ресурсоемкостями один и тот же результат: значение игры и.



Далее, суммируя (24.10) по /, получаем

Но сумма функций «р/ также является строго монотонной и непрерывной и, в свою очередь, имеет обратную ip~. Из (24.11) следует, что = Ф (1), и подстановка (24.10) дает нам

у:=МЧ1)У(24.12)

24.6.Вернемся к исходной игре Г. Ввиду компактности пространства х и тривиальной непрерывности компоненты Х/по х все супремумы sup х

достигаются. Пусть sup Х/ достигается на х, так что= х}.

X Gx

Вообще говоря, sup х,- может достигаться на различных стратегиях

игрока 1, так что выбор стратегии х неоднозначен. Однако все эти стратегии имеют равные f-e компоненты, а только они и участвуют в выражении для функции вьшгрыша. Поэтому мы можем все такие стратегии отождествить или, что то же самое, ограничиться рассмотрением произвольно выбранного представителя множества всех таких стратегий. Далее мы будем считать, что стратегии х при /= 1,..., л зафиксированы однозначно.

24.7.Перейдем к нахождению оптимальной стратегии X* игрока 1 в игре Г. В ее спектр могут входить лишь стратегии вида х ПустьX* = = (?1,. • • »?,1),где ?1 - вероятность соответствующей стратегии х .

Лемма. Для оптимальной стратегии X* = (i,..., „) должно быть ?/>0(/=1,...,«).

Доказательство. Предположим, что ~ наших условиях у1 > 0). Возьмем некоторое О < е < и построим стратегию игрока 2 в соответствии с (24.8). Для этой стратегии ввиду О и (24.9) будет

Н(Х\у)= 2 tF(x(>,/)= 2 max F,(x\y9)< < S max Ff{\yJ)= I Н(х\у*) = Н{Х\у*),

i Фк 1<}<П1=1

что противоречит оптимальности стратегии у*, □

24.8. Нам остается фактически найти компоненты оптимальной стратегии X* игрока 1. Составим для этого все уравнения вида (23.5) (ввиду установленной положительности всех компонент неравенства вида (23.6) здесь отсутствуют), которые в данном случае приобретают вид

Полагая для краткости

W4,yk) дУк

-Л = 0, к=1,...,п.(24.13)

у = у*

У = У

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [ 47 ] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90]