назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232] [233] [234] [235] [236] [237] [238] [239] [240] [241] [242] [243] [244] [245] [246] [247] [248] [249] [250] [251] [252] [253] [254] [255] [256] [257] [258] [259] [260] [261] [262] [263] [264] [265] [266] [267] [268] [269] [270] [271] [272] [273] [274] [275] [276] [277] [278] [279] [280] [281] [282] [283] [284] [285] [286] [287] [288] [289] [290] [291] [292] [293] [294] [295] [296] [297] [298] [ 299 ] [300] [301] [302] [303] [304] [305] [306] [307] [308] [309] [310] [311] [312] [313]


299

ИГРЫ с НУЛЕВОЙ СУММОЙ

Майкл Бахарах

Zero-sum Games

Michael Bacharach

Для теории игр игры с нулевой суммой являются тем же, чем две-надцатитактовый блюз для джаза: одновременно и крайним случаем, и исторической отправной точкой. Игрой называется ситуация, характеризующаяся: 1) наличием множества агентов (игроков), у каждого из которых имеется множество альтернативных линий поведения или стратегий; 2) наличием исходов, зависящих от комбинации действий игроков и определяющих предпочтения игроков на множестве этих комбинаций; 3) тем, что каждый игрок знает, каковы эти предпочтения у всех других игроков, и знает, что они известны всем остальным. (Строго говоря, такая ситуация называется игрой с полной информацией в нормальной форме - в дальнейщем мы будем иметь в виду именно ее.) В литературе по играм с нулевой суммой рассматриваются, как правило, два игрока, скажем, Л и Д в распоряжении которых имеется конечное множество стратегий, а их предпочтения могут быть описаны функциями полезности фон Неймана - Моргенщтерна. Такую структуру предпочтений можно представить в виде матрицы платежей, в которой элемент, стоящий на пересечении /-й строки и у-го столбца, т.е. {Ujj, v-j), обозначает ожидаемые полезности или платежи соответственно игроков АпВ, если первый игрок выбирает стратегию /, а второй - стратегию j. Если в игре такого типа и + v.j = О для всех / VLj, то эта игра носит название матричной игры с нулевой суммой (в дальнейщем мы называем ее просто игрой с нулевой суммой). В таких играх предпочтения игроков в отнощении каждой пары стратегий в точности противоположны, поэтому у них нет никаких оснований действовать как пара или команда, т.е. никаких причин для сотрудничества (кооперативных действий). Поэтому теории кооперативных игр с нулевой суммой не может быть в принципе: такие игры, по определению, являются некооперативными, и каждый игрок должен выбирать свою стратегию в условиях неопределенности относительно выбора другого.

На рис. 1 приводится матрица платежей игры с нулевой суммой, которую можно назвать «Битва в Новогвинейском море». Как принято в играх с нулевой суммой, в матрице отражены только платежи игрока, выбирающего строки (поскольку тем самым заданы и платежи ифОка, выбирающего столбцы, - это те же числа, только с противоположными знаками. - Примеч. пер.). Генерал Кении (игроку4) должен рещить, искать ли ему японский флот в северном направлении (страте-



гия а,), где видимость плохая, или в южном (стратегия aj); японский командующий (игрок В) решает, плыть ли ему северным (стратегия Р,) или южным путем (стратегия Pj). Платеж для Кении есть ожидаемое число дней, в течение которых он сможет бомбить вражеский флот.

Bs strategies

As strategies

P. Р2

2 2

1 3

Рис. 1

Фон Нейман и Моргенштерн (Neumann and Morgenstem, 1944) разработали аппарат теории игр как часть теории рационального действия, изучающую групповые взаимодействия людей, при том что результат этих взаимодействий, т.е. платежи для каждого из агентов, существенным образом зависят от решений других агентов. В такой ситуации характеристика того или иного действия как рационального оказывается проблематичной, что прекрасно понимали фон Нейман и Моргенштерн. Основная теоретическая проблема состоит в том, что будут делать Ап В, если каждый из них стремится достичь лучшего для себя результата. Но то, какое действие будет лучшим для А, зависит от того, что будет делать В, т.е. от того, что лучше всего для В, и т.д. до бесконечности. Фон Нейман и Моргенштерн полагали, что они отыскали удовлетворительное решение этой фундаментальной проблемы для специального случая игр с нулевой суммой. Это решение обусловило популярность таких игр.

Сильная сторона теории фон Неймана - Моргенштерна состоит в том, что для широкого класса игр (игр с нулевой суммой) любой из двух совершенно независимых друг от друга принципов рационального поведения дает один и тот же совершенно определенный ответ на вопрос о том, как же должны себя вести ифоки. Столь высокая степень внутренней непротиворечивости теории, проявляющаяся во взаимном подтверждении двух ее постулатов, возможно, привела к несколько преувеличенной оценке достоинств каждого из этих постулатов самого по себе. Эти два постулата или принципа рационального действия называются «принципом равновесия» и «принципом максимина». «Принцип равновесия» гласит, что стратегии а* и р* рациональны лишь тогда, когда каждая из них есть наилучший ответ на другую, т.е. когда а* максимизирует u(d, р*), а р* максимизирует v(a*, Р), где и (а, Р) и v(a, Р) означают платежи игроков Ап В соответственно, если выбрана пара стратегий (а, Р). (Термин «ответ» надо понимать метафорически, поскольку в данном случае нет непосредственной коммуникации.) Такая пара стратегий в теории игр называется некооперативным равно-



весием, или равновесием по Нэшу. В данном случае ввиду того, что м(а, р) = -v(a, р), ее нередко называют также седловой точкой, поскольку она задает максимум и на множестве а и минимум и на множестве р. «Принцип равновесия» нередко понимался слишком поверхностно, однако в его защиту выдвигалось и немало строгих аргументов (см., например: Johansen, 1981). Фон Нейман и Моргенштерн отчетливо осознавали, что он может служить не более чем необходимым условием рационального выбора игроков: если рациональные стратегии существуют, они, как можно доказать, должны отвечать этому принципу, однако для их существования требуются другие, независимые причины (Нейман и Моргенштерн, 1944 (1970), разд. 17. 3).

«Принцип максимина» гласит, что игрок А должен максимизировать на множестве а минимум м(а, р) на множестве р, т.е. искать «мак-симин» и, а В должен искать максимин v или, что эквивалентно, «ми-нимакс» и. Другими словами, А следует максимизировать свой уровень безопасности, который для стратегии а есть не что иное, как т1пр м(а, р) - наихудший исход, который может дать ему стратегия а; а В надлежит минимизировать свои уровень риска тах м(а, Р) - наилучший исход, который может дать стратегия р его сопернику. Этот принцип неоднократно подвергался критике, и его принятие (с некоторыми оговорками) в конечном счете бьшо отчасти обязано тому обстоятельству, что он удачным образом сочетался с другими положениями теории фон Неймана - Моргенштерна. Их собственная аргументация в его защиту была скорее интуитивной, чем строгой: они утверждали, что принцип максимина отражает рациональную осторожность игрока, не имеющего веских оснований для того, чтобы приписать определенные вероятности отдельным стратегиям оппонента. Второй аргумент (не стоящий своих авторов) бьш справедливо раскритикован Элсбергом (Ellsberg, 1956); в соответствии с ним, рациональным для игрока А может быть решение, принятое им при том предположении, что он принимает пассивную стратегию («м1погап1 game»), соответствующую матрице платежей. В такой ифс А делает первый ход, а В - второй, зная, как сыграл А (иначе говоря, А выступает в роли «лидера по Штакельбергу»). В такой ситуации жесткие правила выбора в условиях определенности действительно делают для А рациональной стратегию максимина. Однако нет никаких убедительных оснований в пользу того, что А должен воспринимать ситуацию именно так.

В игре с Новогвинейским морем легко видно, что набор максимин-ных пар стратегий совпадает с набором седловых точек. Этот факт наглядным образом иллюстрирует общее правило (теорема 1): если в игре с нулевой суммой имеется седловая точка, то определяющая ее пара стратегий будет седловой тогда и только тогда, когда эта пара представляет собой максимин. Теорема 1 утверждает, что два принципа выбора совпадают. Кроме того, оба принципа однозначно определяют решение, что утверждает теорема 2: если в игре с нулевой суммой есть седловая точка, то каждая максиминная стратегия одного игрока в сочетании с соответствующей максиминной стратегией другого игрока дает один и тот же платеж.

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232] [233] [234] [235] [236] [237] [238] [239] [240] [241] [242] [243] [244] [245] [246] [247] [248] [249] [250] [251] [252] [253] [254] [255] [256] [257] [258] [259] [260] [261] [262] [263] [264] [265] [266] [267] [268] [269] [270] [271] [272] [273] [274] [275] [276] [277] [278] [279] [280] [281] [282] [283] [284] [285] [286] [287] [288] [289] [290] [291] [292] [293] [294] [295] [296] [297] [298] [ 299 ] [300] [301] [302] [303] [304] [305] [306] [307] [308] [309] [310] [311] [312] [313]