назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232] [233] [234] [235] [236] [237] [238] [239] [ 240 ] [241] [242] [243] [244] [245] [246] [247] [248] [249] [250] [251] [252] [253] [254] [255] [256] [257] [258] [259] [260] [261] [262] [263] [264] [265] [266] [267] [268] [269] [270] [271] [272] [273] [274] [275] [276] [277] [278] [279] [280] [281] [282] [283] [284] [285] [286] [287] [288] [289] [290] [291] [292] [293] [294] [295] [296] [297] [298] [299] [300] [301] [302] [303] [304] [305] [306] [307] [308] [309] [310] [311] [312] [313]


240

не моду распределения. Обычно игроки приходят либо к исходу C либо к исходу DD (Rapoport and Chammah, 1965).

Бимодальность наблюдается и в повторяющихся играх против запрограммированного игрока, который «настроен» на кооперативную стратегию. Приблизительно половина наблюдаемых субъектов «отвечает» на это сотрудничество тем же, в то время как другая половина пытается его использовать с целью получения максимального платежа.

Сравнение результатов различных программируемых стратегий в повторяющейся игре показало, что так называемая стратегия взаимности «как ты мне, так и я тебе» (tit for tat) оказалась наиболее эффективной для установления сотрудничества между субъектами. Эта стратегия начинает с выбора С и далее повторяет выбор партнера в пред-ществующей игре. Некоторый психологический интерес содержится в наблюдении, что субъекты почти никогда не знают, что они на самом деле играют против своего собственного зеркального отражения с отставанием на одну игру. В некотором смысле этот факт демонстрирует, как трудно признать, что поведение других по отнощению к тебе может быть в значительной степени отражением твоего поведения по отношению к ним. Следствием этого непонимания может быть, например, эскалация взаимной враждебности в различных ситуациях.

Возможно, наиболее интересный результат экспериментов с повторяющейся игрой в рамках «дилеммы заключенного» состоит в том, что, даже если количество повторений игры известно обоим субъектам, тем не менее, часто достигается неявное соглашение о сотрудничестве. Это наблюдение интересно тем, что оно иллюстрирует недостаточность рекомендаций, базирующихся на абсолютно строгих стратегических рассуждениях.

На первый взгляд, неявное соглашение рационально для повторяющейся игры, поскольку «измена», как можно предположить, вызовет ответную «враждебную позицию» в целях «самозащиты», поскольку другой игрок стремится избежать наихудшего исхода, связанного с предложенным, но отвергнутым сотрудничеством. Тем не менее, этот аргумент не относится к игре, о которой известно, что она последняя, поскольку за ней не может последовать расплата. Таким образом, D доминирует над С в последней игре, и согласно «принципу обеспеченного успеха» результат DD является предопределенным. Это переключает внимание на игру, предшествующую последней, которая теперь, по сути, сама есть «последняя игра» и к которой теперь может быть применена та же аргументация. И так далее. Таким образом, строгий стратегический анализ показывает, что стратегия, состоящая из D для всех повторений игры, - единственно рациональная независимо от числа повторений.

Индукция «от конца» не может быть проведена, если количество повторений бесконечно, неизвестно или определено стохастически. В таких случаях, если вероятность завершения игры не слишком велика, индивидуальная рациональность не обязательно диктует 100%-е использование стратегии D. Естественно, возникает вопрос о сравнительных достоинствах различных стратегий в повторяющейся игре типа



«дилеммы заключенного». Этот вопрос рассмотрен эмпирически в работе Аксельрода (Axelrod, 1984).

Лиц, заинтересованных в этой проблеме, попросили представить программы для проведения 200-шагоюй игры типа «дилеммы заключенного». Каждая программа должна была «сыграть» с каждой другой представленной программой, включая саму себя. Программа с самой большой суммой полученных платежей объявлялась победителем конкурса.

Было предложено 15 программ, и среди них - программа со стратегией «взаимности» (tit for tat). Она и получила самую высокую оценку. Был объявлен второй конкурс, на этот раз со стохастическим завершением, при ожидаемом числе итераций около 150. Одновременно с приглашением к участию во втором конкурсе были оглашены результаты первого конкурса вместе с полными описаниями представленных программ. На этот раз было подано 63 программы из шести стран. Программа со стратегией «взаимности» вновь была среди них (предложенная тем же конкурсантом и никем другим), и она снова получила самую высокую оценку.

Интересная особенность этого результата состояла в том, что выигравшая стратегия не «победила» ни одну программу, против которой она играла. Действительно, она не может победить ни одну программу, поскольку единственный путь получить более высокую оценку, чем партнер, состоит в применении большего, чем он, числа стратегий Д чего, по определению, стратегия «взаимности» не может сделать. Она может только сыграть вничью либо проиграть, но не более чем одну игру. Из этого следует, что стратегия «взаимности» получила самую высокую оценку, потому что другие программы, очевидно, разработанные так, чтобы победить своих оппонентов, каждый раз сокращали выигрыш обоих партнеров, включая свой собственный. Результаты этих конкурсов могут быть проинтерпретированы как дальнейшее подтверждение ущербности стратегий, базирующихся на попытках увеличивать индивидуальные выигрыши в ситуациях, где возможны как кооперативные, так и конкурентные стратегии. Кроме того, преимущество кооперативных стратегий не обязательно зависит от наличия возможностей для явных соглащений.

Поддержка последнего вывода пришла из такого отчасти неожиданного источника, как приложения игровых концепций в теории эволюции (Maynard Smith, 1982; Rapoport, 1985). До недавних пор игровыми моделями, использовавшимися в теоретической биологии, бьши так называемые игры против природы (см., например, работу: Lewontin, 1961). «Выбор стратегии» бьш представлен появлением определенного генотипа в популяции, живущей в стохастической среде. Степень адаптации к среде выражалась в относительном воспроизводственном успехе данного генотипа, т.е. статистически ожидаемой численности потомства, доживающего до репродуктивного возраста. В данном случае популяция эволюционировала к наилучшим образом приспособленному генотипу.

В этой модели адаптация зависит только от вероятностного распределения наблюдаемых состояний природы (например, влажные или



сухие сезоны), но не от доли популяции, которая приняла данную стратегию. Когда эта зависимость вводится, модель становится действительно игровой с более чем одним настоящим игроком.

Модель, описанная в виде «дилеммы заключенного», появилась в теоретической биологии в связи с борьбой между особями одного и того же вида, например, за самок или за территорию. Предположив для простоты наличие двух способов борьбы, «жесткого» и «мягкого», можно, изучая вероятный результат эволюции, увидеть связь с «дилеммой заключенного». В столкновении между «жесткой» и «мягкой» особями первая выигрывает, а вторая - проигрывает. Тем не менее, столкновение между двумя «жесткими» особями может вызвать более серьезный ущерб для обеих, чем столкновение между двумя «мягкими» противниками. При соответствующем ранговом упорядочении платежей (относительных воспроизводственных успехов) модель становится «дилеммой заключенного». Развитие несмертельных орудий борьбы, таких, как, например, загнутые назад рога, или поведенческие ограничения, возможно, были результатом естественного отбора, благодаря которому смертельные поединки между особями одного и того же вида становились редкими.

Повторяющиеся схватки предполагают сравнение эффективности стратегий в повторяющейся игре. Мейнард Смит и Прайс (Maynard Smith and Price, 1973) наблюдали компьютерно имитируемую популяцию в повторяющейся игре типа «дилеммы заключенного» при использовании игроками различных стратегий, где платежами были дифференцированные коэффициенты воспроизводства игроков, использующих соответствующие стратегии. Таким образом, происходило наблюдение за эволюцией данной популяции. В конечном счете отвечающие взаимностью, т.е., по существу, игроки со стратегией «как ты мне, так и я тебе», стали отчетливо преобладать.

Центральным понятием в игровых моделях эволюции является «эво-люционно стабильная стратегия» (ЭСС). Она стабильна в том смысле, что популяция, состоящая из генотипов, применяющих данную стратегию, не может быть «завоевана» изолированными мутантами или мигрантами, поскольку такие «захватчики» не должны иметь «воспроизводственного успеха». С помощью компьютерного моделирования было показано, что популяция, поведение которой описывается программами, представленными на выщеупомянутый конкурс, эволюционирует к стратегии «взаимности». Тем не менее, впоследствии было показано и то, что стратегия «взаимности» не является во всех случаях эволюционно стабильной.

В итоге больщой интерес к «дилемме заключенного» среди специалистов по теории поведения и в последнее время среди многих биологов может быть отнесен на счет новых идей, порожденных на основе анализа этой игры и результатов экспериментов с ней. Различные рекомендации относительно рещений, базирующихся на индивидуальной и коллективной рациональности в некоторых конфликтных ситуациях, порождают сомнения в том, что простое определение «рациональности» как эффективной максимизации чьих-либо ожидаемых выгод

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194] [195] [196] [197] [198] [199] [200] [201] [202] [203] [204] [205] [206] [207] [208] [209] [210] [211] [212] [213] [214] [215] [216] [217] [218] [219] [220] [221] [222] [223] [224] [225] [226] [227] [228] [229] [230] [231] [232] [233] [234] [235] [236] [237] [238] [239] [ 240 ] [241] [242] [243] [244] [245] [246] [247] [248] [249] [250] [251] [252] [253] [254] [255] [256] [257] [258] [259] [260] [261] [262] [263] [264] [265] [266] [267] [268] [269] [270] [271] [272] [273] [274] [275] [276] [277] [278] [279] [280] [281] [282] [283] [284] [285] [286] [287] [288] [289] [290] [291] [292] [293] [294] [295] [296] [297] [298] [299] [300] [301] [302] [303] [304] [305] [306] [307] [308] [309] [310] [311] [312] [313]