Финансы

единственной промежуточной станции. Его противник, который, как предполагается, достаточно умен, чтобы представить себе такие возможности, стоит перед тем же самым выбором. Оба противника должны выбрать место выхода из поезда, не зная о соответствующем решении, принимаемом каждым из них. Если в результате принятия решений они окажутся в конце концов на одной и той же платформе, то Шерлок Холмс может с достоверностью считать себя убитым Мориарти. Если Шерлок Холмс благополучно достигнет Дувра, то он может считать себя спасенным.

Каковы оптимальные стратегии, в частности, для Шерлока Холмса? Эта игра имеет, очевидно, определенное сходство с игрой в «орлянку»; профессора Мориарти можно принять за того игрока, который стремится угадать. Назовем его игроком 1, а Шерлока Холмса - игроком 2. Обозначим выбор выхода в Дувре через 1, а выбор выхода на промежуточной станции через 2. (Это относится как к т4, так и к т2.)

Рассмотрим теперь матрицу &С в табл. 7. Клетки (1, 1) и (2, 2) соответствуют поимке профессором Мориарти Шерлока Холмса. Элементы матрицы, соответствующие этим выборам, должны быть, по вполне понятным

причинам, очень большими, например 100. Клетка (2, 1) означает, что Шерлок Холмс благополучно попадает в Дувр, в то время как Мориарти останавливается в Кентербери. Это - поражение Мориарти; поскольку оно касается обоих соперников, этой ситуации должно соответствовать в матрице большое по абсолютной величине отрицательное число, но меньшее, чем упомянутое выше положительное число. Пусть, например, это отрицательное число есть -50. Клетка (1, 2) означает, что Шерлок Холмс ускользает от Мориарти на промежуточной станции, *но не попадает на континент. Это лучше всего назвать ничьей и соответствующему элементу матрицы приписать значение 0.

Матрица &С изображена в табл. 10.

Как в рассмотренных ранее примерах (Ь) и (с), диагонали отделены (100 больше, чем 0 и чем - 50); следовательно, оптимальные стратегии снова единственны и являются смешанными. Использованные выше формулы дают значение (для Мориарти) игры

v = 40

и оптимальные стратегии (£ для Мориарти, ц для Шерлока Ходмса): ? ГЗ 21 - Г 2 31

Таким образом, Мориарти должен с вероятностью 60% ехать в Дуврг в то время как Шерлок Холмс должен с вероятностью 60% сойти на промежуточной станции; оставшиеся 40% соответствуют в каждом случае другой возможности.

Замечание. В рассказе Конан Дойль, естественно, не рассматривает смешанные стратегии и вместо этого описывает фактическое развитие событий. Поэтому Шерлок Холмс выходит на промежуточной* станции и победоносно провожает взглядом специальный поезд Мориарти, проследовавший в Дувр. Решение Конан Дойля является наилучшим при его ограничениях (только чистые стратегии), поскольку он предписал каждому сопернику то поведение, которое, как мы нашли, является наиболее

вероятным (т. е. он заменяет вероятность в 60% на достоверность). Это, однако, порождает некоторое заблуждение, будто этот процесс приводит к полной победе Шерлока

Холмса, тогда как шансы (т. е. значение партии), как мы уже видели, благоприятст-

-> ->

вуют Мориарти. Из нашего результата для g и к) вытекает, что Шерлок Холмс был уже с вероятностью 48% мертв, когда его поезд отошел от вокзала Виктории. См. в связи с этим высказывание в цитированной выше книге Моргенштерна (стр. 98) о том, что вся поездка была ненужной, поскольку проигрывающего можно определить с самого начала.

18.5. Рассмотрение несколько более сложных игр

18.5.1. Полученное в п. 17.8 общее решение игры двух лиц с нулевой суммой вводит определенные альтернативы и понятия, в частности наличия или отсутствия полной определенности, значения партии vr и множеств оптимальных стратегий Л, В. Для всех этих понятий мы получили в п. 18.2 достаточно простые явные характеристики и определения. Они оказались пригодными даже в п. 18.3 при переформулировке всех результатов.

Эта простота может привести даже к некоторым недоразумениям. Действительно, результаты в пп. 18.2 и 18.3 получены с помощью непосредственных и притом вполне элементарных вычислений. Комбинаторные критерии полной определенности (18.А), (18.С) в п. 18.3, по крайней мере в их окончательном виде, были также значительно более прямолинейными по сравнению с встречавшимися ранее. Это может вызвать сомнение в необходимости привлекать рассмотрения из п. 17.8 (и соответствующие результаты из п. 14.5 для случая полной определенности), особенно потому, что они основаны на математической теореме в п. 17.6, для которой был необходим анализ линейности и выпуклости в § 16. Если бы все это можно было заменить на рассуждения в стиле пп. 18.2, 18.3, то наши рассмотрения в §§ 16 и 17 были бы совершенно необоснованными х).

Но это не так. Как указывалось в конце п. 18.3, чрезвычайная простота процедур и результатов в пп. 18.2 и 18.3 является следствием того факта, что они приложимы только к очень простым играм двух лиц с нулевой суммой, именно к играм типа «орлянки», для которых р4 = f52 = 2. По-видимому, для общего случая более абстрактные построения из §§ 16 и 17 пока представляются необходимыми.

Для того чтобы правильно понять взаимосвязь этих вещей, мы на нескольких примерах покажем, что для больших значений 3 утверждения из пп. 18.2, 18.3 уже не имеют места.

18.5.2. Для наших целей достаточно рассмотреть игры с р4 = р2 = 3. По существу они будут несколько напоминать игру в «орлянку» - большая общность получена только за счет введения третьей альтернативы.

Таким образом, оба игрока имеют альтернативы (т. е. значения для т1? т2) 1, 2, 3. Для читателя лучше всего подразумевать под выбором 1 «решетку», под выбором 2 -«герб» и под выбором 3 что-нибудь вроде «безымянный». Снова пытается угадать игрок 1. Если f одного из игроков «безымянный», то не имеет значения, что у другого - «герб» или «решетка»; существенно лишь одно: у другого тоже «безымянный» или же у него одна из первых двух возможностей.

Поэтому в данной игре матрица будет иметь вид, представленный в табл. 11.

*) Конечно, они не утратили бы строгости, но было бы совершенно необоснованным использование сложного математического аппарата для элементарной задачи.

Таблица 11

Четыре первых элемента матрицы (т. е. первые два элемента в первых двух строках) соответствуют уже знакомому примеру игры в «орлянку» (см. табл. 2). Два элемента, равные а, соответствуют случаю, когда игрок 1 выбирает «безымянный» и выбор игрока 2 не совпадает с выбором

игрока 1. Два элемента, равные у, соответствуют противоположной ситуации. Элемент, равный 3, соответствует случаю, когда оба игрока выбирают «безымянный». Придавая соответствующие значения (положительное, отрицательное или нуль), мы можем каждой из этих ситуаций поставить в соответствие премию или штраф или же сделать ее безразличной.

Мы получим все эти примеры, когда они нам понадобятся, конкретизируя нашу схему, т. е. выбирая соответствующим образом указанные выше а, 3, у.

18.5.3. Наша задача состоит в том, чтобы показать, что ни один из результатов (18:А), (16:В), (18:С), вообще говоря, не верен.

По поводу (18:А). Этот критерий полной определенности относится к частному случаю р4 = р2 = 2. Для больших значений р1э р2 две диагонали даже не будут исчерпывать матрицы, и, следовательно, положение дел только на диагоналях не может быть такой же характеристикой, как это было выше.

По поводу (18:В). Приведем пример игры, которая не является вполне определенной, но в которой тем не менее существует оптимальная стратегия одного из игроков, являющаяся чистой (конечно,

для другого игрока это уже не так). Кроме Таблица 12

того, особенность этого примера состоит в том, что у одного из игроков имеется несколько оптимальных стратегий, в то время как у другого - только одна.

Возьмем для игры, описываемой табл. 11, а, Р, у из табл. 12. Здесь а > 0, 6 > 0. Для себя читатель определит, какие комбинации выбора «безымянный» соответствуют выигрышу или штрафу в указанном выше смысле.

Проанализируем эту игру, используя критерии из п. 17.8.

Для £ = {У2, У2, 0} всегда К (£ $ = 0, т. е. при этой стратегии игрок 1 не может ничего потерять. Следовательно, v 0. Для ц = 8s = {0, 0, 1} всег--у ->

да К (£, г) rgO1), так что при этой стратегии не может ничего потерять игрок 2. Следовательно, v fg 0. Таким образом, имеем

v = 0.

Поэтому £ является оптимальной стратегией в том и только том случае, когда К (£, г]) 0, а г] является оптимальной стратегией в том и только

*) Действительно, в данном случае К (£, г)) = - 6£3.