назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [ 49 ] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147]


49

3. Критерий Гурвица. Этот критерий является своего рода обобщением двух предьщущих критериев. Он представляет из себя целое семейство критериев, зависящих от некоторого параметра а , смысл которого - в определении баланса между подходами «крайнего пессимизма» и «крайнего оптимизма». В математическом виде критерий записывается как

V = max \а max а„ + (1 - а) min а„ 1.

\<j<nl<j<n

В качестве оптимальной стратегии выбирается стратегия, на которой достигается значение max. Значение параметра выбирается из интервала 0<а< \. Критерий Вальда получается как частный случай при а = О, а критерий максимакса при а = 1. Выбор конкретного значения параметра определяется скорее субъективными факторами, например склонностью к риску ЛПР (лица принимающего решение). При отсутствии каких-либо явных предпочтений вполне логично, например, выбрать значение а = 0,5 .

4.Критерий Сэвиджа {критерий минимаксного риска). Применение данного критерия предполагает рассмотрение некоторой производной матрицы, смысл которой состоит в том, что для каждой стратегии второго игрока определяется выигрыш в наиболее благоприятном случае (при наиболее правильном выборе стратегии первым игроком для данной ситуации), а далее вычисляются величины «недополученных» выигрышей для всех остальных стратегий первого игрока при рассматриваемой стратегии второго игрока. Элементы данной матрицы = у 5 которая обычно называется матрицей риска, рассчитываются как г. =таха -л . Далее к матрице рисков применяется ми-нимаксный подход, а именно:

V = min max г..

В качестве оптимальной стратегии выбирается стратегия, на которой достигается min. Тем самым мы выбираем такую стратегию, для которой наибольшее значение «недополучения» будет иметь наименьшее значение.

5.Критерий Лапласа. Этот критерий исходит из следующего соображения. Поскольку нам ничего не известно о принципах или вероятностях применения вторым игроком своих стратегий, то мы предполага-

ем эти вероятности все равными -.



Тогда критерий можно записать как

V = max

Таким образом, смысл данного критерия - максимизация ожидаемого выигрыша в предположении о равновероятности применения вторым игроком своих стратегий.

Пример. Найти оптимальные стратегии первого игрока, исходя из различных критериев, в игре с полной неопределенностью относительно поведения второго игрока, заданной следующей платежной матрицей:

5101825

87823

21181221

20221915

Решение.

1. Максиминный критерий Вальда. Вычислим минимальные значения по строкам (min а,),

а далее из них выберем максимальное.

Г 5 10 18 25

8 7 8 23 21 18 12 21 20 22 19 15

5 7 12 15

Таким образом, получаем К = max min а, =15 при применении «стра-тегии 4».

Ответ: оптимальной стратегией первого игрока является «стратегия 4».

2. Критерий максимакса. Вычислим максимальные значения по строкам (таха,,), а далее из них выберем максимальное

( S101825

87823

21181221

20221915

25 23 21 22



Таким образом, получаем V = max max а, = 25 при применении «стратегии 1».

Ответ: оптимальной стратегией первого ифока является «стратегия 1».

3.Критерий Гурвица. Вычислим максимальные (таха ) и минималь-

ные (mina ) значения по строкам, а далее произведем их взвешива-ние с коэффициентом а = 0,5 :

5*0,5 + 25*0,5 = 15 7*0,5 + 23*0,5 = 15 12*0,5 + 21*0,5 = 16,5 15*0,5 + 22*0,5 = 18,5.

Таким образом, получаем V = max Г 0,5 max л„ + 0,5 min а.. 1 = 18,5 при

применении «стратегии 4».

Ответ: оптимальной стратегией первого игрока является «стратегия 4».

4.Критерий Сэвиджа {критерий минимаксного риска). Построим матрицу рисков. Для этого первоначально вьтислим максимальные значения по столбцам

22 1

5 8 21 20

10 7 18 22

18 8

12 19

25 23 21 15

21 22 19 25

, а далее непосредственно матрицу рисков

21-522-10

21-822-7

21-2122-18

21-2022-22

19-18 19-8 19-12

19-19

25-25 25-23 25-21 25-15

Далее вычислим максимальные значения по строкам и из них выберем строку с минимальным значением

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [ 49 ] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147]