| | | Ожидаемая прибыль | Оптимальное решение |
Исход 3-го вращения, j | Закончить | Вращать | | Решение |
| | | | | | Вращать |
| | | | | | Вращать |
| | | | | | Закончить |
| | | | | | Закончить |
| | | | | | Закончить |
Этап 3. | | | | | | |
/,(/) = | max{2/, p/4(l) +p/4(2) +p/4(3) +p/4(4) +p/4(5)} = | |
| max{2/, 0,3 х 5 + 0,25 х 5 + 0,2 х 6 + 0,15 х 8 | + 0,1 х 10} = | |
| max{2/, 6,15}. | | | | |
| | | Ожидаемая прибыль | Оптимальное решение |
Исход 2-го вращения,/ | Закончить | Вращать | &(/) | Решение |
| | | | 6,15 | 6,15 | Вращать |
| | | | 6,15 | 6,15 | Вращать |
| | | | 6,15 | 6,15 | Вращать |
| | | | 6,15 | 8,00 | Закончить |
| | | | 6,15 | 10,00 | Закончить |
Этап 2. | | | | | | |
| max{2/,p/3(l)+p/3(2)- | /з(3)+р/3(4) + | Р/з(5)} = | |
| | .{2/, 0,3x6, | 15 + 0,25x6,15+0,2x6,15-+ | -0,15 х 8 + 0,1 х 10} | |
| | ;{2/, 6,8125}. | | | |
| | | Ожидаемая прибыль | Оптимальное решение |
Исход 1-го вращения,/ | Закончить | Вращать | | Решение |
| | | | 6,8125 | 6,8125 | Вращать |
| | | | 6,8125 | 6,8125 | Вращать |
| | | | 6,8125 | 6,8125 | Вращать |
| | | | 6,8125 | 8,0000 | Закончить |
| | | | 6,8125 | 10,0000 | Закончить |
Этап 1.
/,(0)-рШ+РгШ) +р/2(3) +р/2(4) +р/2(5) =
= 0,3 х 6,8125 + 0,25 х 6,8125 + 0,2 х 6,8125 + 0,15 х 8 + 0,1 х 10 = 7,31.
В начале игры единственным выбором является вращение колеса.
Из предыдущих таблиц следует, что оптимальным решением будет следующая последовательность действий.
НомеР Оптимальная стратегия
вращения
1 Начало игры; вращать
2 Продолжить игру, если исходом первого вращения есть 1, 2 или 3; иначе закончить игру
3 Продолжить игру, если исходом второго вращения есть 1, 2 или 3; иначе закончить игру
4 Продолжить игру, если исходом третьего вращения есть 1 или 2; иначе закончить игру
Ожидаемая прибыль от игры составляет 7,31 - 5 = 2,31 долл.
УПРАЖНЕНИЯ 15.1
1. Пусть в задаче из примера 15.1.1 по периметру колеса расставлены числа от 1 до 8, и вероятности остановки колеса на каждом из этих чисел одинаковы. Предполагая, что каждая игра состоит не более чем из пяти вращений колеса, определите оптимальную стратегию игры.
2. Я хочу продать свой подержанный автомобиль тому, кто предложит наивысшую цену. Изучая автомобильный рынок, я пришел к выводу, что с равными вероятностями мне за автомобиль могут предложить низкую (около 1050 долл.), среднюю (около 1900 долл.) либо высокую цену (около 2500 долл.). Я решил помещать объявление о продаже автомобиля на протяжении не более трех дней подряд. В конце каждого дня мне следует решить, принять ли наилучшее предложение, поступившее в течение этого дня. Какой должна быть моя оптимальная стратегия относительно принятия предложенной цены за автомобиль?
15.2. ЗАДАЧА ИНВЕСТИРОВАНИЯ
Некто планирует инвестировать С тыс. долл. через фондовую биржу в течение последующих п лет. Инвестиционный план состоит в покупке акций в начале года и продаже их в конце этого же года. Накопленные деньги затем могут быть снова инвестированы (все или их часть) в начале следующего года. Степень риска инвестиции представлена тем, что прибыль имеет вероятностный характер. Изучение рынка свидетельствует о том, что прибыль от инвестиции зависит от т условий рынка (благоприятных или неблагоприятных). При этом условие i приводит к прибыли г, с вероятностьюpt, /=1,2, т. Как следует инвестировать С тыс. долл. для наибольшего накопления к концу п лет?
Обозначим
х, - сумма денежных средств, доступных для инвестирования в начале i-го года (ж,-С),
yt - сумма реальной инвестиции в начале i-го года (yt < х,). Элементы модели ДП можно описать следующим образом.
1. Этап i представляет i-Pi год инвестирования.
2. Альтернативами на этапе i являются величины yt.
3. Состояние системы на этапе i описывается величиной х,.
Пусть ft(x) - максимальная ожидаемая сумма поступления денежных средств за годы от i до п при условии, что в начале i-го года имеется сумма xt. Для А-го условия рынка имеем следующее.
х1+, = (1 + rjу, + fx,-yj = rky,-1-х,, к = 1,2.....m.
/(xj= max \pj{x,+rky,) / = 1, 2,...,;;, где/„ +i(*„ + 1) = j, так как после /i-го года инвестиции нет. Отсюда следует, что
(*")= о™* А (*" + iJ"} = х" + о™* JS(АГ*} Введя обозначения F = ptrk , получим
[О, если 7 < О,
[х„, если г > 0.
f jfn, если 7 < 0,
(1 + г)хп, если г > 0.
Пример 15.2.1
Пусть в предыдущей модели инвестирования объем инвестиции составляет С= 10 ООО долл. на 4-летний период. Существует 40%-ная вероятность того, что вы удвоите деньги, 20%-ная- останетесь при своих деньгах и 40%-ная - потеряете весь объем инвестиции. Необходимо разработать оптимальную стратегию инвестирования.
Используя принятые в модели обозначения, получаем следующее.
С=10 000,« = 4,/и = 3,
р, = 0,4, р2 = 0,2,3 = 0,4,
/-, = 2, г2 = 0, г3=-\.
Этап 4.
7 = 0,5x0,1 + 0,2x0 + 0,Зх(-1) = 0,2, /4(*4) = (1+ г )х4=1,2*4.
Отсюда получаем
| | Оптимальное решение | |
Состояние | Л,(х4) | | |
| 1,2 х4 | | |
Этап 3.
А(*з) = max {pjt (дг, + /;у,) + р2/4 (дг, + г,у,) + />,/„ (дг, + г,у,)} =
= отах {0,5xl,2(x3 +y,) + 0,2xl,2(x,+0y,) + 0,3xl,2[x, + (-1)у,]} = = max {1,2х, + 0,246 v,} = 1,44*,.
Поскольку вероятность ft-ro условия рынка равна рк, рекуррентное уравнение динамического программирования имеет следующий вид: