Перечислим возможные стратегии управления в порядке возрастания их эффективности[6,12,13,М]:
-управления с разомкнутым контуром или, что одно и тоже, программное управление;
-управления с обратной связью;
-управление с использованием обратной связи и упреждения;
-управление по замкнутому контуру.
Ниже кратко рассматриваются основные постановки задач оптимального управления динамическими системами как той базы, на основе использования которой уже в дальнейшем можно строить Модели оптимального управления портфелем финансовых инструментов.
Учитывая, что случай оптимального дискретного управления динамической системой является частным случаем управления в непрерывном времени, дальнейшее рассмотрение будем проводить, в основном, в непрерывном времени, при этом сам переход от непрерывного времени к дискретному времени может быть выполнен без особого труда.
7.2.2. Задача оптимального программного управления динамической системой
Под динамическими системами понимаются такие системы, модель функционирования которых в функции времени может быть представлена в виде дифференциальных (для дискретного времени - разностных) уравнений.
В терминах теории управления[12] задача оптимального ПРОГРАММНОГО управления динамической системой может быть сформулирована в следующем виде:
Требуется решить вариационную задачу, а именно найти функцию времени V(t) (т.е. «управление»), исходя из условия обеспечения экстремума целевому функционалу, т.е.:
max J =
U( I)
I{X,U ,t)dt + F{X„t,) (7.2.1)
при условии динамики изменения состояния в виде:
X = f{X,U,t)(7.2.2) начальных условиях:
Го, X{t,)=X,(7.2.3) и ограничениях на управление:
{U{t)}eV(7.2.4).
Выражение (7.2.1) - это целевой функционал, конкретное содержание которого определяется выбираемой целью управления.
Выражение (7.2.2) - это векторно-матричное дифференциальное уравнение, описывающее динамику системы, которое может быть решено при начальном условии, определяемом выражением (7.2.3). Отметим, что вынужденную составляющую решения указанного уравнения определяет правая часть этого уравнения, а именно - управление U(t).
Выражение (7.2.4) определяет ограничения на управление U(t) динамической системой.
Отметим далее, что в зависимости от ВИДА ЦЕЛЕВОГО ФУНКЦИОНАЛА, задачи оптимального управления называ-ют[ 12,14] задачей Больца:
IX ] = \l{X ,и J)dt + F {X ,,t) (7.2.5)
задачей Лагранжа:
max J = I(X ,U ,t)dt(7.2.6)
U( t)
задачей Майера:
max J - F (X,,/,)(7.2.7)
и ( t )
Задачи оптимального управления вне зависимости от вида целевого функционала могут быть преобразованы одна в другую и, в математическом смысле, являются полностью эквивалентными друг другу[12].
Задачу оптимального ПРОГРАММНОГО управления динамической системой также называют [12,14] задачей оптимального управления динамической системой по РАЗОМКНУТОМУ конту-
В задачах указанного типа никак не используется информация о текущем состоянии системы, и оптимальное управление может быть синтезировано заранее, т.е. без учета указанной информации.
Пример программного управления температурой жилого дома рассматривался нами ранее.
Еще одним примером[12] задачи оптимального программного управления является определение оптимальной траектории движения ракеты. Управляющие параметры в этой задаче - это моменты включения двигателей и длительность их работы, величина и направление силы тяги, которую следует приложить к ракете в каждый отдельный момент времени. Режим работы двигателей выбирается в зависимости от ряда ограничений, например, в зависимости от общего количества топлива на борту ракеты. Вектор состояния указанной управляемой системы может отождествляться с массой ракеты, а также с ее траекторными координатами и скоростями их изменения. Зависимость вектора состояния системы в функции времени описывается системой дифференциальных уравнений, выводимых из законов механики. Результирующая траектория космического полета определяется в результате поиска экс-