Лабораторная работа 8. Принцип максимума. . Формулировка принципа максимума Понтрягина
Рассматривается управляемая система с ОДУ
, (17)
с начальными и конечными условиями
(18)
и критерием эффективности
. (19)
Введем дополнительную переменную , подчиняющуюся дифференциальному уравнению
, . (20)
Эта переменная представляет собой значение критерия в текущий момент времени
. (21)
Теперь будем рассматривать расширенную систему ОДУ
(22)
с начальными условиями .
Введем гамильтониан H и вектор сопряженных переменных р:
(23)
или, в скалярной форме,
.
Так как все функции правых частей не зависят от переменной, то уравнение для тривиально, и принимают обычно .
Принцип Понтрягина (формулировка):
Пусть u(t), такое допустимое управление, то есть удовлетворяющее ограничению что соответствующая ему траектория x(t) , выходящая из точки x(0) , проходит в момент времени T через точку x(T).
Для оптимальности управления u(t) и траектории x(t) необходимо существование такой непрерывной, ненулевой вектор-функции , что:
а) для любого гамильтониан достигает максимума, то есть ;
б) в конечный момент времени t=T должно выполняться соотношение
.
Таким образом, принцип максимума требует решения краевой двухточечной задачи
, (24)
(25)
, (26)
для решения которой необходимо задать 2m начальных условий. Если рассматривается задача с фиксированным временем и закрепленными концами , то в такой задаче содержится необходимое число констант для определения решения краевой задачи. Исключая управление из дифференциальных уравнений, получим замкнутую систему для неизвестных вектор-функций и .
Принцип максимума дает необходимые условия минимума интеграла (21) и основан на игольчатой вариации функционала. Достаточность принципа требует анализа второй вариации, отметим только, что для линейных дифференциальных уравнений условия принципа максимума необходимы и достаточны.
Наибольшую трудность при применении принципа максимума вызывает решение двухточечной краевой задачи. Кроме того, решение ищется в виде программного управления, то есть функция является функцией времени.
Динамическое программирование дает решение задачи в виде синтеза, управление является функцией координат динамической системы, однако в непрерывной постановке приводит к решению задачи Коши, но для нелинейных уравнений в частных производных. Эта задача более сложная, чем решение обыкновенных дифференциальных уравнений, ее, как правило, решают на некоторой сетке, заменяя непрерывное время дискретными значениями.
Достарыңызбен бөлісу: |