3.5. ФОРМАЛИЗМ ПОНТРЯГИНА


Следующий формализм связывают с именем Льва Семеновича Понтрягина. Некоторыми деталями биографии он напоминает чемпиона мира Алехина, игравшего более двадцати шахматных партий вслепую.

Дополним вектор состояния x импульсами движения, не выделяя более их в нем, тогда уравнение системы приобретет вид

x' = Ф(x,u),


где u – вектор управления, отыскиваемый в соответствии с интегральным критерием качества

τ=0:∞ L(x,u)dτ -> min.


В динамике естественного движения гамильтонова функция равна разности между значениями удвоенной кинетической энергией и лагранжианом, т.е. H=2T–L. Заметим, что понятие первого интеграла (гамильтониана) шире его узкой энергетической трактовки в том смысле, что так мы можем называть любую функцию H, вдоль линии уровня которой движется точка, изображающая состояние.

Обозначим через ψ расширенный вектор обобщенных импульсов для объекта с регулятором. Тогда удвоенную «кинетическую энергию» можно посчитать через квадратичную форму от ψ или, что то же самое, если вспомнить соотношение импульса движения и скорости, через билинейную функцию так, что H = ψTФ–L.

Рациональное движение достигается поддержкой в системе постоянного уровня H. Очевидно, что назначением управления можно поддерживать разные уровни энергии, вопрос состоит в том, какой именно уровень избрать? В консервативных системах энергия, как мы знаем, не просто сохраняет постоянное значение, ее выгодно, в смысле интегрального критерия качества, не расходовать.

Принцип максимума Понтрягина. Принцип гласит, что необходимым условием минимума интегрального критерия качества является выбор оптимального управления, обеспечивающий поддержку на постоянном уровне максимума обобщенной энергии (гамильтониана) H=maxTψ–L)=const.

В задачах управления регулятор меняет энергетический баланс системы. Если закачать в нее «энергии» больше оптимального уровня, она не сможем удержаться от трат, приводящих к потерям качества.

Линейно-квадратичная задача. В задачах оптимального управления линейными системами

x' = Ax + Bu,


часто минимизируется интегральный квадратичный критерий качества

J = 0.5∫τ=0:T (xTQx + uTRu)dτ, Q≥0, R>0.


Гамильтониан, соответственно, имеет вид

H = ψTФ – L = ψT(Ax + Bu) – 0.5(xTQx + uTRu).


Согласно принципу максимума, оптимальное управление отыскивается на частном экстремуме этой функции по управлению, следовательно

∂H/∂u = BTψ – Ru = 0, отсюда u = R–1BTψ.


Постоянство гамильтониана на оптимальной траектории гарантируется двумя сопряженными уравнениями Гамильтона

dx/dt = ∂H/∂ψ = Ax+Bu, x0=x(0),

dψ/dt = –∂H/∂x = –ATψ+Qx, ψ=ψ(∞)


При стабилизации объекта в нулевом конечном состоянии конечные обобщенные импульсы принимают нулевое значение ψ = 0.

Верхом совершенства в решении задачи оптимального управления считается реализованная возможность заменить выходы сопряженной системы линейной комбинацией выходов самого объекта u = – Kx. Этим мы устраняем дублирование динамики (согласно логике естественного движения объект сам по себе состоит из сопряженных подсистем) и упрощаем регулятор. Данное направление называется оптимальным синтезом регуляторов или аналитическим конструированием.

Матричное уравнение Риккати. Стремясь к обозначенной выше цели синтеза, заменим выходы сопряженной системы линейной комбинацией переменных состояния ψ = –Px.

Взяв производную от последнего выражения и сопоставив ее второму уравнению системы Гамильтона, получим ψ'=–P'x – Px' = –ATψ+Qx.

Пользуясь уравнением системы и учитывая вид оптимального управления, приходим к дифференциальному уравнению Риккати

P' + PA + ATP – PBR–1BTP = –Q, P = 0


В том случае, когда верхний предел интегрального критерия качества бесконечен, квадратная матрица искомых коэффициентов P постоянна. Отсюда следует матричное алгебраическое уравнение Лурье-Риккати

PA + ATP – PBR–1BTP = –Q,


которое на сегодняшний день решается большинством математических пакетов вычислительными методами.

Синтез регулятора. С приключениями мы добрались, наконец, до формулы оптимального регулятора. Наградой за проявленное терпение будет то, что формула эта чрезвычайно проста

u = –Kx,


где K = R–1BTP, P – решение уравнения Риккати. Оптимальное управление достигается безынерционным регулятором, обеспечивающим функционалу минимальное значение J = 0.5x0TPx0.

Система уравнений Гамильтона содержит уравнения динамики исходного и сопряженного объекта. Вместе с краевыми условиями проблема их решения называется двухточечной граничной задачей (ДГЗ).

Критерий качества управления представлен функционалом, зависящим от состояния и управления, первое слагаемое гарантирует вывод объекта в нулевое положение, второе экономит ресурсы регулятора.

Примечание. В задачах с нефиксированным временем развития процесса заведомо известно оптимальное значение H, оно равно нулю. Этим еще раз подчеркивается, что название обобщенная энергия для этой функции весьма условно, следует из предыстории, поэтому лучше употреблять здесь более нейтральный термин «гамильтониан».

Rambler's Top100