15.11.2016 admin

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ



БАЛОНИН Н.А. ИЛЛЮСТРАЦИИ К КНИГЕ

КНИГА НОВОГО КУРСА | МОДАЛЬНЫЙ СИНТЕЗ


Оптимальный и модальный синтез (оптимальный регулятор, модальный регулятор, наблюдающие устройства) – раздел теории динамических систем, связанный со стабилизацией систем. Модальный синтез – альтернатива квадратической оптимизации, в обоих есть принципиальная свобода выбора решения, особенно, у многосвязных систем. Примеры ниже связаны с синтезом линейного квадратичного регулятора.

ТЕОРЕТИЧЕСКИЕ ПРЕДПОСЫЛКИ


Матричное уравнение Риккати. При известных A, R, Q (A<0, R<=0, Q>0, матрицы R и Q симметричны), рассматривается уравнение вида

PRP+PA+A'P+Q=0


Алгоритм решения использует прямоугольный блок S=[v;w] – часть матрицы собственных векторов, отвечающей устойчивым составляющим спектра [A R; –Q –A'], причем P=wv–1.

Якопо Франческо – итальянский математик рубежа XVIII века. Учился в Падуе. С 1747 жил в Венеции. Известен также инженерной деятельностью, он руководил постройкой речных плотин. Основные труды относятся к интегральному исчислению и дифференциальным уравнениям. Автор исследований об интегрируемости в элементарных функциях одного типа дифференциального уравнения 1-го порядка, названного его именем. Отмеченное уравнение описывает стационарную точку решения.

Матричное уравнение Ляпунова. При известных A, Q (A<0, Q>0, Q=Q'), ищется матрица P из уравнения PA+A'P+Q=0. Это частный случай обращения к процедуре решения уравнения Риккати, при R=0.

Линейно-квадратичная задача. В задачах оптимального управления линейными системами

x' = Ax + Bu,


часто минимизируется интегральный квадратичный критерий качества

J = 0.5∫τ=0:T (xTQx + uTRu)dτ, Q≥0, R>0.


Матричное алгебраическое уравнение Лурье-Риккати

PA + ATP – PBR–1BTP = –Q,


которое решается большинством математических пакетов вычислительными методами, обеспечивает синтез регулятора:

u = –Kx,


где K = R–1BTP, P – решение уравнения Риккати. Оптимальное управление достигается безынерционным регулятором, обеспечивающим функционалу минимальное значение J = 0.5x0TPx0.

Среда, облегчающая проектирование, должна обеспечивать графическое сопровождение математического моделирования. В фильмах компьютер "на подхвате" у проектировщика сам продумывает варианты трехмерного изображения объекта. Такие высоты пока возможны только в специализированной оболочке, то, что ниже, базируется на школьной геометрии и простейших командах отображения моделируемых объектов.

Пример 1. Решим задачку по стабилизации тележки массой W с перевернутым маятником массы M и длины L. Матрица А такой системы имеет пару отличных от нуля собственных значений ±5.42 (система неустойчива). Весовые коэффициенты диагонали матрицы Q назначим единичными, вес при затратах на управление R=0.01 можно варьировать. Полученная замкнутая система будет иметь комплексный спектр в левой полуплоскости. Первая и третья составляющие вектора состояния x – положение тележки и угол отклонения маятника (задано начальное отклонение).

Графики

Пример 2. Решим задачку по стабилизации тележки массой W с 2 перевернутыми маятниками масс M, m и длин L, l. Весовые коэффициенты диагонали матрицы Q назначим единичными, вес при затратах на управление R=0.001 можно варьировать. Повышая коэффициент R вклада управления, можно снижать норму матрицы обратных связей.

Повышая коэффициент R вклада управления, можно снижать норму матрицы обратных связей, приближая наиболее выраженное левое собственное значение к 0. Движения системы становятся более плавными, при этом не возникает риск уронить (реальный) маятник ввиду того, что перед нами всего лишь линейное приближение.

Пример 3 Рассмотрим задачу стабилизации канала высоты самолета, оперирующей моделью второго порядка (пара собственных значений).


Структурная схема такой системы состоит из пары звеньев: апериодического звена, описывающего динамику вращательных движений корпуса, управляемого рулевой машинкой, и интегратора в модели набора высоты.


Модальный синтез применен здесь для итерационного изменения спектра матрицы A системы с учетом мер модального доминирования, синтез завершается графиком переходного процесса, отражающего изменение высоты.

Рассмотрим действие оптимального управления применительно к той же системе, веса при переменных состояния по прежнему возьмем единичными, значение R подберем опытным путем, исходя из вида переходного процесса.

Как видно, собственные значения переместились примерно в ту же область. Трудности такого сорта модели систем не вызывают, поскольку развесовывать приходиться переменные состояния, взятые в абстрактном масштабе. Матрицы K коэффициентов обратных связей для обоих расчетов примерно близки.

Модальный синтез имеет дело непосредственно со спектром и ориентирован на обеспечение некоторых постоянных времени, т.е. непосредственно задает темпы движения вращательной и поступательной подсистем канала тангажа. Что удобно, поскольку от этих составляющих зависит, в том числе, комфорт движения. Итог оптимального синтеза менее предсказуем, это более простой, менее дифференцированный деталями метод, что видно и по программному обеспечению. Основное его преимущество – весами можно влиять на соотношение переменных, имеющих физический смысл тангажа и высоты полета. Для систем высокого порядка начинает проявлять себя неопределенность выбора коэффициентов квадратического критерия качества: их приходится подбирать.

ВЫРАЩИВАНИЕ КРИСТАЛЛОВ В УСТАНОВКЕ ТИПА "РОСТ"


Разращивание кристалла от затравки 50×50 мм. осуществляется вручную. Переход на автоматическое управление происходит по достижении нужного диаметра (например, 200 мм.), температура в печи около 800 град.


В процессе роста кристалла в тигле автоматически поддерживают постоянный уровень расплава. Цикл управления продолжается 12-15 мин. и начинается с измерения уровня расплава. После перемещения кристаллодержателя вверх, уровень расплава в тигле падает. Оценка уровня дает возможность косвенно оценить диаметр кристалла. Cпустя короткое время начинается подпитка расплава (7-8 мин), которая прекращается по восстановлении уровня. После измерений, начинается температурное воздействие на диаметр кристалла, его можно уменьшить, подняв температуру донного нагревателя. Причем температура подпиточного расплава (ТПР) задается выше на 2-3 градуса температуры расплава в тигле (это видно и глазом – цвет расплава в тигле и кольцевой емкости близки). На вариацию уходит около 4 мин., потом цикл возобновляется.


Помимо этапа разращивания кристалла от затравки, выделяют еще два этапа, в зависимости от того, находится кристалл в тигле, или вышел из него. За время выращивания система автоматического управления, стабилизируя диаметр, понижает тепературу в печи на 30-40 градусов.

МОДЕЛИРУЕМ СИСТЕМУ С ОПТИМАЛЬНЫМ РЕГУЛЯТОРОМ


Дистантный эмулятор имитирует процессы стабилизации диаметра слоя кристалла, для расчета используем модель

x'=Ax+Bu, y=Сx+Du.


Зададим некоторое начальное состояние выходов системы y1(0)=D1, y2(0)=T1 и рассчитаем вектор U=(D–CA–1B)–1Y воздействия u=U–Kx многосвязной системы (обратные связи учтены при задании матрицы A), выводящего выходы в положение Y=[y1, y2], где y1=D2, y2=T2.

Стартовый диаметр D1 считаем в отклонениях от 200 мм (зеленый график), а стартовую температуру подпиточного состава T1 в отклонении ее от регламентируемой температуры (красный график). Чтобы не наблюдать дикие переходные процессы, не следует стартовать с произвольного начального состояния. Вектор начального состояния рассчитывается из предположения, что начальные скорости изменения диаметра и температуры нулевые.

Оптимальный синтез меняет темпы процессов: масштаб R=3*I, I – единичная матрица, крититический (меньше нельзя) для устойчивости расчета, за этим стоят физические факторы – реализуемость. Ослабить обратные связи, напротив, несложно, задавая R=30*I.

Собственные значения подсистем до синтеза сильно разнесены (см. модели): темп изменения диаметра определяется значениями λ1=–5.3728, λ2=–0.2786, темп изменения температуры – собственными значениями λ3=–3.0534, λ4=–0.0708. Такие системы называют жесткими. Степень разнесения собственных значений в каждой подсистеме настолько велика, что для улавливания быстрых составляющих на фоне медленных надо выбирать уменьшенный интервал или строить особые методы интегрирования. Стоит задуматься о том, каким образом, при каком эксперименте, удалось точно оценить те и другие.

Выше проявляют себя только медленные составляющие с λ2 и λ4. Быстрые составляющие видны, например, при старте с нулевых значений диаметра и температуры заданием начальных их скоростей: моделирование реакции системы на импульс. Оптимальный регулятор мало на них влияет.

Hide

Rambler's Top100