ИДЕНТИФИЦИРУЕМОСТЬ

Идентифицируемость и меры доминирования. Эта тема не является темой с устоявшимися воззрениями. Изложенные ниже критерии и меры модального доминирования предложены Балониным Н.А. [1].

К истории вопроса Несколько предварительных замечаний. Известная книга Калмана, где рассматривались системные критерии, не касается параметрической идентифицируемости (под идентифицируемостью там понимается наблюдаемость, т.е. идентифицируемость не параметров, а сигналов состояния). Сходный с критериями Калмана критерий параметрической идентифицируемости приведен в работе Ли, посвященной дискретным системам. Однако Аоки, например, неблагоприятный по Ли случай кратных собственных значений автономной системы считает предпосылкой идентифицируемости ненаблюдаемых систем, поскольку зная одно собственное значение, мы знаем и другое.

Здесь недоразумение, поскольку о кратности мы должны откуда-то знать. Для Аоки идентифицируемость – это разрешимость частного метода параметрического оценивания относительно частного параметра, что противоречит постановке задач теории систем Калмана. Попытка переложить критерий идентифицируемости на непрерывные системы встречается в книге по автоматическому управлению Ройтенберга, однако в нем фигурирует неоправданное усложнение: матричная экспонента. Да и сам по себе критерий сомнителен, поскольку по матрице дискретной системы в принципе невозможно однозначно восстановить матрицу непрерывной системы, а критерий вовсе не рассматривается, как потенциальный. Причем для теории управления останавливаться на автономных системах неинтересно.

В результате неразработанности темы один из первых справочников, выпущенных по теории автоматического управления, содержит ляп. Опубликованному здесь критерию не удовлетворяет ни одна линейная динамическая система по той простой причине, что использовано избыточное количество параметров описания ее в пространстве состояний. Ее "идентифицируемость" противоречит элементарным представлениям о возможности эквивалентных преобразований уравнений. Таким образом множество "совместно наблюдаемых и идентифицируемых систем", согласно этому справочнику, пусто.

Пора теории остановиться на каком-либо одном разумном варианте. Такой вариант, собственно, предлагается ниже.

Отправная точка в суждениях о потенциальной идентифицируемости системы безотносительно к методу восстановления ее параметров - как и управляемость или наблюдаемость - это свойство сугубо потенциальное, состоит в доказательстве отсутствия другой какой-либо другой системы на выбранном классе систем, которая ведет себя точно также, как и исходная система, и, следовательно, такие системы принципиально неразличимы в выбранных для идентификации условиях. Восстановить однозначно параметры такой системы нельзя. Этот подход позволяет доказать ряд теорем и вывести критерии, сходные с критериями Калмана и Ли. Существуют и принципиально неидентифицируемые системы, для которых невозможно выбрать подходящие условия, ведущие к их идентификации. Всегда находится какой-либо смежник. Покажем это.

Идентифицируемость автономных систем. Модель линейной автономной динамической системы имеет вид:

x'=Ax,

где x - вектор состояния (пространства Rn), x0=x(0).

Определение (не отступая от калмановской трактовки). Линейная автономная динамическая система называется полностью идентифицируемой по состоянию, если при заданном векторе начальных условий x0 матрица ее параметров A может быть однозначно восстановлена по временной последовательности x=x(t).

Иначе, тоже следуя калмановской традиции, пара (A,x0) полностью идентифицируема тогда и только тогда, когда множество пар, объединенных общностью интегральной кривой x=x(t), вырождается в точку. В противном случае указанная пара неидентифицируема. Публикуемый ниже критерий идентифицируемости напоминает критерии управляемости и наблюдаемости.

Теорема 1. Необходимое и достаточное условие полной идентифицируемости пары (A,x0) состоит в следующем:

rank[x0 Ax0 A2x0 ... An-1x0] = n,

где n - порядок системы. Матрицу, выписанную в квадратных скобках, будем называть матрицей идентифицируемости и обозначать W.

Доказательство. Опирается на разложение матричной экспоненты в конечную сумму слагаемых

eAt=0m-1αk(t)Ak,

где m - степень минимального аннулирующего полинома A, αk(t) - коэффициенты интерполяционного полинома Лагранжа-Сильвестра для экспоненциальной функции, определенной на спектре A.

У пар (A,x0) и (B,x0), объединенных общностью интегральной кривой, равны и производные процессов, т.е. Ax(t)=Bx(t), где x(t)=eAtx0. Функции αk(t) линейно независимы между собой на любом интервале времени, что позволяет перейти к матричному уравнению

(A-B)[x0 Ax0 A2x0 ... Am-1x0]=0.

Матрица A является корнем своего минимального аннулирующего полинома, любая ее степень, которая выше m, выражается через предыдущие, поэтому ранг матрицы справа равен рангу матрицы идентифицируемости W. Множество возможных решений сводится в точку B=A тогда и только тогда, когда ранг матрицы идентифицируемости полон. Доказательство окончено.

Дискретные системы. Идентифицируемость непрерывных систем не сводится к вопросу об идентифицируемости дискретных систем, рассмотренных Ли. Матрицу непрерывной системы в принципе нельзя восстановить однозначно по матрице системы, появляющейся в итоге дискретизации: A по значениям eAL и L. Варианты восстановлений рассматривались в работе А.В. Прасолова. Между тем, проверки критериев идентифицируемости соответствующих непрерывной и дискретной систем дадут одинаковый результат, поскольку замена A в W матричной экспонентой eAL для любого L (т.е. матрицей дискретной системы) не сказывается на ее ранге. Критерий идентифицируемости проверить можно даже тогда, когда параметры системы при частном (равномерном) способе составления выборки данных для идентификации найти невозможно.

Идентифицируемость - это свойство системы, а не метода восстановления ее параметров. Это системное свойство, такое же, как управляемость и наблюдаемость. Невозможность построения одного работоспособного регулятора или наблюдающего устройства, не означает невозможность построения другого. Но для неуправляемых и ненаблюдаемых систем решить задачи управления или наблюдения в калмановской их трактовке невозможно. То же самое касается построения идентификаторов. В теоретически разрешимом случае, необходимо либо изменить способ составления выборки, либо измерить производные, что близко один к другому, ввиду известных методов вычисления значений производных.

Идентифицируемость неавтономных систем. Наше рассмотрение будет неполным, без охвата общих описаний уравнений систем в пространстве состояний, а они таковы

ẋ=Ax+bu, y=cx(t),

где по прежнему x - вектор состояния (пространства Rn), x0=x(0).

Определение. Линейная динамическая система называется полностью идентифицируемой по состоянию, если при заданном векторе начальных условий x0 существует управление, при котором параметры A,b,c можно восстановить с точностью до параметров ее канонической формы (наблюдаемости) по временной последовательности x=x(t).

Иначе, пара ((A,b,c),x0) полностью идентифицируема тогда и только тогда, когда существует управление, при котором множество пар, объединенных общностью интегральной кривой x=x(t), вырождается при каноническом ее описании в точку. В противном случае указанная пара неидентифицируема.

Теорема 2. Необходимое и достаточное условие полной идентифицируемости пары ((A,b,c),x0) состоит в следующем:

rank[x0 Ax0 A2x0 ... An-1x0 b Ab A2b ... An-1b] = n,

где n - порядок системы. Наблюдаемость системы при этом подразумевается, поэтому запишем иначе Rank Wo=n, Rank [W Wc]=n.

Доказательство. Ассиметричное по отношению к матрице наблюдаемости вхождение матрицы управляемости в критерий идентифицируемости диктуется разным значением проблем управляемости и наблюдаемости для нужд идентификации. Ненаблюдаемые системы содержат части, параметры которых восстановить невозможно, поэтому критерий наблюдаемости выписывается особняком как предварительное условие. Вектор состояния канонической формы наблюдаемости можно восстановить, не зная параметров системы, например, при импульсном воздействии. Расширительное толкование принципа дуальности Калмана сводит проблему управляемости системы с парой (A,b) к проблеме идентифицируемости пары (A,b), поскольку импульсный сигнал переводит систему в состояние b. Аддитивность влияний исходного начального состояния и состояния, в которое систему по истечении некоторого любого конечного времени идентификации импульсный сигнал переводит, позволяет рассматривать общие уравнения идентификации систем по нескольким запускам процесса, которые аналогичны автономному случаю, но оперируют указанной составной матрицей. Доказательство окончено.

Если вектор состояния доступен непосредственному измерению при любом управлении, то есть, уравнения выхода отсутствуют, можно говорить об идентифицируемости пары ((A,b),x0) с точностью до всех параметров при условии, что Rank [W Wc]=n. У автономных систем имеем Rank W=n.

Нестационарные системы. Если характер нестационарности неизвестен, параметры нестационарной линейной динамической системы восстановить невозможно, поскольку уравнения по одной точке процесса заведомо неразрешимы. В данном случае имеет смысл указать на смысл грамиана идентифицируемости, аналогичному грамианам управляемости и наблюдаемости. В стационарном случае все более или менее прозрачно - все равно, что проверять, грамиан или системную матрицу.

Обыденная постановка задачи идентификации предусматривает попытку описания автономной системы с нестационарными параметрами автономной стационарной системой, причем грамиан связывает между собой параметры обоих систем, интеграл от нормы невязки фазовых скоростей которых на участке идентификации минимален. Это свойство можно положить в основу определения квазиидентифицируемости (как бы идентифицируемости), и тогда невырожденность грамиана будет гарантировать также, как и в тривиальном случае рассмотрения стационарных систем, однозначную разрешимость задачи. Квазиидентифицируемость подразумевается в задачах на восстановление медленно изменяющихся параметров, но есть ньюансы.

Квазиидентифицируемость вовсе не гарантирует близость параметров нестационарной и стационарной систем. Она гарантирует едиственность восстановления. Существуют контрпримеры, показывающие, что на классе нестационарных систем с гармоническими процессами, аналитически точно описываемыми стационарными уравнениями, "замороженные" параметры далеки от параметров стационарной системы. В таких случаях алгоритмы идентификации приводят к странным, на первый взгляд, результатам, поскольку их оценки однозначны и не меняются, а решение лежит в стороне от ожидаемого при сколь угодно медленном темпе изменения параметров. Эта особенность нестационарных систем поясняет, почему бессмысленно приводить графики "отслеживания" параметров [1].

МОДАЛЬНЫЙ СИНТЕЗ

Процедура анализа собственных значений, называемая eig(A), обыденна в практике матричных вычислений. Синтез не заслужил еще такой силы обобщения, как собственная функция. Данная работа обращает внимание на то, что обе эти проблемы связаны. Предварительный анализ многое определяет в последующем синтезе.

УРАВНЕНИЯ АНАЛИЗА И СИНТЕЗА СОБСТВЕННЫХ ЗНАЧЕНИЙ

Однородное уравнение полной алгебраической проблемы собственных значений имеет вид

(A-dE)v=0,


где d - собственное значение матрицы А, удовлетворяющее характеристическому полиному det(A-dE)=0, v - собственный вектор матрицы A.

Неоднородное уравнение значительно более редко встречается в математической литературе

(A-dE)v=b,

вектор b определен в пределах некоторого линейного подпространства, b=Bm.

В том случае, когда b=0 и d выбран как корень характеристического уравнения A, задача сводится к отысканию собственных векторов матрицы A. Если b равно собственному или корневому жорданову вектору A, отвечающему кратному собственному значению d, решением задачи являются корневые жордановы векторы.

При произвольно назначаемом спектре решением задачи являются собственные векторы матрицы

Q=A-BK,

отличающейся от A аддитивной составляющей.

Первая задача известна как задача анализа, вторую уместно называть задачей синтеза. Прикладное ее значение выходит за рамки данного исследования, однако стоит отметить, что в теории управлении она встречается при синтезе модальных регуляторов.

Решением неоднородного уравнения является векторная резольвента v=(A-dE)-1b. Точки разрыва ее отвечают собственным векторам матрицы A. В общем же она является годографом для собственных векторов синтезируемой матрицы Q=A-BK.

Несложно показать, что в одномерном случае B=b, матрица K равна сумме левых собственных векторов Q, отвечающих ее отличным от спектра матрицы A собственным значениям. Напомним, что левыми собственными векторами являются вектор-строки матрицы V-1, обратной по отношению к матрице столбцов собственных векторов V.

РЕШЕНИЕ ПОЛНОЙ ПРОБЛЕМЫ

Для одномерных задач, когда B=b для всех значений d, столбцы искомой матрицы собственных векторов V заведомо линейно независимы между собой в силу известных свойств резольвенты А, частным значениям которой они равны. Покажем, чему при этом равна K.

Система неоднородных уравнений в матричной форме имеет вид

AV-VD=[b b ... b], или A-Q=[b b ... b]V-1.

Так как Q=A-bK, имеем bK=[b b ... b]V-1, вынося b за скобки и избавляясь от него, получаем K=[1 1 ... 1]V-1, т.е. вектор-строка K равна сумме левых векторов Q.

В вырожденных случаях, при совпадении части собственных значений матриц A и Q, единицы заменяются нулями, что гарантирует разрешимость задачи. Как видно, в сумму входят тогда только левые собственные векторы, отвечающие отличным от спектра матрицы A собственным значениям.

И в самом общем случае, матрица K равна взвешенной сумме левых собственных векторов Q, отвечающих ее отличным от спектра матрицы A собственным значениям.

ВАРИАЦИЯ ОДНОГО СОБСТВЕННОГО ЗНАЧЕНИЯ

При изменении только одного собственного значения, матрица K равна соответствуюшему левому собственному вектору Q.

Однако в многомерном случае его можно еще и выбирать, оптимизируя K, поскольку v=(A-dE)-1b, b=Bm, m - нормированный вектор варьируемых коэффициентов.

В данном случае BK=[Bm 0... 0]V-1, избавляясь от B, приходим к выводу, что K равна произведению множителя m на левый собственный вектор матрицы Q (первую строку V-1). Учтем, что V-1V=E, а часть V, отвечающая неизменяемым собственным значениям Q, составляют собственные векторы матрицы A.

Следовательно левые собственные векторы матриц A и Q, отвечающие варьируемому собственному значению, ортогональны прочим собственным векторам A, т.е. они коллинеарны между собой. В случае точечной вариации спектра V-11=kT-11, где T-11 - левый нормированный собственный вектор A (вектор строка).

Так как V-1V=E, то V-11V1=1, первый собственный вектор V1=(A-dE)-1b, имеем V-11(A-dE)-1b=1. Учитывая ортогональность V-11 собственным векторам A, последнее выражение упрощается до V-11b/(a-d)=1, a - собственное значение A. Заменим V-11 на kT-11, отсюда получаем, что

k=(a-b)/T-11b.

Матрица K равна левому собственному вектору Q, т.е. K=kT-11, k - это норма корректирующих матрицу A коэффициентов. Минимальное по норме решение соответствует случаю максимальному значению делителя T-11b, т.е. максимуму скалярного произведения T-11B и m, где m - вектор-строка произвольно назначаемых коэффициентов. Оптимум достигается на значении m=(T-11B)T.

МЕРЫ ДОМИНИРОВАНИЯ

Полученное решение имеет тот смысл, что норма k прямо пропорциональна изменению спектра и обратно пропорциональна множителю T-11b. Чем больше последний, тем меньшими усилиями изменяется спектр. Этот коэффициент можно постулировать как меру доминирования собственного значения - величину, обратную минимальной норме матрице K, которой достигается смещение. Если этот коэффициент стремится к нулю, изменить спектр весьма сложно.

Автору системных критериев управляемости и наблюдаемости Калману принадлежит и теорема о возможности произвольного назначения спектра линейной динамической системы, породившую неоправданные спекуляции в области построения модальных регуляторов. Если дополнить системные критерии близкими к ним по смыслу мерами управляемости и наблюдаемости (нулевая мера означает невыполнение критерия Калмана), то картина получается значительно более полной.

В то же время указанные меры отвечают одинарным или небольшим изменениям собственных значений, поэтому определенное значение приобретают итерационные алгоритмы постепенного изменения собственных значений с ориентацией на меры. Принцип дуальности Калмана позволяет рассчитывать как меры управляемости, так и меры наблюдаемости. Данная прикладная сфера теории анализа и синтеза собственных значений недостаточно развита и неоправданно мало известна в научной литературе.



Rambler's Top100