7.4. ВЫРОЖДЕННЫЕ ЗАДАЧИ ИДЕНТИФИКАЦИИ


Будем развивать далее метод, предложенный в [59, 61], в котором отчасти сочетаются черты рекуррентного и рекурсивного подходов. Для этого вернемся к исходной постановке задачи, когда система уравнений идентификации записана в общей ее форме

Zθ = Y.


Договоримся считать, что матрица измерений Z большая, прямоугольная и может быть крайне плохо обусловленной или вырожденной.

В середине столетия Пенроуз удачно расширил формальное определение обратной матрицы A-1A = Е понятием матрицы псевдообратной A+, удовлетворяющей четырем условиям

AA+A = А, A+AA+ = A+, (AA+)Т=AA+, (A+A)Т=A+A.


Первые два из них можно интерпретировать «выживает сильнейший», вторые два свидетельствуют о симметрии взаимных произведений A и A+. Обычная матрица A-1 также удовлетворяет этим соотношениям. Матрица A+ единственная, для каждой A есть своя псевдообратная, для нулевой матрицы A ее псевдоинверсия A+ = 0. Фробениусова норма разности

||A+A–Е|| или ||AA+–Е||


отлична от нуля, но она минимальна среди претендентов на роль псевдообратной матрицы.

Нормальное псевдорешение системы линейных уравнений также, как и обычное решение, единственно и записывается в виде

θ = Z+Y.


Геометрическая интерпретация нормального псевдорешения состоит в том, что оно является ортогональной проекцией нулевой точки θo = 0 на множество решений вырожденной системы или обобщенных решений, минимизирующих норму разности левой и правой частей несовместной системы ||Zθ–Y||. Нормальное псевдорешение θ единственно, как проекция нуля оно обладает минимальной нормой на указанном множестве. Иными словами, нормальное псевдорешение наделено примерно теми же свойствами, что и псевдообратная матрица.

Математическое выражение, указывающее путь вычисления проекции любой точки θ0, а не только нулевой, имеет вид

θ = θ0 + Z+(Y – Zθ0).


Это общее псевдорешение зависит от ряда произвольных постоянных. Изменяя точку θo, мы получаем все новые и новые решения задачи ортогональным проецированием. Нет такого места на множестве возможных решений, до которой мы не дотянулись бы проекцией из точки, принадлежащей всему пространству. Для несовместных систем поиск по-прежнему ведется на множестве оценок, минимизирующих норму разности левой и правой частей исходного уравнения.

Разновидность общего псевдорешения уравнения идентификации описывает проецирование точки в пространстве с метрикой, порожденной эллиптической нормой ||W–1(θ – θ0)||, когда

θ = θ0 + Zw+(Y – Zθ0),


где Zw+ = W(ZW)+ называется W–взвешенной псевдообратной матрицей. Она обобщает понятие Пенроуза на случай линейных операторов, определенных в пространстве с произвольной метрикой.

Работать напрямую с матрицей измерений нет нужды, кроме тех случаев, когда следует трепетно отнестись к обусловленности уравнений. Формулы работоспособны с матрицами системы нормальных уравнений Pθ=R, сведем свойства псевдорешений в таблицу.

θ = P–1R, det(P)≠ 0||Pθ–R|| = 0
θ = P+Rmin ||Pθ–R||
min ||θ||
θ = θ0 + P+(R–Pθ0)min ||Pθ–R|
min ||θ–θ0||
θ = θ0 + Pw+(R–Pθ0), Pw+ = W(PW)+min ||Pθ–R||
min ||W–1(θ–θ0)||
θ = θ0 + Pw+(R–Pθ0), Pw+ = W(WPW)+Wmin ||W(Pθ–R)||
min ||W–1(θ–θ0)||


Точки зрения на принцип назначения весовых коэффициентов могут быть различными. Наиболее простой выбор дает соображение равных пропорций, когда элементы диагональной матрицы W совпадают со значениями элементов θ0, тогда

||W–1(θ – θ0)||=(((θ1 – θ01)/θ01)2 + ... + ((θn – θ0n)/θ0n)2)½


Пропорционально взвешенная оценка параметров ищется по формуле

θ = θ0 + diag (θ0) (Z diag (θ0)) + (Y – Zθ0).


Этот подход напоминает налоговую систему, чем меньше коэффициент вектора притяжения, тем с большим вниманием он рассматривается. Отметим некоторые его преимущества.

Очевидно, что он отличается от распространенной теперь уже практики использования всюду, где только можно, нормального псевдорешения, которому отвечает нулевой вектор притяжения. Синтеза полезной информации в таких процедурах не происходит. В отличие также от обобщенного метода наименьших квадратов (ОМНК), здесь весовые коэффициенты уравновешивают не невязки измерений, а непосредственно отклонения коэффициентов искомой оценки θ от коэффициентов вектора притяжения θ0. Метод наименьших квадратов без весовых коэффициентов слишком «мешковат», для того, чтобы самостоятельно исправлять странности, вытекающие из различия между тем, что требуется по существу от идентификации и механической подгонкой оценки под ответ.

Дисбаланс весовых коэффициентов позволяет выделить наиболее подверженные дрейфу нестационарные параметры. Столь гибкий аппарат управления оцениванием неоправданно мало используется.

Следует иметь в виду, что за качество оценок придется платить полновесной монетой. Эффективность вычислительных методов заключается в «причесывании» выделяющихся элементов, тогда как веса препятствуют масштабированию. При неосторожном обращении метод счета легко превращается в то самое мифическое решето, которым в России носят в избу воду. Вырожденные задачи требуют особой щепетильности, и при различных подходах к очевидно простым, казалось бы, уравнениям параметрического оценивания возникает большое количество проблем, с изучением которых связано дальнейшее исследование.

Rambler's Top100