2.1. МАТРИЧНАЯ АЛГЕБРА


Вот уже столетие как матрицы пользуются повышенным вниманием математиков. Им целиком посвящен один из заметных научных трудов уходящего века, монография Ф. Р. Гантмахера [12]. Свойства матриц тщательно изучаются, некоторые из них, как астероиды, носят имена своих первооткрывателей. Спрашивается, почему объекты, шагнувшие в мир как бы со страниц конторской книги, обрели в нем такое звучание? Попытаемся подыскать вразумительный ответ на поставленный вопрос.

Матрица является закономерным продуктом развития теории числа. Еще греки задавали рациональные числа отношением двух целых чисел. Иррациональные числа можно представить таблицей длин катетов прямоугольного треугольника. Комплексные числа оставались для математиков лишь предметом отвлеченных манипуляций вплоть до XIX в., когда норвежец Гаспар Вессель первым ввел их геометрическое представление [5]. Позднее ирландский математик Уильям Роуэн Гамильтон развил алгебраическую интерпретацию комплексных чисел, согласно которой каждое комплексное число задается парой обычных чисел.

Умножение комплексных чисел можно представить как поворот на плоскости. Нельзя ли ввести новый вид числа и определить способ умножения, выразив с его помощью поворот в трехмерном пространстве? Эти числа Гамильтон назвал триплетами. Задача о триплетах, беспрестанно занимавшая математика, оказалась крепким орешком. Вся семья Гамильтона переживала с ним его неудачи. Сам он рассказывал, что стоило ему спуститься к завтраку, как один из его сыновей спрашивал: «Ну, папа, можешь ли ты уже умножать триплеты?» И папа должен был удрученно отвечать: «Нет, я могу только складывать и вычитать их».

Секрет триплетов оказался прост. Законы арифметики выверялись веками, нелегко было поверить, что платой за усложнение числа послужит коммутативный закон. Кватернионы не допускают приведения подобных членов заменой AB+BA на 2AB. Спустя полвека Софус Ли создал алгебру и вовсе на противоположном начале AB=–BA. В этом случае AB+BA=0 и (A+B)2=A2+B2. Затея Гамильтона прижилась и вскоре дала замечательные всходы. В соревновании нарождающихся алгебраических систем кватернионы уступили место матрицам, которые вобрали в себя удивительное свойство отображать резонанс. Резонансными свойствами обладают атом и электрическая схема, элементарная частица и звезда. Матрица оказалась весьма простой и удобной моделью многих систем.

Матрицы – это прямоугольные таблицы чисел с элементами, пронумерованными по строкам и столбцам:

A=
 a11 
 a12 
 ... 
 a1m 
 a21 
 a22 
 ... 
 a2m 
 ... 
 ... 
 ... 
 ... 
 an1 
 an2 
 ... 
 anm 


Складывать и вычитать их между собой нужно поэлементно. Сходно оперируют с комплексными числами. Умножение матриц не наследует черты комплексной арифметики. Оно опирается на представление о скалярном произведении пары векторов

с = (a, b) = a1b1 + a2b2 ... anbn.


Его используют в аналитической геометрии при определении величины косинуса угла раствора двух векторов a, b единичной длины. При умножении матриц C=AB каждая строка A умножается скалярно на каждый столбец B, результаты сводятся в итоговую таблицу C. Умножение вектора на матрицу описывает его поворот с одновременным масштабированием. Это можно трактовать также просто как смену ортов системы координат на векторы, составляющие столбцы A.

Произведение матриц не коммутативно: AB≠BA. Кроме того, возникают проблемы с делением их друг на друга. Алгебраисты склонны объединять хорошо ведущие себя объекты в поле или в кольцо. По определению, существует поле вещественных чисел. Оно задает правила игры. Им подчиняются также комплексные числа. Целые числа поля не образуют, их скромный удел – кольцо, сохраняющее правила сложения, вычитания и умножения. Это означает частичную возможность пускать процессы вычислений вспять. Матрицы образуют некоммутативное кольцо. Если отсеять нехорошие матрицы, а это, прежде всего, неравнобокие по длине и ширине таблицы, то из них удается сконструировать приличное поле.

Мерой приличия матрицы является ее определитель – функция элементов квадратной матрицы порядка n, обозначаемая det(A). Определитель (детерминант) матрицы второго порядка равен разности произведений элементов двух ее диагоналей a11 a22a12 a21. Определитель матрицы более высокого порядка можно выразить через определители ее блоков, на этот счет разработана строгая, но громоздкая теория. Выход ее прост: в поле вещественных чисел делить на нуль запрещается, то же самое касается матриц с нулевым определителем – на них делить нельзя.

Не следует забывать о том, что матрица значительнее числа. У нее есть свои, присущие только ей свойства и операции. Например, так как она имеет горизонтальный и вертикальный размеры, ее можно поставить набок. Не каждая матрица заслуживает обратной, но любую таблицу легко «опрокинуть». Матрица, у которой столбцы заменены строками, называется транспонированной по отношению к исходной и обозначается AT, т. е.

AT=
 a11 
  a21 
  ... 
  an1 
  a12 
  a22 
  ... 
  an2 
  ... 
  ... 
  ... 
  ... 
  a1m 
  a2m 
  ... 
  anm 


Транспонирование – в некотором смысле не доведенное до конца обращение, слабое утешение за запрет образовывать поле. О том, что природа операции транспонирования близка к инверсии, свидетельствует то, что для ортогональных матриц, с ортогональными нормированными столбцами, в точности AT=A–1. Кроме того, правило раскрытия скобок едино для операций транспонирования и обращения (AB)T=BTAT, (AB)–1=B–1A–1.

Вырожденных матриц много, между тем нуль в обычной арифметике должен быть только один. Поэтому все отличные от строго нулевой неинвертируемые матрицы выбраковываются. Как ни удивительно, оставшегося материала хватает на поле. Математик, вооружившись определителем, выступает в роли портного, отхватывающего ножницами у старой, но годной на жакет рубахи протертые рукава. Если принять во внимание размеры матриц, понятно, почему они выдерживают все.

Что касается поля, то о нем многое известно из школьной арифметики. Невырожденные матрицы через отношения A–1A=E, AA–1=E обзаводятся обратными элементами A–1. Единичная матрица E содержит только нули и еще единицы на главной (направленной слева-направо и вниз) диагонали. Уравнение AX=B имеет единственное решение X=A–1B тогда и только тогда, когда det(A) ≠ 0. Матричная «нотация» резко упростила вид записи систем алгебраических и дифференциальных уравнений, с ее помощью научные книги c середины XX века стали заметно тоньше.

Матричное исчисление ущербно, так как нет возможности приводить подобные вида AB и BA. Его сильная сторона видна не сразу. Оказывается, что потеря мобильности в перестановке сомножителей с лихвой окупается перспективой замены матрицы A более простыми компонентами разложений A=QR или A=UDV. Здесь все как в химии, занятой возней с ингредиентами – разложения необычны, но действенны.

Распространенные в матричной алгебре разложения A на множители осуществимы и тогда, когда обратной матрицы нет. Это снижает риск получить на выходе вычислительного агрегата ерунду. Детали разложений достаточно разговорчивы, по их виду бывает несложно предсказать судьбы частных инверсий. Для симметричных матриц AT=A большой популярностью пользуется разложение Холецкого A=LLT, где часть представляет собой нижнюю треугольную матрицу

L=
 l11 
  0 
  ... 
  0 
  l12 
  l22 
  ... 
  0 
  ... 
  ... 
  ... 
  ... 
  ln1 
  ln2 
  ... 
  lnn 


Признаком вырожденности L служат нулевые диагональные элементы. Располагая сведениями о матрице разложения, несложно оценить ее ущербность по отношениям элементов.

Никто не инвертирует ныне матрицы на основе теории определителей. Дело в том, что по внешнему виду таблицы никак не скажешь, насколько она предрасположена к обращению. Точно также «молчит» определитель. Он зависит от масштабного множителя при матрице det(kA) = kndet(A). Умножили матрицу на большое число – и ее определитель «поправился». Это не означает, конечно, что проблемы машинной арифметики решает простое масштабирование. С легким сердцем можно попытаться заложить плохо обусловленные данные в вычислительную технику, как в стиральную машину, и нажать кнопку. Увы, компьютер сам по себе ничего умного не придумает, вместо A–1 он вернет «тряпочки». Беда не в них, собственно, а в том, что мы об этом, порою, даже не подозреваем.

Среди разложений большое значение имеет спектральное разложение квадратной матрицы A=VDV–1, в котором D – диагональная матрица. Его аналогом для прямоугольных таблиц является более сложное сингулярное разложение вида A=USVT. После разложений, уравнение AX=B заменяется на LLTX=B или USVTX=B и решается последовательной инверсией сомножителей, например, LTX=L–1B, X=(L–1)TL–1B и т. п. Сингулярное разложение используется для формальной оценки зависимости решения от погрешностей: числом обусловленности cond (A) называется максимум отношения сингулярных чисел (элементов диагонали S). Компьютер выполняет над складываемыми несоразмерными значениями работу сенокосилки. Так что своевременное информирование о характере обрабатываемого им материала позволяет заглянуть в будущее.

Примерно до середины XX столетия не пришедшиеся ко двору прямоугольные матрицы вызывали вялую реакцию алгебраистов. Наконец, стало ясно, что более нельзя терпеть неопределенность в способах выражения решения системы линейных алгебраических уравнений общего вида AX=B, с любыми матрицами левой и правой частей. Вычислительные алгоритмы, конечно, хорошо, но без соответствующих обозначений трудно работать с вырожденными или, наоборот, с переопределенными системами. В эпоху торжества матричной алгебры такая помеха смотрелась как белое пятно на карте досконально изученной территории.

Сначала Мур (1920), а потом Пенроуз (1955) предложили использовать в роли аналога обратной матрицы «масштабированную» транспонированную матрицу A+=MAT=ATW, удовлетворяющую уравнению AA+A = A. Его решение единственно. Пенроуз озаботился тем, чтобы найти близкие аналоги уравнениям A–1A=E, AA–1=E. Псевдообратная (как бы обратная) матрица отвечает условиям AA+A=A, A+AA+=A+, AA+=(AA+)T, A+A=(A+A)T. Первые два из них подтверждают представление о том, что выживает сильнейший. Остальные уравнения констатируют симметрию взаимных произведений матриц A и A+. Разработав столь совершенную теорию, алгебраисты смогли облегченно вздохнуть и написать «решение» системы линейных уравнений, годное на все случаи, как X=A+B.

Традиция решать несовместные системы восходит к Гауссу, который минимизировал квадрат нормы разности ||AX–B||2. Квадратичная функция привлекательна тем, что ее экстремум отвечает линейному уравнению, получаемому после дифференцирования и приравнивания нулю производной. Система нормальных уравнений AT(AX–B)=0 метода наименьших квадратов Гаусса совместна всегда, но может иметь множество решений. В таком случае псевдорешение выделяет среди прочих вектор минимальной длины. Расчет X=A+B дает точку, наиболее близкую к началу системы координат на множестве возможных решений. Если ранг матрицы вторичной системы полон, то ее вид подводит к часто используемой в литературе формуле для псевдообратной матрицы A+=(ATA)–1AT.

Следуя Гауссу, уравнения A–1A=E, AA–1=E можно заменять условиями минимума квадратов норм ||PA–E||2, ||AP–E||2. Такое обобщение не противоречит предыдущему, причем среди претендентов на роль псевдообратной матрицы выбирается экстремальное решение P=A+, минимальное, в свою очередь, по норме (сумма квадратов элементов итоговой матрицы P минимальна). Теория матриц, с ее разнообразием необычных элементов, однажды дала импульс развитию алгебре, абстрагируемой от особенностей арифметики чисел. Она и сейчас образует богатую почву для проведения масштабных параллелей.

Rambler's Top100