Метод холецкого в решении системы линейных уравнений - Про уравнения

Разложение матриц на треугольные множители. Схема Холецкого

Лекция 3. Метод Холецкого

Метод Гаусса, подробно рассмотренный выше, был и остается основным инструментом для решения систем линейных уравнений. Основным, но не единственным. Нам следует получить представление еще о двух группах методов: 1) методы разложения матрицы на треугольные множители; 2) итерационные методы.

Рассмотрим метод Холецкого, который предназначен для решения систем с симметричными положительно определенными матрицами. Почему нас интересуют именно такие матрицы?

Во-первых, как известно, матрица жесткости (см (1.1)) является симметричной матрицей.

Во-вторых, вспомним, что при использовании метода конечных элементов потенциальная энергия конструкции определяется выражением

, (3.1)

где q – вектор перемещений конструкции, а K – ее матрица жесткости.

Аналогично, для кинетической энергии системы получено

, (3.2)

где M – матрица инерции.

В исходном, недеформированном, состоянии потенциальная энергия деформации конструкции равна нулю. В то же время любые перемещения точек конструкции приводят к ее деформации и, значит, к увеличению П по сравнению с недеформированным состоянием. Таким образом, исходя только из соображений физического смысла, мы пришли к выводу о положительной определенности матрицы жесткости. Подобные соображения можно привести и для матрицы инерции.

Теорема Холецкого. Если A – симметричная положительно определенная матрица, то существует действительная невырожденная нижняя треугольная матрица L такая, что , т.е.

Согласно этой теореме мы можем заменить в исходной системе линейных уравнений матрицу на ее разложение:

. (4)

Если мы обозначим , то можем легко решить задачу в два этапа:

1) — определяем y;

2) — определяем x.

Обе эти системы с треугольными матрицами и, следовательно, легко решаются. То есть разложение Холецкого дает возможность заменить сложную задачу решения системы уравнений с полностью заполенной матрицей двумя простыми задачами – решение двух систем с треугольной матрицей.

Остается только научиться строить матрицу L.

Вспомним определение произведения матриц: . Следовательно, элемент есть произведение i-й строки матрицы L на j-й столбец матрицы :

. (3.5)

Учтем симметричность матрицы A. Это значит, что мы можем ограничиться рассмотрением только элементов нижнего треугольника матрицы A :

. (3.6)

Теперь для получения удобных для использования формул полезно записать это выражение отдельно для поддиагональных и для диагональных элементов матрицы A:

(3.7)

Кстати, эти формулы позволяют понять, почему в теореме Холецкого содержится ограничение, которое требует положительной определенности матрицы . Если попытаться применить формулы (3.7) к матрице, не являющейся положительно определенной, то это приведет либо к получению отрицательного числа под знаком квадратного корня при вычислении , либо к некорректной операции деления на ноль при вычислении .

Пример. Найти по схеме Холецкого решение системы:

(3.8)

Матрица этой системы

(3.9)

в результате применения формул (3.7)

представляется в виде разложения , где

(3.10)

Теперь находим решение исходной системы путем решения двух треугольных систем:

Содержание

Итерационные методы решения систем линейных алгебраических уравнений
Стандартные итерационные методы
Итерации Якоби и Гаусса — Зейделя
Метод Холецкого (нахождение симметричного треугольного разложения)
Содержание
1 Разложение Холецкого (метод квадратного корня), базовый точечный вещественный вариант для плотной симметричной положительно определённой матрицы
1.1 [math]LL^T[/math] -разложение
1.2 [math]LDL^T[/math] -разложение
2 Разложение Холецкого, блочный вещественный вариант для плотной симметричной положительно определённой матрицы
3 Разложение Холецкого, точечный вещественный вариант для разреженной симметричной положительно определённой матрицы
3.1 Основные отличия от случая плотной матрицы
3.2 Переупорядочивания для уменьшения количества новых ненулевых элементов
4 Разложение Холецкого, блочный вещественный вариант для разреженной симметричной положительно определённой матрицы
5 Разложение Холецкого для симметричной незнакоопределенной (седловой) матрицы
6 Разложение Холецкого для эрмитовой матрицы
6.1 Точечный вариант
6.2 Блочный вариант
7 Использование разложения Холецкого в итерационных методах
7.1 Ограничивание заполнения в разложении Холецкого
7.2 Неполное разложение Холецкого по позициям IC( [math]k[/math] )
7.3 Приближенное разложение Холецкого по значениям IC( [math]tau[/math] )
7.4 Приближенное разложение Холецкого второго порядка IC( [math]tau_1,tau_2[/math] )
7.5 Комбинация разложений Холецкого IC( [math]k,tau[/math] ) и IC( [math]tau,m[/math] )
8 Использование разложения Холецкого в параллельных итерационных алгоритмах
8.1 Переупорядочивания для выделения блочности
8.2 Разложение в независимых блоках
8.3 Разложение в сепараторах
8.4 Иерархические и вложенные алгоритмы
8.5 Блочный метод Якоби
8.6 Аддитивный метод Шварца
8.7 Неполное обратное треугольное разложения
9 Решение линейных систем с треугольной матрицей
9.1 Решение системы с плотной нижнетреугольной матрицей
9.2 Решение системы с плотной верхнетреугольной матрицей
9.3 Решение системы с разреженной нижнетреугольной матрицей
9.4 Решение системы с комплексной треугольной матрицей
9.5 Решение систем с блочноокаймленными треугольными матрицами

Итерационные методы решения систем линейных алгебраических уравнений

Стандартные итерационные методы

В разделах Метод исключения Гаусса и Методы решения систем с симметричными матрицами процедуры решения систем алгебраических уравнений были связаны с разложением матрицы коэффициентов ( A ). Методы такого типа называются прямыми методами. Противоположностью прямым методам являются итерационные методы. Эти методы порождают последовательность приближенных решений ( < x^> ). При оценивании качества итерационных методов в центре внимания вопрос от том, как быстро сходятся итерации ( x^ ).

Итерации Якоби и Гаусса — Зейделя

Простейшей итерационной схемой, возможно, являются итерации Якоби. Они определяются для матриц с ненулевыми диагональными элементами. Идею метода можно представить, используя запись ( 3 times 3 )-системы ( Ax = b ) в следующем виде: $$ begin x_1 &= (b_1 — a_x_2 — a_x_3) / a_, \ x_2 &= (b_2 — a_x_1 — a_x_3) / a_, \ x_3 &= (b_3 — a_x_1 — a_x_2) / a_. \ end $$ Предположим, что ( x^ ) — какое-то приближение к ( x = A^b ). Чтобы получить новое приближение ( x^ ), естественно взять: $$ begin x_1^ &= (b_1 — a_x_2^ — a_x_3^) / a_, \ x_2^ &= (b_2 — a_x_1^ — a_x_3^) / a_, \ x_3^ &= (b_3 — a_x_1^ — a_x_2^) / a_. \ end $$

Эти формулы и определяют итерации Якоби в случае ( n = 3 ). Для произвольных ( n ) мы имеем $$ begin tag x_i^ = left( b_i — sum_^ a_x_j^ — sum_^ a_x_j^ right)/a_, quad i = 1, 2, ldots, n. end $$

Заметим, что в итерациях Якоби при вычислении ( x_i^ ) не используется информация, полученная в самый последний момент. Например, при вычислении ( x_2^ ) используется ( x_1^ ), хотя уже известна компонента ( x_1^ ). Если мы пересмотрим итерации Якоби с тем, чтобы всегда использовать самые последние оценки для ( x_i ), то получим: $$ begin tag x_i^ = left( b_i — sum_^ a_x_j^ — sum_^ a_x_j^ right)/a_, quad i = 1, 2, ldots, n. end $$ Так определяется то, что называется итерациями Гаусса — Зейделя.

Для итераций Якоби и Гаусса — Зейделя переход от ( x^ ) к ( x^ ) в сжатой форме описывается в терминах матриц ( L, D ) и ( U ), определяемых следующим образом: $$ begin L &= begin 0 & 0 &cdots & cdots & 0 \ a_ & 0 &cdots & cdots & 0 \ a_ & a_ & 0 & cdots & 0 \ vdots & vdots & vdots & ddots &vdots\ a_ & a_ & cdots & a_ & 0 end, \ D &= mathrm(a_, a_, ldots, a_), \ U &= begin 0 & a_ &a_ & cdots & a_ \ 0 & 0 & a_ & cdots & a_ \ vdots & vdots & ddots & ddots &vdots\ 0 & 0 & cdots & 0 & a_ \ 0 & 0 & cdots & 0 & 0 end. end $$ Шаг Якоби имеет вид ( M_J x^ = N_J x^ + b ), где ( M_J = D ) и ( N_J = -(L+U) ). С другой стороны, шаг Гаусса — Зейделя определяется как ( M_G x^ = N_G x^ + b ), где ( M_G = (D+L) ) и ( N_G = -U ).

Процедуры Якоби и Гаусса — Зейделя — это типичные представители большого семейства итерационных методов, имеющих вид $$ begin tag M x^ = N x^ + b, end $$ где ( A = M-N ) — расщепление матрицы ( A ). Для практического применения итераций (9) должна «легко» решаться система с матрицей ( M ). Заметим, что для итераций Якоби и Гаусса — Зейделя матрица ( M ) соответственно диагональная и нижняя треугольная.

Сходятся ли итерации (9) к ( x = A^b ), зависит от собственных значений матрицы ( M^N ). Определим спектральный радиус произвольной ( n times n )-матрицы ( G ) как $$ rho(G) = max , $$ тогда если матрица ( M ) невырожденная и ( rho(M^N) —>

Метод Холецкого (нахождение симметричного треугольного разложения)

Основные авторы описания: И.Н.Коньшин

Содержание

1 Разложение Холецкого (метод квадратного корня), базовый точечный вещественный вариант для плотной симметричной положительно определённой матрицы

1.1 [math]LL^T[/math] -разложение

Разложение Холецкого — представление симметричной положительно определённой матрицы [math]A=A^Tgt 0[/math] в виде произведения [math]A = LL^T[/math] , где [math]L[/math] — нижняя (Lower) треугольная матрица со строго положительными элементами на диагонали. Иногда разложение удобно записать в эквивалентной форме [math]A = U^TU[/math] , где [math]U = L^T[/math] — верхняя (Upper) треугольная матрица. Для любой симметричной положительно определённой матрицы разложение Холецкого существует и единственно.

Элементы матрицы [math]L[/math] можно вычислить, начиная с верхнего левого угла матрицы [math]A[/math] , по формулам:

Выражение под квадратным корнем всегда положительно, если [math]A[/math] — вещественная симметричная положительно определённая матрица.

Вычисление происходит сверху вниз, слева направо, т.е. сначала вычисляется [math]L_[/math] ( [math]j lt i[/math] ), а уже затем [math]L_[/math] . Вычисления обычно проводятся в одной из следующих последовательностей.

Алгоритм Холецкого-Банашевича (Cholesky–Banachiewicz algorithm) или просто алгоритм Холецкого, когда вычисления начинаются с верхнего левого угла матрицы [math]L[/math] и проводятся по строкам. Этот вариант разложения используется наиболее часто, особенно при использовании построчного формата хранения элементов матрицы [math]L[/math] .

Краут-вариант алгоритма Холецкого (Cholesky–Crout algorithm), когда вычисления также начинаются с верхнего левого угла матрицы [math]L[/math] , но проводятся по столбцам. Этот вариант разложения используется несколько реже, применяется он при использовании столбцевого формата хранения элементов матрицы [math]L[/math] , а также когда необходимо проводить коррекцию ведущих элементов при выполнении приближенного разложения.

Оба варианта разложения могут быть применены если требуется построить нижнетреугольный сомножитель [math]L[/math] прямо поверх исходной матрицы [math]A[/math] .

В разделе Разложение Холецкого (метод квадратного корня) подробно рассмотрен базовый точечный вещественный вариант для плотной симметричной положительно определённой матрицы.

1.2 [math]LDL^T[/math] -разложение

Иногда удобнее бывает рассматривать [math]LDL^T[/math] вариант симметричного треугольного разложения, в котором матрица [math]L[/math] является нижней унитреугольной (т.е. имеет единицы на главной диагонали), а [math]D[/math] — диагональная матрица с положительными элементами. В этом варианте разложения легко проследить связь как с ранее рассмотренным [math]LL^T[/math] вариантом:

[math]A = LDL^T = LD^D^L^T = (LD^),(LD^)^T = tilde L tilde L^T,[/math]

так и с несимметричным [math]LU[/math] -разложением:

[math]A = LDL^T = L(DL^T) = LU.[/math]

2 Разложение Холецкого, блочный вещественный вариант для плотной симметричной положительно определённой матрицы

Можно также рассмотреть блочный вариант разложения Холецкого. Предположим, что [math]n=MN[/math] , тогда исходную матрицу [math]A[/math] размера [math]ntimes n[/math] можно представить как блочную матрицу размера [math]Ntimes N[/math] с блоками размера [math]Mtimes M[/math] . Все формулы, используемые для получения точечного разложения Холецкого, для блочной матрицы [math]A[/math] останутся практически без изменений. Вместо явного обращения диагональных блоков, эффективнее хранить их в факторизованном виде [math]D_=L_L^T_[/math] , а вместо операции деления использовать соответствующие операции решения для треугольных систем. Общее количество арифметических операций при этом останется практически неизменным, но зато существенно возрастет локальность вычислений. Размер блока [math]M[/math] выбирают таким образом, чтобы все блоки, участвующие в операции исключения, помещались в кэш первого или второго уровня. В этом случае подкачки данных в память будут минимальными.

Аналогичный прием понадобится также и для эффективной реализации параллельной версии разложения Холецкого, что позволит минимизировать как общее количество межпроцессорных обменов, так и количество пересылаемой между процессорами информации. Полезным побочным эффектом применения блочной версии разложения Холецкого может стать повышение скалярной эффективности алгоритма за счет явного использования размера блока [math]M[/math] во внутренних циклах (прием «разворачивание цикла» или «loop unrolling»).

3 Разложение Холецкого, точечный вещественный вариант для разреженной симметричной положительно определённой матрицы

Если исходная матрица [math]A[/math] представлена в разреженном виде, то для экономии памяти, а также арифметических операций, необходимо учитывать ее разреженность.

3.1 Основные отличия от случая плотной матрицы

В этом разделе необходимо рассмотреть матрицы, характеризующиеся способом хранения ненулевых элементов, и имеющие следующие виды разреженности.

Лента — матрица, ненулевые элементы которой сосредоточены внутри ленты шириной [math]2d+1[/math] , т.е. когда [math]a_=0[/math] при [math]|i-j| gt d[/math] . В этом случае, при проведении разложения Холецкого новые ненулевые элементы могут образовываться только внутри этой же ленты (поскольку нет выбора ведущих элементов в силу положительной определенности матрицы [math]A[/math] ). Количество ненулевых элементов в исходной матрице [math]A[/math] , а также в нижнетреугольном множителе [math]L[/math] будет около [math](d+1)n[/math] , а арифметические затраты составят приблизительно [math]d^2n[/math] .

Профиль — в более общем случае, заполнение в каждой строке треугольного множителе [math]L[/math] будет определяться позицией первого ненулевого элемента. Сумма по всем строкам расстояний от первого ненулевого элемента строки до главной диагонали и составляет «профиль» матрицы и определяет верхнюю границу количества ненулевых элементов в нижнетреугольном множителе [math]L[/math] .

Общая структура разреженности. Верхней границей заполнения треугольного множителя [math]L[/math] , конечно же, будет значение «профиля» матрицы, но учет особенностей структуры ненулевых элементов внутри профиля иногда может дать дополнительный эффект в повышении эффективности вычислений.

При рассмотрении общего случая разреженности необходимо выбрать формат хранения разреженных данных. Таковым может быть, например, формат построчного сжатия данных («compressed sparse row» или CSR формат). В первом вещественном массиве, подряд (обычно в порядке возрастания номеров столбцов) хранятся ненулевые элементы матрицы, во втором, в том же порядке хранятся номера столбцов, в третьем, отдельно сохраняется начало каждой строки. Если общее количество ненулевых элементов в матрице равно nnz («number of nonzeros»), то память для хранения разреженных данных такой матрицы в формате CSR при использовании двойной точности составит [math]3,+n+1[/math] . Оценку количества арифметических операций в общем случае невозможно, т.к. помимо количества ненулевых элементов в исходной матрице оно существенно зависит от структуры ее разреженности.

Для реализации разложения Холецкого в этом случае понадобится несколько операций с разреженными строками:

копирование из одной разреженной строки в другую (или во временный «плотный» вектор, операция распаковки данных);

выполнение операции исключения для одного из элементов строки;

вставка в строку нового ненулевого элемента («fill-in»);

сжатие данных с копированием из временного плотного вектора в сжатый разреженный (операция упаковки данных).

3.2 Переупорядочивания для уменьшения количества новых ненулевых элементов

Структура треугольного множителя [math]L[/math] , а также объем памяти им занимаемый зависят от упорядочивания строк и столбцов исходной матрицы [math]A[/math] , в котором проводилось разложение. Существуют алгоритмы, минимизирующие заполнение матрицы [math]L[/math] .

В первую очередь это алгоритм RCM (Reverse Cuthill–McKee), который предназначен для уменьшения профиля матрицы. Одновременно с уменьшением профиля происходит и уменьшение заполнения треугольного множителя [math]L[/math] . Это очень широко применяемый, быстрый, но не самый эффективный алгоритм.

Алгоритм вложенных сечений (Nested Dissection, ND) — служит именно для минимизации заполнения множителя [math]L[/math] . В некоторых частных случаях доказана его асимптотическая оптимальность.

В общем случае, проблема поиска перестановки, минимизирующей заполнение множителя [math]L[/math] , является NP-полной задачей.

4 Разложение Холецкого, блочный вещественный вариант для разреженной симметричной положительно определённой матрицы

Иногда разреженную симметричную матрицу бывает удобно представить в блочном виде с блоками небольшого размера [math]M[/math] , равного, например, количеству неизвестных функций на узел при конечно-элементной или конечно-разностной аппроксимации уравнений в частных производных. В этом случае структура разреженности хранится для всей блочной структуры разреженности (что позволяет экономить память на хранении целочисленных массивов). Если общее количество ненулевых блоков размера [math]Mtimes M[/math] в матрице равно nnz («number of nonzeros»), то память для хранения разреженных данных такой мелкоблочной матрицы в формате CSR при использовании двойной точности составит [math](2M^2+1),+n/M+1[/math] .

В некоторых случаях, размер блока [math]M[/math] может выбираться из других соображений, например, для повышения эффективности работы процедур нижнего уровня за счет приема разворачивания циклов (loop unrolling).

Алгоритмы, необходимые при выполнении разложения Холецкого для матриц, рассмотренных в этом разделе, могут быть получены комбинацией уже рассмотренных идей блочности и разреженности.

5 Разложение Холецкого для симметричной незнакоопределенной (седловой) матрицы

Если симметричная матрица [math][/math] представима в виде

где [math]A[/math] — симметричная положительно определенная ( [math]A=A^Tgt 0[/math] ) и [math]C[/math] — симметричная неотрицательно определенная ( [math]C=C^Tge0[/math] ) матрицы, то, выполнив один шаг блочного исключения, ее можно преобразовать к виду

[math] begin A & 0 \ 0 & S end , [/math]

где матрица дополнения по Шуру [math]S=-(C+B^TA^B)[/math] является строго отрицательно определенной ( [math]S=S^Tlt 0[/math] ). Это означает, что матрица [math][/math] имеет [math]n_A[/math] положительных и [math]n_C[/math] отрицательных собственных значений, где через [math]n_A[/math] и [math]n_C[/math] обозначены размерности матриц [math]A[/math] и [math]C[/math] , соответственно.

В этом случае существует симметричное треугольное разложение вида [math]=D^T[/math] , где [math][/math] является нижней унитреугольной, а диагональная матрица [math]D[/math] содержит [math]n_A[/math] положительных и [math]n_C[/math] отрицательных элементов на главной диагонали, причем такое разложение может быть получено напрямую без выбора ведущего элемента даже если [math]C[/math] — нулевая матрица.

В общем случае разложения невырожденной незнакоопределенной системы необходимо применять выбор ведущего элемента с главной диагонали матрицы, что соответствует некоторой симметричной перестановке строк и столбцов исходной матрицы [math][/math] .

6 Разложение Холецкого для эрмитовой матрицы

Эрмитовой (или комплексно-самосопряженной) матрицей называют такую квадратную комплексную матрицу [math]A[/math] , для элементов которой выполняется соотношение [math]a_=overline<a_>[/math] (здесь, если [math]z=a+b,[/math] и [math]^2=-1[/math] , то [math]overline z=a-b,[/math] ). В матричном виде это можно записать как [math]A=overline[/math] или [math]A = A^*[/math] .