LU分解是一种重要的数值线性代数技术, 用于解决线性方程组和矩阵求逆等问题. 在科学工程领域, 经常需要解决形如Ax=bAx = bAx=b的线性方程组, 其中AAA是系数矩阵, xxx是未知向量, bbb是已知向量. LU分解是一种将系数矩阵AAA分解为一个下三角矩阵LLL和一个上三角矩阵UUU的方法, 即A=LUA = LUA=LU. 这个分解有许多优点, 其中之一是它可以帮助我们更有效地解决多个不同的右端向量bbb对应的线性方程组, 而无需每次都重新分解AAA. 此外, LU分解也有助于计算矩阵的逆, 因为一旦我们得到了A=LUA = LUA=LU的分解, 就可以相对容易地计算出AAA的逆. 因此, LU分解是许多数值计算和线性代数问题的基础.
LU分解在数值计算中具有广泛的应用, 包括但不限于以下几个方面:
- 线性方程组求解 LU分解可用于有效解决多个不同右端向量的线性方程组, 减少了重复分解系数矩阵的计算开销.
- 矩阵求逆 一旦得到A=LUA=LUA=LU的分解, 可以相对容易地计算矩阵AAA的逆矩阵. 这在各种科学计算和工程应用中非常有用.
- 数值稳定性 LU分解可以帮助分析和改善数值算法的稳定性, 以减小舍入误差的影响.
- 最小二乘法 LU分解可用于最小二乘拟合等问题, 其中需要求解超定或欠定线性方程组.
本文仅考虑不选主元素的三角分解方法, 即AAA的顺序主子式都不等于0, 否则需要对矩阵AAA左乘一个排列矩阵PPP.
算法描述
LU分解的数学原理基于Gauss消元法. 它的核心思想是将系数矩阵AAA通过一系列行变换变成一个上三角矩阵UUU, 同时记录下每次行变换的过程, 以构造下三角矩阵LLL.
设AAA是一个n×nn \times nn×n的矩阵, LU分解的目标是找到下三角矩阵LLL和上三角矩阵UUU, 使得A=LUA = LUA=LU. 具体步骤包括:
- 将LLL初始化为单位下三角矩阵, 将UUU初始化为AAA的副本.
- 针对第一列, 使用行变换操作将UUU的第一列元素变成零, 同时记录行变换操作到LLL的第一列.
- 重复上述步骤, 依次处理第二列, 第三列, 直到处理完最后一列, 得到完整的LU分解.
数学上, 行变换操作是通过矩阵乘法来表示的, 这些操作将AAA的行变换为UUU的行, 同时更新LLL. 最终, 得到的矩阵UUU就是原矩阵AAA的上三角部分, 而矩阵LLL则包含了所有行变换的信息.
实际上, 如果每次都进行消元, 可能导致不稳定的情形出现, 且效率较低. 我们可以直接从LU分解的结论A=LUA=LUA=LU出发, 利用矩阵乘法的定义, 我们可以得到n2n^2n2个方程, 通过化简计算, 可得如下快速计算LU分解的算法:
设A=(aij),L=(lij),U=(uij)A=(a_{ij}),L=(l_{ij}),U=(u_{ij})A=(aij),L=(lij),U=(uij), 首先由AAA的第1行第1列可以计算出UUU的第1行和LLL的第1列:
u1j=a1j,j=1,2,⋯ ,n u_{1j}=a_{1j},j=1,2,\cdots,n u1j=a1j,j=1,2,⋯,n
lk1=ak1u11,k=2,3,⋯ ,n l_{k1}=\frac{a_{k1}}{u_{11}},k=2,3,\cdots,n lk1=u11ak1,k=2,3,⋯,n
下面假设UUU的111到k−1k-1k−1行, LLL的111到k−1k-1k−1列均已算出, 则有:
ukj=akj−∑r=1k−1lkrurj,j=k,k+1,⋯ ,n u_{kj}=a_{kj}-\sum_{r=1}^{k-1}l_{kr}u_{rj},j=k,k+1,\cdots,n ukj=akj−r=1∑k−1lkrurj,j=k,k+1,⋯,n
lik=1ukk(aik−∑r=1k−1lirurk),i=k,k+1,⋯ ,n l_{ik}=\frac1{u_{kk}}\left(a_{ik}-\sum_{r=1}^{k-1}l_{ir}u_{rk}\right),i=k,k+1,\cdots,n lik=ukk1(aik−r=1∑k−1lirurk),i=k,k+1,⋯,n
根据如上递推公式即可算出LLL和UUU的全部元素.
算法实现
#include <armadillo>
using namespace arma;
/*
* LU分解
* L:下三角矩阵
* U:上三角矩阵
* A:待分解矩阵
* e:精度
*
* 返回(bool):
* true : 分解失败
* false: 分解成功
*/
bool LU(mat &L, mat &U, const mat &A, const double &e = 1e-6)
{
if (A.n_cols == 1)
{
L.ones(1, 1);
U.resize(1, 1);
if (abs(U.at(0, 0) = A.at(0, 0)) < e)
return true;
return false;
}
L.eye(A.n_cols, A.n_cols);
U.zeros(A.n_cols, A.n_cols);
unsigned n(A.n_cols - 1);
for (unsigned i(0); i != n; ++i)
{
U.at(i, i) = A.at(i, i);
for (unsigned k(0); k != i; ++k)
U.at(i, i) -= L.at(i, k) * U.at(k, i);
if (abs(U.at(i, i)) < e)
return true;
for (unsigned j(i + 1); j != A.n_cols; ++j)
{
L.at(j, i) = A.at(j, i);
U.at(i, j) = A.at(i, j);
for (unsigned k(0); k != i; ++k)
{
U.at(i, j) -= L.at(i, k) * U.at(k, j);
L.at(j, i) -= L.at(j, k) * U.at(k, i);
}
L.at(j, i) /= U.at(i, i);
}
}
U.at(n, n) = A.at(n, n);
for (unsigned i(0); i != n; ++i)
U.at(n, n) -= L.at(n, i) * U.at(i, n);
if (abs(U.at(n, n)) < e)
return true;
return false;
}
实际上armadillo库提供了lu
函数, 也可以直接使用arma::lu
.
实例分析
对以下矩阵进行LU分解:
A=(621−12410114−1−10−13) A=\begin{pmatrix} 6&2&1&-1\\2&4&1&0\\1&1&4&-1\\-1&0&-1&3 \end{pmatrix} A=621−12410114−1−10−13
代入程序求得
L=(1.00000000.33331.0000000.16670.20001.00000−0.16670.1000−0.24321.0000) L=\begin{pmatrix} 1.0000&0&0&0\\ 0.3333&1.0000&0&0\\ 0.1667&0.2000&1.0000&0\\ -0.1667&0.1000&-0.2432&1.0000 \end{pmatrix} L=1.00000.33330.1667−0.166701.00000.20000.1000001.0000−0.24320001.0000
U=(6.00002.00001.0000−1.000003.33330.66670.3333003.7000−0.90000002.5811) U=\begin{pmatrix} 6.0000&2.0000&1.0000&-1.0000\\ 0&3.3333&0.6667&0.3333\\ 0&0&3.7000&-0.9000\\ 0&0&0&2.5811 \end{pmatrix} U=6.00000002.00003.3333001.00000.66673.70000−1.00000.3333−0.90002.5811