1.特征分解
特征分解是指将矩阵分解为一组特征值与特征向量的乘积。设A是n阶方阵,如果存在实数λ和n维非零列向量x,能使
成立,则将λ称为矩阵A的特征值,将非零向量x称为矩阵A对应于特征值λ的特征向量。
式(2.17)也可以写为
这是一个含有n个未知数n个方程的齐次线性方程组,它有非零解的充分必要条件为系数行列式
即
通过求解式(2.20),即可得到矩阵A的所有特征值及其对应的特征向量。
如果x是矩阵A的特征向量,则任何缩放后的向量sx(s∈R,s≠0)也是矩阵A的特征向量,且sx与x有相同的特征值。因此,我们通常只考虑单位特征向量。假设矩阵A有n个线性无关的特征向量v1,v2,…vn,它们分别对应于特征值λ1,λ2,…,λn。我们将特征向量连接成一个矩阵,即V=[v1 v2 … vn]。与之类似,我们也可以将特征值排列成一个向量λ=(λ1,λ2,…,λn),并以此构造对角矩阵Λ。因此,矩阵A的特征分解可以记作A=VΛV-1。
只有可以对角化的矩阵才能进行特征分解。在此,给出矩阵对角化的定义:对于n阶矩阵A和B,若存在可逆矩阵P,能使
成立,则称矩阵B是矩阵A的相似矩阵,或者说矩阵A与矩阵B相似。式(2.21)的这一过程即对矩阵A进行相似变换,我们把可逆矩阵P称为矩阵A到矩阵B的相似变换矩阵。当矩阵B为对角矩阵Λ时,可通过相似变换矩阵P,使
式(2.21)的这一过程就称为矩阵A的对角化。
2.奇异值分解
奇异值分解(singular value decomposition,SVD)是另一种常用的矩阵分解方法,其可以对特征分解无法处理的非可对角化矩阵进行分解。对于任意m×n矩阵A,奇异值分解都可以将A分解成一个m×m矩阵U、一个m×n矩阵D和一个n×n矩阵V的乘积,即
式(2.23)中的分解方式就称为奇异值分解。
对于矩阵D,有Dii=σi且其他位置的元素均为0,σi为非负数且满足σ1≥σ2≥…≥0,其中σi称为奇异值(singular value)。矩阵A的秩等于非零奇异值的个数。矩阵U和矩阵V均为正交矩阵,其中矩阵U的列向量ui称为矩阵A的左奇异向量,矩阵V的列向量vi称为矩阵A的右奇异向量。我们给矩阵A左乘它的转置AT,得到方阵ATA,对这个方阵进行特征分解,有
由此得到的vi就是矩阵A的右奇异向量。此外,我们还可以得到(www.daowen.com)
这里的σi就是上面定义的奇异值,ui就是矩阵A的左奇异向量。
3.LU分解
LU分解是矩阵分解的一种,其将一个n×n方阵A分解为一个下三角矩阵L和一个上三角矩阵U的乘积。
令A=LU,记
由矩阵乘法,得
和
4.QR分解
设n×n矩阵A的秩为n,QR分解都可以将A为一个n×n正交矩阵Q、一个n×n上三角矩阵R,即
式(2.30)中的分解方式就称为QR分解。将矩阵A按列向量分块:
由于矩阵A是满秩的,故α1,α2,…,αn是线性无关的,用Schmidt正交化将线性无关的向量组{αi}正交化得{βi},再单位化得{qi},即
1)正交化
2)单位化
且可得
其中,于是
最终得到的Q=[q1 q2 … qn]是正交矩阵,是上三角矩阵。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。