特征值, 特征向量与正定矩阵
目录
1 特征值与特征向量的定义 3
2 特征值与特征向量的求解 3
3 特征值的性质 3
3.1 相似不变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3.2 特殊矩阵的特征值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3.3 矩阵多项式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3.3.1 矩阵多项式的特征值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3.3.2 零化多项式与最小多项式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.3.3 若当矩阵的最小多项式与矩阵可对角化的条件 . . . . . . . . . . . . . . . . . . . . . 5
3.4 矩阵幂次的特征值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.5 逆矩阵的特征值与特征向量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
4 矩阵的对角化 6
4.1 矩阵可对角化的条件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
4.2 相似上三角化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
5 特征值的应用 7
5.1 差分方程求解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
5.2 微分方程求解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
6 实对称矩阵 7
1
6.1 特征值与特征向量的性质 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
6.2 实对称矩阵的分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
7 厄米矩阵 8
7.1 定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
7.2 厄米矩阵的性质 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
8 正定矩阵 8
8.1 正定矩阵的定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
8.2 性质 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
8.2.1 等价定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
8.2.2 性质 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
8.3 二次型与配方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
8.3.1 二次型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
8.3.2 配方法化简二次型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
8.3.3 二次曲面及其分类 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
8.4 正定矩阵与内积 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
8.4.1 内积定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
8.4.2 度量矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
8.4.3 相合与标准正交基 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
8.5 内积与特征值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
8.5.1 实对称矩阵的特征值全是实数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
8.5.2 正交矩阵的特征值模全是 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
9 相似矩阵 14
9.1 定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
9.2 若当标准型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
9.3 SVD 奇异值分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1 特征值与特征向量的定义
若对于非零向量 𝑥
𝐴𝑥 = 𝜆𝑥
则称 𝜆 𝐴 的一个特征向量,𝑥 𝜆 对应的特征值. 对于零特征值, 其特征向量位于矩阵的零空间
2 特征值与特征向量的求解
特征值的定义化为
(𝐴 𝜆𝐼)𝑥 = 0
𝑑𝑒𝑡(𝐴 𝜆𝐼) = 0
该方程称为特征方程, 解出特征值后代入消元即可得到特征向量.
那么矩阵加上单位阵的整数倍后, 特征值也会加上整数倍, 特征向量不变
3 特征值的性质
3.1 相似不变量
特征值之和等于矩阵的迹
𝜆
𝑖
= 𝑡𝑟 (𝐴)
特征值之积等于矩阵的行列式
Π𝜆
𝑖
= 𝑑𝑒𝑡(𝐴)
3.2 特殊矩阵的特征值
实对称矩阵的特征值是实数, 实反对称矩阵的特征值为纯虚数, 取共轭对称即证
上三角阵和对角阵的特征值是对角线上的元素, 由特征方程即证
3.3 矩阵多项式
3.3.1 矩阵多项式的特征值
𝐴 的全体特征值为 𝜆
𝑖
, 𝐴
𝑘
的全体特征值为 𝜆
𝑘
𝑖
这是因为任何矩阵都能相似到一个上三角阵 (见下文), 且该上三角阵对角线上的所有元素为其特征值,
𝐴 = 𝑇
1
𝑈𝑇
那么
𝐴
𝑘
= 𝑇
1
𝑈
𝑘
𝑇
而上三角阵幂次的对角元是对角元的幂次, 即证
进而可以得到矩阵多项式的特征值, 𝑓 (𝑥) 为多项式函数,𝜆
𝑖
𝐴 的全体特征值, 那么 𝑓 (𝐴) 的全体特征
值为
𝑓 (𝜆
𝑖
)
这同样可以由相似上三角化证明: 𝐴 = 𝑇
1
𝑈𝑇 , 那么
𝑓 (𝐴) = 𝑇
1
𝑓 (𝑈)𝑇
依然由对角元即证
3.3.2 零化多项式与最小多项式
零化多项式是使 𝑓 (𝐴) = 0 的多项式. 根据哈密顿-凯莱定理, 零化多项式一定存在. 化多项式中首项
系数为 1 的次数最低的称为最小多项式. 可以不加证明地给出如下结论
1. 矩阵的最小多项式是唯一的
2. 最小多项式是任何零化多项式的因式
3. 最小多项式的根是全体特征值
4. 相似矩阵有相同的最小多项式
另外可以证明对于准对角阵
𝐴 =
𝐴
1
𝐴
2
.
.
.
𝐴
𝑠
其零化多项式为 𝑓
1
(𝑥), 𝑓
2
(𝑥), ·· · , 𝑓
𝑠
(𝑥) 的最小公倍数, 其中 𝑓
𝑖
(𝑥) 𝐴
𝑖
的最小多项式. 这是因为对于准对
角阵有
𝐴
𝑘
=
𝐴
𝑘
1
𝐴
𝑘
2
.
.
.
𝐴
𝑘
𝑠
那么
𝑓 (𝐴) =
𝑓 (𝐴
1
)
𝑓 (𝐴
2
)
.
.
.
𝑓 (𝐴
𝑠
)
𝑓 (𝐴) = 0 当且仅当全部 𝑓 (𝐴
𝑖
) = 0, 即证
3.3.3 若当矩阵的最小多项式与矩阵可对角化的条件
特别地对于若当矩阵 (相似矩阵的一般等价类),𝐴
𝑖
为若当块. 而对于 𝑘 级若当块
𝐽
𝑘
=
𝑎
1
.
.
.
.
.
.
𝑎
1 𝑎
其最小多项式为 (𝑥 𝑎)
𝑘
, 这是因为
𝐽 𝑎𝐼 = 𝐽
𝑘
=
0
1
.
.
.
.
.
.
0
1 0
𝑘 次幂为 0,𝑘 1 次幂不为零, 即证
因而欲矩阵可对角化, 等价于对应若当矩阵每个若当块都是一级的, 也就是最小多项式没有重根
3.4 矩阵幂次的特征值
若矩阵 𝐴 的全部特征值为 {𝜆
𝑖
}, 那么 𝐴
𝑘
的全部特征值为 {𝜆
𝑘
𝑖
}, 这是因为 𝐴 可以相似于一个对角阵 𝐷,
𝐴 = 𝑇
1
𝐷𝑇
那么
𝐴
𝑘
= 𝑇
1
𝐷
𝑘
𝑇
由于对角阵 𝑘 次幂仍是对角阵, 且对角元为原本的 𝑘 次方, 故即证
3.5 逆矩阵的特征值与特征向量
𝐴
1
的特征值为
1
𝜆
, 特征向量相同, 这是因为
|𝐴 𝜆𝐼 | = 0 |𝐴
1
||𝐴 𝜆𝐼 | = 0 |𝐼 𝜆𝐴
1
| = 0
故全体特征值为 {
1
𝜆
}, 又有
𝐴𝑥 = 𝜆𝑥 𝑥 = 𝜆𝐴
1
𝑥 𝐴
1
𝑥 =
1
𝜆
𝑥
得到特征向量的关系
4 矩阵的对角化
假设矩阵 𝐴 𝑛 个线性无关的特征向量, 那么将特征向量写为一个矩阵 𝑆 即可得到
𝐴𝑆 = 𝑆Λ
其中 Λ 为对角元为对应特征值的对角阵,
𝑆
1
𝐴𝑆 = Λ, 𝐴 = 𝑆Λ𝑆
1
4.1 矩阵可对角化的条件
1. 所有特征值互不相同的矩阵可对角化
2. 矩阵可对角化当且仅当每个特征值的代数重数与几何重数相等
4.2 相似上三角化
虽然不是每个矩阵都能相似对角化, 但是任何矩阵都能相似化为一个上三角阵,
𝐴 = 𝑇
1
𝑈𝑇
这是因为可以将一个特征向量 𝜉
1
扩充为一组基 𝜉
1
, ·· · , 𝜉
𝑛
, 记组成的可逆矩阵为 𝑃 则有
𝐴𝑃 = 𝑃
𝜆
𝐴
22
依次递推即证
5 特征值的应用
5.1 差分方程求解
5.2 微分方程求解
6 实对称矩阵
6.1 特征值与特征向量的性质
𝐴 为实对称矩阵,
𝐴𝑥 = 𝜆𝑥
取共轭转置得
𝑥
𝑇
𝐴 = 𝜆𝑥
𝑇
对比取共轭的原式得到
𝜆𝑥
𝑇
𝑥 = 𝜆𝑥
𝑇
𝑥
得到 𝜆 为实数
𝑧 = 𝑥
𝑇
1
𝐴𝑥
2
, 取转置得
𝑥
𝑇
1
𝐴𝑥
2
= 𝑥
𝑇
2
𝐴𝑥
1
𝑥
𝑇
1
𝜆
2
𝑥
2
= 𝑥
𝑇
2
𝜆
1
𝑥
1
𝑥
𝑇
1
𝑥
2
= 0
对称矩阵属于不同特征值的特征向量正交
由代数重数与几何重数可以证明
,
实对称矩阵可以对角化
,
即实对称矩阵有
𝑛
个线性无关的特征向量
实对称矩阵正特征值的数目等于正主元的数目, 负特征值的数目等于负主元的数目
6.2 实对称矩阵的分解
设有实对称矩阵 𝐴, 则可以将其分解为
𝐴 = 𝑄Λ𝑄
𝑇
其中 𝑄 的列向量为 𝐴 的特征向量 (模长化为 1),Λ 为对角元为 𝑄 对应向量特征值的对角阵. 这是因为 𝐴
可以写为
𝐴 = 𝑆Λ𝑆
1
𝑆 的列向量相互垂直, 若化其模长为 1, 𝑆
1
= 𝑆
𝑇
7 厄米矩阵
7.1 定义
对于复矩阵而言, 定义
𝐴
𝐻
= 𝐴
𝑇
那么对于复向量 𝑥, 𝑦, 其内积为
𝑥
𝐻
𝑦
如果 𝐴 满足
𝐴
𝐻
= 𝐴
则称 𝐴 厄米矩阵
7.2 厄米矩阵的性质
1. 厄米矩阵的特征值为实数
2. 厄米矩阵属于不同特征值的特征向量正交
厄米矩阵即对应实数域下的对称阵, 实数域下的正交阵则对应酉矩阵
8 正定矩阵
8.1 正定矩阵的定义
正定矩阵是所有特征值都为正的对阵矩阵.
8.2 性质
8.2.1 等价定义
1. 正定矩阵所有顺序主子式为正对 𝑋
𝑖
都有
𝑋
𝑖
0
𝐴
𝑖
𝑋
𝑖
0
> 0
得到 𝐴
𝑖
正定, 即证
2. 正定矩阵所有主元为正有
𝑥
𝑖
=
𝑑𝑒𝑡
(
𝐴
𝑖
)
𝐴
𝑖1
> 0
3. 对于任意 𝑥, 𝑥
𝑇
𝐴𝑥 > 0 存在正交阵使得
𝐴 = 𝑆
𝑇
Λ𝑆
那么
𝑥
𝑇
𝐴𝑥 = (𝑆𝑥)
𝑇
Λ(𝑆𝑥) > 0
8.2.2 性质
正定矩阵的逆仍是正定矩阵, 由特征值即可推出
𝐴, 𝐵 都是正定矩阵, 那么
𝑥
𝑇
(𝐴 + 𝐵)𝑥 = 𝑥
𝐴
𝑥 + 𝑥
𝑇
𝐵𝑥 > 0
得到 𝐴 + 𝐵 也是正定矩阵
对于任意矩阵 𝐴(不一定是方阵),
𝑥
𝑇
𝐴
𝑇
𝐴𝑥 = (𝐴𝑥)
𝑇
(𝐴𝑥) 0
得到 𝐴
𝑇
𝐴 为正定矩阵, 𝐴 不是列满秩时为半正定
任何正定矩阵 𝐴 都可以找到可逆矩阵 𝑃 使得
𝐴 = 𝑃
𝑇
𝑃
这是因为正定矩阵可以正交相似对角化
𝐴 = 𝑆
𝑇
Λ𝑆
𝑃 =
𝑠
1
𝜆
1
···
𝑠
𝑛
𝜆
𝑛
即可得到
𝐴 = 𝑃
𝑇
𝑃
另外对于正定矩阵 𝐴, 𝐵, 其乘积 𝐴𝐵 全体特征值为正. 这是因为假设
𝐴𝐵𝑥 = 𝜆𝑥
同时左乘 𝑥
𝑇
𝐵
𝑇
, 得到
𝑥
𝑇
𝐵
𝑇
𝐴𝐵𝑥 = 𝜆𝑥
𝑇
𝐵
𝑇
𝑥 = 𝜆𝑥
𝑇
𝐵𝑥
由于
𝑥
𝑇
𝐵𝑥 > 0
得到
𝜆 =
𝑥
𝑇
𝐵
𝑇
𝐴𝐵𝑥
𝑥
𝑇
𝐵𝑥
=
(𝐵𝑥)
𝑇
𝐴(𝐵𝑥)
𝑥
𝑇
𝐵𝑥
而此处由 𝐵 可逆, 得到 𝐵𝑥 0, 就有
𝜆 > 0
如果还有 𝐴𝐵 也是实对称矩阵, 即有 𝐴𝐵 = 𝐵 𝐴, 那么 𝐴𝐵 就是正定矩阵. 这是因为
𝐴 = 𝑃
𝑇
𝑃, 𝐵 = 𝑄
𝑇
𝑄
那么
𝐴𝐵 = 𝑃
𝑇
𝑃𝑄
𝑇
𝑄
𝐴𝐵 相似处理得到
𝑄 𝐴𝐵𝑄
1
= 𝑄𝑃
𝑇
𝑃𝑄
𝑇
𝑄𝑄
1
= 𝑄𝑃
𝑇
𝑃𝑄
𝑇
= (𝑃𝑄
𝑇
)
𝑇
(𝑃𝑄
𝑇
)
𝐴𝐵 相似于正定矩阵, 得到 𝐴𝐵 正定
8.3 二次型与配方法
8.3.1 二次型
对于 𝑥
𝑇
𝐴𝑥, 展开后变为
𝑥
𝑇
𝐴𝑥 =
𝑎
𝑖 𝑗
𝑥
𝑖
𝑥
𝑗
如果假定 𝑎
𝑖 𝑗
= 𝑎
𝑗𝑖
, 𝐴 为对称阵, 那么这样的 𝐴 与二次型是一一对应的关系, 称为二次型的矩阵
8.3.2 配方法化简二次型
对于二次型, 希望通过换元消去交叉项, 使其全部变为平方项.
𝑄 = 2𝑥
2
1
+ 𝑥
1
𝑥
2
+ 𝑥
2
3
= 2(𝑥
1
+
1
4
𝑥
2
)
2
1
8
𝑥
2
2
+ 𝑥
2
3
如果令
𝑦 =
1
1
4
1
1
𝑥
𝑥 = 𝑃𝑦
那么
𝑄 = 𝑥
𝑇
𝐴𝑥 = 𝑦
𝑇
𝐴
𝑦
其中
𝐴 = 𝑃𝐴
𝑃
𝑇
, 𝐴
= 𝑃
𝑇
𝐴𝑃
矩阵 𝑃 即对矩阵 𝐴 做列变换得到三角矩阵的消元矩阵, 可以由初等变换得到, 矩阵 𝐴
为对角阵. 称变
换后的二次型为标准型, 𝐴
的对角元都为 ±1, 称该二次型为规范型, 规范性中正负对角元的数目分别
称为正负惯性指数
8.3.3 二次曲面及其分类
椭圆
𝑥
2
𝑎
2
+
𝑦
2
𝑏
2
= 1
双曲线
𝑥
2
𝑎
2
𝑦
2
𝑏
2
= 1
抛物线
𝑦 = 𝑎𝑥
2
退化的二次曲线
𝑥
2
= 𝑦
2
𝑎
2
,
𝑥
2
𝑎
2
= 1,
𝑥
2
𝑎
2
= 1, 𝑥
2
= 0
椭圆面 (三个都是正的)
𝑥
2
𝑎
2
+
𝑦
2
𝑏
2
+
𝑧
2
𝑐
2
= 1
单叶双曲面 (一个负的)
𝑥
2
𝑎
2
+
𝑦
2
𝑏
2
𝑧
2
𝑐
2
= 1
双叶双曲面 (两个负的)
𝑥
2
𝑎
2
𝑦
2
𝑏
2
𝑧
2
𝑐
2
= 1
二次锥面 (没有常数)
𝑥
2
𝑎
2
+
𝑦
2
𝑏
2
=
𝑧
2
𝑐
2
椭圆抛物面 (都是正的)
𝑧 =
𝑥
2
𝑎
2
+
𝑦
2
𝑏
2
双曲抛物面 (马鞍面, 有负的)
𝑧 =
𝑥
2
𝑎
2
𝑦
2
𝑏
2
方程中不含第三个变量即可延伸成为柱面
退化的二次曲面:
1. 两个相交平面 𝑥
2
=
𝑦
2
𝑎
2
2. 两个平行平面
𝑥
2
𝑎
2
= 1
3. 两个重合平面 𝑥
2
= 0
8.4 正定矩阵与内积
8.4.1 内积定义
若定义任意两个向量都按某种法则对应一个实数, 且满足
1. (𝑎, 𝑏) = (𝑏, 𝑎)
2. (𝜆𝑎, 𝑏) = 𝜆(𝑎, 𝑏)
3. (𝑎 + 𝑏, 𝑐) = (𝑎, 𝑐) + (𝑏, 𝑐)
4. (𝑎, 𝑎) 0 等号成立当且仅当 𝑎 = 0
则称 (𝑎, 𝑏) 𝑎, 𝑏 的内积
8.4.2 度量矩阵
若取一组基
𝛼
1
, ..., 𝛼
𝑛
那么向量 𝑎, 𝑏
𝑎 = 𝑎
1
𝛼
1
+ ... + 𝑎
𝑛
𝛼
𝑛
𝑏 = 𝑏
1
𝛼
1
+ ... + 𝑏
𝑛
𝛼
𝑛
的内积可以写为
𝑥
𝑇
𝐺𝑦
其中
𝑥 =
𝑎
1
.
.
.
𝑎
𝑛
, 𝑦 =
𝑏
1
.
.
.
𝑏
𝑛
, 𝐺
𝑖 𝑗
= (𝛼
1
, 𝛼
𝑗
)
𝐺 为该内积在该基下的度量矩阵, 由内积性质可得 𝐺 为正定矩阵
8.4.3 相合与标准正交基
若有另外一组基
(𝛽
1
, ...𝛽
𝑛
) = (𝛼
1
, ... , 𝛼
𝑛
)𝑃
记同一向量在该基下的坐标为 𝑥
, 𝑦
, 即有
𝑥 = 𝑃𝑥
, 𝑦 = 𝑃𝑦
则在该基下的内积为
(𝑎, 𝑏) = 𝑥
𝑇
𝐺
𝑦
𝐺 = 𝑃
𝑇
𝐺𝑃
𝐺 𝐺
相合关系, 若在某组基下度量矩阵为单位阵, 称该组基为标准正交基
8.5 内积与特征值
定义两个列向量的内积为
(𝑥, 𝑦) = 𝑥
𝐻
𝑦
那么就有如下性质
1. (𝑥, 𝑥) 0, 当且仅当 𝑥 = 0 时等号成立
2. (𝑥, 𝑦) = (𝑦, 𝑥)
3. (𝑎𝑥 + 𝑏𝑦, 𝑧) = 𝑎(𝑥, 𝑧) + 𝑏(𝑦, 𝑧), (𝑥, 𝑎𝑥 + 𝑏𝑦) = 𝑎(𝑥, 𝑦) + 𝑏(𝑥, 𝑧)
4. (𝐴𝑥, 𝑦) = (𝑥, 𝐴
𝐻
𝑦)
可以通过构造内积证明特征值的有关命题
8.5.1 实对称矩阵的特征值全是实数
对于实对称矩阵有 𝐴
𝐻
= 𝐴
𝑇
= 𝐴 , 上述性质即化为
(𝐴𝑥, 𝑦) = (𝑥, 𝐴𝑦)
𝑥 = 𝑦 𝐴 的特征向量, 得到
(𝐴𝑥, 𝑥) = 𝜆(𝑥, 𝑥)
(𝐴𝑥, 𝑥) = (𝑥, 𝐴𝑥) = 𝜆(𝑥, 𝑥)
𝜆 = 𝜆
得到 𝜆 为实数
8.5.2 正交矩阵的特征值模全是 1
对于正交矩阵有 𝐴
𝑇
𝐴 = 𝐼, 那么取 𝑥 = 𝑦 为其特征向量
(𝐴
𝑇
𝐴𝑥, 𝑥) = (𝑥, 𝑥)
(𝐴
𝑇
𝐴𝑥, 𝑥) = (𝐴𝑥, 𝐴𝑥) =
|
𝜆
|
2
(𝑥, 𝑥)
得到
|
𝜆
|
= 1
9 相似矩阵
9.1 定义
𝐴, 𝐵 相似, 即存在 𝑀 使得
𝐴 = 𝑀
1
𝐵𝑀
那么若有 𝐴𝑥 = 𝜆𝑥,
𝑀
1
𝐴𝑀 𝑀
1
𝑥 = 𝜆𝑀
1
𝑥
𝜆, 𝑥 𝑀
1
𝐴𝑀 的特征值与特征向量, 相似矩阵具有相同的特征值
9.2 若当标准型
可以定义若当块
𝐽
𝑚
(𝜆) =
𝜆 1
𝜆 1
.
.
.
.
.
.
𝜆 1
𝜆
称为特征值为 𝜆 𝑚 阶若当块, 矩阵的一个特征值对应一个若当块, 若当块构成的准对角阵为若当矩阵,
若当矩阵互不相似, 每个矩阵都与一个若当矩阵相似, 通过
𝑟𝑎𝑛𝑘 (𝐴 𝜆𝐼) = 𝑟𝑎𝑛𝑘 (𝐽 𝜆𝐼)
可以求解若当矩阵
9.3 SVD 奇异值分解
𝑣
1
, ... , 𝑣
𝑟
𝐴 列空间的一组标准正交基,𝑢
1
, ... , 𝑢
𝑟
𝐴 行空间的一组标准正交基, 且满足
𝐴𝑣
𝑖
= 𝜎
𝑖
𝑢
𝑖
也就是
𝐴𝑉 = 𝑈Σ, 𝐴 = 𝑈Σ𝑉
𝑇
那么
𝐴
𝑇
= 𝑉Σ
𝑇
𝑈
𝑇
𝐴
𝑇
𝐴 = 𝑉
𝜎
2
1
𝜎
2
2
.
.
.
𝑉
𝑇
𝑉 𝐴
𝑇
𝐴 的特征向量矩阵,𝜎
2
𝑖
为矩阵的特征值, 同样计算 𝐴𝐴
𝑇
𝐴𝐴
𝑇
= 𝑈
𝜎
2
1
𝜎
2
2
.
.
.
𝑈
𝑇
由此可以计算出 𝑈 𝑉. 可以将 𝑉 𝑈 扩展为全空间的标准正交基, 那么 𝑣
𝑟+1
, ... , 𝑣
𝑛
为零空间的标准正
交基,𝑢
𝑟+1
, 𝑣
𝑚
为左零空间的标准正交基, 然后在 Σ 中补上 0