特征值
若对于 阶方阵 ,存在 和 满足 ,则称 为 的特征值, 为 的特征向量。特征值和特征向量包含了一个矩阵所表示的线性变换是如何发生的信息。例如,一个等于 的特征值和一个等于 的特征向量表示矩阵所代表的线性变换会把向量沿 的方向上拉伸到原来的两倍。不难发现,若 是 的一个特征向量,那么 的非零倍数也是 的一个特征向量。因此,一个矩阵只能有有限个特征值,但可以有无限个特征向量。下面我们说到特征向量的数量时,均指矩阵的线性无关的特征向量的数量。
如果给 加上单位矩阵的倍数,那么有 ,因此加上 会使所有特征值变大 ,但不改变特征向量。
逆矩阵的特征值是原矩阵的倒数,从几何意义上很容易理解。
特征值的求法
将 进行移项,可以得到:
由于 ,因此 是奇异的。所以可以得到 ,通过解这个关于 的 次多项式就可以得到所有 的特征值了。再将 代回上面的式子中,消元即可得到 的解。
在求解特征值的过程中,我们得到了一个关于 的多项式,这个多项式称为 的特征多项式,对应的方程称为特征方程。矩阵的特征方程是一个多项式,因此可以用韦达定理来得到它的和与积。下面不加证明地给出两个性质:
- 特征值之积等于行列式的值
- 特征值之和等于矩阵的迹
其中,矩阵的迹被定义为矩阵对角线上元素之和,即 。
根据代数基本定理,一个 阶矩阵在复数域上应该恰好有 个特征值。这些特征值不一定都是实的,因此实矩阵也会有复的特征值。
在上一节曾提到,实的特征值代表线性变化将向量沿特征向量的方向进行了拉伸,那么虚的特征值代表什么呢?和 类似,虚的特征值代表将向量沿特征值方向进行旋转。更统一地,对于一个复特征值,它的模长代表了沿特征向量方向拉伸或压缩的倍数,幅角则对应了旋转的角度。
根据虚根成对定理,实矩阵的复特征值总是成对出现的,即若 是 的特征值,则其共轭复数 也是 的特征值。
特征值分解
若 阶方阵 有 个不同的特征值和特征向量 ,则可以把 个特征向量按照特征值从大到小放在一个矩阵中,将 写成下面的形式:
其中有:
由于 个特征向量线性无关,因此 可逆,故有:
特征值分解的几何意义
矩阵在欧几里得空间下可以看作是对基向量的变换,即矩阵 会将 变换成以 为基底的向量。特征值分解则把一个线性变化分成三步:
- 将向量变换到以特征向量为基底的向量
- 将变换后的向量在各个特征向量的方向上按照特征值进行拉伸/旋转
- 将基底变换回去
对角化
对角化是指将矩阵分解为下面形式的过程:
其中 是一个对角矩阵(diagonal matrix),即只有对角线上有非零值的矩阵。可以看出,特征值分解是对矩阵进行对角化的一种方法。
矩阵的幂
将矩阵特征值分解后,计算矩阵的幂就非常方便了:
其中对角矩阵 的幂是非常好计算的:
微分方程与矩阵指数函数
对于一个线性系统,若满足:
求解这个微分方程可以得到:
根据泰勒展开可以得到:
将这个定义延展到矩阵中,就得到了 的定义:
将 进行特征值分解:,有:
因此:
Comments NOTHING