参考书目:《线性代数:未竟之美》
本讲义用于竺可桢学院线性代数线上辅学课程,奈何本人水平有限,有些地方在课程中可能表述不清晰,还请多多包涵。
引入
线性代数的一大目标是:我们希望找到出发空间和到达空间合适的基使得线性映射在这两组基下的表示更简单(尽可能多的零,尽量向对角矩阵靠近).我们将眼光放在线性变换,即出发空间和到达空间相同的线性映射,并且我们关注 出发空间与到达空间取同一组基的时候,如何取基,可以把同一个线性映射的矩阵尽可能表示得简单 ;
从矩阵在不同基下的的表示出发
假设我们有一个在 维线性空间 上线性变换 ,其在基 ( 的每个列向量是都是一个基)下的矩阵为 ,即
假设我们很幸运,找到了另外一组基 ,并且已知这个线性映射在这组基下的矩阵很漂亮,是对角的,即
如果又恰好知道两组基之间的过渡矩阵
那么我们可以推导出
为什么一定可逆?(基之间的互相表示)
继续由上面的式子(1),我们展开,为矩阵的第个列向量
展开对应相等
这一过程给我们的启发是,如果我们知道可以达到的对角化的矩阵是怎么样的,那么可以逆推出变换矩阵,从而找出这组基是怎么样的;上面的,与就是我们今天要讨论的特征值与特征向量,如何寻找它们就是我们今天的重点;
特征值与特征向量
定义
设是线性空间上的一个线性变换,如果存在数和非零向量使得,则称数为的一个特征值,并称非零向量为属于其特征值的特征向量
同构地,对于矩阵而言,有:
设矩阵,如果存在数和非零向量使得,则称数为的一个特征值,称非零向量为属于其特征值的特征向量.
设 是 上的线性变换, 为恒等映射,则下述条件等价:
- 是 的特征值;
- 不是单射 列不满秩;
- 不是满射 行不满秩;
- 不可逆 不可逆({==行列式为0==})
对于第二第三条的矩阵版本有疑问的同学可以回顾 LALU 相抵标准型一节给出的定理:
线性映射是单射当且仅当其矩阵表示为列满秩矩阵,线性映射是满射当且仅当其矩阵表示为行满秩矩阵.
特征多项式
由上述性质,是的特征值等价于,故我们可以通过求解特征值,其中为在某组基下的矩阵,为单位矩阵. 对于特征向量的求解,求出的非零解就是特征向量在基下的坐标,如果是矩阵的特征向量,那么就是解.
上述求解特征向量的方法需要我们求解的根,我们将称为{==特征多项式==};
设,且存在非零向量使得,求.
Answer
由题意知2是矩阵的特征值,因此我们有
[|2E-A|=\begin{vmatrix} 1 & 1 & 0 \ -2 & 2 & -1 \ -1 & -a & 2 \end{vmatrix}=9-a=0 ]
因此.
特征多项式可以写为以下的形式
对于级矩阵,记
[f(\lambda)=|\lambda E-A|=a_0\lambda^n+a_1\lambda^{n-1}+\cdots+a_{n-1}\lambda+a_n]
则, , ,且等于所有级主子式之和乘以.
由韦达定理
一元n次韦达定理
设方程 有根 . 那么:
- 各根之和:
- 各根之积:
-
;
-
.
相似与特征多项式
- 相似矩阵有相同的特征多项式?(从而有相同的迹,行列式,特征值;),即有吗?反过来呢?
Answer
设,则. 因此有.
我们知道特征多项式相同则特征值相同,迹等于所有特征值之和,行列式等于所有特征值之积,因此相似矩阵有相同的迹,行列式,特征值.
- 如果是,那么同一特征值的特征向量之间有什么关系?
Answer
设,则分别属于同一特征值的特征向量和满足.
由以及,我们有,即,因此是属于的特征向量,即是的特征向量,即.
回忆{==基的选择导致同一向量在不同基下的坐标表示==},实际上这个问题就是该定理的推论;
同一向量在不同基下的坐标表示
设线性空间的两组基为和,且基到的变换矩阵(过渡矩阵)为,如果在和下的坐标分别为和,则.
[\xi=(\alpha_1,\ldots,\alpha_n)X=(\beta_1,\ldots,\beta_n)Y.]
将过渡矩阵的条件,即代入上式可得:
[\xi=(\alpha_1,\ldots,\alpha_n)X=(\alpha_1,\ldots,\alpha_n)AY.]
又由于在线性无关向量组下的坐标唯一,故我们有,即.
回答以下两个问题:
-
设 均为 阶矩阵,证明: 是 的特征值,则 也是 的特征值;
-
设 ,证明:
并由此推出 和 非零特征值相同,且 时有 .
Proof
- 设 是 属于 的特征向量,则 ,因此 ,即 ,因此 是 属于 的特征向量,故 也是 的特征值。
实际上这里还有一点需要说明,就是 ,否则它将不能作为特征向量。事实上证明是简单的,假设 ,则 ,由于 ,因此必然有 ,但这与 是 属于 的特征向量矛盾,因此 。
- 根据分块矩阵初等变换的性质,我们可以通过不断尝试选取到 ,其逆矩阵为 ,我们发现恰有
因此 与 相似,因此它们的特征多项式相同,即
根据行列式的计算性质 ,我们有
即 ,因此 和 非零特征值相同,且 时有 .
对于可逆矩阵,我们知道了与有相同的特征值,如果不可逆,两个矩阵又有什么关系呢?
我们有以下结论
设分别为数域上阶、阶方阵,有个两两不等的公共特征值,则矩阵方程有秩为的矩阵解. 反之,若数域为复数域,矩阵方程有秩为的矩阵解,则至少有个公共的特征值(计重数).
证明见 《LALU》.P465
设阶矩阵与阶矩阵无公共复特征值,为矩阵,则矩阵方程存在唯一解.
Answer
设是所有矩阵构成的线性空间,定义上的线性变换. 由于和无公共复特征值,所以只有零解,即为上单射,可知是满射且是同构映射. 于是,对任意的,都存在唯一的使得,即矩阵方程存在唯一解.
特征值的性质与结论
-
设是线性空间上的线性变换的特征值,是属于的特征向量,则
-
是的特征值,是的特征值,且仍是相应特征向量;
-
若是上的多项式,则;
-
-
设是阶矩阵的特征值,可逆,则是的特征值,是的伴随矩阵的特征值,且特征向量不变.
-
设为阶矩阵,则与有相同的特征值(含重数).
-
可逆/不可逆/可逆/不可逆;
-
;
-
(对合)/(幂等)/(幂零);
-
(为常数,且已知的个特征值为);
-
为对角块矩阵,即.
Proof
1 由于,则,即是的特征值,仍是相应特征向量。
而,即是的特征值,仍是相应特征向量。
2 利用前述的相关性质,我们有
3 设是的特征值,即,则,即,因此是的特征值,仍是相应特征向量。
又由于可逆时,根据前面关于和特征值的讨论可知,是的伴随矩阵的特征值,仍是相应特征向量。
4 我们用特征多项式证明。实际情况是,的特征多项式为(回忆转置不改变行列式),实际上与的特征多项式完全一致,因此与有相同的特征值(含重数)。
5 可逆时有 ,因此的特征值都不为0。 同理,不可逆同理表明存在特征值等于0,可逆表明不是的特征值,不可逆表明是的特征值。
6 ,因此都是的特征值。
7 我们首先考虑对合矩阵,接下来的同理可以得到类似结论。由于,设,则,因此,即,因此或是的特征值。
注:本题解决过程中告诉我们一个解题技巧,如果看到的多项式这种形式的表达式,事实上的特征值只能是的根,如上题中,则,因此的特征值只能是。
同理,我们可以知道幂等矩阵的特征值只能是0和1,幂零矩阵的特征值只能是0(这是一个重要的幂零矩阵等价条件,未来我们会再次遇到)。
8 设 ,则
因此都是的特征值。
9 证明:
[ |\lambda E - A| = \begin{vmatrix} \lambda E_1 - A_1 & 0 & \cdots & 0 \ 0 & \lambda E_2 - A_2 & \cdots & 0 \ \vdots & \vdots & \ddots & \vdots \ 0 & 0 & \cdots & \lambda E_m - A_m \end{vmatrix} = \prod_{i=1}^{m} |\lambda E_i - A_i| = 0 ]
因此,的特征值都是的特征值。
-
设,且,求;
-
设为三阶矩阵,其特征值为,求,的特征值,的特征值以及;
-
设为三阶矩阵,,,求;
-
设为三阶矩阵,其特征值为,求;
Answer
-
事实上,由解得的特征值为,而根据的特征值性质可知,的特征值为,即,因此.
-
由于的特征值为,因此,而的特征值为,因此的特征值为,故的特征值为的特征值加3(即为,又根据和特征值的性质可知,的特征值为,即为,而的特征值根据特征值性质的讨论可知为,即为,因此.
-
设,则,因此或,根据对合矩阵的讨论可知,的特征值恰为-1和2. 又,且为3阶矩阵,因此的3个特征值必为-1,-1,2.
又的特征值为,因此的特征值为,的特征值为的特征值加3,即,故.
- 由题意知,故的特征值为即为,而就是的迹(即矩阵对角线元素之和),因此.
特征向量与特征子空间的性质
-
的不同特征值对应的特征向量线性无关;
-
的不同特征值对应的特征子空间的和为直和;
-
最多有个不同的特征值.
有以下推论
Proof
- 设 是 的互异特征值, 是相应的特征向量。反证法,我们假设 线性相关,由线性相关性引理可知,存在 是使得
[ \xi_k \in \mathbf{spa}(\xi_1, \ldots, \xi_{k-1}) ]
成立的最小整数,则存在 使得
将 作用到上式两边,我们有
将上式两边乘以 ,然后减去上式,我们有
由于我们选取的 是满足 的最小整数,因此 线性无关,故 ,因此 ,这与 是特征向量矛盾,因此 线性无关。
-
回忆直和的证明方法,我们选取合适等价命题进行证明。假设
其中 ,由于 的不同特征值对应的特征向量线性无关,因此 不可能是特征向量,否则可知它们线性相关,故必有 ,这表明 的不同特征值对应的特征子空间的和为直和。
-
设 是 的互异特征值, 是相应的特征向量。前面已经证明了 线性无关,因此 ,得证。
-
若是线性映射互异的特征值,则,则一个特征向量不能属于多个特征值.
-
的不同特征值对应的特征子空间的基向量合在一起构成的向量组线性无关,且是的基.
- 代数重数:某一特征值的代数重数指重根的个数;
- 几何重数:某一特征值的几何重数指特征向量生成线性空间的维数
{==若是的特征值,则的代数重数大于等于几何重数==}
我们思考,如果所有的特征子空间已经是全空间,那么是否所有向量都是特征向量呢?下面的例子告诉我们不是这样的,事实上,只有当特征值唯一的时候,这个结论才正确:
设 是 维线性空间,,证明:
- 若 是 的属于不同特征值的特征向量,则 时, 不是 的特征向量;
- 中的每一非零向量都是 的特征向量 ,其中 是一个常数, 是恒等变换。
Proof
-
设 ,其中 ,并假设 是 的特征向量,即存在 使得
展开括号,我们有
即
即
由于 线性无关,因此
当 时,我们有 ,这与 矛盾,因此 不是 的特征向量。
-
右推左显然,我们只考虑左推右的证明。由上一小问结论可知,若 中的每一非零向量都是 的特征向量, 不可能有不同的特征值(因为有不同的特征值就有不同特征值对应的特征向量,但它们的线性组合一定仍在 中,这与从第一问中得到的结论,即它不是 的特征向量矛盾)。设 是 的唯一的特征值,则对于任意 ,我们有 ,即 在任意元素上的像都已经唯一确定,则显然在 的一组基上的像也唯一确定,由线性映射唯一确定的定理可知这样的线性映射是唯一的, 符合要求,因此它就是我们要找的线性映射。
设 是数域 上一个 阶方阵, 是 阶单位矩阵, 是 的属于特征值 的一个特征向量,向量组 按如下方式产生:
[(A - \lambda E) \alpha_{i+1} = \alpha_i, \quad i = 1, 2, \ldots, s-1.]
证明向量组 线性无关。
Proof
由于 是 属于特征值 的特征向量,故有 。
设
两边同时左乘 可得
以此类推,在等式两边不断左乘 可得:对于 都有
令 得到 。再依次代回不难得到 ,从而向量组 线性无关。
可对角化的条件
设,如果存在的一组基使得在这组基下的矩阵是对角矩阵,则称可对角化.
设是数域上的维线性空间,是上的线性变换,是的所有互异特征值,则以下条件等价:
- 可对角化;
- 有 个线性无关的特征向量,它们构成 的一组基;
- 有在 下不变的一维子空间 ,使得 ;
- ;
- ;
- 每个特征值的代数重数等于几何重数。
有推论
若 阶矩阵 有 个不同的特征值,则 可对角化. 反之, 可对角化不一定有 个特征值.
总结而言,只要特征子空间可以张成整个空间,那么这个线性变换就是可对角化的。
对角化的基本步骤
- 先任意写出 在一组基 下的矩阵 ,当然为了计算方便一般选取自然基;
- 利用特征多项式 求出 的所有不同特征值;
- 解线性方程组 (实际上就是方程组 ,其中 是上一步求 出的特征值)求出 在不同特征值下的线性无关特征向量;
- 第三步中求得的所有向量就是 的特征向量在基 下的坐标,根据前面的讨论, 的特征向量也就是使得 的矩阵表示为对角矩阵的那组基.
- 当然,如果题目中直接给出求 使得 为对角矩阵,那么我们只需进行 2、3 两步,并将 3 中得到的向量按列排列成矩阵 P 即可 6.如果要求是正交矩阵,那么3中求出来的所有向量需要在 各自的特征子空间中正交化 。
求矩阵
[A=\begin{pmatrix} 0 & -1 & 1 \ -1 & 0 & 1 \ 1 & 1 & 0 \end{pmatrix} ]
的所有特征值,对应的特征子空间,以及与 相似的一个对角矩阵.
Answer
对于求解矩阵的对角化问题,首先求出其特征多项式(具体步骤不展开,实际上就是三阶行列式的计算,可以使用按行(列)展开、公式法或者初等变换化为三角矩阵等方法),令,解得特征值为 .
接下来求解特征向量和特征子空间,即求解和解,得到特征值1对应的特征子空间为,特征值-2对应的特征子空间为.
与相似的对角矩阵实际上就是特征值排列在对角线上的结果,即 .
设 是次数小于等于 2 的实多项式线性空间 上的变换,对任意 ,定义
[T(f(x))=\frac{\mathrm{d}((x-2)f(x))}{\mathrm{d}x}]
证明 是 上的线性变换,且可对角化.
Answer
首先证明这是线性变换. 首先验证线性性,对于任意,,我们有
然后说明这是上的线性变换,即该映射的到达空间是,即, 因为是次数小于等于2的实多项式,设,则
因此是上的线性变换.
下面我们来判断是否可对角化. 线性变换的可对角化问题第一步要转化为任意一组基下的矩阵,然后判断矩阵是否可对角化,因此我们先任意选取一组基,为方便我们选取自然基,然后求出在这组基下的矩阵,然后求出其特征多项式,令,解得特征值为 . 即该3阶矩阵有3个不同的特征值,因此可知可对角化,即可对角化.
经典问题
已知,求.
Answer
首先求出的特征多项式,令,解得特征值为 .
接下来求解特征向量和特征子空间,实际上就是求解,得到特征向量为
[\eta_1=\begin{pmatrix} 1 \ 1 \ -1 \end{pmatrix},\enspace \eta_2=\begin{pmatrix} 1 \ 1 \ 1 \end{pmatrix},\enspace \eta_3=\begin{pmatrix} 1 \ -1 \ -1 \end{pmatrix}.]
所以记,则,因此
进一步计算得到
[A^n=\frac{1}{2}\begin{pmatrix} 1+(-1)^n & (-1)^{n+1} & 1 \ 1+(-1)^{n+1} & (-1)^n & 1 \ 1+(-1)^{n+1} & (-1)^n & 1 \end{pmatrix}.]
设和是中两个列向量,.
-
求的特征值;
-
证明:不可对角化.
Answer
- 我们知道,,并且因此,故的秩为1. 而,因此一定不可逆,故0一定是的特征值,且对应的特征子空间维数为的解空间维数,即为.
由此我们知道最多有两个特征值,因为0的代数重数(即作为次特征多项式的零点次数)必然大于等于其几何重数,当期代数重数为时可能还有一个一重特征值. 我们利用特征值之和等于的迹来找出可能的第二个特征值. 我们设,则, 因此的迹为,其中为的特征值. 若,则,. 若,则的所有特征值均为0.
- 由上一小问可知,若即的全部特征值为0,因此只有一个维的特征子空间,故特征子空间直和不等于,故不可对角化.
反之,若不可对角化,我们用反证法. 假设,则有两个特征值,一个为0,一个为,因此有两个特征子空间,一个是0对应的维特征子空间,一个是对应的一维特征子空间,因此可分解为两个特征子空间的直和,与不可对角化矛盾,因此.
设为阶非零矩阵,且. 证明:不可对角化;
Answer
设是的特征值,由题意,即,因此的所有特征值都为0. 但(因为不是零矩阵),因此0对应的特征子空间维数为,因此不可对角化.
-
设为阶矩阵,且. 证明:可对角化,并求出与之相似的对角矩阵(注:本题结论可推广到任意的);
-
设为二阶矩阵,非零向量不是的特征向量,且. 证明:和线性无关且可对角化并求与相似的对角矩阵.
Answer
由题意,因此的特征值就是方程的解,即.
接下来我们需要说明0和2对应的特征子空间维数之和为,即,其中和分别为0和2对应的特征子空间. 事实上,由可知,由知,又根据秩不等式,因此. 综上可知,.
实际上,就是的解空间,就是的解空间,因此,因此由可知,即0和2对应的特征子空间维数之和为,因此可对角化.
由于可对角化矩阵代数重数等于几何重数,因此特征值0对应的代数重数为,特征值2对应的代数重数为,因此我们可以得到与相似的对角矩阵为,其中0的个数为,2的个数为.
反证法,假设和线性相关,则存在不全为零的常数使得. 显然,因为假设,则,由于,故,这与不全为0矛盾. 因此我们有,即是的特征向量,这与题设矛盾,因此和线性无关.
由题意,,即,又,因此不可逆,从而,故或.
若,则可逆,因此可知,即,故为的特征向量,这与条件矛盾,因此. 同理,,因此有两个特征值1和2,又是2阶矩阵,因此由\autoref{cor:可对角化必要条件} 可知一定可对角化,且对角矩阵为.
证明阶上三角矩阵
[J_0=\begin{pmatrix} \lambda_0 & 1 & & \ & \lambda_0 & \ddots & \ & & \ddots & 1 \ & & & \lambda_0 \end{pmatrix}]
不与对角阵相似.
Answer
首先求出特征多项式为,因此只有一个特征值,且代数重数为.
接下来求几何重数,即的解空间维数,即的解空间维数,事实上由于,因此解空间维数为,即几何重数为,因此不可对角化
设 , , 证明:
- 若 是矩阵 属于特征值 的特征向量,则 .
- 和 至少有一个共同的特征向量.
- 有 个不同的特征值则
- 当且仅当 的特征向量也是 的特征向量.
- 存在次数小于等于 的多项式 使得 .
- 若 均可对角化,则对角化的过渡矩阵可以相同(同时对角化).
- 可以同时上三角化,即存在可逆矩阵 使得 和 都是上三角矩阵.
设 阶方阵 和 都可对角化,并且它们有相同的特征子空间(但不一定有相同的特征值),证明 .
习题
-
设为n阶复方阵,为可逆矩阵。证明
-
已知为3阶矩阵,特征值为1,2,3;求
-
证明:若,则可对角化(Hint:矩阵方程可对角化条件),并判断以下说法说法哪一个正确
- 的特征值兼有一定兼有和
- 可对角化,但其特征值不一定同时有和,可能为和,和,或者和
-
证明秩为1的向量可以写为,(回忆相抵标准型~)
-
设 为 维实向量且 ,求矩阵的特征值(Hint: 特征多项式展开)
-
都是阶矩阵,证明与有相同的特征值.(Hint:证明相似)
-
判断并证明:阶方阵满足,则对于所有的有理数,有可逆
-
记
证明:
- 是 的一个子空间,并求该子空间的维数;
- 对任意可逆矩阵 , 是 和 的特征向量;
- 对任意可逆矩阵 ,。
