高等代数

高等代数理论基础48:特征值与特征向量

2019-03-28  本文已影响16人  溺于恐

特征值与特征向量

特征值与特征向量

定义:设\mathscr{A}​是数域P上线性空间V的一个线性变换,若对于\lambda_0\in P​,存在一个非零向量\xi​,使\mathscr{A}\xi=\lambda_0\xi​

则称\lambda_0\mathscr{A}的一个特征值,\xi称为\mathscr{A}的属于特征值\lambda_0的一个特征向量

注:

1.特征向量的方向经过线性变换后保持在同一直线上

2.特征向量不是被特征值唯一确定的,若\xi是线性变换\mathscr{A}的属于特征值\lambda_0的特征向量,则\xi的任一非零倍数k\xi也是\mathscr{A}的属于\lambda_0的特征向量

\mathscr{A}\xi=\lambda_0\xi\Rightarrow \mathscr{A}(k\xi)=\lambda_0(k\xi)

3.特征值被特征向量唯一确定,一个特征向量只能属于一个特征值

求法:

设V是数域P上n维线性空间,\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n​是一组基,线性变换\mathscr{A}​在这组基下的矩阵是A,设\lambda_0​是特征值,它的一个特征向量\xi​\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n​下的坐标为x_{01},x_{02},\cdots,x_{0n}​,则\mathscr{A}\xi​的坐标为A\begin{pmatrix}x_{01}\\x_{02}\\\vdots\\x_{0n}\end{pmatrix}​,\lambda_0\xi​的坐标为\lambda_0\begin{pmatrix}x_{01}\\x_{02}\\\vdots\\x_{0n}\end{pmatrix}​

\mathscr{A}\xi=\lambda_0\xi相当于坐标之间的等式A\begin{pmatrix}x_{01}\\x_{02}\\\vdots\\x_{0n}\end{pmatrix}=\lambda_0\begin{pmatrix}x_{01}\\x_{02}\\\vdots\\x_{0n}\end{pmatrix}

(\lambda_0E-A)\begin{pmatrix}x_{01}\\x_{02}\\\vdots\\x_{0n}\end{pmatrix}=0

即特征向量\xi的坐标(x_{01},x_{02},\cdots,x_{0n})满足齐次方程组

\begin{cases}a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=\lambda_0x_1\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=\lambda_0x_2\\ \cdots\\ a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n=\lambda_0x_n\end{cases}

\begin{cases}(\lambda_0-a_{11})x_1-a_{12}x_2-\cdots-a_{1n}x_n=0\\ -a_{21}x_1+(\lambda_0-a_{22})x_2-\cdots-a_{2n}x_n=0\\ \cdots\\ -a_{n1}x_1-a_{n2}x_2-\cdots+(\lambda_0-a_{nn})x_n=0\end{cases}

\xi\neq 0​,故它的坐标x_{01},x_{02},\cdots,x_{0n}​不全为零,即齐次方程组有非零解

|\lambda_0E-A|=\begin{vmatrix}\lambda_0-a_{11}&-a_{12}&\cdots&-a_{1n}\\ -a_{21}&\lambda_0-a_{22}&\cdots&-a_{2n}\\ \vdots&\vdots& &\vdots\\ -a_{n1}&-a_{n2}&\cdots&\lambda_0-a_{nn}\end{vmatrix}=0​

特征多项式

定义:设A是数域P上一n级矩阵,\lambda是一个文字,矩阵\lambda E-A的行列式

|\lambda E-A|=\begin{vmatrix}\lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\cdots&-a_{2n}\\ \vdots&\vdots& &\vdots\\ -a_{n1}&-a_{n2}&\cdots&\lambda-a_{nn}\end{vmatrix}

称为A的特征多项式,是数域P上的一个n次多项式

注:若\lambda_0是线性变换\mathscr{A}的特征值,则\lambda_0是矩阵A的特征多项式的一个根,反之,若\lambda_0是矩阵A的特征多项式在数域P中的一个根,即|\lambda_0E-A|=0,则对应齐次方程组有非零解,若(x_{01},x_{02},\cdots,x_{0n})是方程组的一个非零解,则非零向量\xi=x_{01}\varepsilon_1+x_{02}\varepsilon_2+\cdots+x_{0n}\varepsilon_n满足\mathscr{A}\xi=\lambda_0\xi

\lambda_0是线性变换\mathscr{A}的一个特征值,\xi是数域特征值\lambda_0的一个特征向量

确定线性变换\mathscr{A}的特征值与特征向量:

1.在线性空间V中取一组基\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n​,写出\mathscr{A}​在这组基下的矩阵A

2.求出A的特征多项式|\lambda E-A|在数域P中全部的根,即\mathscr{A}的全部特征值

3.将所求得的特征值逐个代入方程组,对每个特征值,解方程组,求出一组基础解系,即属于这个特征值的几个线性无关的特征向量在基\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n下的坐标,求出属于每个特征值的全部线性无关的特征向量

例:

1.n维线性空间中,数乘变换\mathscr{K}在任一组基下的矩阵都是kE,它的特征多项式为|\lambda E-kE|=(\lambda-k)^n

故数乘变换\mathscr{K}的特征值只有k

由定义,每个非零向量都是属于数乘变换\mathscr{K}的特征向量

2.设线性变换\mathscr{A}在基\varepsilon_1,\varepsilon_2,\varepsilon_3下的矩阵是A=\begin{pmatrix}1&2&2\\2&1&2\\2&2&1\end{pmatrix}

\mathscr{A}的特征值与特征向量

特征多项式为|\lambda E-A|=\begin{vmatrix}\lambda-1&-2&-2\\-2&\lambda-1&-2\\-2&-2&\lambda-1\end{vmatrix}=(\lambda+1)^2(\lambda-5)

故特征值为-1(二重)和5

把特征值-1代入齐次方程组\begin{cases}(\lambda-1)x_1-2x_2-2x_3=0\\ -2x_1+(\lambda-1)x_2-2x_3=0\\ -2x_1-2x_2+(\lambda-1)x_3=0\end{cases}

可得\begin{cases}-2x_1-2x_2-2x_3=0\\ -2x_1-2x_2-2x_3=0\\ -2x_1-2x_2-2x_3=0\end{cases}

基础解系为\begin{pmatrix}1\\0\\-1\end{pmatrix},\begin{pmatrix}0\\1\\-1\end{pmatrix}

故属于-1的两个线性无关的特征向量为\xi_1=\varepsilon_1-\varepsilon_3,\xi_2=\varepsilon_2-\varepsilon_3

属于-1的全部特征向量为k_1\xi_1+k_2\xi_2,k_1,k_2取遍数域P中不全为零的全部数对

再将特征值5代入得\begin{cases}4x_1-2x_2-2x_3=0\\ -2x_1+4x_2-2x_3=0\\ -2x_1-2x_2+4x_3=0\end{cases}

基础解系为\begin{pmatrix}1\\1\\1\end{pmatrix}

故属于5的一个线性无关的特征向量为\xi_3=\varepsilon_1+\varepsilon_2+\varepsilon_3

属于5的全部特征向量为k\xi_3,k是P中任意不为零的数

3.在空间P[x]_n中,线性变换\mathscr{D}f(x)=f’(x)在基1,x,{x^2\over 2!},\cdots,{x^{n-1}\over (n-1)!}下的矩阵为

D=\begin{pmatrix}0&1&0&\cdots&0\\ 0&0&1&\cdots&0\\ \vdots&\vdots&\vdots& &\vdots\\ 0&0&0&\cdots&0\end{pmatrix}

D的特征多项式为

|\lambda E-D|=\begin{vmatrix}\lambda&-1&0&\cdots&0\\ 0&\lambda&-1&\cdots&0\\ \vdots&\vdots&\vdots& &\vdots\\ 0&0&0&\cdots&-1\\ 0&0&0&\cdots&0\end{vmatrix}=\lambda^n

故D的特征值为0

通过解相应齐次线性方程组可知,属于特征值0的线性无关的特征向量组只能是任一非零常数

即微商为零的多项式只能是零或非零常数

4.平面上全体向量构成实数域上一个二维线性空间

选择\mathscr{G}_\theta在直角坐标系下的矩阵为\begin{pmatrix}cos\theta&-sin\theta\\sin\theta&cos\theta\end{pmatrix}

特征多项式为\begin{vmatrix}\lambda-cos\theta&sin\theta\\sin\theta&cos\theta\end{vmatrix}=\lambda^2-2\lambda \cos\theta+1

\theta\neq k\pi时,多项式无实根,故\theta\neq k\pi时,\mathscr{G}_\theta没有特征值

特征子空间

对线性变换\mathscr{A}的任一特征值\lambda_0,适合条件\mathscr{A}\alpha=\lambda_0\alpha的向量\alpha所成的集合,即\mathscr{A}的属于\lambda_0的全部特征向量再添上零向量所成的集合,是V的一个子空间,称为\mathscr{A}的一个特征子空间,记作V_{\lambda_0}

注:V_{\lambda_0}的维数是属于\lambda_0的线性无关的特征向量的最大个数,V_{\lambda_0}=\{\alpha|\mathscr{A}\alpha=\lambda_0\alpha,\alpha\in V\}

\lambda E-A|=\begin{vmatrix}\lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\cdots&-a_{2n}\\ \vdots&\vdots& &\vdots\\ -a_{n1}&-a_{n2}&\cdots&\lambda-a_{nn}\end{vmatrix}

展开式中,有一项是主对角线上元素的连乘积(\lambda-a_{11})(\lambda-a_{22})\cdots(\lambda-a_{nn})

其余各项至多包含n-2个主对角线上的元素,对\lambda的次数最多是n-2

故特征多项式中含\lambda的n次与n-1次项只能在主对角线上元素的连乘积中出现

\lambda^n-(a_{11}+a_{22}+\cdots+a_{nn})\lambda^{n-1}

\lambda=0,可得常数项|-A|=(-1)^n|A|

故若只写出特征多项式的前两项与常数项,有|\lambda E-A|=\lambda^n-(a_{11}+a_{22}+\cdots+a_{nn})\lambda^{n-1}+\cdots+(-1)^n|A|

|\lambda E-A|在数域P上能分解为一次因式的乘积,由根与系数的关系,A的全体特征值的和为a_{11}+a_{22}+\cdots+a_{nn},称为A的迹,记作Tr(A),A的全体特征值的积为|A|

注:特征值被线性变换确定,在有限维空间中,任取一组基,特征值为线性变换在这组基下矩阵的特征多项式的根,基不同则线性变换的矩阵一般也不同,但是相似

定理:相似的矩阵有相同的特征多项式

证明:

设A\sim B,即有可逆矩阵X,使B=X^{-1}AX

\therefore |\lambda E-B|=|\lambda E-X^{-1}AX|

=|X^{-1}(\lambda E-A)X|=|X^{-1}||\lambda E-A||X|

=|\lambda E=A|\qquad\mathcal{Q.E.D}

注:

1.定理说明线性变换的矩阵的特征多项式与基的选择无关,直接被线性变换决定,故可称为线性变换的特征多项式

2.定理的逆不成立,特征多项式相同的矩阵不一定相似

A=\begin{pmatrix}1&0\\0&1\end{pmatrix},B=\begin{pmatrix}1&1\\0&1\end{pmatrix}

它们的特征多项式都是(\lambda-1)^2,但A和B不相似,和A相似的矩阵只能是A

Hamilton-Cayley定理

定理:设A是数域P上一个n\times n矩阵,f(\lambda)=|\lambda E-A|是A的特征多项式,则

f(A)=A^n-(a_{11}+a_{22}+\cdots+a_{nn})A^{n-1}+\cdots+(-1)^n|A|E=O

证明:

设B(\lambda)是\lambda E-A的伴随矩阵

由行列式性质

B(\lambda)(\lambda E-A)=|\lambda E-A|E=f(\lambda)E

\because 矩阵B(\lambda)的元素是|\lambda E-A|的各个代数余子式

都是\lambda的多项式,次数不超过n-1

\therefore 由矩阵运算性质

B(\lambda)=\lambda^{n-1}B_0+\lambda^{n-2}B_1+\cdots+B_{n-1}

其中B_0,B_1,\cdots,B_{n-1}都是n\times n数字矩阵

设f(\lambda)=\lambda^n+a_1\lambda^{n-1}+\cdots+a_{n-1}\lambda+a_n

则f(\lambda)E=\lambda^nE+a_1\lambda^{n-1}E+\cdots+a_nE

B(\lambda)(\lambda E-A)=(\lambda^{n-1}B_0+\lambda^{n-2}B_1+\cdots+B_{n-1})(\lambda E-A)

=\lambda^n B_0+\lambda^{n-1}(B_1-B_0A)+\lambda^{n-2}(B_2-B_1A)+\cdots+\lambda(B_{n-1}-B_{n-2}A)-B_{n-1}A

\therefore \begin{cases}B_0=E\\ B_1-B_0A=a_1E\\ B_2-B_1A=a_2E\\ \cdots\\ B_{n-1}-B_{n-2}A=a_{n-1}E\\ -B_{n-1}A=a_nE\end{cases}

以A^n,A^{n-1},\cdots,A,E依次从右边乘第1,2,\cdots,n+1式

得\begin{cases}B_0A^n=EA^n=A^n\\ B_1A^{n-1}-B_0A^n=a_1EA^{n-1}=a_1A^{n-1}\\ B_2A^{n-2}-B_1A^{n-1}=a_2EA^{n-2}=a_2A^{n-2}\\ \cdots\\ B_{n-1}A-B_{n-2}A^2=a_{n-1}EA=a_{n-1}A\\ -B_{n-1}A=a_nE\end{cases}

将以上n+1个式子一起加起来,左边为零,右边为f(A)

\therefore f(A)=O\qquad\mathcal{Q.E.D}

推论:设\mathscr{A}是有限维空间V的线性变换,f(\lambda)\mathscr{A}的特征多项式,则f(\mathscr{A})=\mathscr{O}

上一篇下一篇

猜你喜欢

热点阅读