Machine Learning

线性代数-详解二次型(精华)

2016-09-17  本文已影响711人  stevekeol

何为二次型?形如 f(x1,x2,x3) = a*x1^2+b*x1*x3+c*x2^2;这样每一项都是二次的表达式。

何为标准形?形如f(y1,y2,y3) = a*y1^2+b*y2^2+c*y3^2;只含平方项不含混合项的表达式。

二次型的重要议题就是:用变量的线性替换化简一个二次型为标准形。

变换的意义:如将复杂的二次曲面变换为椭圆柱面,处理运算后,再利用非退化的变换矩阵变换为二次曲面.

二次型化为标准形的意义


线性变换:

x1=c11*y1+c12*y2+...+c1n*yn,

x2=c21*y1+c22*y2+...+c2n*yn,

...

xn=cn1*y1+cn2*y2+...+cnn*yn

称系数矩阵C是:由x1,x2...xn到y1,y2...yn的一个线性变换;若矩阵C的行列式不为0,则该线性变换为非退化的(满秩的)

定理:任意一个二次型f(x1,x2,...xn)都可以经过非退化线性变换为标准形a*y1^2+b*y2^2+...c*yn^2

二次型的矩阵表示:

二次型的矩阵表示

定理:n*n的任意对称矩阵A,存在n*n的可逆矩阵C使C'AC为对角形(注:C'为C的转秩)

矩阵理论的实质,就是找到一个可逆矩阵C,使C'AC成为对角矩阵!

定理:任意一个二次型f(x1,x2,...,xn) = X'AX都可经非退化的线性变换X = U*Y化为t1*y1^2+t2*y2^2+...+tn*yn^2,(t1,...,tn是A的全部特征值),U为正交矩阵,该线性变换称为正交线性变换

解题步骤:

解题步骤

步骤总结:

1、写出二次型的矩阵A

2、由A的特征多项式,求出特征值;即可写出标准形

3、对不同的特征值,求出对应的特征向量(基础解系);注意对于多重特征值,需要将特征向量正交化,最后单位化

4、写出正交线形变换(即映射标准形)


出发点:二次型的标准形不唯一(与所作的非退化线性变换有关),因此我们希望得到有唯一性的特殊形式的标准形,即“规范性”:f(x1,x2,...,xn) = z1^2+z2^2+...+zr^2,即r项系数均为1.

定理:(惯性定理)任意一个秩为r的二次型f(x1,x2,...xn)均可化为规范型,且不论何种非退化的线性变换得到的规范型都唯一

概念:秩为r的标准形/规范型中,正平方项的个数p称为正惯性指数,负平方项的个数r-p称为负惯性指数。前者减去后者的差称为符号差,即p-(r-p)


概念区分:

矩阵等价:r(A) = r(B)

矩阵相似:r(A) = r(B),且,特征值相等

矩阵合同:首先,A/B均为对称矩阵,r(A) = r(B),且,正负惯性指数相等

1、相似 =>等价;合同 => 等价

2、若A/B均为对称矩阵,相似 <=>合同


正定矩阵:(A必须为对称矩阵)

二次型 f(x1,x2,...,xn) = X'AX ,当X不为O时,恒有:

f > 0, 则称f为正定的; f < 0,则称f为负定的;f>=0,则称f为半正定的;f<=0则称f为半负定的

1、若f(x1,x2,...,xn) = X'AX是正定的,则:

正惯性指数为n;特征值均大于0;A的所有顺序主子式全大于零

2、推论:若f为负定的,则A的顺序主子式满足,(-1)^k*顺序主子式 > 0

3、若A为正定矩阵,则:

k*A为正定矩阵;A^(-1)为正定矩阵;A的伴随矩阵A*为正定矩阵;A^k为正定矩阵;C'AC为正定矩阵(C为可逆矩阵,因为非退化的线性变换保持二次型的正定性不变);

A/B为同阶正定矩阵,则A+B为正定矩阵;将A和B放在对角处的大矩阵,也为正定矩阵.


TIPS:本文只是个人对过去的总结,不保证简洁性、系统性、易懂性。如需交流:zhejiangdaxue2011(微信号)

上一篇下一篇

猜你喜欢

热点阅读