线性代数基础

2019-07-22  本文已影响0人  老羊_肖恩

1 向量和向量空间

1.1 标量和向量

  标量(Scalar)是一个实数,只有大小,没有方向。而向量(Vector,也称之为矢量)是由一组实数组成的有序数组,同时具有大小和方向。一n维向量\vec{a}是由n个有序实数组成,表示为:
\vec{a} = [a_1, a_2, ···, a_n]其中a_i称为向量\vec{a}的第i个分量,或第i维。

1.2 向量空间

  向量空间(Vector Space),也称线性空间(Linear Space),是指由向量组成的集合,并满足以下两个条件:

欧氏空间  一个常用的线性空间是欧氏空间(Euclidean Space)。一个欧氏空间表示通常为Rn,其中n为空间维度(Dimension)。欧氏空间中向量的加法和标量乘法定义为:
[a_1, a_2, ···, a_n] + [b_1, b_2, ···, b_n] = [a_1 + b_1, a_2 + b_2, ···, a_n + b_n]
c[a_1, a_2, ···, a_n] = [ca_1, ca_2, ···, ca_n]其中a, b, c ∈ R为一个标量。

线性子空间  向量空间V的线性子空间UV的一个子集,并且满足向量空间的条件(向量加法和标量乘法)。

线性无关  线性空间V中的一组向量\lbrace\vec{v_1}, \vec{v_2}, · · · , \vec{v_n}\rbrace,如果对任意的一组标量(λ_1, λ_2, · · · , λ_n),满足λ_1\vec{v_1} + λ_2\vec{v_2} + · · · + λ_n\vec{v_n} = 0,则必然λ_1 = λ_2 = · · · =λ_n = 0,那么向量{\vec{v_1}, \vec{v_2}, · · · , \vec{v_n}}是线性无关的,也称为线性独立的。

基向量  向量空间V的基(Base)B = \lbrace\vec{e_1}, \vec{e_2}, · · · , \vec{e_n}\rbrace是V 的有限子集,其元素之间线性无关。向量空间V所有的向量都可以按唯一的方式表达为B中向量的线性组合。对任意\vec{v} ∈ V,存在一组标量(λ_1, λ_2, · · · , λ_n)使得
v = λ_1\vec{e_1} + λ_2\vec{e_2} + · · · + λ_n\vec{e_n}
其中基B中的向量称为基向量(Base Vector)。如果基向量是有序的,则标量(λ_1, λ_2, · · · , λ_n)称为向量\vec{v}关于基B坐标(Coordinates)。

1.3 范数

范数(Norm)是一个表示向量“长度”的函数,为向量空间内的所有向量赋予非零的正长度或大小。对于一个n维向量\vec{v},一个常见的范数函数为p 范数:
ℓ_p(\vec{v}) = ||\vec{v}||_p= (\sum_{i=1}^n|v_i|^p)^{1/p}
其中p ≥ 0为一个标量的参数。常用的p的取值有1,2,∞等。
ℓ_1范数 ℓ1范数为向量的各个元素的绝对值之和。
||\vec{v}||_1 = \sum_{i=1}^n|v_i|ℓ_2范数  ℓ2范数为向量的各个元素的平方和再开平方。
||\vec{v}||_2 = \sqrt{\sum_{i=1}^nv_i^2} = \sqrt{\vec{v}^T\vec{v}} ℓ2 范数又称为Euclidean 范数或者Frobenius 范数。从几何角度,向量也可以
表示为从原点出发的一个带箭头的有向线段,其ℓ2 范数为线段的长度,也常称为
向量的模。
ℓ_∞范数 ℓ∞ 范数为向量的各个元素的最大绝对值。
||v||_∞ = max\lbrace v_1, v_2, ···, v_n\rbrace下图给出了常见的范数示例:

常见的范数,红线表示不同范数的ℓp = 1 的点

2 矩阵

  由m × n个数aij (i = 1,2,···,m; j = 1,2,···, )排成的mn列的数表称为mn列矩阵,简称m × n矩阵。表示方法如下:
A=\begin{pmatrix} a_{11} & a_{12}&{···}&a_{1n}\\ a_{21} & a_{22}&{···}&a_{2n}\\ \vdots & \vdots&\ddots&\vdots\\ a_{m1} & a_{m2}&{···}&a_{mn}\\ \end{pmatrix}一个矩阵A从左上角数起的第i行第j列上的元素称为第i, j项,通常记为[A]ij 或aij。矩阵A定义了一个从RnRm的线性映射,矩阵A也记作Am × n。行数和列数都等于n的矩阵称之为n阶矩阵或n阶方阵,记作An
  只有一行的矩阵
A=\begin{pmatrix} a_1 & a_2 & \dots & a_n \end{pmatrix}称为行矩阵,又称为行向量。为避免混淆,行矩阵也记作
A=\begin{pmatrix} a_1 , a_2 & \dots & a_n \end{pmatrix}只有一列的矩阵称之为列矩阵,也称之为列向量:
A=\begin{pmatrix} a_1 \\ a_2\\ \vdots \\ a_n\\ \end{pmatrix}如果矩阵A和矩阵B的行数和列数都相等,那么称它们为同型矩阵。如果A=(aij)与B=(bij)是同型矩阵,且所有对应元素满足:
a_{ij} = b_{ij}那么称矩阵A和矩阵B相等,记作:
A=B元素都为0的矩阵称之为零矩阵,注意,不同型的零矩阵是不相等的。

2.1 线性映射

线性映射(Linear Mapping)是指从线性空间V到线性空间W的一个映射函数f : V → W,并满足:对于V中任何两个向量uv以及任何标量c,有
f(u+v) = f(u) + f(v)
f(cv) = cf(v)
n个变量x1,x2, ···,xnm个变量y1,y2,···,ym之间的关系式
y =Ax= \begin{cases} y_1 = a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n\\ y_2 = a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n\\ \vdots\\ y_m = a_{m1}x_1 + a_{m2}x_2 + \dots + a_{mn}x_n\\ \end{cases}表示一个从变量x1,x2, ···,xn到变量y1,y2,···,ym的线性变换,其中A定义为m × n的矩阵(Matrix),是一个由mn列元素排列成的矩形阵列,aij为常数。

2.2 矩阵运算

2.2.1矩阵加法

对于两个m × n的矩阵AB,他们的和为A + B,具体如下:
A + B= \begin{pmatrix} a_{11} + b_{11} &a_{12} + b_{12} & \dots & a_{1n} + b_{1n}\\ a_{21} + b_{21} &a_{22} + b_{22} & \dots & a_{2n} + b_{2n}\\ \vdots & \vdots & \vdots & \vdots \\ a_{m1} + b_{m1} &a_{m2} + b_{m2} & \dots & a_{mn} + b_{mn}\\ \end{pmatrix}只有当两个矩阵为同型矩阵时,它们才能进行加法运算。矩阵加法满足以下运算规律:
\begin{align} & A + B = B + A \\ & (A + B) + C = A + (B + C) \\ & A + (-A) = 0 \end{align}

2.2.2数与矩阵相乘

数c与矩阵A的乘积记作cA或Ac,运算如下:
cA = Ac = \begin{pmatrix} ca_{11} & ca_{12} & \dots & ca_{1n}\\ ca_{21} & ca_{22} & \dots & ca_{2n}\\ \dots & \dots & \dots & \dots\\ ca_{m1} & ca_{m2} & \dots & ca_{mn}\\ \end{pmatrix}数乘矩阵满足以下运算规律
\begin{align} & (\alpha \beta)A = \alpha(\beta)A \\ & (\alpha + \beta)A = \alpha A+ \beta A \\ & \alpha(A + B) = \alpha A + \alpha B\\ \end{align}矩阵加法与矩阵数乘合称为矩阵的线性运算。

2.2.3矩阵与矩阵相乘

假设有两个A和B 分别表示两个线性映射g : Rm → Rkf: Rn → Rm ,则其复合线性映射
(g ◦ f)(x) = g(f(x)) = g(Bx) = A(Bx) = (AB)x,其中AB表示矩阵AB的乘积,定义为
[AB]_{ij} =\sum_{k=1}^{m}a_{ik}b_{kj}两个矩阵的乘积仅当第一个矩阵的列数和第二个矩阵的行数相等时才能定义。
Ak × m矩阵和Bm × n矩阵,则乘积AB是一个k × n的矩阵。矩阵的乘法满足结合律和分配律:
• 结合律:(AB)C = A(BC),
• 结合律:(aB)C = A(aBC), a是标量。
• 分配律:(A + B)C = AC + BCC(A + B) = CA + CB.

2.3 矩阵类型

对称矩阵 对称矩阵(Symmetric Matrix)指其转置等于自己的矩阵,即满足
A = AT
对角矩阵 对角矩阵(Diagonal Matrix)是一个主对角线之外的元素皆为0 的矩阵。对角线上的元素可以为0 或其他值。一个n × n的对角矩阵A满足:
[A]_{ij} = 0 ,i \neq j , ∀i, j ∈ \{1, · · · , n\}对角矩阵A也可以记为diag(a),a为一个n维向量,并满足
[A]_{ii} = a_in × n的对角矩阵A = diag(a) 和n维向量b的乘积为一个n维向量
Ab = diag(a)b = a ⊙ b其中表示点乘,即(ab)i = aibi

单位矩阵 单位矩阵(Identity Matrix)是一种特殊的的对角矩阵,其主对角线元素为1,其余元素为0。n阶单位矩阵In,是一个n × n的方块矩阵。可以记为
I_n = diag(1, 1, ..., 1)一个m × n的矩阵A和单位矩阵的乘积等于其本身。
AI_n = I_mA = A逆矩阵 对于一个n × n的方块矩阵A,如果存在另一个方块矩阵B 使得
AB = BA = I_n
其中In为单位阵,则称A是可逆的。矩阵B称为矩阵A的逆矩阵(Inverse Matrix),记为A−1。一个方阵的行列式等于0 当且仅当该方阵不可逆。

正定矩阵 对于一个n × n的对称矩阵A,如果对于所有的非零向量x ∈ Rn都满足
x^TAx > 0A为正定矩阵(Positive-Definite Matrix)。如果x^TAx ≥ 0A是半正定矩阵(Positive-Semidefinite Matrix)。

正交矩阵 正交矩阵(Orthogonal Matrix )A为一个方块矩阵,其逆矩阵等于其转置矩阵。
A^T = A^{−1}等价于ATA = AAT = In

Gram矩阵  向量空间中一组向量\vec v_1, \vec v_2, \dots, \vec v_nGram矩阵(Gram Matrix)G是内积的对称矩阵,其元素Gijv^T_iv_j

2.4 特征值与特征矢量

如果一个标量λ和一个非零向量v满足Av = λv
λv分别称为矩阵A的特征值(Eigenvalue)和特征向量(Eigenvector)。

上一篇下一篇

猜你喜欢

热点阅读