线性代数的本质——笔记1

2019-04-05 本文已影响0人 WinterPrince

1.向量是什么？

有三种理解向量的方式，如下：

向量是空间中的一条箭头，它有长度与方向两个属性。
向量是有着一串数字的列表
向量可以是任何东西，只要它的加法和乘法有意义。

2.向量是空间中一组基向量的线性组合

以2维空间为例，存在一组基向量 $\vec{i}= \begin{bmatrix} 1\\ 0\end{bmatrix}， \vec{j}=\begin{bmatrix} 0 \\ 1\end{bmatrix}$ 。这个二维空间中的任意一个向量都可以由这一组基向量表示，那么就说这个二维空间是 $\vec{i}，\vec{j}$ 这一组基向量所张成的空间。具体表示方式为：

$\vec{u}=a\vec{i}+b\vec{j}$

其中 $a,b$ 是任意实数，也是 $\vec{u}$ 的值。 $\vec{u}=\begin{bmatrix} a\\b \end{bmatrix}$
仅仅通过对基向量进行缩放相加的操作就能得到空间中的任何一个向量，这也说明向量加法与数乘尤为重要。

所以说

看到向量就要想到它是所处空间中一组基向量的线性组合。

自然，这样的基向量有无数组，二维空间中，我们通常选择上述的 $\vec {i } ,\vec {j}$ 作为基向量。

3.线性变换

变换其实等价于函数，在此场景下，函数输入的是向量，输出的也是向量。

$L(\vec{u})=\vec{v}$

输入输出的向量维度可以不同。

之所以用变换而不是函数来定义，是因为变换更强调一个运动的过程，例如二维空间中我们能想象，向量经过一个线性变换从而移动到空间中其他位置。

变换有线性变换和非线性变换2种，本节讲的是线性变换及其与矩阵的关系。

将向量想象成箭头，那么线性变换是指起点在原点的向量在不同空间中的移动，且保持了向量数乘和加法的不变性。
这个不同空间可以理解为

空间的维数不一样。
空间的定义的基向量不一样。

例如一个3维向量经过线性变换变成了3维向量。 $(维数一致)$
或者一个3维向量经过线性变换变成了2维向量。 $(维数不一致)$

上述的1其实是2的一个特例，如果变换后空间维数不一样了，那么空间定义的基向量肯定也发生了改变。

变换（或映射）T称为线性变换，若：
对定义域内的一切 $u，v$ ， $T(u+v)=T(u)+T(v)$ 。
对定义域内的一切 $u$ ；和任何标量 $c$ ， $T(cu)=cT(u)$ 。

直观上，我们可以使用

变换过程中，空间原点的位置不改变。

变换后空间中的直线还是直线，不能弯曲。

2个条件来表示线性变换。

4.怎样进行线性变换?

我们知道线性变换就是将空间中所有的向量移动到一个新的位置。在此过程过程中，向量的起点不变。那么如何追踪任意一个变换过的向量呢？

由上一节我们知道了向量其实是基向量的线性组合，任何向量都可以由基向量来表示。

如果我们只追踪基向量，空间中任意一个变换后的向量自然就能由变换后的基向量来表示。

怎么知道基向量的变换情况呢？在二维空间中，我们只需观察 $\vec{i}= \begin{bmatrix} 0 \\ 1 \end{bmatrix} ，\vec{j}= \begin{bmatrix} 0 \\ 1 \end{bmatrix}$ 这组基向量。并且线性变换后的基向量的系数就是线性变换之前基向量的系数，也就是线性变换之前 $\vec{u}$ 的坐标 $a_1,b_1$ 。

二维空间中的一组基向量

问题如下：

已知
$\vec{u}=a_1\vec{i}+b_1\vec{j}$

即 $\vec{u}=\begin{bmatrix} a_{1}\\b_{1} \end{bmatrix}$ ， $\vec{u}$ 经过线性变换后变为 $\vec{v}$ ，即 $L(\vec{u})=\vec{v}$ ，此时 $\vec{i},\vec{j}$ 相应地变换为 $\vec{i_1}= \begin{bmatrix} a \\ b\end{bmatrix}$ ， $\vec{j_1}= \begin{bmatrix} c \\ d \end{bmatrix}$ ，且 $\vec{v}=a_2\vec{i_1}+b_2\vec{j_1}$
证明 $a_{2}=a_{1},b_{2}=b_{1}$ 。

证明如下：

由上文线性变换的定义可知：
$L(\vec{u})=L(a_{1}\vec{i}+b_{1}\vec{j})=a_1L(\vec{i})+b_1L(\vec{j})=a_1\vec{i_1}+b_1\vec{j_1}=\vec{v}$
所以 $a_{2}=a_{1},b_{2}=b_{1}$ 。

所以只要我们知道了变换后的基向量坐标，我们就能进行线性变换。

5.矩阵是什么？

现在假设已知线性变换后的基向量 $\vec{i_1}$ , $\vec{j_1}$ 。
借用上述证明中的各已知条件。

$\vec{v}=a_1\vec{i_1}+b_1\vec{j_1}$
$\vec{i_1}= \begin{bmatrix} a \\ b\end{bmatrix}$ ， $\vec{j_1}= \begin{bmatrix} c \\ d\end{bmatrix}$

那么将 $\vec{i_1}，\vec{j_1}$ 的坐标"包装"在一个 $2×2$ 的格子里，我们称其为矩阵。
$\begin{bmatrix}a&b\\c&d\end{bmatrix}$

看到这里，大家应该明白了原来矩阵是经过线性变换后的基向量的拼接。

也就是说，矩阵代表着线性变换，空间的线性变换由变换后的基向量的坐标来完全确定。

而日常应用中通常会给出矩阵，所以本节开头假设变换后的基向量已知是成立的，它就是矩阵的元素嘛。

 因此，看到矩阵就要想到它代表着空间中的线性变换，它是线性变换后空间中一组基向量的坐标。

那么空间中变换后的任意向量就可以由基向量来表示了。

请看下面的例子：

有矩阵 $\begin{bmatrix}a&b\\c&d\end{bmatrix}$ ，另有向量 $\begin{bmatrix} x \\ y \end{bmatrix}$ ，则向量在矩阵的"作用"下，(经过一个线性变换)，向量的新坐标(移动到一个新的位置)如下：

$\begin{bmatrix} a & b \\ c & d \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} =x\begin{bmatrix} a \\ c \end{bmatrix}+y\begin{bmatrix} b\\d \end{bmatrix}$

请仔细看，跟上文中 $\vec{u}=a\vec{i}+b\vec{j}$
这一形式类似,此时 $x,y$ 相当于 $a,b$ ，为基向量的系数，而 $\begin{bmatrix} a\\c \end{bmatrix}$ ， $\begin{bmatrix} b\\d \end{bmatrix}$
则为线性变换后的基向量。