11.机器学习-多元线性回归(1)多维特征和向量化
2023-04-03 本文已影响0人
那钱有着落吗
之前我们学习的线性回归都是一个变量,也就是x,现在我们来看下多维特征,也就是很多的变量。
1. 多维特征
如图,我们之前学习的是房屋大小对于房价影响,那么如果加上卧室数量,楼层高度,房龄,这些因素,就相当于有了影响房价很多的因素了。
有了这么多变量,我们需要一些特定的写法来表示他们,我们使用X的上标来表示他是第行或者说第几条数据,然后使用X的下标来表示这个变量是第几个特征。
为了更加方便的表达这种多元线性回归的公式,我们使用向量的方式来表示:
例如X向量就表示x1,x2,x3,x4。
w向量与x向量的点积就是如图所示。
2. 向量化
我们使用向量化除了上面讲的书写简单外,在实际的代码编写和运行速度上也快过for循环,虽然for循环看起来好像也是比较简单。
但是使用向量化的方式:调用numpy的向量点积函数,运行速度和书写都更优化。因为这个函数可以调用计算机的硬件资源来并行计算。
再比如进行梯度下降计算的时候也是一样的问题,如果是使用for循环这种逐步计算的方式,几十上百个还行,但是一旦上万,百万,千万的时候,并行计算就变得尤为重要了。因为那个时候还用for就慢死。