机器学习的数学基础
2018-02-07 本文已影响89人
dalalaa
所谓三百六十行、行行转IT,机器学习看似是一个IT类的岗位,
但是用人单位却更青睐招聘数学或者统计学专业的应聘者,甚至有些单位直接没有专业要求,只要求有数学建模经验。
这就为转行者提供了一个更有前景的选择,目前这个行业有来自各行各业的转行者。
这个行当看似门槛很高,其实谁都可以做,毕竟谁还没学过高数?
那么要入行机器学习需要哪些数学基础呢,这里给大家简单罗列一下,大部分都是大学高数内容,小部分超纲,可以自己看看:
-
线性代数
- 线性代数是机器学习的重中之重,如果你愿意深究机器学习中各种算法的原理,你就会发现线性代数无处不在,比如:
- 主成分分析(PCA)
- 奇异值分解(SVD)
- 矩阵的特征分解
- LU分解(将一个 NxN 矩阵 A 分解为一个上三角矩阵 U 和下三角矩阵 L 的过程, 即: LU=A)
- QR分解(将矩阵转化成正交矩阵和上三角矩阵的乘积)
- 因式分解
- 对称矩阵
- 正交化
- 特征值/特征向量
- 向量空间
- 正规化
- 这些知识能够帮助理解模型优化的过程
- 线性代数是机器学习的重中之重,如果你愿意深究机器学习中各种算法的原理,你就会发现线性代数无处不在,比如:
-
概率论与数理统计
- 概率统计是机器学习的理论基础,虽然不如线性代数使用频繁,但也非常重要,常用知识有如下这些:
- 排列组合
- 基本概率定理
- 贝叶斯定理
- 方差与期望
- 条件分布与联合分布
- 标准分布(伯努利分布、二项分布、多项分布、均匀分布、高斯分布)
- 极大似然估计
- 先验分布与后验分布
- 最大后验估计
- 概率统计是机器学习的理论基础,虽然不如线性代数使用频繁,但也非常重要,常用知识有如下这些:
-
多变量微积分
- 微积分在很多情况下会与线性代数结合使用
- 微分与积分
- 偏微分
- 向量值函数
- 梯度
- Hessian矩阵(对向量x的每一个元素求二阶导数得到的矩阵)
- Jacobian矩阵
- 拉普拉斯变换
- 微积分在很多情况下会与线性代数结合使用
-
其他
- 信息论(信息熵、信息增益)
- 实数与复数分析(极限、集合与序列、傅里叶变换、拓扑等)
参考地址:https://towardsdatascience.com/the-mathematics-of-machine-learning-894f046c568
原文里面有少量专业词汇我没找到中文对应词,就直接跳过了,希望能有数学基础比较扎实的同学提示一下。