打破机器学习边界的工具,构建基石
本文约1300余字,阅读需要约3.2分钟;
本文所有推荐的数据,阅读完后,会有系统资料提供;
系统资料领取见文末;
关键词:人工智能,机器学习,深度学习,数学,学习建议,微专业
机器学习工程师的边界是什么?
简而言之,边界是当我们不会英语的时候,会少有出国的机会,较小概率看到国外的世界。
大多数的事物都是有边界的,包括机器学习,那么,于大多数人而言,
机器学习的边界又是什么呢?
(1)线性代数
(2)概率统计
(3)部分数学基础
当跨越了机器学习的边界,AI这条路是否可以走得更轻松?
答案是肯定的,掌握了机器学习的底层基础(跨越边界),至少在模型优化阶段更加游刃有余。
AI领域的基石又是什么?
以机器学习为例,机器学习的基石如下(重要的事情说2遍):
(1)线性代数
(2)概率统计
(3)部分数学基础
如何打破边界?又如何构建基石?
以下的内容给你主要答案。
机器学习与相关数学等基础的关系
(1)线性代数如何应用到机器学习中?
方法建议:尽量将线性代数与现实意义结合起来
对于线性代数,理解它与机器学习的关键在于:理解线性代数与现实世界的巧妙的耦合。
上图中的x,y可以分别代表看事物的2个维度,x,y各自有大量的线性组合,意味着事物的2个维度有大量不同的看法,将这些看法用机器来进行计算,归纳,演绎,组合大量个别的看法,抽离出符合大多数的平衡点,从而得出普遍适用的结论。这不是一个人能做到的,即使他是一个极其聪明的人。
这想想都是一件奇妙的巧妙而耦合的事件。
(2)概率统计如何应用到机器学习中?
方法建议:尽量将看似无味的概率统计与感兴趣的话题结合起来理解
如上图所示,用机器来判断是否是合适的女婿,转换为是合适女婿的概率问题,也就是二分类问题,更是一个概率计算的问题,如何保证这个计算过程不出问题,计算概率怎么计算的?可以怎么优化?框架提供的计算过程不可能适合所有的情况,当我们遇到不一样的的情况的时候,如何根据实际环境做优化?要解决类似的问题,都需要用到概率统计。概率统计于机器学习而言,犹如三足(线性代数,概率统计,数学)鼎立之一足。
(3)数学基础如何应用到机器学习中?
方法建议:将实际意义与兴趣赋予看似枯燥的学习之后,尽量死磕最少必要知识,如下面提到的sigmod函数,凸函数,梯度下降法等。
亦如上图所示,Y=w1*身高+w2*品德+w3*财富+w4*颜值+w5*才能 是数学公式Y=w1*x1+w2*x2+w3*x3+w4*x4+w5*5。
另外,sigmoid函数也是数学函数。由此可见,机器学习是由很多的基础的数学函数累计而成。另外,在很多情况下,也会遇到数学当中的最优化问题,如凸函数,随机森林下降问题。如果要增大做好的概率,必然会涉及到数学问题。数学基础是一个大大的瓶颈。
打破边界的误区
误区是:也许你早已意识到数学,线性代数,概率统计对做机器学习的重要性,也在积极补课中,于是一头扎进大学的教材中。
重点是:埋头死磕了好多次,每次都半途而费,学了很多,学到的很少。
原因是:教材始终更偏向理论,优点是每一步都可靠,逻辑严谨,可缺点就更明显了,
那就是:更难理解
这也是在线教育存在的社会价值,在逻辑严谨的纯理论和更通俗易懂的类比中,找到一个有助于大多数人成长的平衡点。
古语有云:“独学而无友 则孤陋而寡闻”,多人学习,协作学习能较快认识到打破机器学习边界的误区,尽可能的使用合适的学习方法。