AI界的产品经理产品经理PMbook

读书笔记 | 《机器学习》的算法总结 - AI产品经理需要知道的

2017-11-06  本文已影响316人  rui_liu
机器学习.jpg

-- 原创,未经授权,禁止转载 2017.11.06 --

传送门:
机器学习的基本概念(一):http://www.jianshu.com/p/10fc7e397a3e
机器学习的基本概念(二):http://www.jianshu.com/p/b3edf9c9f2c8
机器学习模型评估与选择:http://www.jianshu.com/p/c5111d585367

一、算法类别

机器学习的算法繁多,分类方式也很多,如:

最有效的算法分类,是基于学习任务的,它在实践中使用广泛。那么,如何选择合适的算法呢?

通常,我们根据算法的优缺点、训练数据规模、数据质量、任务目标,等等问题综合考虑。当然,选择大家认可度高的算法,更容易得到“不错”的结果。

算法按功能类别大致分为13种,下图总结了不同类别算法的优缺点,以及著名代表算法。

算法.png

二、基于学习任务的算法分类

上篇文章讲到,机器学习中,学习方式我们主要分两大类:

(其实还会分为半监督学习,强化学习等类型。这里不做过多探讨。)

image image

这里想讨论的,是基于不同的学习任务,常用的算法有哪些,优缺点是什么。
如下图:

监督学习.png

1)分类任务

a)概述

通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。

分类算法通常适用于预测一个类别(或类别的概率),而不是连续的数值。

b)应用:
c)算法解释

2)回归

回归
a)概述

回归算法用于连续型分布预测,针对的是数值型的样本,使用回归,可以在给定输入的时候预测出一个数值,这是对分类方法的提升,因为这样可以预测连续型数据而不仅仅是离散的类别标签。

回归的目的就是建立一个回归方程用来预测目标值,回归的求解就是求这个回归方程的回归系数。

b)应用:

房价预测、股票走势或测试成绩等连续变化的案例。

c)算法解释:

3)聚类

无监督学习.png
a)概述

聚类,就是根据数据的"相似性"将数据分为多类的过程。
所有的聚类算法都试图找到数据的内在结构,以便按照最大的共同点将数据进行归类。

b)应用:

细分客户、新闻聚类、文章推荐等。

c)算法解释:

4)降维

a)概述

降维,通过某种数学变换将原始高维属性空间转变为一个低维子空间,在这个子空间中样本密度大幅提高,距离计算也变得更加容易。

降维的方法可以分为:

说到维度,其目的是用来进行特征选择和特征提取,注意特征选择和特征提取这二者的不同之处:
【特征选择】:选择重要特征子集,删除其余特征。
【特征提取】:由原始特征形成较少的新特征。

c)算法解释

结束

算法还有很多,且学且珍惜~~

最后,我的目的是成为一名ai pm,求推荐~

-- 原创,未经授权,禁止转载 2017.11.06 --

上一篇 下一篇

猜你喜欢

热点阅读