机器学习实战

2018-06-17  本文已影响21人  真是明明

1、机器学习基础

2、kNN近邻算法

是分类数据最简单有效的算法。缺点:训练数据集很大的时候必须使用大量存储空间,且必须对数据集中的没一个数据进行距离计算,非常耗时,且无法给出任意数据的基础结构信息。

3、决策树

决策树分类器就像带有终止块的流程图,终止块表示分类结果。是一种贪婪算法,他要在给定的时间内做出最佳选择,但并不关心能否达到全局最优。
缺点:当类别太多时,错误可能就会增加的比较快。

4、朴素贝叶斯

贝叶斯提供了一种利于已知值来估计未知概率的有效方案

5、Logistics回归

用一条直线对数据点进行拟合,这个拟合过程就称作回归。
根据现有数据对分类边界线建立回归公式,以此进行分类。

6、支持向量机SVM

svm是一种监督式学习的方法,可广泛地应用于统计分类以及回归分析,泛化错误率较低。

7、AdaBoost元算法

AdaBoost算法十分强大,它能够快速处理其他分类器很难处理的数据集

8、回归

与分类一样,回归也有预测目标值的过程。回归预测连续型变量,而回归预测离散型变量。回归是统计学中最有力的工具之一。

9、树回归CART

数据集中经常包含一些复杂的相互关系,是的输入数据和目标变量之间呈现非线性关系。一般采用树结构来对这种数据建模,相应的,若叶节点使用的模型是分段常数则称为树回归,若叶节点使用的模型是线性回归方程则为模型树。

10、k-均值聚类算法

11、Apriori算法

12、FP-growth算法

13、PCA简化数据

14、SVD简化数据

15、大数据与MapReduce

其他:

神经网络RNN

上一篇下一篇

猜你喜欢

热点阅读