《实用机器学习》读书笔记
2018-02-09 本文已影响25人
Me极客
书籍和课程
- 《机器人》
- 《模式识别》
- SVM
- Hadoop/Spark/Tensorflow
摘录
经典问题:回归,分类,推荐,排序
研究方法:理论来源,R
研究目的:从数据中学习出有效的模型,进而能对未来做预测。
必须面对:数据预处理,分布式:Hadooop Mahout、Spark MLLib
过程步骤:原始数据搜集>>建立模型解决问题>>算法性能评估
大数据:狭义的大数据,使用机器学习来分析大数据。广义的大数据,数据的搜集,整理,存储,共享,分析和可视化。
交叉学科:模式识别,人工智能,统计学,数据挖掘;数值优化。
机器学习:监督学习:预测y; 非监督学习:存在模式;
集成学习:综合多个模型
实际例子
病人住院时间预测:根据病人的历史记录预测病人在未来一年的住院时间
信用分数:从过去的还款记录中自适应学习出相应的模型
电影推荐:历史观看信息
酒店推荐
R语言
缩写名词
ICDM:国际数据挖掘大会