【散人】机器学习程序员

《实用机器学习》读书笔记

2018-02-09  本文已影响25人  Me极客

书籍和课程

摘录

经典问题:回归,分类,推荐,排序
研究方法:理论来源,R
研究目的:从数据中学习出有效的模型,进而能对未来做预测。
必须面对:数据预处理,分布式:Hadooop Mahout、Spark MLLib
过程步骤:原始数据搜集>>建立模型解决问题>>算法性能评估
大数据:狭义的大数据,使用机器学习来分析大数据。广义的大数据,数据的搜集,整理,存储,共享,分析和可视化。
交叉学科:模式识别,人工智能,统计学,数据挖掘;数值优化。


机器学习:监督学习:预测y; 非监督学习:存在模式;
集成学习:综合多个模型

实际例子

病人住院时间预测:根据病人的历史记录预测病人在未来一年的住院时间
信用分数:从过去的还款记录中自适应学习出相应的模型
电影推荐:历史观看信息
酒店推荐


R语言

缩写名词

ICDM:国际数据挖掘大会

上一篇 下一篇

猜你喜欢

热点阅读