00-Scikit-learn学习笔记系列文章
2018-05-25 本文已影响0人
青伢子
机器学习读书笔记
番茄又名西红柿,是一种可以多吃有益健康的蔬菜撰写机器学习读书笔记,总结自己系统学习sklearn的经验,将整个学习过程写成读书笔记的形式分享给大家,共同进步。
根据学进度,近期将整理自己的笔记,撰写系列文章,并同时发布Jupyter Notebook文件和Python脚本文件https://gitee.com/zengqs/slkern-notebook.git。
内容组织
基础部分
工具篇
- 使用环境及库
概念篇
- 使用pandas分析、清洗数据
- 一个机器学习系统的小案例
基本算法
介绍sklearn的基本算法
- 分类(Classification )
- 回归(Regression)
- 聚类(Clustering )
- 降维(Dimensionality reduction)
- 模型选择(Model Selection)
- 数据预处理(Preprocessing )
高级主题
- 管道
- 交叉验证
- 网格搜索
- 图像特征提取应用项目实战
论文撰写技巧
分享论文发表中需要用到的技巧
- 比较实验环境的建立
- 图表的绘制
公开数据集
所有数据集合提供本地版本,保存到Git托管服务器,方便下载测试
- IRIS
参考资料
- Hands-On Machine Learning with Scikit-Learn and TensorFlow
- Python 语言构建机器学习系统 第2版(影印版)
- Python数据挖掘入门与实践
- scikit learn机器学习:常用算法原理及编程实战
- Python机器学习及实践:从零开始通往Kaggle竞赛之路
- Python大战机器学习:数据科学家的第一个小目标