数据科学家我爱编程

Data Science from Scratch笔记

2018-05-25  本文已影响67人  钻石草帽

本文“发表于微博自媒体”,微博:@钻石草帽

Kaggle是一个举办数据科学竞赛的网站

本文为《Data Science from Scratch: First Principles with Python》的读书笔记


重要原则

预备知识

预备知识的内容结构:

概念

概念的内容结构:

数据科学

模型

机器学习

数学

算法

K近邻算法

朴素贝叶斯算法

线性回归

逻辑回归

决策树

概念

建立决策树

神经网络

聚类分析

自然语言处理

自然语言处理(Natural Language Processing,NLP)是指与语言有关的各种计算技术。

词云

n-grams模型

语法

利用语法规则(grammar)建模生成符合要求的句子。

主题建模

主题建模的目标是从不同的文本中寻找它们共同的主题,隐含狄利克雷分析(Latent Dirichlet Analysis,LDA)技术常用于确定一组文档的共同主题。

网络分析

推荐系统

数据库

数据库与SQL

MapReduce

实践提示

上一篇下一篇

猜你喜欢

热点阅读