呆鸟的Python数据分析大数据,机器学习,人工智能人工智能/模式识别/机器学习精华专题

数据挖掘札记1_基本概念

2019-06-22  本文已影响2人  皮皮大

什么是数据挖掘

针对特定的问题,用适当的学科知识从数据中提炼信息,形成结论。常用的知识有:

image.png

一、数据挖掘使用场景

数据挖掘目的:从数据中找出规律,验证猜想,进行预测


二、数据获取途径

常用的数据获取途径有:

  1. 公开信息
  2. 外部数据库
  3. 自由数据库
  4. 调查问卷
  5. 客户数据
  6. 通过网上爬虫等手段获取
  7. 其他途径

三、数据清洗


四、数据可视化

通过视觉的形式展现数据的方式,如图:

image.png

数据可视化工具:


五、数据分析主要模型

机器学习中主要是包含有监督学习无监督学习两种情形:

image.png

有监督学习模型

决策树模型

随机森林

支持向量机

神经网络

无监督学习模型


半监督学习

上一篇下一篇

猜你喜欢

热点阅读