TECH

大师兄的数据分析学习笔记(一):关于数据分析

2022-03-25  本文已影响0人  superkmi

大师兄的数据分析学习笔记(二):探索性数据分析(一)

一、关于数据分析

1. 什么是数据分析
2. 数据分析的一般流程

(1) 数据获取
(2) 探索分析与可视化

(3) 数据预处理
(4) 分析模型
(5) 模型评估

3. 分析工具
作用
numpy 定义了更高效快速的数据结构。
scipy 基于numpy数据结构实现数据科学计算。
matplotlib / pyecharts 实现数据可视化。
pandas 基于numpy提供数据模型和操作工具。
scikit-learn 提供数据挖掘算法。
keras 提供复杂数据模型和深度神经网络工具。

二、数据获取

1. 数据仓库DW
  • 特点1:记录了全部的事实。
  • 特点2:可以方便地以不同维度抽取和整理数据。(数据集市-DM)
  • 区别1:数据仓库面向主题存储;数据库面向业务存储。
  • 区别2:数据仓库面向分析(Online Analysis Processing);数据库面向应用(Online Transaction Processing)。
  • 区别3:数据仓库可能有比较大的冗余,变化大,数据量大; 数据库组织规范。
2. 检测与抓取
3. 填写、日志、埋点

第一种:页面统计。
第二种:统计操作行为。

4. 计算
上一篇下一篇

猜你喜欢

热点阅读