4. 数据处理

2018-07-31  本文已影响0人  柄志

数据清洗

数据清洗就是将重复的数据筛选清除、将缺失的数据补充完善、将错误的数据纠正或删除

处理重复数据

查找重复数据

COUNTIF函数
高级筛选
条件格式
数据透视表

删除重复数据

菜单操作
排序
筛选

处理缺失数据

缺失值最常见的表现形式是空值或错误的标识符。

处理缺失值的方法

  1. 用一个样本统计量的值代替缺失的值(例如平均值)
  2. 用一个统计模型计算出来的值去代替缺失值
  3. 将有缺失值的记录删除
  4. 将有缺失值的记录保留,仅在相应的分析中做必要的排除
定位输入
查找替换

检查逻辑错误

IF函数

条件格式

数据加工

数据加工时在数据清洗的基础上对数据字段进行信息提取、计算、分组、转换等加工,得到需要的数据表

数据抽取

字段分列

分列
LEFT、RIGHT函数

字段合并

&
CONCATENATE函数

字段匹配

VLOOKUP函数

VLOOKUP函数的作用是在表格的首列查找指定的数据,并返回指定的数据所在行中的指定列处的单元格

HLOOKUP函数

HLOOKUP函数的作用是在表格的首行查找指定的数据,并返回指定的数据所在列中的指定行处的单元格

SEARCH函数

数据计算

简单计算

函数计算

总和与平均值
日期

数据分组

数据转换

数据表的行列转换

选择性粘贴

数据抽样

RAND函数
上一篇 下一篇

猜你喜欢

热点阅读