数据分析之数据准备

2020-04-03  本文已影响0人  AoEliauk

做数据分析首先就要数据,本文介绍的是如何理解数据?数据来源有哪些?供大家阅读。

一、理解数据

1.字段与记录:

字段是事物或现象的某种特征。我们称列名称为字段。

记录是事物或现象某种特征的具体表现。我们称每一行数据为一条记录。

2.数据类型:字符型数据和数值型数据

字符型数据是不具有计算能力的文字数据类型。

数值型数据是直接使用自然数或度量单位进行计算的数值数据。

更改数据类型的操作:选中某一单元格---单击鼠标右键---设置单元格格式---不同数据类型

设置单元格对话框

3.数据表:

数据表是由字段、记录和数据类型构成的,其要求:

(1)数据表由标题行和数据部分组成的

(2)第一行是表的列标题(字段),不能重复

(3)第二行起是数据部分,不允许出现空白行或空白列

(4)数据表中不能有合并单元格

(5)数据表和其他数据表之间至少留出一个空白行和一个空白列

(6)数据表应该以一维形式存储,若是二维表要转化为一维表

4.二维转一维:

一维&二维表

操作步骤:打开"数据透视表和数据透视图向导"功能---选择"多重合并计算数据区域"---"创建单页字段"---"选定区域"位置选中二维表的数据区域---"添加"---"新建工作表"---完成---最后双击透视表的右下角最后一个汇总数据即可得到一维表。


二、数据来源

1.导入数据:

(1)导入文本数据:数据---自文本---txt格式的文本

(2)自动导入网站数据:数据---自网站---新建Web查询---输入网址---转到---导入---选择区域---确定。

从网站导入的数据可不断地刷新,就可获取最新的数据。

刷新的方法:(1)数据---刷新数据(2)点击某单元格---鼠标右键---刷新

(3)点击某单元格---鼠标右键---数据范围属性---修改刷新频率/勾选打开文件时自动更新

2.问卷录入:多选题录入方法ABCDEF

二分法:把每个相应选项定义为一个变量,对每个变量做定义:0代表未选,1代表已选。若选择ACD,应该是'101100'

多重分类法:事先定义录入的值,并且根据限选的项数确定应录入变量的个数。


                                                  本文为《谁说菜鸟不会数据分析-入门篇》第三章读书笔记

上一篇 下一篇

猜你喜欢

热点阅读