【数据分析】第二步:数据收集

2019-11-28  本文已影响0人  云_c6f1

数据分析必须要有数据,从明确分析目的和思路、到数据收集、再到数据处理、之后的数据分析都离不开数据。

在我们做数据收集时:

首先要理解数据;

其次要清楚数据的来源。

一、数据理解

对数据的理解,能够帮助我们清晰地认识到数据分析对数据有什么要求。

1.1、字段与记录

数据由字段与记录共同组合而成。从数据分析的角度来理解字段和记录的概念:

☞字段是事物或现象的某种特征。例如学生成绩表中的姓名,学号,语文,数学,英语等都是字段。在统计学中称为变量。

☞记录是事物或现象某种特征的具体表现。例如学生成绩表中的。比如学生成绩表中姓名可以是张三或李四。记录也称为数据或变量值。

1.2、数据类型

数据类型分为:字符型数据和数值型数据。常见的数据类型有:数值、文本、日期、货币、会计专用、时间、百分比、分数、科学计数、特殊等

☞字符型数据不具有计算能力的文字数据类型。它包括中文字符,英文字符,数字字符(非数值型)等字符。

☞数值型数据是直接使用自然数或度量单位进行计量的数值数据。对于数值型数据,可以直接用算术方法进行汇总和分析。

1.3、数据表

数据表由字段、记录和数据类型构成。

数据表的设计是否合理,关系着后期数据分析的效率及深度。

数据表设计有如下6条要求:

1)、数据表由标题行和数据部分组成

2)、第一行是表的列标题(字段名),列标题不能重复

3)、第二行起是数据部分,数据部分的每一行数据称为一个记录,并且数据部分不允许出现空白行和空白列

4)、数据表中不能有合并单元格存在

5)、数据表与其他数据之间应该留出至少一个空白行和一个空白列

6)、数据表需要以一维的形式存储,但是在实际操作中接触的数据往往是以二维表格的形式存在等,此时应将二维表转化为一维表的形式存储数据。

什么是一维表,什么是二维表?

一维表的第一行列标题都是字符型字段。

二维表的第一行列标题包含是数值型字段。

如何将二维表转化为一维表?

在使用Excel转换过程中,我们要用到数据透视表中的“数据透视表和数据透视图向导”功能。操作步骤如下

Excel中二维表转一维表

二、数据来源

获取数据的方式可以分为两种:导入外部数据和自己录入数据。

2.1导入数据

导入的外部数据最常见的来源有两种:文本和网站数据来源。

1)、文本数据是比较常见的数据来源,那么如何将文本文件导入Excel呢?

导入文本数据的具体操作:

数据→导入数据→选择数据文件(下一步)→设置数据分隔(下一步)→下一步→完成

2)、自动导入网站数据,方法如上。

2.2问卷调查录入

数值题:录入相应数值

单选题:录入时采用1234分别代表ABCD四个选项,录入对应数字即可。

多选题:方法如上类似

排序题:先用123456定义选项ABCDEF,然后按照顺序录入。

开放性文字题:首先归类编码换成多选题,如不能就对这类问题直接做定性分析。

上一篇 下一篇

猜你喜欢

热点阅读