【数据分析】第二步:数据收集
数据分析必须要有数据,从明确分析目的和思路、到数据收集、再到数据处理、之后的数据分析都离不开数据。
在我们做数据收集时:
首先要理解数据;
其次要清楚数据的来源。
一、数据理解
对数据的理解,能够帮助我们清晰地认识到数据分析对数据有什么要求。
1.1、字段与记录
数据由字段与记录共同组合而成。从数据分析的角度来理解字段和记录的概念:
☞字段是事物或现象的某种特征。例如学生成绩表中的姓名,学号,语文,数学,英语等都是字段。在统计学中称为变量。
☞记录是事物或现象某种特征的具体表现。例如学生成绩表中的。比如学生成绩表中姓名可以是张三或李四。记录也称为数据或变量值。
1.2、数据类型
数据类型分为:字符型数据和数值型数据。常见的数据类型有:数值、文本、日期、货币、会计专用、时间、百分比、分数、科学计数、特殊等
☞字符型数据不具有计算能力的文字数据类型。它包括中文字符,英文字符,数字字符(非数值型)等字符。
☞数值型数据是直接使用自然数或度量单位进行计量的数值数据。对于数值型数据,可以直接用算术方法进行汇总和分析。
1.3、数据表
数据表由字段、记录和数据类型构成。
数据表的设计是否合理,关系着后期数据分析的效率及深度。
数据表设计有如下6条要求:
1)、数据表由标题行和数据部分组成
2)、第一行是表的列标题(字段名),列标题不能重复
3)、第二行起是数据部分,数据部分的每一行数据称为一个记录,并且数据部分不允许出现空白行和空白列
4)、数据表中不能有合并单元格存在
5)、数据表与其他数据之间应该留出至少一个空白行和一个空白列
6)、数据表需要以一维的形式存储,但是在实际操作中接触的数据往往是以二维表格的形式存在等,此时应将二维表转化为一维表的形式存储数据。
什么是一维表,什么是二维表?
一维表的第一行列标题都是字符型字段。
二维表的第一行列标题包含是数值型字段。
如何将二维表转化为一维表?
在使用Excel转换过程中,我们要用到数据透视表中的“数据透视表和数据透视图向导”功能。操作步骤如下

二、数据来源
获取数据的方式可以分为两种:导入外部数据和自己录入数据。
2.1导入数据
导入的外部数据最常见的来源有两种:文本和网站数据来源。
1)、文本数据是比较常见的数据来源,那么如何将文本文件导入Excel呢?
导入文本数据的具体操作:
数据→导入数据→选择数据文件(下一步)→设置数据分隔(下一步)→下一步→完成
2)、自动导入网站数据,方法如上。
2.2问卷调查录入
数值题:录入相应数值
单选题:录入时采用1234分别代表ABCD四个选项,录入对应数字即可。
多选题:方法如上类似
排序题:先用123456定义选项ABCDEF,然后按照顺序录入。
开放性文字题:首先归类编码换成多选题,如不能就对这类问题直接做定性分析。