数据产品入门

3、大数据测试

2020-07-01  本文已影响0人  猪儿打滚

前言

在个人看来,大数据测试可以归为一个测试体系。因为它不仅要验证正常的业务功能,还要针对大数据所使用的工具/框架进行测试,这需要大数据测试人员掌握大数据技术,比如说Hadoop生态圈的技术:Hadoop生态圈技术栈

大数据是什么

大数据是指那些数据量特别大、数据类别特别复杂的数据集,这种数据集不能用传统的数据库进行转存、管理和处理。

大数据测试策略

1、基本功能测试

不管是什么样的测试,首先要保证的就是基本功能的正确性。从黑盒层面来看,大数据测试可以看成三个步骤:


大数据黑盒视图

1、原始数据->大数据处理
这里要测试的是原始数据的正确性,比如数据来源是埋点,那么就需要保证埋点上报的正确性,也就是对埋点进行测试。
测试文档可以是埋点测试文档
2、大数据处理
这里要测试的是大数据对原始数据处理的正确性,大数据对原始数据处理完后,会把处理后的数据保存在一个/多个数据仓库中(比如es),这时候可以通过查询数据仓库的数据来进行。
测试文档可以是详细设计文档
3、前端展示
前端展示的数据,有两个可能性:
a.展示的数据直接来源于大数据(比如clickhouse)
b.展示的数据是经过后端处理的
所以这里的测试,是需要根据具体的业务和实际的技术方案来进行
测试文档可以是需求文档

2、大数据处理步骤的测试

步骤图示

从上图可以看出,大数据处理步骤大体上可以分成三个步骤:

这些过程中,可以通过Hive得到分析报告来做进一步的验证。

hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。

PS.上面2和3,摘自http://www.mamicode.com/info-detail-2156972.html

上一篇下一篇

猜你喜欢

热点阅读