1. 报告自动化的前提
2018-07-26 本文已影响28人
数据成长之路
请确定已经阅读此系列教程的说明
教程已上传Github
系列教程还可以在报告自动化专栏中进行阅读。
总体说明
对报告进行自动化是对一篇成熟的数据分析报告的提升,而数据分析报告已经成熟时对报告进行自动化的充要条件。
一篇成熟的数据分析报告有如下要求:
-
稳定的数据获取来源
- 使用爬虫或者调用API获取数据
- 对缺失数据有成熟的补全或者筛选方式
-
确定的数据分析方法
- 允许基于不同的情况进行不同的数据分析思路,但是所有分析思路必须是一个有限集,自动化报告是没有创造性的
-
较为固定的分析描述语言
- 把数据结果使用自然语言描述出来,使用较为固定的句式方便与自动化处理
- 对于信息整合有较为固定的逻辑,方便自动化写出报告总结
适合进行自动化的报告,必然是自动化之后可以节约大量的人力和脑力成本,提升报告产出效率的,且这样的报告会出现如下特征:
- 相同的分析方法对不同的数据多次重复性使用
- 同样式的图表对不同的数据需要重复作图
- 同样的分析描述需要每篇报告再写一遍
.....
重点在于,明明已经设计好了分析思路却需要进行一遍遍单调枯燥的数据分析,被日常性工作消耗了大量时间精力。
完成报告自动化之后的成果:
- 只需要手动写出需要人工分析的少部分内容
- 报告主体部分一键自动化生产
- 报告可以进行模块化生产,提升整个报告生产流程的效率
此框架的相关知识积累书目:
以下为作者写此报告制作框架前与此框架相关的知识积累,具体内容可在Github中提供部分pdf文档
- Pro Python
- Mastering Python Design Patterns
- SICP:计算机程序的构造和解释中文版
- 利用python进行数据分析
- Numpy, Pandas, Matplotlib库官方文档
- W3School的HTML和CSS教程