数据分析入门:谁说菜鸟不会数据分析
什么是数据分析?怎么样才是数据分析的思维?数据分析的流程有哪些?常用的数据方法又有哪些?工具呢?可以学习的网站有哪些?我觉得《谁说菜鸟不会数据分析(入门篇)》讲的很清楚,能够基本解决你想要了解的有关数据分析的基础知识,当然,如果你没有太多时间去详细完整地看完整本书,那以下内容会对你有比较大的帮助。这是我学习过程中的学习笔记,也是这本书知识点的概括和总结,希望对你有所帮助。
一、什么是数据分析?
提取有用信息、形成结论、发挥数据作用
1、分类和作用
探索性数据分析侧重于发现新的特征,验证性数据分析侧重于验证已有假设。
2、数据分析6步曲
数据处理包括:数据清洗、数据转化、数据提取、数据计算
撰写报告:结论、建议或解决方案
3、常用指标和术语
平均数、绝对数、相对数、百分比、百分点、频率、频数、比例、比率、倍数、番数、同比、环比
二、确定分析思路
1、数据分析方法论
数据分析方法论用来宏观地指导数据分析,更多的是指数据分析思路。
2、常用的数据分析方法论
营销方面的理论模型:4P、用户使用行为、STP理论、SWTO等
管理方面的理论模型:PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等
1)PEST分析方法
政治Political:政治体制、经济体制、财政政策、税收政策、产业政策、投资政策、国防开支等等
经济Economic:收入水平、消费偏好、就业情况、储蓄情况等等
技术Technological:新技术的发明和发展、技术更新速度、传播速度、专利情况等等
社会Social:受教育程度、文化水平、宗教信仰、风俗习惯、审美观点、价值观等等
2)5W2H分析方法
3)逻辑树分析方法
作用:理清思路、避免重复和无关的思考
原则:要素化:相同问题归纳为要素
框架化:各个要素构成框架,遵守不重不漏原则
关联化:保持必要的相互关系
4)4P营销理论
产品Product:满足需求的东西
价格Price:购买产品的价格,关系到企业利润、成本补偿、产品销售促销等。影响定价的三要素:需求、成本、竞争。
渠道Place:产品从生产到用户的流转环节。
促销Promotion:刺激用户消费,促进消费增长。促销的四大要素:广告、宣传推广、人员推销、销售促进。
2、用户行为理论
有使用行为轨迹:
网站分析指标体系:
3、总结
PEST主要用于行业分析
4P主要用于公司整体经营情况分析
逻辑树可用于业务问题专题分析
用户行为理论用户用户行为研究分析
5W2H可用于用户行为分析、业务问题等等
三、数据准备
1、二维数据传一维数据
2、文本数据导入EXCEL:数据-自文本
四、数据处理(EXCEL)
1、数据清洗
1)重复数据的处理
函数法:COUNTIF(range,criteria)
高级筛选
条件格式法
数据表透视法
2)删除重复数据
2、缺失数据处理
定位输入(Ctrl+G)
1)使用样本统计量的平均值代替缺失值
2)用统计模型计算出来的值去替代缺失值
3)删除缺失记录
4)保留,但在分析时排除
3、检查数据逻辑错误
1)IF函数
2)条件格式 OR AND
4、数据加工
1)抽取
字段分列:菜单法、LEFT/RIGHT函数
字段合并:CONCATENAT
字段匹配:VLOOKUP
2)数据计算
3)数据分组 VLOOKUP
4)数据转换
行列转换
数据转换
5)数据抽样 RAND
五、数据分析
1、数据分析方法
综合分析的5个步骤:
数据标准化:0-1标准化、Z标准化
权重确定方法:专家访谈法、德尔菲法、层次分析法、主成分分析法、因子分析法、回归分析法、目标优化矩阵表等
2、高级数据分析方法
3、数据透视表
百分比计算
环比、同比计算
数据分组计算
六、数据展现
1、图表
作用:表达形象化、突出重点体现专业化
常用:
数据间的关系:成分、排序、时间序列、频率分布、相关性、多冲数据比较
迷你图:插入-迷你图
平均线图、双坐标图、竖形折线图
瀑布图:用于财务分析,表示企业成本的构成、变化等
帕累托图:又叫排列图、主次图,按照发生频次的高低绘制的直方图
旋风图:对称条形图,可用于活动/行为前后的指标变化,具有因果关系指标之间的变化和联系
2、图表模板
图表-另存为模板
七、数据分析报告
数据分析报告种类:
专题分析报告:单一性、深入性
综合分析报告:全面性、联系性
日常数据通报:进度性、规范性、时效性
附录: