数据分析第二天入门学习
第二章 结构为王--确定分析思路
数据分析方法论主要从宏观角度指导如何数据分析,数据分析的前期规划,指导着后期数据分析工作的开展。
数据分析法则是指具体的分析方法,如交叉分析、相关分析等,是微观角度指导如何进行数据分析。
如何用数据分析方法论指导我们确定分析思路,进而确定需要分析的内容或指标。
常用的数据分析方法论
1、PEST分析法 用于对宏观环境的分析。行业分析
政治环境(political) 一个国家的社会制度,执政党的性质,政府的方针、政策、法令等。构成政治环境的关键指标有:政治体制、经济体制、财政政策、税收政策、产业政策、投资政策、专利数量、国防开支水平、政府补贴水平、民众对政治的参与度等。
经济环境(economic) 宏观经济环境主要指一个国家的国民收入、国民生产总值及其变化情况,以及通过这些指标反映的国民经济发展水平和发展速度。微观经济环境主要指企业所在地区或所服务地区的消费者的收入水平、消费偏好、储蓄情况、就业程度等因素,这些因素直接决定着企业目前及未来的市场大小。关键指标有:GDP及增长率、进出口总额及增长率、利率、汇率、通货膨胀率、消费价格指数、居民可支配收入、失业率、劳动生产率等。
社会(social) 关键指标有:人口规模、性别比例、年龄结构、出生率、死亡率、种族结构、妇女生育率、生活方式、购买习惯、教育状况、城市特点、宗教信仰状况等因素。
技术(technological) 除了要考察与企业所处领域直接相关的技术手段的发展变化外,还应及时了解:国家对科技开发的投资和支持重点,该领域技术发展动态和研究开发费用总额,技术转移和技术商品化速度、专利及其保护情况。
2、5W2H分析法 从回答中发现解决问题的线索,何因(why)、何事(what)、何人(who)、何时(when)、何地(where)、如何做(how)、何价(how much)
3、逻辑树分析法 又称问题树、演绎树或分解树 ,最常使用的工具之一,它是将问题的所有子问题分层罗列,从最高层开始,并逐步向下扩展。遵循三个原则:要素化 把相同问题总结归纳成要素
框架化 把各个要素组织成框架,遵守不重不漏的原则
关联化 框架内的各要素保持必要的相互关系,简单而不孤立
缺点,涉及的相关问题可能有遗漏,应用头脑风暴。业务问题专题分析
4、4P营销理论 产品(product),产品是指能够提供给市场,被人们使用并消费并满足人们某种需要的任何东西,包括有形产品、服务、人员、组织、观念或它们的组合
价格(price)顾客购买产品时的价格,包括基本价格、折扣价格、支付期限等。价格关系到企业的利润、成本补偿,以及是否有利于产品销售、促销等。影响定价的三大因素:需求、成本与竞争,最高价格取决于市场需求,最低价格取决于该产品的成本费用,在最高价格和最低价格的幅度内,企业能把这种产品价格定多高取决于竞争者的同种产品的价格。
渠道(place)产品从生产企业流转到用户手上的全过程中所经历的各个环节。
促销(promotion)广告、宣传推广、人员推销、销售促进是一个机构促销组合的四大要素。
公司的整体运营情况,可以采用4P理论。
5、用户行为理论 认知-熟悉-试用-使用-忠诚
还有金字塔法、生命周期理论法。
相互嵌套使用,第一层逻辑树,第二层4P或者5W2H。
第四章 三心二意--数据处理
信心 信心指未看见任何未来时,你依然怀抱希望,坚持下去。唯有相信,才有可能。
细心 1%的错误=100%的失败,1个数字能影响一个结果,一个结果能影响一个决策,一个错误的决策能毁掉一个公司!数据分析师要对差异非常敏感,一个异常值可能就是问题的症结所在。
平常心 处理数据要有一颗平常心--平淡、平等、平静对待问题。只要数据、事实和规律,其他都是浮云。
诚意 诚实、尊重事实,数据分析若失去了真实可信的本质,就等于丧失了其尊严和价值。
合意 满足需求方(领导、运营部门)的分析目的与需求。与需求方经常沟通与反馈,不要闭门造车。
数据抽取 =VLOOKUP(B2,'[新建 Microsoft Excel 工作表.xlsx]Sheet3'!$B$2:$D$4,3,FALSE)
数据分组 =VLOOKUP(B9,E:F,2)
多项选择题的两种录入方式:二分法,各种选项用0和1表示是否被选择。录入的时候比较繁琐,效率低下,而且容易出现错误,但是在数据分析的时候相对简单,一般数据分析采用二分法录入的数据。
多重分类法:录入速度快,直接录入选项的代码,省人工成本,缺点是只能在SPSS里分析。
可以通过HLOOKUP和SEARCH转换。
=IF(ISNUMBER(HLOOKUP(1,A2:C4,1,0)),1,0)
=IF(ISNUMBER(SEARCH("1",A6)),1,0)