行业 | 如何找数据
作为一名情报学学生、一名在咨询边缘走了一段时间的小白,也算接触了不少工具和渠道,但一直觉得这些零零散散的渠道有点乱,量虽多,真正面对搜集任务时很多时候并不知道如何下手,下面是结合一门职问在线课程和自己的经历做的总结。
(一)确定所要搜集数据的目的
用来支撑何种研究目的?用来证明/证伪哪个观点?
示例:证明近五年来国内经济发展水平稳步上升、证明全面二孩政策发挥效应等
(二)将研究目的转化为具体维度的数据或指标
这一步应该是最难的,主要分为三种情况:
1. 使用直接指标:有直接相关的指标可以利用,例如反映经济发展水平的GDP。
2. 使用替代指标:没有直接相关的指标,但是可以使用替代指标,例如要说明X行业并购市场的活跃度,如果选择最直接相关的“并购资金规模”这个维度/指标,那这些数据是很难获取的,但可以使用“并购案例数目”来代替,也是能达到目的的。
3. 使用分解指标:例如要反映“X行业的市场潜力”,可以使用市场渗透率这一指标,进一步可分解为:市场渗透率=当前市场规模(供给端)/潜在市场规模(需求端),而潜在市场规模又可分解为客户数量 X 单一客户的平均业务规模,客户数量又可分解为目标客户数量 x 平均选择概率,这样一步一步将指标进行分解,搭建起框架,该用直接指标的直接用,不能用的找替代,继续分解,逐步解决。
(三)选择合适的渠道进行数据搜集
下面的分类仅供参考且列举不全、有些不合逻辑的地方(例如爬虫和搜索引擎应该算做是获得其他渠道数据的手段和方法,但很多时候可以当做直接渠道,如利用爬虫获取知乎上的一手数据,所以也就写进去了)
1. 总体把握:主体-数据-渠道
这种方式便于从主体切入进行结构化思考,例如从主体切入,最底层的公司、同业竞争者、上游供应商和下游消费者;中层行业;上层监管机构(如政府),这些主体产生了许多公开数据、内部数据非公开数据以及潜在可获得数据,一些监管机构、咨询公司、行业协会或券商等已经形成了很多二手数据可以参考,也可以通过访谈、问卷等获得一手数据。但这种思考方式只是方便我们从总体上一览数据搜集的方式,不是解决问题的有效分类方式。
2. 情景切入:情景-渠道
这种思考方式便于从具体情景切入,利于快速、结构化解决问题。其中,情景指的是要搜集哪些层级的数据,对应怎样的情景,例如搜集的是行业数据,如果是较成熟的行业,则可以从监管机构报告、行业协会报告等多个渠道获取;如果搜集的是公司数据,可以从公司年报、招股书或券商报告等渠道搜集。
下面是对上述渠道的一些简单罗列:
监管机构报告:主要是政府机构/事业单位等,包括通用层次的统计局以及特定领域的管辖机构,比如工商局、卫计委、食药监局、中国人民银行、银保监会、工业与信息化部、知识产权局等。这就需要我们对研究的行业或公司所处的监管体系有所了解。可参考 国内外有哪些比较权威的统计数据网站?
行业协会报告:对于一些很成熟的行业已经有了很多行业协会,这些协会也会经常发布报告,比如中国保险协会、中国银行业协会。这个也是需要我们对研究的行业或公司有全局的了解。
咨询公司报告(这里的咨询公司也包含一些市场调查公司,就不单列了):常见有MBB/德勤/罗兰贝格/埃森哲;尼尔森/益普索/艾瑞/易观智库等。平时可以参考咨询公司或市场调查公司的排名、分类及擅长领域,可以参考:(1)请问怎么找咨询公司的咨询报告?(2)咨询公司分为几种?
券商研究报告:通常可以借助慧博、乐晴智库等获取,在筛选时可以根据领域排名筛选券商和分析师。
专业数据库:例如Wind/同花顺/彭博等。这个需要我们平时注意积累,掌握研究领域常用的数据库。
公司年报与招股书:重点关注管理层经营分析、财务报表等,可参考 如何看年报?
此外,还有一些知名公司及其研究院(例如阿里研究院)、特定领域垂直网站(如雪晴网、巨潮资讯等)也会发布一些报告,可以参考,具体可见 在哪里能找到各行业的分析研究报告?
(四)进行数据的交叉检验double check
1. 为什么要做数据的double check?
(1)口径不一致。比如A咨询公司认为未婚者中年收入达到15w才算中产阶级,报告中所有的数据都是基于年收入15w以上来测算的,B公司认为要达到20w,所以虽然最后两所公司的报告都包含“未婚者中的中产阶级数量”这一指标,数据却是不一致的。
(2)估算方式不一致。咨询报告和券商研究报告中很多数据都是估算而来,由于方式和数据源选择不同,得出的结果可能会存在或大或小的差异。
(3)数据有效性问题。例如由于计算准则的变化,相关主体对之前公布的数据进行变更,因此需要以最新发布的版本为主。
2. 如何进行double check?发现不一致怎么办?
(1)横向多份对比:差距不大,按需选择;差距很大,检查是否是口径、数据源不同等
(2)纵向时间对比:多找几年的数据对比看趋势是否合理
(3)专家验证:通过专家访谈、cold call等方式验证