《数据思维课》学习笔记之六
现在进入了第二模块,如何收集数据。第一讲是为什么不同的数据要区别对待?
数据的核心,是一个“量”,它只能是一个数字,有些表面看起来不是数字的数据,要通过编码的方式转化为数字。比如性别婚否,已婚可以用1,未婚可以用2,离异可以用3等来表示。
数据要成组使用才有意义。比如告诉你老杨今年40岁了,本身没有什么实际意义。如果告诉你一组数据,不但包括老杨,还包括他的十五个同事的年龄,这一组年龄,就组成了年龄变量,有了具体含义。通过对这一组数据的分析,可以得到平均年龄,中位年龄等信息,进而能知道这一群同事的年龄分布状况。
年龄是一方面,性别,体重,民族,爱好等又分别可以组成不同的数据组别,这样就可以得到许多的产量。把这些变量放在excel表格里面,就完成了一次收集数据的过程。
数据本身是有差异的。数据种类,按照作者介绍,大致分为类别数据、次序数据、间隔数据、比例数据四种。并且用了非常形象的比喻做了说明。唐僧属于非此即彼的认知特点,对就是对,错就是错,这就是类别数据。沙和尚很讲究次序,遇到事情先问唐僧,唐僧不在找悟空,悟空也不在就找八戒,这个做法就是遵循了次序数据的原则。猪八戒有一个九齿钉耙,并列存在,但是间隔排列,这就是间隔数据。孙悟空的金箍棒,可长可短,伸缩自如,可以象征比例数据。
说实话,对这四种数据,我还是不太理解,或者说理解的不透彻。尤其是间隔数据与比例数据,有些区分不开。这一点需要引起自己注意,以后要慢慢搞清楚。
数据不同,代表的含义不同,所以对待的方式也不同。这四种数据有一个特点,单向兼容,比例数据可以转化为间隔数据,但是反过来不行。
第二讲,如何定量的把握一个事物?
定量把握,需要进行测量,而测量,就是得到一个指标体系的过程。
测量要注意三个方面,一是关联性。想知道年龄结构,却去关注体重指标,肯定是没道理的。二是结构性。测量得到的数据,必须能够有效说明想要测量的事物,这样才能保证测量的有效性。三是完备性。认识一个事物,需要许多指标,只有多一个没用,少一个就不能说明问题,这才是最佳的选择。当然,宁多勿少,多了不过是麻烦,浪费,少了,就白干了。
测量前的准备工作极其重要,就是去确定各需要测量的指标。有些事物很难一下子搞清楚,需要用纬度拆分的方式来进行。一层不行就两层,直到能把事情说清楚位置。
比如测量顾客满意度,可以拆分为回头率,投诉率等。
需要注意的原则有两个,一是边际效益最大化,一是有效。其实,最重要的因素,仍然是具体实施测量的人。人不同,对事物的认识不同,那么拆分的纬度就不同,测量手段,测量过程,测量结果也就都不一样了。
要想能够尽可能精准的测量,加强对事物的认识,把握事物本质,才是测量精准的核心。
数据思维,不过是一个工具。要知道,三岁孩子,给他一门大炮也伤不了人呢。