《深入浅出数据分析》读书笔记2 检验理论
2016-02-26 本文已影响69人
一冠疯格
第二章 检验理论
人们在随机调查的说法不一定符合他们的实际做法。
更应该使用:比较法
统计与分析最基本的原理之一就是比较法,数据只有通过互相比较才会有有意义。
如果一组统计数据看起来很有意思,就要针对这份数据与其他统计数据的你叫情况,解释为什么会有这种作用。
观察研究法:被研究的人自行决定自己属于哪个群体的一种研究方法。
比较得越多,分析结果越正确,对于官观察研究尤其如此。
当开始怀疑因果关系的走向时,请进行反向思考。
混杂因素就是研究对象的个人差异,它们不是你试图进行比较的因素,最终会导致分析结果的敏感度变差。
为了控制观察研究混杂因素,有时候,将数据拆分为更小的数据块是个好想法。
下一步需要做实验,来指出那种策略最有效。
控制组:一组体现现状的处理对象,未经过任何新的处理。
好的实验总是有一个控制组(对照组),使分析师能够将检验情况与现状进行比较。
混杂因素照样会影响实验,为了进行有效比较,各个组必须相同,避免混杂因素。
随机选择相似组,从对象池中随机选择对象是避免混杂因素的极好办法。在将对象随机分配到各个组以后,最终结果是:可能成为混杂因素的那些因素最终在控制组合实验组中具有同票同权。
通过随机选择组成各个组的成员,组与组之前非常相似,因而具有可比性。
总结:如果比较法无法解释问题,就在除去混杂因素之后做实验,在局面混乱的情况下,要小心地观察调查数据,创建随机控制实验。