简单统计学-读书笔记
本书的目的是帮助我们院里错误,通过本书,我们将学到一些简单的指导准则,用于识别其他人或者你自己说出的不靠谱的观点。
模式、模式、模式
章鱼保罗的故事,一只章鱼(章鱼是最聪明的无脊椎动物)成功预测了7场2010年世界杯比赛的获胜者。
章鱼真的可以预测未来吗?
事实并非如此,作者从多个角度来解释的这其中的“黑幕”,比如只公布预测成功的消息,而失败的并没有被报道出来;
我们通常倾向于寻找模式并且相信我们所观察到的模式是有意义的。
不再神奇的超级畅销书
当数据涉及人们的选择时,就会出现“自选择偏差”,在这种情况下,对于做出不同选择的人进行比较的做法是靠不住的。
在我们通过观察人们的行为而收集的“观测性数据”中,自选择偏差非常普遍。人们可以选择自己的行为,因此他们的选择也反映了自身的特点。要想避免这种自选择性偏差,可以进行对照实验,即将人们随机分配到不同的小组里,然后告诉他们应该怎样做。

根据这个例子,如果把警察都解雇掉,难道投票率会提升??
这也是一个谬误,首先这个人群就是筛选出来的,这个样本无法代表整体,这个例子中涉及2个问题,一个是否投票,一个是否犯罪,也许是不投票的人更容易犯罪。
自选择性的观测数据,也类似与有偏差的样本,也就是样本数据是经过筛选的,而不是随机的。
幸存者偏差
回溯性研究往往存在幸存者偏差,当我们选择现在的样本并回顾过去时,我们只能看到幸存者。老年人的历史医疗记录中排除了没有活到老的个体,公司财务历史记录中排除了已经破产的公司。

观测性研究,同样存在幸存者偏差。
作者提到了一个观点,就是一本畅销书《从优秀到卓越》,这本书我是听过的,但是这本书同样存在一个致命的问题:幸存者偏差,这是一项存在幸存者偏差的回溯性研究。
我们会自然地根据我们看到的现象得出结论。我们还应该考虑我们没有看到的事情。为了避免幸存者偏差,我们应当从过去开始,并向未来展望。
被误传的谋杀之都
安慰剂效应
只有通过对照实验得出的结论,才具有参考意义,单凭一组实验数据,很容易被“安慰剂效应”影响,得出错误结论
当基数很小时,一个统计以外可能会产生巨大的影响。
当任何两样事物随时间增长时,它们之间可能没有任何因果关系,但他们仍然具有统计相关性。
新的经济学上帝
图像可以帮助我们解释数据,作出判断,发现倾向、模式、趋势和关系;
一张图片的价值可能胜过千言万语;
但图像可能有意无意地扭曲或破坏数据。
关于图形的一些迷惑性

不仔细看的话,的确可以得出这个结论,但是仔细分析下这个图表,会发现,他的横坐标时间轴,前几个值都是10年未单位,而最近的只有4年,用四年和十年对比??
坐标轴的起始点,每一个单位代表的意义,都存在被恶意修改的可能
- 调整坐标轴的起始点,通常是纵坐标不从零开始,这就放大了数据的波动性
- 隐藏纵坐标的数字,更容易迷惑读者
- 时间轴的单位,比如同一个单位,有的代表1年,有的代表10年,就是影响数据的观察
- 隐藏某些时间段,来放大影响
- 使用双轴,叠加上述其他的操作,来增强对比
- 切换横纵坐标,这个手法,很厉害

将时间轴,放在纵轴上,结论就发生了逆转
图像可以揭示某种模式,比如收入随时间的变化以及收入与支出的相互关系。图像也会扭曲数据,误导读者。
几个有意思的悖论:
三门问题
二孩问题
辛普森悖论
当聚合数据被分解时,其中的模式发生逆转的现象
要想注意到可能的辛普森悖论,关键是考虑是否存在被忽略的混杂因素
这是一个悖论,不是一个错误,只是说,我们在看数据的时候,需要注意到其中的混杂因素
