蔡蔡 第九章 《肠卜术与科学研究》

2020-12-09  本文已影响0人  2022的菜花

肠卜术  古罗马的占卜师(祭司、僧侣),每每在宰杀所祭祀的牲畜后,查看其内脏、肠胃的情形,以推断吉凶祸福的一种占卜术。

肠卜术实验取得成功的的可能性非常小,但肠卜僧多,剖开的牲畜更多,所以即使预测正确的可能性极低,但仍旧会有预测准了的。假设预测成功了的,可以提交给《国际肠卜僧杂志》发表。那么,这些预测成功了的,合在一起,也足以让人们相信肠卜术是有效的。但这里有2个问题,一是没有预测成功的,不会出现在杂志上,哪怕数量远远超过预测准确了的。二是预测准确了的,经不起重复验证。

一些科学家传递出一个信息,在科学界,“肠卜术”也是存在的。希腊人约翰.约安尼迪斯在2005年发表了一篇“公开发表的研究成果大多不真实的原因何在”的论文。他认为,得到发表的医学成果大多是不真实的。

基因对精神分裂症的影响数据

以基因对精神分裂症的影响为例。对10万种基因进行检验,大约10种对精神分裂产生影响,可能就会有5个基因被认为不具有统计学显著性而排出在外,随机通过检验的会是5000个基因。实验者就会发表文章称这5000个基因对精神分裂症有影响,但实际真正通过检验有影响的,只有5个。

赢家诅咒与文件柜问题

赢家诅咒    有的实验结果具有统计学显著性,但不可信,禁不起重复实验。而重复实验危机反应出一个事实:科学研究的道路上困难重重,我们的大多数观点都是错误的,即使在第一轮检验中侥幸胜出的观点也大多是错误的。

文件柜问题  由于大众传播受到统计学显著性临界值的影响,导致某个科学领域对某个假设的证据形成了严重歪曲的观点。

理论上P值 实际P值

p值操控  P值小于0.05的论文可以发表,当P值大于0.05,但又接近0.05时,可能就会出现人为的操控数据,让p值低于0.05。科学家把这种做法描述成:“对数据进行严刑拷打,直到他们招供才罢手”。因此,所谓的具有统计学显著性的实验结果,也可能是通过操控数据去迎合自己的预期。

显著性检验是调查员,不是审判员

把“P<0.05”等同于“对”,以及把“P大于0.05”等同于错,这是不对的。一个常用的简单办法,就是在显著性检验的基础上报告“置信区间”。置信区间指的是一系列顺利通过归为不可能法检验的假设与我们实际观察的结果之间一致程度的合理范围。

费舍尔赞同显著性检验和发现真理不是一回事儿,提出“科学事实被判定为经受住了实验的检验,必须满足一个前提条件:只要实验设计合理,每次得到的实验结果几乎都能表现出一定程度的显著性。”

上一篇下一篇

猜你喜欢

热点阅读