统计学分析单位的偏差效应

2017-05-02  本文已影响6人  豌豆花下猫

即使我们对成功的衡量标准达成了某个共识,比如说学生的考试分数,仅此一项统计还是会有充裕的欺骗空间。举个例子,下面的两个陈述句都可以说是正确的,但看看你是否能够将这两者调和在一起。

政客甲(挑战者):“我们的教育水平正变得越来越糟!2013年有6成学校的考试成绩低于2012年。"

政客乙(在任者):“我们的教育水平正变得越来越好!2013年有8成学生的考试成绩高于2012年。”

给大家一点提示:并不是所有学校的学生人数都是一样的。如果我们回过头来再看这两句似乎相互矛盾的陈述,你会发现政客甲将学校当作其分析单位(“有6成学校……”),而政客乙则是将学生作为其分析单位(“有8成学生……”)。在统计学中,分析单位是作为比较或描述的对象而存在的——其中一位政客选择了学校的表现,而另一位政客选择了学生的表现。如果成绩上升的学生正好来自办学规模非常大的学校,那么大部分学生在学业上有所进步而大部分学校的成绩正在退步,这两者是完全有可能同时发生的。为了让这个例子更加直观,我们可以用美国各州的经济情况进行说明。 政客甲(平民主义者):“我们的经济一塌糊涂!2012年有30个州的收入都出现了下滑。”

政客乙(更接近精英派):“我们的经济走势一片光明。2012年有70%的美国人的收入都增加了。”

从这两句话中,我能读出的信息是:诸如纽约、加利福尼亚、得克萨斯、伊利诺伊等州的经济形势最好,而收入下滑的那30个州更有可能是规模比较小的州,如佛蒙特、北达科他、罗德岛等。由于各个州的面积大小不同,大部分州的经济下滑和大部分美国人的收入上升是完全有可能同时存在的。关键就在于分清分析单位,描述的对象到底是谁(或什么),以及不同的人口中的谁(或什么)是不是存在差异?刚刚举了两个虚构的例子,而接下来的这个例子是一个真实且至关重要的统计学问题:世界各地人民的收入不均衡因为全球化的到来是改善了,还是恶化了?一种理解是,全球化只是加剧了现有的收入不均状况,1980年时的富裕国家(以人均国内生产总值为参考)在之后的20年间的增长速度超过了贫困国家。富国会变得更富,这说明贸易、外包、外国投资以及其他全球化的组成部分沦为了发达国家扩大经济霸权的工具。

如果换一种分析单位,同样的数据也可以(也应该)以一种完全不同的方式来解读。我们不关心穷国,我们只关心穷人。恰巧世界上有绝对比例的穷人生活在中国和印度,这两个国家都是人口大国(人口数量均超过10亿),而且在1980年的时候这两个国家都处于相对贫穷的发展阶段。但是,在过去的几十年时间里,中国和印度的经济都经历了高速发展,这在很大程度上要归功于它们与世界上其他国家日益加深的经济一体化。《经济学人》这样评价中国和印度:“它们都是‘迅速的全球化者’。”考虑到我们的目的是改善人类本身的穷困,因而在衡量全球化给全世界穷人带来的影响时,将中国(13亿人口)和毛里求斯(130万人口)当成是比重相同的两个国家来看待是不合理的。

上述例子的分析对象应该是人,而不是国家。1980〜2000年这20年的时间到底发生了什么?回想一下刚刚那个虚构的学校例子。世界上的大部分穷人恰好都生活在两个大国里,而这两个大国在融入全球化的过程中都经历了经济的飞速发展。正确的分析得出了一个截然不同的结论:全球化有利于全世界的穷人。《经济学人》杂志指出:“如果你考虑的是人而不是国家,那么全球不平等现象正在迅速减少。”

——选自《赤裸裸的统计学》

上一篇 下一篇

猜你喜欢

热点阅读