多伦多封城日记2020-04-08星期三阴转晴:数字也会说谎
昨天教了“事实”与“观点”这一对概念,今天没有课,老师给了本书让自己念,念完以后要分辨一下书里面哪些是“事实”哪些是“观点”。小姑娘跟她妈妈一起翻看,突然她妈妈问我:“这句话说‘俄罗斯是著名的红菜汤的故乡’。红菜汤著名这算是事实还是观点呀?”
“这应该算是事实。”我说。
“爸爸说这是事实。”妈妈告诉小姑娘。
说完以后我心里一愣,“著名”究竟是“事实”还是“观点”呢?跟很多事情一样,定量的描述显得黑白分明,定性的形容却往往叫人吃不准。如果有一个客观的标准,比如做一个抽样调查,50%以上的人知道红菜汤则为“著名”,那么“事实”就比较容易判断。可是在实际生活中我们不可能处处都有数据为证,也不会时时都有为所有人接受的标准。
越是没有数据,我们就越是迷信数据,但凡有人给出数据就少有人敢于质疑。其实今时今日用数据来佐证“观点”,让“观点”听起来像是“事实”,很多时候只是一种论证技巧,其可信度就跟古典小说里面的“有诗为证”差不多。小时候读《三国》《水浒》,经常看见“有诗为证”这样的说法,完全不能理解一首诗怎么可以作为证据。鲁迅在《中国小说史略》里面粗略考证过这个问题,认为这个传统始于诗歌极盛的唐代,大家普遍尊重诗人认为能够写成诗的都不会是信口开河。后世有文学史学者专门就“有诗为证”写过一本书,详细梳理这个传统的来龙去脉。总而言之,古代人识文断字的不多,一听诗都这么写,那就错不了。现代人虽然都学过加减乘除,但许多人并不真正了解统计数字背后的逻辑,只是理所当然地对数字抱有一种近乎迷信的崇拜。尤其是如今,技术的发展让媒体可以十分便捷地将枯燥的数字“图形化”,就更加容易把“观点”包装成“事实”的样子。
今天看到这样一组数据,美国南方路易斯安那州公共卫生部门发布的新冠病毒死亡人数统计,在目前死亡的652人中70.5%是黑人,28.6%是白人,亚裔只占0.9%。媒体哗然,为黑人在新冠病毒面前的脆弱感到费解,甚至有政客将问题进行政治化解读,认为新冠检测多数由私人医生进行,而黑人能够获得的医疗资源相对匮乏,造成了他们过高的死亡率,呼吁改变应对疫情的公共政策。
路易斯安那州新冠死亡人数中各族裔所占比例 (USA Today据州卫生部数据制图)但是,数据并不总是代表“事实”,或者说不一定是“事实”的全部。如果我们把各族裔在死亡人数中的占比除以各族裔在该州的人口比例,得出一个指数,就会发现以上数据至少有两点片面之处。第一,按人口比例来看,黑人在新冠中的死亡率之高,比单看死亡人数比例显得更为突出。第二,亚裔的死亡比例指数(0.53)跟白人(0.46)基本持平甚至略高,这与前面一组数据给人的印象完全不同。
路易斯安那州各族裔新冠死亡率指数(作者据USA Today数据制图)这还不是最主要的问题。这两组数据都只看了死亡率与族裔之间的关系,很容易让人形成一个“观点”认为族裔是影响新冠死亡率最重要甚至唯一的因素。一家主流媒体在报道这些数据时指出,非洲裔美国人应该知道他们是高风险人群。但是,为什么族裔之间会有这么大的区别呢?
路易斯安那州新冠死亡病人所患基础病 (USA Today据州卫生部数据制图)另外一组数据则为我们展现了一幅截然不同的画面。跟我们从各个国家的疫情报道中得知的一样,新冠患者中不治身亡的大多数都患有各种基础病。在路易斯安那州,新冠死亡者中66.4%有高血压,43.5%有糖尿病。州卫生部2017年的调查数据中没有高血压的数字,但黑人比白人患糖尿病的比例要高出许多,其他基础疾病也有不同程度的差异。如果我们以这组数据为出发点,得出的“观点”就不再是黑人是新冠疫情高危人群,而应该改成高血压、糖尿病患者是高危人群。
路易斯安那的数字只是一个小例子。在新冠疫情这段时间,各种数据让人眼花缭乱,很容易根据这些数据得出似是而非的“观点”。比如,“事实”告诉我们,1440万人口的安省每日新增确诊人数比840万人口的魁省要少很多。据此数据,我们可以得到“观点”,魁省的疫情远比安省严重。
魁省(红色)和安省(蓝色)每日确诊人数(CBCNews)但是,另外一个“事实”是魁省接受测试的人数占总人口的比例是安省的两倍。似乎我们又可以得出一个相反的“观点”,安省如果把测试数量提升到与魁省相当的水平,确诊人数也会随之翻倍,反超魁省。
真的这样吗?事情并不那么简单,数字还可以再次反转。安省测试结果15%为阳性,而魁省只有9%。为什么呢?因为测试并不是随机进行的,在测试之前医疗系统已经对谁需要接受测试进行了初步筛查,只有被认为危险性比较高的人才会接受测试。也就是说,如果增加受试人数,确诊人数可能会增加但一定不会按比例增加。如果把安省的测试数量增加一倍,结果也许不是确诊人数翻番,而完全有可能是测试为阳性的比例从15%降低到跟魁省差不多的水平。
这就是数字带给我们的错觉。
还有一种错觉是我们总是希望每件事都有一个合理的解释,这样大家都可以“抄作业”,但有些时候未必如此。加拿大西部的BC省由于地理上更加靠近亚洲,与中国的往来更加频繁,疫情几乎与中国同步出现,是加拿大最早爆出新冠病例的省。但是随着疫情全面爆发,BC省的曲线却异乎寻常地平缓,疫情控制大大好于安省和魁省。同是加拿大,联邦卫生官员给出的防疫指导意见同样是保持社交距离、勤洗手、无需戴口罩(直到这两天才改口),为什么会有这么大的差异呢?
媒体和公众对此都非常关心,希望找到一个明确的答案,毕竟同是加拿大,BC的作业借给其他省抄一下应该不难。BC的卫生官员在媒体的追问下分析了各种可能的原因,最后得出一个“观点”——运气。与魁省相比,BC占了一个时间上的优势。3月16日开始的两周是BC大部分中小学的春假,魁省则是3月2日这周。春假不只是学校放假,也是许多家庭合家出行旅游的时间。3月初加拿大人还普遍认为只有中国、韩国、伊朗是主疫区,其他国家安全,对国际旅行并不忌讳。春假之后魁省从美国、法国旅行回来的人流开启了疫情爆炸式增长,而这个时候BC的春假还没开始。加拿大和各省的卫生官员都捕捉到了国际旅行与疫情之间的密切关系,在3月13日春假开始之前发布了旅行警告,要求大家尽可能取消一切非必要国际旅行,这很可能对BC的疫情控制起到了一定的作用。但是这却无法解释安省与BC的差距。安省的春假也是从3月16日开始,也是在3月13日发布了旅行警告,却似乎没有收到同样的效果。记者和专家努力寻找“事实”,从BC卫生官员的个人履历到省级公共卫生体系,但这些“事实”却很难构成一个有力的链条去推导出任何有说服力的“观点”。
好在BC的卫生官员没有努力给自己脸上贴金,非要总结出经验来上光荣榜,没有经验就是没有经验,虽然没有“作业”借给兄弟省,但也避免了抄错作业的后果。
我的第一本书已经在亚马逊上架,详情点击阅读《写给女儿的书》。
点击此处链接使用美国亚马逊账号购买纸质书和Kindle版电子书。
点击此处链接了解如何在Google Play购买电子书。