读书大数据

读书日记 46 数据之巅

2017-11-04  本文已影响39人  魔鬼的小牧师

数据之巅是作者凃子沛的著作,把美国历史和大数据这个概念结合起来写的一本书,书中有大量精彩的案例分析以助于我们理解什么是现代文明,什么是好的思维方式。

1971年美国福特汽车公司推出一款新的车型叫平托车,这款车耗油量小,车型小,卖的很便宜只有2000美元,是福特汽车公司为了对抗日本和德国车投放的一款车型,在汽车的所有指标数据中,不光是价格,客户满意度这样的数据很重要,更为重要的是交通事故率,平托车在这一指标中还算是交代的过去,但是平托车在油箱的设计上存在重大问题,一旦发生追尾事故,就会引发油箱爆炸导致车上乘客死亡。1972年在美国加利福尼亚的高速公路上就发生了这么一起事故,两个年轻人开车发生了追尾,一个人当场死亡,另一人大面积烧伤,那个重伤的年轻人就把福特汽车公司告上了法庭,这场官司旷日持久一直打了5年,在这期间,一个名叫道伊的记者写了一篇文章叫疯狂的平托,文章中说,福特公司知道平托车的缺陷,但是他们算过一笔账,如果每辆汽车增加一块16美元的挡板就可以预防这样的事故,但是成本会增加很多,通过对比成本和交通事故率所引发的赔偿等费用,公司决定不添加这块挡板,而是花钱去赔偿。最终引起了舆论的轩然大波,福特汽车公司虽然很有钱,花大价钱请了律师团,但最终还是难逃败诉的命运。

在这个案例中,很多人认为生命是无价的,万恶的资本家为了赚钱追求利润无视生命的价值,这是极为不道德的。但是经济学家弗里德曼是怎么看这个问题的?他说福特汽车公司到底应不应该装这个挡板?我不知道,我没有计算过,无论是谁都要计算过才能知道。此外,我们不能说生命是无价的,所以就无止境的提高汽车的安全性能,因为提高汽车的安全性能是有成本,有代价的,是必须的计算的,生命是不是无价的?在你的主观世界,道德感,价值观里可以认为生命是无价的,但是在现实里,我们也必须把它放到计算公式中。

实际上,汽车制造商要不要给汽车加一块挡板,表面上市制造商自己的决定,但是实际上是消费者自己的决定,提高汽车的安全性所需要的所有设施都会成为汽车的成本,都有消费者来承担。如果我们说生命是无价的,安全性是我们需要不惜任何代价都应该追求的东西,那么今天我们见到的那些汽车马路上跑的只有坦克车了。前几年中国的新闻报道了校车的安全问题,引发了舆论的广泛讨论,社会各界人士提出要制定安全标准,后来在实践中发现这事根本就进行不下去,因为安全标准写的太高了,确实有点接近坦克车的标准,因为如果标准写的不够高,将来出事故了就是你制定者的责任,但是这样的标准制定出来的校车,没有任何一所学校支付的起。

道德主义者会说人命无价,生命无价,你在小说或者道德制高点上这么说,也没有人敢反对,但是在真实世界中,在市场经济中,你必须给人命定价,在真实世界中,保护人命必须要付出代价,人类的资源有限,只能进行选择,比如一年的政府预算,你是拨给水利部修建大坝防止洪水侵吞人命,还是拨给医学家研究癌症,防止病魔杀死生命呢?在真实的世界里,只有计算成本收益,只有给人命定价才是可行的方案。他们说人命无价,回避给人命计价,最终所导致的结果必然是对人命的轻贱,比如好几年有这么一则新闻,在马路上出了交通事故,一个人骑摩托车撞死了狗,自己也死了。两家人家一家赔狗,一家赔人命,结果法院判决,狗一万四一条,人命只有一万九,因为狗命是客观标准的,是名贵品种就是一万四,而人命没有客观标准,大家都回避这个问题,最后也不知道根据什么标准计算出来一万九,这是何等荒唐的事情。

在很多人的脑子里很多事情是无法数据化的,比如上文提到的人命,但是在现代社会又必须要有一个标准的计算方法和数据来进行对话的前提,那么我们到底要不要数据呢?

数据的标准化计算和人类价值观念的冲突或许是人类社会的永恒难题。在数据之巅这本书中,有这样1个例子。在美国南北战争期间,南北双方对是否废除奴隶制吵得一塌糊涂最后还打起来了,在此期间,美国北方有一个统计数据,在北方每162个黑人就有1个黑人患有白痴或者精神病,而在南方则是1600个黑人中就有1个人患有同类疾病,所以有人得出结论,黑人一自由马上就发疯。这时候有一个精神病医生叫贾维斯,他认为这个数据肯定是错的,于是就去实地考察,最终发现是表格的设计出了问题及其容易把白人的精神病患填写到黑人的名下,所以才到这样的后果,这个案例说明了数据是会生长的,一个原本小小的错误经过放大,变成了如此大的一个谬误,还成为了南方政治家手中的利器。

杰斐逊在美国立国之初立下了一个规矩那就是工程的预算必须要各个相关部门进行成本收益的计算,后来争夺预算的各方都针对自己项目的成本收益进行计算,不断夸大自己的收益,缩小自己的成本以便于自己部门能够拿到预算,演化成了恶性竞争,数据各种不靠谱,最终美国各个部门各个利益集团发表了绿皮书那就是针对各个收益进行数据的标准化,绿皮书与1950年发表,虽然还是有很多漏洞,但是很大程度上是各方利益的平衡点,阻止了恶性竞争。数据本身是标准的,但是在现实中很多东西是无法量化和标准化的,只有引入竞争,引入一定规则,才能把数据逐步规范化,让数据逐步演化逐步完善。

美国建国之初经过博弈规定了一个黑人只能算作五分之三个白人,这是各方互相博弈达到的一个平衡点,很多人对此表示了愤怒,凭什么一个黑人只能算60%的白人呢?那没有办法,汉密尔顿说这个数据确实不好看,但是没有这个数据难道我们要在会议大厅里争论到老吗?有了这个数据我们才能携起手来共同建设这个国家,后来经过南北战争和马丁路德金的黑人平权运动最终美国黑人获得了平等的权利,但是如果当时没有这个数据,可能美国就会彻底分裂,所谓美利坚合众国也就不复存在了,正是这样一个非常不道德的数据把美国人联合在了一起,也正是这样的一个数字在美国人心里扎上了一根刺,最终通过战争和抗争为黑人争取到了平等的权利。

现代文明是建立在大数据,数据的基础之上的。数据文明的三大好处,第一,人和人之间可以进行对话,拥有一个对话的基础,有一个阶段性的结论。第二,数据文明可以使得人和人,尤其是陌生人之间的大规模协作成为可能。第三,数据是一个可以累进的文明。凃子沛先生这样说,数据不像有些人说的那样是什么资源,数据是土壤,数据的开放和透明,就像土壤上流淌的水,水流到哪里,哪里就会盛开文明之花。

上一篇 下一篇

猜你喜欢

热点阅读