警惕陷入大数据的混沌
现在有一种现象,开口闭口都谈大数据,似乎没有数据支撑,罗列出N个变量和因素,不用数据说话,就不客观、不科学、不可信。
的确,大数据给我们认识、决策事物提供了明确的依据,避免了拍脑袋、凭感觉、靠经验的错误。但大数据也可能把真正核心的变量淹没在无穷的变量之中,使我们抓不住重点,再次陷入数据的混沌之中。
某种意义上说,大数据是科学的。但科学也有他的适用边界,并不能包治百病,适应所有领域。
正是从这个角度出发,世界著名的媒体文化研究者和批评家尼尔·波兹曼才苦口婆心地劝告我们说:历史、人类学、社会学这些东西,要回归人文学科的本质,少一点统计,少一点数字,反而更好。
今天读顾衡好书榜解读戴蒙德的《剧变》,脑洞被进一步打开。
作者戴蒙德在《剧变》中罗列了12个变量,用于解释七个国家是怎么陷入危机,又是如何在危机中做出选择的。
贾雷德·戴蒙德是当代少数几位探究人类社会与文明的思想家之一。写了不少有影响力的著作。在中国影响比较大的是《枪炮、病菌和钢铁》和《崩溃》两本书。
《枪炮、病菌和钢铁》讲的是各民族不同的命运,是由环境决定的。用他自己的话说就是“不同民族的历史遵循不同的道路前进,其原因是民族环境的差异,而不是民族自身在生物学上的差异”。
《崩溃》讲的则是,走向崩溃的文明社会都有一个共同的原因,就是环境资源的枯竭。
两本书都观点明确,只抓住一个关键变量讨论问题。
而《剧变》中作者一改以往的风格,罗列了12个变量,看似面面俱到,客观全面,却给人一种不得要领捣浆糊的感觉。
顾衡老师对这一点提出了不客气的批评。认为参数的无限增加并不是逼近真相的有效途径。讨论复杂问题,简化是必要的前提。
从这个观点出发,我看到现在一些企业管理的弊端。
制度越多越好,数据越全越好,考核指标越细越好。一些绩效管理的公式设置的参数之多,计算方法之繁琐,只有计算的人知道。
这样做的结果,不仅大大增加了管理成本,还容易忽略核心要素,与管理目标和初衷南辕北辙,陷入指标数据的陷阱。
删繁化简是一种高超的管理能力;直达问题本质,用一个措施、办法解决问题,比设定多个变量更有效。被大数据绑架,把大数据奉为圭臬,往往会使人陷入看似清晰的混沌。
我想起了“三大纪律,八项注意”,一页纸不到,就把初建的人民军队的纪律规范起来。想起“打土豪、分田地”一个口号,就把中国农民动员起来。这是何等的有力高效。
我这里绝不是反对大数据,而是强调使用大数据的边际条件适用范围,同时评估采集统计大数据的成本,如果不需要大数据就可以做好决策评估,也没有必要多此一举。
非常赞成顾衡老师的的观点:历史过于复杂,变量太多,所以要想面面俱到的话,那除了口水话片汤话,你什么都说不了。简化就成了有效讨论的前提。