魅力大数据——预见未知
读《周易》的时候,有一句话博大精深:
生生之谓易,成象之谓乾,效法之谓坤,极数知来之谓占,通变之谓事,阴阳不测之谓神。(《系辞·上·第五章》)
什么意思呢?
借用古人对古人的注疏说一说吧。
晋代韩康伯在《周易注》解释说:神也者,变化之极,妙万物而为言,不可以形诘者也,故曰“阴阳不测”。白话翻译一下:所谓的“神”,并不是鬼怪,也并非神仙,而是一种玄之又玄的东西的称谓,无法形容,无法预测,由于不知道怎么称呼它,只好称之为“神”。
重点是“不测”——不可预测、不可预知。
人生来对不可知的事物心怀敬畏,同时又跃跃欲试,于是就有了历史学家的“野心”。要论第一人,应当是写出被后世称为“史家之绝唱,无韵之离骚”的《史记》的司马迁,汉武帝时期的太史公,距离二十一世纪的我们已然两千多年了。在早早的两千多年前,他就暗存了一个“野心”,给自己定了一条使命:“究天人之际,通古今之变,成一家之言。”多么荡气回肠!多么惊天辟地!
他要解决的是什么?
以历史镜鉴未来。
换句说,就是预见未知。
在史学界,他几乎做到了。
回归我要说的主题:生活在一个信息爆炸的时代,大数据这一资源,足可以帮助我们发现规律、探索不明,甚至预见未知。
太史公司马迁(图片来自网络)追溯历史,古人一直把通过测量世界来征服世界视为最大的成就。例如,在十三世纪中期的欧洲,天文学家和学者对时间、空间的研究采取了比以往更为精确的量化方式,用历史学家阿尔弗雷德-克罗斯比(Alfred Crosby)的话来说就是“测量现实”。后来,测量方法逐渐被运用到科学观察、解释方法中,体现为一种进行量化研究、记录,并呈现可重复结果的能力。罗德-凯文(LordKelvin)曾说过:“测量就是认知。”培根也曾说过:“知识就是力量。”(节选摘自《大数据时代》)
在那个时代,很多人都隐隐发现了、感觉到了数据的潜在力量。很多数学家以及后来的精算师和会计师也投入到这一领域的探索中,进一步发展了可以准确收集、记录和管理数据的方法。
到了今天,数据思维的概念正在广泛渗入人们的头脑中,转化为工具、方法,应用到各行各业。举一个欧洲智能电网的例子:在德国,太阳能电网被安装到很多家庭。除了卖电给用户,还可以回收多余的电。相关机构通过智能电网每隔五到十分钟收集一次数据,以此来预测用户的用电习惯,从而推断出在未来两到三个月的时间里,整片电网大概需要多少电。建立这项预测之后,就可以用较低的“批发价格”向供电企业预先购买一定数量的电,从而降低了采购成本。
这种动态的、前瞻的数据收集,并建立预测模型解决实际问题,正是大数据广泛应用的剪影之一。
再如谷歌流感趋势预测(GoogleFlu Trends,GFT),是使用来自网页搜索的数据去追踪流感病毒的传播,而且这种预测并不是依赖于对随机样本的分析,而是对整个美国几十亿条互联网检索记录进行分析,由此不仅能够提高微观层面分析的准确性,甚至能够推测出某个特定城市、某个国家的流感状况。虽然有人这种预测尚不准确,但重要的是,它的思路、思维是超前而且正确的!——一方面,公共健康官员和健康专家可以尽快了解流感的爆发,另一方面,这些模型能很好地补充其他调查系统,从更具体的位置进行预报,而且更加及时;此外,这一策略还可以应用在野生动物保护、打击人口贩卖行为,等等。
谷歌流感趋势预测(图片来自网络)总之,这些利用大数据的预测技术固有不完善处,亦如阿尔法狗也曾“技不如人”,然待其升级之后,已然天下无敌手,完胜传统的思维和行为方式!
注:阿尔法狗(AlphaGo),由谷歌(Google)旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发的人工智能程序。2016年3月,阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜;2016年末2017年初,该程序在中国棋类网站上以"大师"(Master)为注册帐号与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩;2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平。
围棋人工智能程序阿尔法狗(图片来自网络)