《数文明》-解读数据、社会及文明的另一视角

2018-10-31 本文已影响7人御风逐鹿

飞扬视点

此书并非简单的人工智能及大数据的扫盲读本，这是一本以“数据”作为认识历史、社会和商业模式的全新维度。

阅读完成：2018.10.24

整理时间：2018.10.31

一.关于本书

1.本书作者

涂子沛，被誉为“大数据先锋思想家”，江西吉安人。本科毕业于华中科技大学计算机系，研究生毕业于中山大学、卡内基－梅隆大学，获公共管理硕士和信息技术科学硕士学位，曾在美国学习、工作多年，2014年从硅谷回国，曾任阿里巴巴集团副总裁，2017年创业（公司名称-数文明科技），同时担任伊斯佳股（智能制造）董事、人民网独立董事。

首部著作《大数据》开大数据之先河，被誉为“为华文世界开创了一个重要话题”；

第二部著作《数据之巅》则认为必须把大数据从科技符号提升为文化符号，推动中国在大数据时代的全球竞争中胜出。

这本《数文明》为数据三部曲的第三部。

2.亮点

阅读过程轻松愉快，没有晦涩的公式和算法说明，多数案例都来自中国，这也是本轮中国企业“软”实力的体现（芯片和操做系统级别算“硬”实力，暂不讨论）。

作者以“数据”为视角，不仅涉及智能商业、新零售等领域，亦涉及对中国历史的洞察，确有“耳目一新”之感。

二.本书精要

1.机器智能不是机器智慧

人类只是输给算法，而不是输给机器。机器人不是比人类聪明，只是比人类能干，阿尔法狗胜利的原因在于算力强大，每天自己对弈3万局。但需要注意的是——算法的背后是一个团队，是一人群加一台机器战胜了人类对手。

另一个原因：机器没有情绪，人类易受情绪影响。

行业大咖对人工智能观点集锦

计算机突破人类大脑局限性，即记得更多、算得更快，可以同时探索、分析更广阔的事实。只是人类脑力的扩展，而不是超越和替代。人类无法创造出比自己更具智慧的客体，这应该成为我们看待人工智能的基点。

2.数据威慑力

基于图像识别技术和中国各地推行的“天网系统”,本书中列举大量案例，恩，确实是“案”，从机动车违章拍摄到犯罪嫌疑人识别及其行动路径图还原等，核心要素即：大数据+图像识别。正如本书作者涂子沛先生在得到直播首发式上的调侃——千万不要做坏事，警察在等着案破。

19世纪80年代，爱迪生发明电灯后，社会学家发现随着城市照明状况的改善，犯罪率会明显下降。今天基于海量摄像头的大数据有同样的功效，可以有效驱散人性幽暗深处的侥幸心理。

纵观西方宗教或东方神话传说，“威慑”的力量来源于记录，无论天堂地狱还是六道轮回，判定依据都是生前行为，“人在做，天在看”，以此作为清算依据。

试想人生百年，一个摄像头永不停歇地记录，一天约4GB数据，100年约143TB数据。随着硬盘成本的降低以及存储、压缩技术的提升，百年之后存储143TB数据的成本可能会低于2万元，再综合考虑通货膨胀等因素 ——即：将人类一生所有经历转化为数据，成本会越来越低。

曾经，人类不敢作恶是出于对地狱和清算的恐惧，但无法有效阻拦无信仰者或无神论者。未来，数据或许超越上帝的力量，渐露万能之相，是不是有点细思极恐：你信不信教我不管，但违法了就必须得管。

据统计，全国公安机关命案现案破案率已经连续5年超过95％，2016年，全国严重暴力犯罪案件比2012年下降43％。2017年8月，浙江省政府召开新闻发布会，宣布近2年来，全省命案破案率保持在99％以上，2017年上半年，全省治安案件数和刑事案件发案数分别同比下降7.76％和28.59％。我的公安朋友是这样告诉我的：“大数据和新技术太厉害了，我们现在是有案必破，破积案、等案破、没案破。”

——摘自本书《数据即证据，无侥幸天下》

3.数据思维看历史

3.1-文字的意义

人类和其他动物的根本区别并非语言，而是文字，正是在文字被发明之后，人类的知识得以记录和传承，文字的核心功能 —— 存储数据（古人的知识、见闻、历史等，皆为“数据”）。有了文字记录，才有了后续发明创造。

3.2-中国史官

中国古代采用“以史制君”的方式 —— 通过史官记录皇帝一言一行以传后人，但皇帝本人不可查阅，以此种手段来约束皇帝本人“不作恶”，核心依然是“记录”。这又是本书给我的一点惊喜：记录即数据，跳出“儒家”、“大历史观”视角。

3.3-中国掉队原因

再次以记录和数据维度切入，认为中国古代开始落后的起点是1454年古登堡印刷机。从此刻起，信息、知识开始在西方社会大面积传播，继而近代科学开始公元1500年后快速崛起。核心：科学技术必须依靠记录才能迭代。而中国所谓“运用之妙，存乎一心”，技艺的进步靠的是随机的“悟”，而不是一代一代、一天一天、一次一次的“记”。基于科学实验的制度，一个专业人士在一年之内通过重复实验所获得的知识和发现，肯定要比一个中国工匠一辈子因为偶然和随机所获得的发现和成果要多。

中国社会还有另外一个严重的问题：崇古，即古人比当代人更高明，“循祖制”是古代最常见的说法。这种思想认识的根源，也是缺乏记录。既然古人做得比今人好，那为何要创新呢，只要好好效仿古人就行了。

以数据维度探讨历史问题，果然有趣。不禁想起另一个维度 —— 金融，再细化一步就是发债VS税收。发债的前提是契约，国债明确了居民和国家之间的债务关系，允许该国以未来信用做抵押进行融资，继而诞生国债市场，把国家信用从虚拟概念转化为可流通的资产。为了保证债权债务关系清晰，继续催生法律制度维护契约执行，欧洲契约社会和法制社会也就这样开始形成。

而中国历朝历代重视税收的前提是“大一统”和国家暴力机器，一旦遇到大的战乱，税收很快就会导致涸泽而渔，民不聊生，继而帝国解体，改朝换代。

3.4-数据领域的量子思维

经典物理学的思维特点是客观、机械、精确的决定论。所谓的量子思维，认为主观世界和微观世界是一个整体，无法分割，人类认识微观世界，必须通过感知、测量和记录，但微观世界一旦被感知、测量和记录，它就开始扭曲，也就是说，微观世界是不确定的。

当史官拿起笔跟着皇帝、当镜头对准演讲者，他们的语言和行为就开始调整，人们知道自己在被观测、被记录的时候，会不由自主地修正自己的行为，从而改变了下一时刻的行为和轨迹。

这就是基于大数据+人工智能预测的困境，如果人类能够准确预知结果，就会改变结果，预测得再准，一旦作用于现实，也什么都得不到。

4.新观点：数据相对论

数量庞大的数据将导致“人人皆有数，人人都有理”。一个人要做出与其他人迥异的结论，总可以找到相应的数据、论据来支撑及佐证自己。从淘宝、JD、今日头条到网易云音乐，早已实现“千人千面”，推送数据会被训练的越来越智能，困扰人类千年的“异教徒”问题终于有望被算法消灭——你再也看不到他们了。

于是乎，数据再多，用户/观众也只看到冰山一角，终其一生都有可能无法掌握事实全貌。

数据会逼近事实，但数据再大，终究不是事实。爱因斯坦的相对论是关于时空和引力的，新的相对论是关于数据和事实的。

数据是人工智能的基础，统治数据空间的不是人脑，而是人工智能。既然记录有极限，数据空间存在边界，那人工智能也必定存在边界。

三.脑洞探讨

1-大数据杀熟，是否有违商业道德？

这个争论预计还将持续很久，“看人下菜碟”应该可以算作一个最为“质朴”且久远的赚钱模式了。我依稀记得自己的童年，都不敢独自逛街 —— 因为不会“侃价”。

在手机购物的时代，算法不但为你定制了商品，连价格都贴心的算好了，只不过这一次，我们把“侃价”机会丢掉了。

可参见之前写过一篇：航班随笔：大数据时代的个人隐私

2-用户数据被商业公司用来盈利，是否应获得报酬？

对于这个问题，答案是“必须的”——未来几年，区块链技术+通证经济的真正落地，将会彻底解决这个问题，暂且收币不做展开了。

3-独立意志是否还存在？

通过公开的数据，互联网开始成为影响、操纵、控制他人心理和观点的媒介工具，这不仅仅是隐私侵犯，而是心理入侵、思想入侵、意识入侵。这种基于算法的大规模合谋破坏了社会的隐形秩序。问题和难点在于：算法是否在运行？它如何运行？普通的消费者对此一无所知。

直到今天，各国政府也没有任何算法监管机构，如果多个算法在云端合谋，整个社会几乎无知无觉，也没有任何还手之力。

再深一步：如果国家规定，商业公司的算法必须经过“有关部门”审核方可通过，是否就合法了？那谁又来审核国家的“审核算法”是否合法？在“算法”的长期驯化下，机器比人类更了解自己 —— 做个脑洞试验吧~

主人，冰箱数据显示，咱家该补酸奶了，请问是否重新下单？

主人，行车记录仪数据显示，咱家车需要做四轮定位了，请问是否预约修理厂？

主人，根据你聊天对象频次分析，这次社区代表竞选，请问是否继续支持隔壁老王？

………………………………

到那时，你相信自己还拥有“自由意志”嘛？

鉴于编辑器及更新同步的缘故，诚邀关注个人微信公众号“飞扬日知录”。