大学,考研,学习

刘德寰老师指定必读书目:涂子沛《大数据》|基础书目带读32

2020-04-08  本文已影响0人  北大胡师姐新传考研

01内容预览

《大数据》这本书以美国为例,介绍了美国信息公开的历程以及数据对美国社会所造成的巨大影响。书名看似是着眼于纯技术层面,但更多是从美国历史的角度去探讨技术与社会的关系。

02作者介绍

涂子沛,江西吉安人,信息管理专家、科技作家,《大数据》、《数据之巅》及《数文明》作者。先后担任中国旅美科技协会副主席、中国旅美科技协会匹兹堡分会主席,在国内有上海真爱梦想公益基金会理事、中国人民大学中国调查与数据中心客座研究员等兼职。毕业于卡内基梅隆大学,系微软认证高级程序员,曾居美国硅谷。2014年12月任阿里巴巴副总裁,分管大数据方面事宜。

03全书简述

第一部分 信息自由和技术创新

第一章 历史争战《信息自由法》

推荐指数:(详看)

可联系知识点:新闻自由、控制研究

美国行政部门的信息公开,在早期,一直都是政府部门自己说了算。为了实现新闻自由和信息开放,美联社的执行主编率先提出“知情权”的概念,但是所谓的知情权并没有法律的保障。美国约翰·摩斯等人面临国会内部的阻力,但仍鼓吹“信息自由”。多年努力后,《信息自由法》被通过,美国成为继瑞典、芬兰之后,世界第三个实施《信息自由法》的国家。为了继续清除阻碍,《信息自由法修正案》通过生效,美国信息自由高速发展。

随着计算机的不断普及,对于存储在计算机内部的数据信息是否属于信息公开范围,成为了《信息自由法》的真空地带。而《电子信息自由法》和《开放政府法》的不断推出完善了美国信息自由的体系,使这个体系成为了世界许多国家的模板。

第二章 数据帝国的兴起

推荐指数:(详看)

可联系知识点:大数据

本章重点内容:摩尔定律、最小数据集、民意调查、中间选民理论、普适计算

计算机硬件的高速发展,使得海量数据成为可能。业务工作的管理数据、民意社情的调查数据,以及对大自然、动植物的特点和变化进行监控而产生的环境数据,成为了联邦政府的三大数据来源。

数据的爆炸增长,超出了人类的预期。“如何收集、保存、维护、管理、分析、共享正在呈指数级增长的数据是我们必须面对的一个重要挑战。”“如何保证这些数据现在、将来的完整性和可用性也成为了另一挑战“,因而联邦政府决定制定一个“大数据”战略。

第三章 数据治国

推荐指数:

可联系知识点:数据应用

“我们信靠上帝。除了上帝,任何人都必须用数据来说话。”这句话在美国广为流传,也反映美国人对数据的推崇。数据成为了美国社会用于交通管理、平权落实、福利打假、治安管理等一系列社会治理的工具。

第四章 商务智能的前世今生

推荐指数:(详看)

可联系知识点:数据挖掘、预测性新闻

本章重点内容:商务智能、数据挖掘、数据可视化

“信息时代,如何将数据、信息转化为知识,扩大人类理性、辅助决策?”决策支持的研究成为了现代商务智能概念最早的源头和起点。数据仓库、联机分析的发展成熟,为商务智能奠定了框架,而数据挖掘则赋予了商务智能的“智能”生命。数据可视化则是把美学元素带入了商务智能,更有效地传达了数据背后的知识和思想。

第二部分 数据和法则

第五章 帝国的法则

推荐指数:

美国是个法制极其发达的国家,上个世纪以来,美国国会、政府先后通过上百个大大小小的法规,分别对数据的收集、使用、发布和管理等关键环节做出了具体的规定。

在收集上,为减少繁琐的信息收集任务,美国国会设立了《纸面工作精减法》并设立了“信息和管制办公室”(OIRA)。在使用上,奥姆斯泰德诉美国政府窃听一案引发公众对“隐私权”的广泛讨论,凯兹案则成为美国隐私保护的重要节点,尼克松水门丑闻爆发后,行政权力对个人的恶劣入侵,让美国社会开始达成保护公民隐私的共识,《隐私法》在1974年被通过。在发布上,当公民根据《信息自由法》提请信息公开时,联邦政府只能收取因为该次查询及其公开这则信息所产生的边际费用,而不能收取政府为了收集、管理这份信息所产生的全部成本和费用。在管理上,为了保证数据发布的质量,联邦政府强调质量要有标准、质量管理要有流程、还需要配有质量救助机制,但是谁对数据质量有裁判权?纠错机制如何运行?即使美国国会通过了《数据质量法》,但是这个法律仍然没有很好地解决问题。

第六章 《数据质量法》的困局

推荐指数:(详看)

可联系知识点:场域理论

本章重点内容:政府俘虏理论

行业管制标准的数据调整,对企业来说动辄就是巨大的利润空间,因而代表公司、企业和财团游说立法者和执法者的现象层出不穷。《数据质量法》表示“无论是公司、消费者还是环境保护的公益组织,全社会都可以来质疑政府发布的数据是否准确,各种不同的利益都将得到保护。”但现实是,《数据质量法》成为了商业制止反对管制标准的利器,公共利益代表常常缺位。

而盐业案后,官员们开始思考《数据质量法》的不足,认为判断政府发布的数据是否准确可靠,需要大量的专业知识,法院的法官并不具备这个资质。此后,国会考虑修改和完善《数据质量法》

第七章 全国隐私风波

推荐指数:

可联系知识点:数字隐私权、媒介伦理、全景监狱理论

随着信息技术的推进、计算机的增多,越来越多人担心联邦政府会利用信息技术来侵犯个人隐私。美国公共知识分子、记者、民意调查机构和公益组织认为美国已经成为一个监控性社会,不断反击联邦政府的中央数据银行计划、数据挖掘计划、万维信息触角计划和建言计划等。

第三部分 数据和公民生活

第八章 数据开放运动

推荐知识:(可略看)

软件早期被视作一种私有专利,几乎所有的软件公司都拒绝公布源代码。但反对专有、封闭、商业化成为浪潮。

开源不代表开放数据,在开源运动的影响下,数据开放也成为了互联网时代的风潮,从技术领域的运动逐渐延展到了政治、文化和社会生活领域。在奥巴马等人的推动下,数据开放不断成为现实,而数据的不断开放也为人们的生活带来了诸多便利。

第九章 试金石:白宫访客记录

推荐指数:(可略看)

医疗问题是美国社会的一个难题。奥巴马曾主张要加大国家财政收入,建立公营性质的医疗保险,扩大医保覆盖面,但是最后他放弃了对富人增税的计划,而是以加重保险公司的负担去实现了他的目标。

民间对奥巴马的医改方案展开了激烈讨论,位于华盛顿的公益组织“华盛顿责任道德公民中心“(CREW)认为奥巴马应该公布其上任后的来访和会客记录,以去判断奥巴马的政策是否没有收到外部因素的影响。

在这一公益组织的不断发难下,白宫最后公布了自己的访客记录。但故事仍没有结束,外界认为白宫的数据仍不够透明,不久后白宫将会安装上一套适合监督的访客信息管理系统。

第十章 矿难中的歌声和数据

推荐指数:(可略看)

西弗州的矿难,29名矿工失去了生命,但是美国矿山安全健康局却没有一个人为此丢官受责。尽管奥巴马上台后,通过推行透明行政、开放数据等措施加大了政府公开的力度,但是矿山安全健康局仍然没有顺势主动开放煤矿岸区哪家差的文字报告,墨守成规,间接导致矿难发生。这一事件遭到了美国社会的强烈批驳。

第四部分 数据展望

第十一章 大趋势

推荐指数:(详看)

可联系知识点:云计算、语义网、元数据

越来越多的国家加入到了数据开放的队伍中,国际开放联盟已经形成。美国仍在技术上寻求突破,开始建立以云计算为基础的平台,全世界政府、企业和个人使用、消费信息技术的模式正在改写。而大数据时代催生的另一最大技术变革,则为语义网,那将是一个更加辉煌的大数据时代。

第十二章 大挑战

推荐指数:(详看)

从电台总统罗斯福到电视总统肯尼迪再到网络总统奥巴马,选举成为一场数据竞争,数据收集分析和整合的能力成为政治选举领域的关键。而在商业领域,各行各业都出现了以数据分析为竞争能力的企业,数据兴则企业兴,数据强则企业强,数据成为了直接的财富。另外,大数据时代正在呼唤下一个社会化的浪潮,一个更开放的世界,一个权力更分散的世界,一个网状的大社会。

第十三章 大变革

推荐指数:(详看)

在线学校、在线教育不断发展成熟,“微学位”新概念随之而来。在线教育普及,名校人人可上,名校也可通过研究各国学习者的行为模式打造更好的线上平台。而教育领域的这场变革,就是由于信息技术的进步,人类手机存储、分析、使用数据的能力实现了巨大的跨越,这种现象也被称为“大数据”。

04全书点评

作者跳脱出了纯技术层面的内容,将目光更多着眼于技术与社会的层面,实属难得。若时间紧迫,建议大家可主要阅览第一、四篇章,补充一些前沿知识点,加深对技术性知识点的理解,把握未来技术的发展趋势。有兴趣的话,第二、三篇章也是不错的课外拓展。另外,大家也需要从技术和社会的角度出发,多多阅读这一议题的论文,比如社会对技术的反思、技术发展所带来的媒体环境变迁、数据隐私与伦理问题等,这些都是新传考试常考察的热点问题。

05可摘录名言

1.(向公众)隐瞒政府实情的力量,就是摧毁这个政府的力量。这种力量不能被轻易授予,也不能轻率使用。

——美国国会《信息自由委员会的报告》

2.一个自由的新闻行业是居于政府和人民的伟大解释者。你,如果同意给它加上桎梏,无异于给自己戴上脚铐。

——乔治·萨瑟兰(1862-1942),美国最高法院大法官,1936年

3. 如果由我来决定,我们是要一个有政府、没报纸的社会,还是一个有报纸、没政府的社会,我将毫不犹豫地选择后者。”

——托马斯·杰斐逊(1743-1826),第3任美国总统

4. 信息消费了什么是很明显的:它消费的是信息接受者的注意力。信息越丰富,就会导致注意力越匮乏……信息并不匮乏,匮乏的是我们处理信息的能力。我们有限的注意力是组织活动的主要瓶颈。

——赫伯特·西蒙 美国经济学家、政治学家、

人工智能的创始人之一

5.人类的理性是有限的,因此所有的决策都是基于有限理性(Bounded Rationality)的结果。如果能利用存储在计算机里的信息来辅助决策,人类理性的范围将会扩大,决策的质量就能提高。

——赫伯特·西蒙,美国经济学家、政治学家、人工智能的创始人之一

6.不论是睡着还是醒着,在工作还是在吃饭,在室内还是在户外,在澡盆里还是在床上——没有躲避的地方。除了你脑壳里的几个立方厘米以外,没有东西是属于你自己的。

——乔治·奥威尔,《一九八四》第一部第二章,1948年

参考文献:

[1] 涂子沛-百度百科https://baike.baidu.com/item/涂子沛/2738300?fr=aladdin

[2] 涂子沛 著 《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活3.0版》

上一篇下一篇

猜你喜欢

热点阅读