《大数据时代》读书笔记
三周时间,终于将《大数据时代》读完。
全书从两部分来写大数据时代对人社会的改变,第一是思维变革,第二是商业变革。
从思维变革上来说,第一,样本=全体;传统小数据的处理方法已不再适用。传统的数据处理是对数据取样,而大数据时代是对全体数据取样,样本=全体,传统的数据量需要用复杂的算法才能准确预测,儿进入大数据时代大数据处理需要简单地算法就可以准确预测。第二,混杂而非精确;传统的数据库要求单一的精确的数据格式,而这已经不能满足大数据时代,大数据,不单单指数据量大,也只数据结构复杂,传统的关系数据库(结构化查询语言(SQL))就不再适用,而需要NOSQL,非关系型数据库。第三,相关关系而不是因果关系; 让数据自己发声,不需要我们去探测数据背后的原因,而直接告诉我们事物的相关关系。虽然我们习惯于探寻因果关系,但实际上通过大数据我们可以更快速的建立相关关系,而对于因果关系,我们很多时候耗费大量时间得到的也不一定是正确的。
从商业变革上来说,我们处于信息(IT)时代,而直到目前,我们一直侧重于T(技术)变革,而现在以及未来的大数据时代,我们是该把目光聚焦于I(信息数据)上了。未来社会,一切皆可量化。而数据除了其本身的价值外,还可以进行二次利用,数据重组,数据创新。
大数据的商业价值链上,有三种类型的公司,第一,数据公司,即本身掌握了数据的公司;第二技术公司,即掌握了数据处理技术的公司;第三,思维创新公司,即懂得通过处理数据达到服务未来的公司。其实有点像金矿,数据公司,就像金矿;技术公司,为掘金人;思维公司,为将金子打磨为精美艺术品的工匠。哪一环都很重要,但作者认为最重要的是数据公司。
本书的最后,也提到,隐私,数据的交叉复用,会让所有人的隐私曝光在大众或者说首先商业公司面前。而在大数据时代,传统的数据使用的告知和许可方法,已不再可能实现,这就需要立法规定数据使用者的责任。
另外,大数据时代才刚刚开启,但是,数据的利用如何能保证谨慎,文中提到,未来社会可能会因为数据预测某人会犯罪而逮捕某人,这样从数据角度上来说预防犯罪事件发生上来说是没有问题的,但是从人类自由意志上来说,在事情没有发生之前就采取措施是明显不妥的。
大数据时代只是我们目前预测的为未来提供的一个选择,当然如何书写还有待我们去亲自实现。