玩转大数据大数据呆鸟的Python数据分析

《大数据时代》的三大思维变革

2019-10-04  本文已影响0人  Ray的数据分析自习室

《大数据时代》是国外大数据研究的先河之作,作者为奥地利商业分析大师维克托·迈尔·舍恩伯。

维克托·迈尔·舍恩伯格在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维。

本文主要讲解该书的Part1,详细阐述了全量数据应用、宏观洞察与更看重相关关系的大数据思维。

《大数据时代》思维导图

大数据与三个相互联系相互作用的思维转变有关

01 更多:不是随机样本,而是全体数据

技术条件的提高,大大拓展了我们收集数据、处理数据的能力,但我们依然没有完全意识到自己拥有了能够收集和处理大规模数据的能力。

小数据时代的随机采样,最少的数据获得最多的信息

  1. 一旦采样过程存在任何偏见,分析结果就会相去甚远
  2. 随机采样不适合考察子类别的情况
  3. 随机采样需要实现设计好问题的结果,调查缺乏延展性,数据不能重新分析以获得计划之外的目的

全数据模式:样本 = 总体

02 更杂:不是精确性,而是混杂性

乐于接受数据的纷繁复杂,而不再追求精确性

允许不精准

大数据的简单算法比小数据的复杂算法更有效

大数据的绝对数量优势压倒了其带来的纷杂错误

纷杂的数据越多越好

新的数据库设计的诞生

03 更好:不是因果关系,而是相关关系

知道是什么就够了,不需要知道为什么

林登与亚马逊推荐系统

关联物,预测的关键

“是什么”,而不是“为什么”

上一篇下一篇

猜你喜欢

热点阅读