Big Data - 01. 更多

2019-03-27  本文已影响0人  Autistic_8d3b

不是随机样本,而是全体数据

让数据“发声”

大数据与三个重大的思维转变有关,这三个转变是相互联系和相互作用的。


小数据时代的随机采样,最少的数据获得最多的信息

古代埃及人口普查,皇家委员会对每个人、每件事都做了记载 >>>《末日审判书》;
当时收集的信息也只是一个大概的情况。


John Graunt(英国裁缝)用统计学推算出鼠疫时期伦敦的人口数,可以利用少量有用的样本信息来获取人口的整体情况。


穿孔卡片与美国人口普查

1934年,波兰统计学家耶日·奈曼(Jerzy Neyman)指出,有目的地选择最具代表性的样本会导致更多的漏洞。事实证明,问题的关键是选择样本时的随机性。
统计学家们证明:


随机采样取得了巨大的成功,成为现代社会、现代测量领域的主新骨。但是这只是一条捷径,是在不可收集和分析全部数据的情况下的选择,它本身存在许多固有的缺陷


大数据与乔布斯的癌症治疗

全数据模式,样本=总体


Xoom与跨境汇款异常交易报警

在某些特定的情况下,我们依然可以使用样本分析法。但这不再是我们分析数据的主要方式。慢慢地。我们会完全抛弃样本分析。

上一篇 下一篇

猜你喜欢

热点阅读