读书笔记——《大数据时代》(4)

2017-01-31  本文已影响31人  whybask

数据的价值包含首要价值和潜在价值。过去,一旦数据的基本用途实现了,我们便认为数据已经达到了它的目的,准备将其删除,让它就此消失。 在大数据时代,数据仍能不断产生潜在价值。数据的潜在价值有三种最常见的释放方式:

数据创新1:数据的再利用

数据再利用的一个典型例子是搜索关键词。互联网用户和搜索引擎之间的一次交互,展现了网页列表,实现了那一刻的特定功能。咋看起来这些信息在实现了基本用途之后似乎一文不值。但google等公司可以用这些关键词预测流感爆发趋势和区域、粉红色(或黑色)是否会成为今年的潮流色、房产价值的升降情况。

移动运营商记录了手机在何时何地连接基站的信息,长期以来运营商们用这些数据来微调网络新性能。出于隐私保护相关法律的限制,移动运行商们并没有用这些数据来谋取利益。但如今,伴随着经济颓势,他们有可能改变立场,认为数据也可以作为其利润的潜在来源。

数据创新2:重组数据

处于休眠状态的数据的价值,可以通过与另一个截然不同的数据集结合,释放出更加有创意的价值。例如:丹麦癌症协会利用本国的手机用户数据库,与癌症患者数据库结合,得到了“手机并不会增加癌症风险”的结论,这是个利好的结论,所以并未引起轰动。但假设结论是相反的,那对世界发展的影响将无法想象。

随着大数据的出现,数据的总和比部分更有价值。当我们将多个数据集重组在一起时,带来的价值将倍增。

数据创新3:扩展数据

促成数据再利用的方法之一是从一开始就设计好它的可扩展性,虽然这并非总是可能的。google的街景汽车不仅仅采集了GPS数据、房屋和街道的照片,甚至还�收集了无线网络的信息,一辆google街景汽车每时每刻都能积累大量的离散数据流。这些数据之所以具有可扩展性,是因为google不仅将其用于基本用途,而且进行了大量的二次利用。甚至对google自动驾驶汽车的运作功不可没。

收集多个数据流或更多数据点的额外成本往往较低廉,因此,收集尽可能多的数据、并考虑各种潜在的二次用途使其具有扩展性是非常有意义的。

上一篇下一篇

猜你喜欢

热点阅读