大树写作第三季

004 大树日课:区块链与大数据----大数据与区块链的共生演进

2018-10-07  本文已影响21人  好先生17

其实在书的前两章分别介绍了大数据和区块链的起源,但由于对区块链比较熟悉了,所以第二章直接略过。今天来探讨一下,大数据和区块链为什么能够放到一起讨论,二者到底有什么异同?

大数据与 不确定性

我们已经了解到,大数据依靠数据量大与维度多,可以获得接近整体的完整信息。更有专家学者指出:大数据的核心是,依靠相关关系分析法的预测。这就很好理解了,利用这些特点,大数据要做的事情其实很简单,那就是分析“各种相关性”,不管二者或者多者之间,有没有直接的因果,甚至不管有没有因果,直接“简单粗暴”地用分析出来的事实说话,这就覆了传统意义上的凡事寻求因果的思路。

顺着这个思路,再进一步,我们就会被从连续、确定、因果的牛顿世界观带到不连续、不确定的量子世界观。认清了事物之间根本不是简单的、线性的、因果的关系,或许才能真正理解大数据的精髓。

拿“蝴蝶效应”来讲,为什么远处的蝴蝶煽动了一下翅膀,就可以引发出天气变化呢?这说的就是在一个超级复杂的系统当中,初始条件的微小变化都能带动整个系统巨大的连锁反应。而我们就是处在这样一个不确定性的世界当中,因此,可以毫不夸张地说,大数据技术才是我们真正研究世界本源的开始。

区块链与信息基因

书中有一组对比的概念,非常有意思:

传统人类世界 | 区块链世界
原子| 0/1
分子| Bit
DNA| 哈希算法
染色体| 哈希指针
分裂| 复制
细胞|智能合约
能量|能量
物种|应用

了解哈希算法的对它的几个重要特性肯定不陌生:良好的碰撞性保证了信息的独特唯一性;哈希值的单向性保证了信息的安全性与稳定性;而暴力破解时巨大解空间保证了多样性。再来对比DNA的特点,唯一性、稳定性、多样性似乎是它们的共性。

哈希指针可以构建出各种各样的数据结构,DNA也可以组合出不同的染色体;智能合约可以通过不同的组合组织起具有一定行为的功能,而细胞组织在一起就能形成不同功能的生物体;生命的维持需要消耗能量,而区块链的运行也得消耗电力;基于DNA的物种有成千上万,而运行在区块链之上的各种应用将来也必将少不了;人类是碳基生命,是生化算法驱动的生命;区块链是硅基生命,是电子算法驱动的生命。
如果说DNA是生物当中的信息基因,那么区块链便是技术当中的信息基因。

大数据与区块链的异同

对比来看,二者有着隐约的相同之处。大数据要应对超级量级和爆发增长的存储,就得要求相应的底层数据库系统效率足够高,成本足够低;区块链本质上是一种分布式数据库技术,可以说是对先有互联网的升级与补充。大数据的分析挖掘是高算力的密集型计算,需要巨大的分布式算力,任务调度,节点管理,高容错与可靠性是必须要求;区块链也是靠各种分布式节点达成共识机制的,同样面临着上述的技术要求。

二者的不同之处也是非常明显的。时间上,大数据发展要早些年,在那张技术成熟度曲线中早已进入了幻灭期,目前正处在复苏的前夕,而区块链自2017年才真正火爆起来,距离幻灭期还有一定距离,目前正在走向“疯狂”。大数据技术通常需要的数据量、计算量都非常大,而区块链所能够承载的信息量非常有限。大数据处理的是典型的非结构化数据,而区块链则是很明显的结构化数据。

共生演化

在分布式系统中有个CAP定理,也即不可能同时满足一致性(Consistence)、可用性(Availability)、分区容忍性(Partition tolerance)。大数据是以牺牲一致性来换取另外两个的,而区块链则是有限保证了一致性。所以,这两者在某种程度上可以优势互补。

区块链记录了非常全面的历史数据,并且不可篡改。随着时间的推移,数据量会越来越大,多样性会越来越多。大数据在数据采集、分析、处理方面的能力则恰好可以弥补区块链数据统计分析能力的不足。在区块链中应用大数据,会极大地拓展区块链的价值尺度。

在大数据系统上使用区块链技术,可以在一定程度上保证数据不被随意修改,同时还可以验证大数据的一致性。将大数据作哈希并上链,将来需要验证数据的真实性时,对要检测的数据做同样的哈希,如果结果相同,则说明数据没有被篡改过。这也是目前很多区块链项目所采用的数据一致性验证技术方式。

以上就是读书过程中对“大数据和区块链共生演化” 的讨论,二者相辅相成,共同进化。

那么大数据面临的一些关键问题,区块链到底有没有具体的解决方案呢?敬请期待下一期……

2018年09月29日

上一篇下一篇

猜你喜欢

热点阅读