区块链的下一个风口:IPFS
随着互联网的飞速发展、应用越来越丰富、用户数量越来越多、数据也呈几何级增长,海量数据的存储给本地存储带了巨大压力,传统的中心化存储(如NAS或SAN)在容量和性能上无法很好地满足大规模数据存储的需求,而且后期拓展的难度和成本都非常高。因此,必须通过其他手段分散存储系统压力,分布式存储和分布式文件系统应运而生。分布式存储多采用普通的硬件设备作为基础设施,因此,单位容量的存储成本也得到大大降低。另外,分布式存储在性能、维护性和容灾性等方面也具有不同程度的优势。
出于Filecoin/IPFS这两个IP的热度,我们或多或少知道了分布式存储这个概念,很多人会觉得这是IPFS或者Filecoin首创,很多时候人们也会拿这个事儿去diss那些集中性存储的服务商,但事实上分布式存储作为一种存储上的解决方案已经比较成熟了,也就是说我们经常拿来和Filecoin对比的亚马逊云、阿里云在部署存储服务器时也会用到分布式存储的技术
再说IPFS这个协议,它也不是分布式存储技术的“独苗”。在主流的分布式存储技术中,还有Ceph、谷歌开发的GFS系统、雅虎开源的HDFS、还有1999年就出现的Lustre系统。只不过IPFS要比这些技术更加“分布”。
那么Filecoin和采用分布式存储技术的亚马逊云有区别吗?本质上没有区别。Filecoin和亚马逊、阿里都是售卖存储资源的企业。最大的区别是,即使亚马逊云采用分布式方案,它的存储服务器设备是中心化搭建中心化管理,数据管理是中心化的,整个网络的运营也是中心化的,它的存储方式再怎么去中心化,即使是用了IPFS也无法避免此前中心化存储所存在的数据安全性问题。那我们可以说Filecoin实质上是一种有别于当前传统互联网模式的企业或者商业模式。
Filecoin的经济模型激励设计本质上是一种Web 3.0构想下存储产业的商业试验,通过激励,整个存储系统的建设管理运行都是去中心化的,最重要的是,Filecoin为整个存储产品的上下游建立起了一个自由集市,一旦整个机制运行起来。供需双方的交易没有第三方的中央组织来干涉的,那么这种方式可不可行呢?我们现在终于有了一个可以试验、评估和参考的案例。
什么人会需要Filecoin类的分布式存储?
新科技的发展不是谁打倒谁,而是谁解决了社会存在问题,消费者就选择谁,越过高度148888,我们还是回归到现实的问题,Filecoin的买方市场在哪里(Filecoin并不是万能的,还是要面临上残酷的商业竞争)?
整个市场有多大?IDC在《Data Age 2025》的报告中预测,从2018年到2025年,全球数据将从33ZB急速增长到175ZB。在2019年,云存储行业产值超过460亿美元,而CDN服务(内容分发网络)产值也超过120亿美元。蛋糕本身是足够大的。
然后就是买方市场的需求,存储最重要的指标是什么?可能并不是性能,安全性占据了更高的优先级。对于任何系统来说数据丢失都是灭顶之灾,在Web 3.0世界里数据作为主权的一部分,存储的安全性更加重要。然后就是成本,对于个人还是企业都是如此,再到最后就是速度。
以上需求匹配Filecoin当前的状况(我们暂时不去考虑今后Filecoin会到达什么样的高度)可能有这些人会需要Filecoin这样的分布式存储服务。
a.拥有大量冷数据存储需求的中小型企业
冷数据就是平时几乎用不到但是你需要长时间保存积累最后能产生价值的数据。这些数据短期内不会对企业的业务产生任何价值,但是又不能丢弃,如果找传统存储服务提供商企业还要多进行多次的备份来对冲数据丢失的风险,这会产生大量的额外成本。这里的需求是永久且安全,这与当前Filecoin的卖点是相契合的。为什么是中小企业?像Filecoin这样刚刚起步且存在一定法律风险的供应商是根本无法通过他们的采购部审批的,此外成本上Filecoin的方案也更低。
此前Filecoin的Slingshot竞赛中,要求节点需要存入真实有价值的数据来获取奖励,我们会发现这些有趣数据集。
一、光纤数据(50-100 TB):这是一个基于传感器的网络和数据分析系统,利用之前铺设的光纤电缆产生的数据来监测全球各城市光纤周围的温度、压力、振动、声音和其他信息。这些数据可以被研究人员、市政管理人员和交通设施监督人员用于协助城市规划和建设。
二、虚拟现实数据(50TB):这些数据来自于一个虚拟现实(VR)和增强现实(AR)系统,它从专业摄像机收集原始视频,然后处理和存储数据。这些数据最初是为房地产和市政工程行业服务的。
三、天文和气象数据(200TB):一个天文和天气数据库,包括图表、分析和照片。这些数据由中国昆明的云南大学生成、收集和存储。
此外还有像斯隆数字天空调查(SDSS)创建的详细宇宙三维地图,包括三分之一天空的深彩色图像,以及超过 300 万个天体的光谱这些数据。还有COVID-19 数据研究数据以及博物馆数据等等。
b.非法内容
这种需求是有前车之鉴的,20年前的BitTorrent协议,该协议是为点对点文件共享而设计的。BitTorrent用户将各种视频、音乐和文本文件下载到本地存储,然后可以与其他用户共享“种子”。后来我们可以看到结果,这个网络上充斥了大量不可描述、盗版侵权的非法内容。
此前利用分布式存储的电驴、海盗湾以及国内的某播软件借助分布式存储技术,用户可以就近获得几乎任何想要的内容,不管是速度、清晰度都秒杀传统的中心化存储HTTP技术,主要的是官方还不需要租用过多服务器去储存这些内容,很大程度降低他们的运营成本。但下场也很明确,全部都被封杀了。
这样的发展和风险同样会发生在Filecoin身上,从技术上来看,分布式网络降低了审查的攻击面。IPFS相比于HTTP协议,实现了信息永久存储且不可篡改删除以及资源共享。IPFS中文社区IPFS.GUIDE,被各类盗版电影充斥着,且用户量少得可怜。
c.所有标榜去中心化的区块链项目或者Dapp
这是一个很大的需求点,因为很多区块链项目自身的主程序和网络数据都存储在中心化服务器上,那么在Filecoin出现后,这些项目和Dapp的数据可以存储在分布式网络内,这样更加安全同时更加去中心化。
d.具有小额高频存储需求的个人或者初创企业
这里可能有人会说Filecoin当前的带宽性能无法满足高速吞吐的需求,这种情况是相对的,对于大规模高并发场景来说,Filecoin目前的带宽资源是不够的。但是对于那些小额存储需求,这种带宽速度和容量是足够的。并且云存储的中心化服务器大多都在深山老林,距离用户非常远,大家的数据传输都要走主干网络,这就很容造成高峰期拥堵,而Filecoin的分布式存储网络不同,它是就近原则,用户也可以自己选择节点来为自己服务,这种情况下,数据传输的速度反而比当前的云存储服务商更快。
此外,Filecoin作为一个“半自由撮合”的市场,本身是充分竞争而不是垄断性的。这样对用户来说是有益的。根据Filecoin开发人员设置的市场价格,市场也会依据存储空间、市场订单情况等来确定价格。存储服务采购商通过Filecoin交换机上发出数据存储订单后,存储主机向采购商提供报价,服务提供商竞价投标,并以最低价格获撮合订单。
e.矿工群体
矿工除了挣钱还有什么地方需要Filecoin的分布式存储?这个需求点很奇怪,但事实上是是存在的,他们太需要一个名头来让自己名正言顺了。这是由于矿工目前的尴尬处境所决定的。此前外界对挖矿的最大质疑就是,你们耗费了大量的能源,但最后好像也没产生实质的劳动价值。监管对于矿场的态度既暧昧又不明确,矿场时刻处在一个游离性的焦虑状态中。现在好了至少Filecoin的矿场可以说我们是在存储有价值的数据。
U1S1,Filecoin现在在存储市场上面临的挑战还是非常巨大的。Amazon S3是互联网上文件存储的巨头。第一非常便宜:每GB存储0.023美元,每10,000次读取请求0.04美分。第二速度非常快。第三非常可靠,虽然社区里经常拿宕机说事儿,但是还不知道Filecoin在经历了同样大规模数据存储后会出现什么样的问题,并且他们的运维不知道比Filecoin的节点服务商高出了多少个量级。还有它的开发者环境配套设施也很完善。也就是说如果Filecoin在整体差不多,个别点完全超越的情况下才会形成替代性。
Filecoin未来的潜力呢?
自动成长性的系统:一旦Filecoin能够稳定运行起来,这个系统是可以在利益驱使下,不断自动生长的。参与进来的节点数量越多整个系统就越强大。
更高的安全性和自主权限:文件是用私钥加密的,这使得没有密钥的任何人都无法访问该文件。文件也被分成多个部分保存在多个节点上,这样就不会出现单点故障。如果集中式服务器出现故障,用户就可能会失去对数据的访问。由于没有中心化治理机构,没有人可以为了审查而拿走你的文件、限制访问或对其进行修改。文件的哈希值保存在分布式账本中。
更加高效:IPFS网络中会对重复的内容进行去重处理,在保证整个网络存储文件的冗余量的同时保证网络的轻便与快捷。
对Dapp市场爆发的天然契合:如果IPFS成为区块链的存储层,一旦dApp规模发展起来,对分布式存储的需求会逐渐爆发。
不管你是否看好Filecoin,但是IPFS背后的分布式存储是一种必然趋势,矛盾点在于中心化结构下的分布式存储并不能完全发挥其应用的价值,也无法达到Web 3.0设想中的要求,那么还是前面所提到的,Filecoin就是一种试验,即通过一种新商业模式或经济机制来激发分布式存储更大的价值。