区块链技术 blockchain

IPFS之IPLD

2018-08-02  本文已影响7人  孔祥子看天下

IPLD是什么

IPLD是内容可寻址web的数据模型。它允许我们将所有散列连接的数据结构视为统一信息空间的子集,将所有将数据与散列连接的数据模型统一为IPLD实例。

IPLD数据模型定义了一种简单的,适用于所有merkle-dags,基于JSON的结构。同时也定义了一系列编码的格式结构。

目前系统的问题

在分布式系统中,通过使用加密哈希来定位内容已经成为了广泛使用的方法。 从区块链到加密数字货币到网页,这中间的数据是庞大的。然而,尽管所有这些工具都依赖于一些常见的原语,但是它们的特定底层数据结构是不可互操作的。

IPLD是所有受哈希启发的协议的一个名称空间。通过IPLD,可以跨协议遍历链接,允许您探索数据,而不管底层协议是什么。

IPLD如何解决了这些问题

IPLD定义了一系列规范来让基于内容寻址,加密hash的分布式系统中的数据变的具有互操作行。

它具有如下特点

一个自包含的描述性模型,惟一地标识任何基于哈希的数据结构,并确保相同的逻辑对象总是映射到相同的位序列。

IPLD将独立的系统组合在一起,使与现有协议的集成变得简单。

有了多格式(multiformat)支持,IPLD很容易升级,并将随着您喜欢的协议而增长。

以各种可序列化的格式表示IPLD对象,如JSON、CBOR、YAML、XML等,使IPLD在任何框架中都易于使用。

非侵入性解析器使IPLD易于集成到现有工作中。

IPLD允许您通过一个公共名称空间,通过协议无缝地跨协议探索数据,结合基于哈希的数据结构。

IPLD结构和组成

一些核心术语和组成

可见,IPLD 是多个由默克尔链接组成的dag图的一种数据模型。

IPLD协议的其他关联部分协议

[图片上传失败...(image-659b3f-1533192576398)]

可以看出,有一些协议还在修订中

一些关键概念

什么是默克尔链接(merkle-link)

一个merkle-link是链接两个对象的方式。目标对象和源对象都使用加密Hash的内容寻址。同时,目标对象的hash也会嵌入到源对象中。包含merkle-links的内容寻址可以做到:

加密完整性检查:解析链接的值可以通过Hash来测试。 这样一来可以实现广泛的,安全的,不受信任的数据交换(例如git或bittorrent),因为其他人不能给你任何不通过Hash链接到的数据。

不可变数据结构:带有merkle链接的数据结构不能改变,这对于分布式系统来说是一个重要的属性。 这对于版本控制,表示分布式可变状态(例如CRDT)和长期归档很有用。

一个merkle-link通过如下的IPLD对象模型表示:一个包含 / 映射到一个 “映射值”(“link value”),例如: 一个链接,在json中可以表示为一个“链接对象”(“link object”)。

<pre class="ql-syntax ql-authorBlock-13003047 first-line ql-long-13003047" spellcheck="false" line="THWy" data-linenum="1">{ </pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="IHq2" data-linenum="2"> "/" : "/ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k"</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="S6jz" data-linenum="3">}</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="irdw" data-linenum="4">// "/" 是一个链接key</pre>

<pre class="ql-syntax ql-authorBlock-13003047 last-line ql-long-13003047" spellcheck="false" line="2F5o" data-linenum="5">// "/ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k" 是一个链接值</pre>

一个在foo/baz有链接的对象:

<pre class="ql-syntax ql-authorBlock-13003047 first-line ql-long-13003047" spellcheck="false" line="uv8V" data-linenum="1">{</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="qfun" data-linenum="2"> "foo": {</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="h0rF" data-linenum="3"> "bar": "/ipfs/QmUmg7BZC1YP1ca66rRtWKxp77WgVHrnv263JtDuvs2k", // 不是一个链接</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="TDFB" data-linenum="4"> "baz":</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="oh2Y" data-linenum="5"> {"/": "/ipfs/QmUmg7BZC11ca66rRtWKxpXp77WgVHrnv263JtDuvs2k"} </pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="o1ET" data-linenum="6">// 是一个链接</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="nVem" data-linenum="7"> }</pre>

<pre class="ql-syntax ql-authorBlock-13003047 last-line ql-long-13003047" spellcheck="false" line="eLYs" data-linenum="8">}</pre>

一下结构中又一个 有一个伪”链接对象” 在 files/cat.jpg ,而实际的链接在 files/cat.jpg/link

<pre class="ql-syntax ql-authorBlock-13003047 first-line ql-long-13003047" spellcheck="false" line="BzC2" data-linenum="1">{</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="xVYH" data-linenum="2"> "files": {</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="5Tff" data-linenum="3"> "cat.jpg": { // 链接的属性包含在其他对象中</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="JBqL" data-linenum="4"> "link": {</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="kRRG" data-linenum="5"> "/": "/ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k"}, </pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="bcqM" data-linenum="6"> "mode": 0755,</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="RNb0" data-linenum="7"> "owner": "jbenet"</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="OmIB" data-linenum="8"> }</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="JISa" data-linenum="9"> }</pre>

<pre class="ql-syntax ql-authorBlock-13003047 last-line ql-long-13003047" spellcheck="false" line="C7Rp" data-linenum="10">}</pre>

当链接被修改时,映射本身将被其指向的对象替换,除非链接路径无效。

这个链接可以是multihash, 也就是说它假设这个链接是在 /ipfs 层级下的,或者是对象的绝对路径。但目前只有 /ipfs 层级路径可以使用。 如果应用需要使用 /表示其他内容,那么应用自身需要保证解析的时候不冲突。

merkle-graph和merkle-dag

具有merkle-link的对象形成一个有方向的图叫Merkle-graph

merkle-path是什么

一个merkle-path是一个unix风格的路径(e.g. /a/b/c/d),它可以实现通过merkle-link遍历,并且获得所有的对象。 通用的文件系统可以被设计成在IPFS之上的对象模型,设计特定的算法来实现数据对象的操作和查询。

工作原理

一个merkle-path是一种unix风格的路径,它依据路径遍历,同时也逐步解析循内容。解析内容意味着获得merkle-link的内容,再进一步解析。例如,假设我们有如下merkle-path:

<pre class="ql-syntax ql-authorBlock-13003047 first-line last-line ql-long-13003047" spellcheck="false" line="3C1W" data-linenum="1">/ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k/a/b/c/d</pre>

其中:

ipfs 是协议的命名空间。

例如

<pre class="ql-syntax ql-authorBlock-13003047 first-line ql-long-13003047" spellcheck="false" line="HM5e" data-linenum="1">> ipfs object cat --fmt=yaml QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="BULY" data-linenum="2">---</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="ne1i" data-linenum="3">a:</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="Yabc" data-linenum="4"> b:</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="Y4R1" data-linenum="5"> link:</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="hAGH" data-linenum="6"> /: QmV76pUdAAukxEHt9Wp2xwyTpiCmzJCvjnMxyQBreaUeKT</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="vJ1l" data-linenum="7"> c: "d"</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="8k8I" data-linenum="8"> foo:</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="0qs7" data-linenum="9"> /: QmQmkZPNPoRkPd7wj2xUJe5v5DsY6MX33MFaGhZKB2pRSE</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="Ynz3" data-linenum="10">> ipfs object cat --fmt=yaml QmV76pUdAAukxEHt9Wp2xwyTpiCmzJCvjnMxyQBreaUeKT</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="voxf" data-linenum="11">---</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="J25M" data-linenum="12">c: "e"</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="O0pA" data-linenum="13">d:</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="T5g7" data-linenum="14"> e: "f"</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="tI1z" data-linenum="15">foo:</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="oc5p" data-linenum="16"> name: "second foo"</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="91C0" data-linenum="17">> ipfs object cat --fmt=yaml QmQmkZPNPoRkPd7wj2xUJe5v5DsY6MX33MFaGhZKB2pRSE</pre>

<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="me84" data-linenum="18">---</pre>

<pre class="ql-syntax ql-authorBlock-13003047 last-line ql-long-13003047" spellcheck="false" line="ClF7" data-linenum="19">name: "third foo"</pre>

假设有如下paths:

/ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k/a/b/c 只会遍历第一个对象,得到字符串 d. /ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k/a/b/link/c 会遍历两个对象,得到字符串 e /ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k/a/b/link/d/e 会遍历两个对象,得到字符串 f /ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k/a/b/link/foo/name 会遍历第一个,第二个对象,得到字符串 second foo /ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k/a/b/foo/name 会遍历第一个,第二个对象,得到字符串 third foo

IPLD限制和愿景

有如下限制:

1. IPLD 路径必须是明确无误的,任意给定的路径遍历的方式必须是恒定的(e.g.避免链接命名冲突)

2.IPLD 路径必须是全局的,同时也要支持其他语言(e.g. 使用 UTF-8,而不是ASCII).

3. IPLD 路径必须是在UNIX和Web之上的层级 (使用 /, 在ASCII 系统内转变必须是确定的 ). 鉴于JSON的成功, 很多系统都支持JSON 接口.

4.IPLD 必须具有支持JSON格式的导入导出能力 JSON数据模型也是简单而且易于使用的。5.IPLD 也必须要易于使用。 可以让定义数据的操作变得很简单。在IPLD之上定义新的数据结构不需要具有很多背景知识 由于IPLD 是基于JSON数据模型的, 它应该通过JSON-LD与RDF及 Linked Data standards 兼容 IPLD序列化格式(在磁盘上,传输中)都需要快速和空间有效 (不能用JSON格式存储, 而是应该用CBOR或其他格式) IPLD 加密哈希散列必须可升级 (使用multihash)

如下特性是加分项:

1. IPLD不应该包含错误的数据,e.g. 存储不完整的JSON.

2..IPLD 应该可升级, e.g. 如果一种更好的在磁盘上存储的格式出现了,系统应该可以只要花费很小的代价就升级 IPLD 对象应该可以可以解析属性,而不仅仅是 merkle links.

3. IPLD 事先定义的格式应该容易实现和转化 IPLD 事先定义的格式应该在不获得整个对象的情况下也可以搜索(CBOR 和 Protobuf 已经可以做到).

参考链接

https://ipld.io/

https://github.com/ipld/specs/blob/master/IPLD.md

联系微信:bitwiki

上一篇 下一篇

猜你喜欢

热点阅读