论文日鉴10:网络信息论浅读
无意之中看到一篇比较有意思的文章,讲的是网络的相互作用,很有意思,所以在此翻译一下全文
复杂系统中高阶相互作用的物理学
The physics of higher-order interactions in complex systems | Nature Physics
复杂网络已经成为建立相互作用系统动力学模型的主要范例。然而,网络本质上仅限于描述成对的相互作用,而真实世界的系统通常是由3个或更多个单元组成的拥有属性组成的高阶相互作用。高阶结构,如超图和单纯复形,因此是一个更好的工具,以映射许多社会,生物和人造系统的真正组织。在这里,我们强调了高阶相互作用引起的集体行为的最新证据,并概述了高阶系统物理学的三个关键挑战。
Main
网络科学帮助我们更好地理解我们所生活的这个高度相互关联的世界的演变。它揭示了无数的系统ーー从社交网络中谣言如何传播,到大型生态系统如何在物种之间相互竞争的情况下保持稳定。这些系统共有的一个关键特征是,它们是一系列复杂的相互作用的拥有属性,这些相互作用控制着它们涌现出来的动力。近年来,社会网络、生态系统和人类大脑的结构都被模拟为图表,其中的节点集描述了系统的单位ーー人类、动物或神经元ーー以及编码它们成对相互作用的边。比如这种方法已经发现,一个人群中接触人数的1/4重尾分布会导致流行病阈值消失,使每个人在大流行期间都处于危险之中。它促使人们认识到,小世界网络和集群促进同步,有效的通信结构往往会达成迅速和扩散的共识,但也容易造成错误信息的传播。
Graphs(图论),无论多么方便,只能提供有限的现实描述。它们本质上受到限制,只能表示具有成对相互作用的系统。然而,在许多生物、物理和社会系统中,单位可能以更大的群体相互作用,而这种相互作用并不总是能够被分解为二元耦合的线性组合。例如,来自神经系统的证据表明,高阶效应是存在的,而且从统计学上和拓扑学上来说都很重要( statistically10,11,12 and topologically13,14.)
然而,也有证据表明,这种 higher-order signatures(高阶信号)在某些情况下可能是多余的,并且可以完全用成对相互作用来描述。在生态系统中,证据清楚地表明多种物种之间存在着复杂的多体相互作用,尽管它们的相互作用模式所引起的效应直到最近才得到正式的研究。其他例子包括代谢和遗传系统、社会协调和群体形成。(ther examples include metabolic and genetic systems21, social coordination22 and group formation)
图1: 成对和高阶表示。
image.png高阶相互作用的概念在多体物理学的背景下是众所周知的,例如在强相互作用或范德瓦尔斯相互作用中,在统计机制中也广泛存在。然而,在所有这些情况下,高阶相互作用的表示都很简单,因为它们不会增加问题的复杂性。在通常被描述为网络的复杂系统中,情况是不同的,在许多情况下,这些相互作用必须使用更高级的数学结构来考虑,如超图和单纯复杂形9(hypergraphs and simplicial complexes9)。一些研究已经表明,高阶相互作用的存在可能对网络系统的动力学产生实质性的影响,从扩散和同步到社会和演化过程,可能导致突然的(爆炸性的)状态之间的过渡。此外,虽然大多数复杂系统的研究集中在节点状态的动态演化,但是很自然地认为高阶结构(由超边描述)本身可能具有一个动态状态,从而导致一个全新的动态过程全景。最后,尽管许多数据集可以很容易地可视化为网络,但很少有数据集可以用超图表示。从单位的动力学,可能还有它们成对相互作用的信息,到这些单位之间高阶相互作用的有意义的模式,仍然是一个巨大的挑战。在这个观点中,我们概述了在高阶系统中出现的新物理学的主要特征,并提出了未来研究的三个关键方向。
由许多相互作用的单元组成的系统长期以来被表示为网络,其相互作用仅限于成对的节点,并表示为边。然而,并不总是可以将群体互动描述为仅仅是成对互动的总和。允许真正的群交互的表示包括超图,超图可以编码任意数量的单元之间的交互,而不需要进一步的约束。在这里,阴影节点组表示超边。单纯复形提供了另一种方法。尽管它们比超图更具约束性,但它们提供了获得强大的数学公式的途径。这里用黑色显示边(1- 单形) ,黄色显示全三角形(2- 单形)。注意,在单纯复形中,需要包括单纯形的所有子面(例如,三角形的边)。此约束不适用于超图。
爆炸性转变的一般途径
从耦合振子的动态演化到疾病的传播,网络上的大多数过程都表现出新的集体行为。通常,这种现象用连续的相变来描述: 例如,当控制参数超过临界阈值时,描述振荡器之间同步现象的阶次参数不断增加。类似的转变在网络上也是众所周知的,在网络上,最初被分开的小集群合并在一起,在临界点跨越系统大小的一个非零散部分。相比之下,几年前首次发现了一组特定的链路选择规则的爆炸性转变,对于这些规则,最大星系团的大小在转变时似乎突然跳到一个有限值。虽然这种特殊的转变后来被归类为连续的异常放大现象,但在最初发现后的几年里,爆炸现象成为密集研究活动的焦点。对于不同的过程,如同步过程,证实了几个不连续的相变。
对于以网络为代表的系统ーー只有成对相互作用的系统ーー爆发现象是相当难以获得的。它们可以通过在最自然的动态设置中添加人为的元素或规则来设计,以防止过渡。然而,最终,一旦过渡变得不可避免,这些添加会在顺序参数中产生突然的跳跃。例如,通过将振荡器的固有频率与其频率之间的相关性,同步在异构网络中可以爆炸性地实现。然而,众所周知,爆炸现象在自然界中是存在的,因此,在许多领域中,对爆炸现象的行为有更好的理解是非常重要的,这主要是因为爆炸现象比持续的爆炸现象更难处理、预测和控制。
通过考虑高阶相互作用而超越网络的建模方法提供了一个框架,在这个框架中爆炸性现象自然出现,因此可以更容易地加以研究。最近在一个单纯复杂形式的社会传染演化模型中观察到一个突然的转变,在这个模型中,个体可以假定为感染或易感状态。与以前的建议相比,这里,成对传输并不单独运作,而是可以通过与群体压力相关的单纯的相互作用来加强(图2a)。该模型可用平均场近似解析求解,表明当高阶相互作用的相对权重超过一个阈值时,就会出现从健康阶段到流行阶段的不连续过渡(其中大部分种群受到感染)。有趣的是,包含三体相互作用足以获得一个流行和非流行状态可以共存的双稳区。这个结果被认为是稳健的和普遍的。实际上,在异质结构和时变结构中以及在更一般的超文本中都观察到了爆炸性跃迁,这些跃迁也可能与高阶不连续渗流过程46有关。
爆炸性并不仅限于扩展过程。对于生物学和神经科学来说,最重要的是耦合振子系统,其中节点的状态是 d 维连续变量,在相互影响下随时间演化(图2b)。最著名的设置可能是 Yoshiki kuramoto提出的,其中一维相位振荡器被赋予了固有频率,相互作用通过正弦耦合发生。在考虑振子之间的结构化高阶相互作用时,附加的非线性会在同步态和非相干态之间产生突变开关。双稳态的出现和滞环的出现仅仅是由于高阶相互作用的存在,而不需要节点的动态演化和局部连通性之间的特定耦合机制。
在这两个例子中,引入高阶相互作用相当于使一个节点的状态变量受到其他几个节点状态的非线性组合的影响。通过调整高阶和成对相互作用强度的相对重要性,可以在两种情况下改变从连续到不连续过渡的性质(图2c)。在这两个完全不同的动力学过程中产生一阶跃迁的机制的相似性导致了这样的猜想: 引入非线性高阶相互作用及其强度的调谐构成了动力学过程中产生突然跃迁的一般要素。
然而,尽管有了这些初步的证据,对于这个猜想仍然缺乏严格和普遍的证据。基于常微分方程不动点线性化的近似方法将超图动力学的稳定性与它们的图投影联系起来,提出了与不同阶次的相互作用有关的稳定性的一般条件。平均场处理允许对任意结构上的扩散和扩散过程进行解析解,将稳定性条件分为结构和动力学条件。基于分岔理论的一般论证表明,对于包括传染病、同步和渗流过渡在内的广泛类型的模型,成对模型的变化,例如增加高阶相互作用,可以导致临界行为从连续过渡到不连续过渡。在某些条件下,数学家已经能够正式证明,高阶相互作用足以在”易感染-易感染”模型中诱导出双稳态行为,而在传统的成对模式中不可能实现双稳态55。总之,研究结果表明,高阶相互作用的存在为爆炸现象提供了一个普遍的途径。然而,这一高阶系统集体行为脆弱性的标志仍有待正式证明。
图2: 高阶相互作用导致爆炸现象。
image.png
拓扑动力过程
图3: 高阶系统是完全动态的。
image.png
与传统的节点动力学描述不同,我们可以为任意阶的超边或简单单元定义状态变量,例如将振荡子关联到边界,然后利用它们的高阶邻接将它们相互耦合。这样,动态单元和相互作用之间的区别就消失了,顺序之间的依赖和反馈循环就成为可能。例如,可以把 k 阶超边(这里 k = 1,边或1- 单纯形)的动力学投影到它们的大阶类比(这里 k = 2,3- 超边或2- 单纯形)上。类似地,也可以投射到较小阶数的类似物上(k = 0,节点)。
网络动力学过程的研究大多集中在节点状态的动力学上,以链路为中介的相互作用。这是一种自然而直观的方法,因为它描述了系统最基本单元的演变,并通过网络中唯一可能的(也是最简单的)交互进行耦合。然而,通过编码高阶相互作用,可以定义不同阶次(节点、超边或单纯)相互作用之间的耦合。更重要的是,我们不仅可以将状态变量关联到节点,还可以将状态变量关联到超边和简单边。例如,边的状态可以影响其两个关联节点的状态,同时促成并受到它所属的高阶相互作用(例如,一个3超边)的状态的影响。通过这种方式,高阶动态系统将静态相互作用转化为与系统其余部分耦合并随时间演化的活动主体。
单纯振荡器的最新研究结果为这一现象提供了一个特别引人注目的例子。考虑一个 Kuramoto 模型定义在一个由节点,边和2单元组成的单纯复形上。在这种情况下,阶段不仅定义在节点上(如传统的描述) ,也定义在高阶面上。经典形式中使用的方程可以直接适用于高阶相互作用,方法是用适当的高阶类比代替节点关联矩阵。在单纯复形中,这些矩阵对应于一阶不同的相互作用之间的边界算子,如节点与边,或边与2- 单形,有效地提供了不同阶相动力学之间的标准映射。有趣的现象出现了,但没有增加更多的复杂性: 1-simplices (边)上的动力学显示了同步过渡57,只有当投影到高维(2-simplices,图3b)或低维(节点,图3c)的单体上时才会显示出来。实际上,相变出现在两个投影动力学,这是有关的无旋和螺线管成分的高阶动力学。当这些动力通过各自的全球秩序参数耦合起来时,这些转变就会变得爆炸性。
Hodge 分解从高阶状态的内部结构的角度为这种行为提供了一个理论基础28,57。实际上,这些分量可以分解为谐波分量、螺线管分量和无旋分量,分别对应于高阶拉普拉斯算子核所诱导的动力学分量和投影到高维和低维单体的动力学分量。在这种情况下,高阶系统可以被认为是拓扑信号的集合ーー与各阶相互作用有关的时间序列,它们有助于在代数拓扑、微分几何和离散微积分之间的交界处使用工具进行分析。作为这个范例,最近证明了更高阶的拉普拉斯函数可以改进对标准图拉普拉斯59的边上流信息的描述。即使单纯复形只包含节点和边,对其描述也有所改进。高阶拉普拉斯公式也为一般拓扑空间60的信号处理提供了第一个公式。
最后,即使定义了高阶相互作用的状态,系统的拓扑结构ーー即单边和超边的存在与否ーー通常也被认为是在时间上固定的(例如,在神经代码15中)。然而,在许多系统中,交互的组织随着时间的推移而变化。如何定义拓扑协同进化的真实模型,使高阶结构和高阶动力学在相互反馈的作用下共同演化,这仍然是一个有待解决的问题。
从数据推断高阶相互作用
图4: 高阶系统的推理仍然是一个开放的和具有挑战性的问题。
image.png
尽管网络数据丰富,但很少有记录包含重构系统高阶交互所必需的信息。人们已经提出了许多工具和概念来解决这个问题,但是现有的提取与高阶交互有关的信号的方法仍然缺乏。基于数据驱动的建模和贝叶斯推断的结合的重建技术提供了一种有效方法的早期证据。
模拟实际系统的一个关键要素是从数据中重建高阶相互作用(图4)。网络系统上可用的绝大多数数据只包含成对交互的记录,即使底层规则依赖于高阶模式。天真地把成对网络中每一个观察到的稠密子图(例如,三角形和较大的团)归结为一个假定的高阶相互作用,混合了实际超边的存在和边的巧合堆积,否则可能出现在群落结构中,同相或几何嵌入。最近的工作已经证明,通过将问题转换为一个贝叶斯推断任务,考虑到最终重建过程中的简约性,区分超边和低阶边的组合是可能的(63)。使用这种方法,只有在统计证据支持的情况下,才能识别超边。目前尚不清楚如何将这些方法概括为包括更现实的模拟假设,包括与中尺度结构和潜在空间嵌入更紧密的相互作用(64)。
64.HONEM: Learning Embedding for Higher Order Networks | Big Data (liebertpub.com)
即使有明确的超边界数据,就像成对的网络数据一样,错误和不完整也是不可避免的,这要求我们从不确定的观察中重构研究对象。对于超图数据,最近的工作67提出了一种基于与零模型比较的方法,这种方法能够过滤掉统计意义不明显的超边。还需要做更多的工作,以便对以重建为条件的分析提供不确定性量化,并利用更先进的超边界预测技术来提高准确性。
除了从直接但不确定的数据进行重构之外,从间接数据(如时间序列)推断高阶结构也是一个挑战,这些间接数据编码了节点的动态行为,而不是直接测量的边和超边。这是许多生物系统中的一个重要问题,例如大脑,帕金森病和精神分裂症等疾病都与功能失调的脑连接体有关,但是通常没有直接的网络测量方法。一种常用的方法是计算时间序列之间的相关性和测量同步性。然而,这些方法对底层系统的理解并不可靠,因为它们无法区分相关性和因果关系ーー两个或两个以上的节点可能高度相关,即使它们不共享一个边或超边。另一组方法涉及利用时间相关性,例如,给定一组多变量时间序列的相位动态重构。这种方法最初只是为成对的互动而设计的,现在已经被推广用来解释相互作用单位的small motifs。
针对三连体的新同步措施的发展使得从实验数据中识别多体锁成为可能,即使隔离的每一对系统仍然是异步的。这种方法能够更好地区分物理连接和有效连接,这些连接与一个节点对另一个节点的时间影响相关联,从而导致更可靠的网络重构方法。
最后,另一种可能性涉及扩展信息理论技术,如格兰杰因果关系和转移熵(Granger causality78 and transfer entropy79),以解释多体相互作用multi-body interactions.的存在。尽管从静态低阶项目和多体信息论量子(static lower-order projections63 and in multi-body information-theoretic quantities80
)中重建高阶相互作用的第一步很有希望,但拓宽这一框架以充分考虑高阶相互作用格式的任务仍然是一个有待解决的问题。
仅仅基于时间相关性的重建方法仍然存在无法充分区分直接和间接因果关系的问题,这意味着它们无法区分节点之间实际边缘或超边缘的存在与连接节点的较长路径。他们同样无法辨别非因果关系。一般来说,只有我们能够采取干预措施,而不是仅仅依靠观测数据,才有可能避免这个问题。然而,基于生成模型贝叶斯推断的方法能够表达因果关系的不确定性。未来的一个重要方向是推广这类方法,以包含时间变化的,并描述出现的高阶几何91。
An important future direction is to generalize such methods to incorporate higher-order interactions83,84,85,86,87,88,89 that vary in time42,43,90 and describe emergent higher-order geometry91.
具有高阶相互作用的网络系统的研究仍处于初级阶段,对发现者提出了新的挑战和机遇。然而,它也受到过去想法的启发。例如,早期的工作考虑了耦合单元系统,其中不同阶的依赖关系通过特定的图形结构编码,澄清了高阶对称性如何影响同步。高层次的相互作用也可以对老问题产生新的见解,在那里它们成为有效的理论。一个典型的例子是具有高阶相互作用的相振子网络,它是由非线性振子系统98,99,100的相位缩减而产生的。因此,理解具有高阶相互作用的相减系统的动力学也可以澄清一般的高维系统101,102,103,104的物理学,特别是在超稳态105和亚稳态106,107的开始。因此,除了为网络科学提供一条振奋人心的前进道路之外,高阶互动还可以为动力系统物理学的更广泛对话创造机会。
From p-spin models12,108 to multilayer109 and non-Markovian temporal networks110
,过去的研究表明,如果考虑更真实的相互作用模式,可能会出现新的现象。克服以前的局限,新的数据和新的理论正在告知我们的网络模型超越了成对的互动。