空转分析工具 | Spatial-MGCN:基于注意机制识别空间
准确识别空间域对于下游分析至关重要,虽然越来越多的计算方法被开发用于空间域检测,但大多数方法无法自适应地学习基因表达和空间信息之间的复杂关系,导致性能不佳。2023年8月,《Briefings in Bioinformatics》发表了一种新颖的具有注意力机制的多视图卷积网络—— Spatial-MGCN,通过有效整合基因表达谱和空间信息来准确识别空间域。
Spatial-MGCN是什么?
Spatial-MGCN是一种新颖的具有注意力机制的多视图卷积网络,用于空间域识别。首先,开发团队使用多视图卷积网络编码器来提取基因表达信息、空间结构信息及其组合中的特定和共享潜在嵌入。接下来,采用注意力机制来自适应地学习这些潜在嵌入的重要性。为了解决ST数据中存在的zero-inflation和dropout,使用零膨胀负二项模型(ZINB)解码器来捕获原始空间表达谱的全局概率结构。此外,在表示学习中引入了空间正则化约束,通过使潜在空间中的空间相邻点更靠近、空间非相邻点更远离来保留空间相邻信息。最后,将学习到的嵌入应用于识别空间域。
Spatial-MGCN方法概述
Spatial-MGCN的性能测试
为了评估Spatial-MGCN的有效性,开发团队在来自10x Visium和Stereo-seq平台的三个数据集上进行了实验。实验结果表明:Spatial-MGCN在空间聚类和轨迹推理方面具有较强的优势。
Spatial-MGCN可以提高空间域识别的性能:Spatial-MGCN 在所有12个组织切片中实现了最佳聚类性能,中位ARI为0.57,分别比CCST和STAGATE高0.03和0.04。相比之下,其余方法(包括 Seurat、stLearn、SEDR、SpaGCN 和 BayesSpace)的ARI中值均低于0.5。此外,与文献的研究结果一致,Spatial-MGCN嵌UMAP可视化显示了大脑皮层(包括第 1 层到第 6 层以及 WM)的有序发展,这些结果优于其他基线方法。
Spatial-MGCN识别DLPFC上的空间域
Spatial-MGCN能够检测各种分辨率下ST的空间模式,证实了其在ST分析中的广泛适用性。
Spatial-MGCN识别小鼠冠状嗅球数据集的组织结构
Spatial-MGCN可估算基因表达以进一步破译空间模式。
Spatial-MGCN估算DLPFC中的皮质标记基因表达
Spatial-MGCN可以更精细地剖析癌组织的异质性,有助于提高对ST数据的理解。
Spatial-MGCN可以更精细地剖析人类乳腺癌的异质性
消融实验强调了将空间正则化约束、空间和特征视图以及注意力机制集成到Spatial-MGCN中的重要性。这些组件的集成可以更好地识别空间域,并自适应地学习和集成空间和特征信息,最终提高模型的性能和稳定性。
Spatial-MGCN及其变体在DLPFC上的ARI箱线图
尽管Spatial-MGCN在识别空间域方面表现良好,但其使用多视图卷积网络编码器的计算方法是内存密集型的,这阻碍了其在大型ST数据集上的应用。未来,开发团队将使用小批量、并行技术甚至分布式系统来优化模型的效率。此外,还可以通过整合空间组学数据和scRNA-seq数据来进一步优化性能并实现空间域的自动注释。
Spatial-MGCN的代码可以从如下链接获取:
👉 https://github.com/cs-wangbo/Spatial-MGCN.
参考文献
Bo Wang, Jiawei Luo, Ying Liu, Wanwan Shi, Zehao Xiong, Cong Shen, Yahui Long, Spatial-MGCN: a novel multi-view graph convolutional network for identifying spatial domains with attention mechanism, Briefings in Bioinformatics, Volume 24, Issue 5, September 2023, bbad262, https://doi.org/10.1093/bib/bbad262
首发公号:深圳国家基因库大数据平台