前沿技术丨利用MUSE对细胞形态和转录状态进行整合空间分析
组织由处于不同状态的细胞集合构成,显微镜可以通过形态学的相似性来识别和表征细胞类型。单细胞转录组学提供了互补的方法来通过转录状态的相似性来表征细胞类型。空间转录组学的最新进展将这两种方法结合起来,允许在空间转录组学、顺序荧光原位杂交、多重抗错荧光原位杂交和空间分辨转录扩增子读出映射 (STARmap)。然而,对于来自同一细胞的形态学和转录组学数据进行综合分析的通用方法尚缺少。2022年3月,Nature Biotechnology杂志上发表了相关研究,该研究提出了细胞显微图像与基因数据融合分析的人工智能方法MUSE,在包含脑、阿兹海默症的多种生物问题研究中,展示图像与基因的融合能大幅提升我们对于复杂器官空间结构与疾病发展解析的认知能力。
接下来小编带大家一起走进这篇文章
利用MUSE对细胞形态和转录状态进行整合空间分析
Integrative spatial analysis of cell morphologies and transcriptional states with MUSE
【发表杂志】Nature Biotechnology(IF:54.908)
【发表时间】2022年3月
【研究团队】美国加州大学旧金山药学院
研究背景
自从17世纪荷兰科学家列文虎克应用显微镜观察生物细胞以来,细胞形态学的差异性一直作为研究器官、组织内在结构的重要依据,是器官的机理特征研究与复杂疾病的致病特征解析的基础手段。近年来随着单细胞基因组学技术的发展,通过基因表达的差异性来揭示组织器官的异质性成为新的研究方法,为许多重大研究计划(如人类细胞图谱、人类生物分子图谱)的提供了技术支撑。这两种方法分别从不同的维度提供了组织的解析手段,如果将二者结合,能否突破单一方法的观测局限,实现更高程度的器官、疾病特异性的分辨力?

基于形态学(x轴)可以分辨出小细胞与大细胞类型;基于基因表达水平(y轴),可以分辨出高、中、低表达的细胞类型;通过两个模态融合,可以进一步完整解析出组织内全部的细胞类型。
主要结果
MUSE 建立在标准的多视图 AE 神经网络架构之上,并添加了自监督损失函数。该研究对MUSE进行了性能的综合评估,评估数据表明 MUSE 满足了他们对成功的多模态方法的两个先验要求。也就是说,MUSE 使用的结构化自我监督方法有助于捕获和组合仅从任何一种方式都无法获得的判别性信息。此外,MUSE 并没有因为一种或两种方式的数据质量差而过度混淆。

然后将 MUSE 应用于两个实验性小鼠皮层数据集。第一个皮层数据集是使用 seqFISH+ 技术获得的。该数据集包括约10,000 个基因的表达谱和 523 个细胞的 DAPI 和 Nissl 染色细胞图像。MUSE 确定了相对大量的空间共定位的集群。在某些情况下,可以看到同一皮质层内的 MUSE 簇具有不同的形态分布,以及与最近单细胞 RNA 测序(scRNA-seq)中报道的不同谷氨酸能细胞类型相匹配学习。

第二个皮层数据集是使用 STARmap 技术获得的。对于转录模式,该数据集包含 1,020个基因的 973 个单细胞表达谱。在综合分析中,MUSE 利用形态多样性进一步将细胞分解为亚组。“复制”的 MUSE 簇仅基于转录特征是不同的。差异表达分析使他们能够将这些簇注释为星形胶质细胞 (Astro.)、海马神经元 (Hippo.)、少突胶质细胞 (Oligo.) 或平滑肌 (SMC) 细胞。 “发现”的 MUSE 集群从任何一种单一模式中都被遗漏了,它们单独只提供了微弱的差异。在这里,来自两种模式的弱异质性的组合使 MUSE 能够识别不同的 L2/3、L5 和 L6 结构。

遗传多样性和肿瘤微环境变异可以极大地影响癌症进展、诊断和治疗。该研究利用了 ST 收集的胰腺导管腺癌 (PDAC) 数据集,该数据集提供了基于组织点(而不是基于单细胞)的转录状态报告。研究者将 MUSE 应用于可用的 ST 和图像多模态数据,并确定了两个形态上不同的癌症区域,每个癌症区域都基于特征标记基因捕获了两个不同的克隆之一。在癌症区域之外,MUSE 还将非肿瘤组织分解为空间上不同的子区域。他们对这些簇进行了差异表达分析,以研究跨组织区域的变化。顶部过表达的癌症区域基因是先前鉴定的 PDAC 生物标志物;这些基因随着与癌症区域距离的增加呈下降趋势。相比之下,顶部过表达的非癌区基因显示出相反的距离趋势。

接下来,该研究使用 10x Visium 空间平台将 MUSE 应用于最近生成的男性成人结肠数据集。受最近一项研究的启发,他们使用来自该组织中主要细胞类型的已知标记来评估已识别簇的一致性。他们专注于四种主要细胞类型,它们被标记为上皮细胞、肌肉细胞、免疫细胞和内皮细胞。在簇内清楚地识别出上皮和肌肉层。与单独的图像模态相比,MUSE 和转录簇通常显示出更高的层特异性基因富集。免疫和内皮细胞在 H&E 图像中出现空间分组。对于免疫区域,仅图像和 MUSE 亚群显示更高的标记富集,而对于内皮区域,仅转录本和 MUSE 显示更高的标记富集。

最后,研究了 MUSE 如何利用组合的 ST 和病理生物标志物图像数据。为此,该研究利用了一项关于大脑中淀粉样蛋白-β (Aβ) 肽沉积(阿尔茨海默病(AD)的关键病理生理学标志)的研究。在具有转录本 (ST) 和 Aβ 分布(免疫荧光成像)的区域信息的多模式 AD 数据集上评估了 MUSE50。对于每个样本,他们分析了一个组织切片,该切片在空间上进行了 ST 测序,以及相邻切片的 Aβ 免疫染色。对于形态学模态,为每个 ST 点分割相邻荧光图像(仅 Aβ 通道)中的相应区域,并使用 Inception v3 模型学习深度嵌入。利用 MUSE 簇来寻找 Aβ 相关基因。确定了四组具有相似区域组成(富含丘脑、下丘脑、海马和皮层)但年龄组成不同的 MUSE 集群。总之,对 MUSE 集群的分析揭示了反映 AD 进展的区域、时间和生物学差异,并提出了 APP 处理在大脑区域之间不均匀的假设。

研究结论
细胞异质性的表征对于了解健康和疾病中组织的组织和功能至关重要。研究组织多样性的两种广泛使用且经过充分验证的方法是显微镜(捕获形态差异)和 scRNA-seq(捕获转录差异)。MUSE 利用包含自我监督和自我重建损失的学习架构,鼓励在这些不同模式中观察到的亚群结构的综合。本研究证明,对于合成数据和来自不同平台的各种生物数据集合,MUSE 可以揭示单一模式或其他方法遗漏的新亚群结构和组织。
文章亮点
1、本文提出了一种多模式结构化嵌入 (MUSE)技术,它可发现任一模态遗漏的组织亚群并补偿特定于模态的噪声。
2、研究者将 MUSE 应用于包含空间转录组学和成像模式的各种数据集,在健康的大脑皮层和肠道组织中确定了具有生物学意义的组织亚群和定型空间模式。
3、在患病组织中,MUSE 揭示了与肿瘤区域接近的基因生物标志物和阿尔茨海默病脑区淀粉样前体蛋白加工的异质性。
参考文献
Bao F, Deng Y, Wan S, et al. Integrative spatial analysis of cell morphologies and transcriptional states with MUSE.Nat Biotechnol. 2022;10.1038/s41587-022-01251-z.
李超 | 文案
