ClusterMap:用于空间基因表达的多尺度聚类分析 | 空间
在空间背景下量化RNA是了解复杂组织中基因表达和调控的关键。原位转录组方法可以在完整的组织中产生空间分辨率的RNA图谱。然而,目前还缺乏一个统一的计算工具来综合分析原位转录组数据。2021年10月,Nature Communications发表了一个无监督和无注释的计算工具:ClusterMap,其在二维和三维空间将RNA精确地聚类到亚细胞结构、细胞体和组织区域中,并在不同的组织类型(包括小鼠大脑、胎盘、肠道和人类心脏器官)中表现稳定。ClusterMap广泛适用于各种原位转录组技术,从高维转录组图谱图像中揭示基因表达模式、细胞生态位和组织结构原理。
为了绘制细胞和组织中基因表达的空间异质性,已经开发了大量基于图像的原位转录组学方法(例如STARmap、Fiseq、ISS、MERFISH、seqFISH、osmFISH等),提供了完整组织中亚细胞RNA定位的图谱。然而,从高维空间转录组数据中直接提取生物模式的低维表示仍然具有挑战性。
ClusterMap是什么?
ClusterMap是基于两个关键的生物学现象。首先,细胞内RNA分子的密度高于细胞外;其次,不同基因编码的细胞RNA在不同的亚细胞位置、细胞类型和组织区域富集。因此,开发团队推断,通过对RNA的物理密度和基因身份进行联合聚类,可以直接从原位转录组数据中确定有生物学意义的模式和结构。随后,根据基因身份和空间尺度对空间聚类进行解析,以表示亚细胞定位、细胞分割和区域识别。
ClusterMap从基于原位转录组数据的预处理成像开始,原始荧光图像被转换成具有物理3D位置和基因身份的离散RNA点。开发团队引入了一个高维向量,称为邻域基因组成(NGC),它是通过考虑每个RNA点上圆形窗口的基因表达谱来计算的。每个RNA点的NGC坐标和物理坐标通过计算整合成每个点上的联合物理和NGC(P-NGC)坐标。接下来的目标是在P-NGC坐标系中对RNA进行聚类,以便进行下游分割。开发团队选择了密度峰值聚类算法(DPC)来计算两个变量:P-NGC联合空间中每个点的局部密度ρ和距离δ。然后将这两个变量的乘积γ按照递减的顺序进行排序,以找到真正的具有高数量级γ值的集群。
ClusterMap的性能评估
与此前的方法相比,ClusterMap在模拟数据集和生物数据集中均表现出稳定的高性能。此外,ClusterMap广泛适用于各种实验方法,包括但不限于STARmap、MERFISH、ISS和osmFISH。结果表明ClusterMap从不同组织样本的原位转录组数据中准确地创建了RNA注释的亚细胞和细胞图谱,这些组织样本具有不同的RNA定位、细胞密度、形态和连接。
开发团队在五个模拟聚类基准数据集和一个由STARmap收集的代表性原位转录组数据中测试了ClusterMap的性能。与以前的方法相比,即使在斑点分布包含不规则的边界、不同的物理密度以及不同形状和大小的情况下ClusterMap在所有六个数据集中均表现出稳定的性能。
ClusterMap在小鼠初级皮质(V1)生成细胞类型和组织区域图:即使是密集的小鼠V1皮质细胞,细胞分割也清晰可见;与人工注释的分割标签相比,ClusterMap细胞标签的准确率达到80~90%;在小鼠V1皮层数据集中,ClusterMap确定了与之前报告中表达特征和组织定位都相匹配的细胞类型;ClusterMap准确地检测到皮质分层,从而可以对每个皮质层的细胞类型组成进行量化。综上,ClusterMap可以有效、准确、自动地进行细胞分割、细胞分型和组织区域识别。
ClusterMap在小鼠胎盘中生成细胞类型和组织区域图:鉴定了多达7224个细胞,通过使用Louvain算法将其聚类为12种细胞类型,其标记基因与scRNA-seq定义的细胞类型一致;ClusterMap根据细胞类型图确定了五个组织区域。
ClusterMap揭示胎盘中的细胞生态位和细胞-细胞邻接图。
开发团队分析了来自四种具有代表性的原位转录组学方法的小鼠大脑数据,验证了ClusterMap对不同实验方法的普遍适用性。
ClusterMap支持3D原位转录组学分析:在3D心脏类器官样本中,分层聚类将细胞分为三类,其具有不同的分子特征;100μm厚的小鼠V1样本包括所有六个皮质层和胼胝体,其中鉴定出多达24000个细胞,3D聚集成11种细胞类型,其结果显示了与先前发表的结果相似的空间分布。
ClusterMap将显著地扩展科研人员对从亚细胞器到器官的细胞类型图谱的所有尺度细胞组织的知识,并使单个细胞的局部微环境的进一步表征成为可能。
除了空间转录组数据外,ClusterMap还可以被推广应用于其他二维和三维映射的高维离散信号(如蛋白质或活细胞成像数据)。在未来,预计ClusterMap还可以通过结合其他类型的生物特征(如亚细胞器、细胞形状等)进行扩展,以揭示基因表达如何塑造细胞结构和组织形态的基本原理。
ClusterMap工具将在如下链接更新和维护:
https://github.com/wanglab-broad/ClusterMap
https:// github.com/LiuLab-Bioelectronics-Harvard/ClusterMap
首发公号:国家基因库大数据平台
参考文献
He, Y., Tang, X., Huang, J. et al. ClusterMap for multi-scale clustering analysis of spatial gene expression.Nat Commun 12, 5909 (2021). https://doi.org/10.1038/s41467-021-26044-x
图片来源于NC官网和参考文献,如有侵权请联系删除。