Nature综述:单细胞和空间转录组的数据整合
器官包含了众多类型的细胞,其中不同的细胞在空间上的相互作用,与其功能密切相关。然而,单细胞测序破坏了细胞间的空间关系,而空间转录组并不能区分出特定的细胞。如何将这两类数据整合使用,自然遗传学综述21年6月的论文“整合单细胞和空间转路组数据,来阐述组织空间细胞间动态的论文,概述了相关方法。
空间转录结合单细胞,可应用于对组织内稳态,组织发育,疾病微环境,肿瘤和免疫细胞组织的微环境中,不同类型的细胞如何在空间互作的研究。
该类研究的步骤是,先对不同类型的细胞测序后进行聚类,之后通过空间标记及染色切片,拿到空间的转录信息,之后对空间中的每个方格进行细胞类型判别,得出图d中,两种细胞间相互作用的,关于配体受体相互作用的发现,即绿色的细胞和红色的细胞相邻,而红色的蓝色的细胞不相邻,故其中没有相互作用。
具体的研究步骤,首先是选出研究的关注点,之后对组织样本进行切片,通过空间标记和单细胞测序,找出高分辨率RNA探针的影像(HPRI),之后对方格进行细胞类型判别,识别出组织间的分界线,之后对细胞间的交互进行分析。
单细胞和空间转录数据的结合算法,可以分为三类。
第一类是逆卷积Deconvolution,其输入是单细胞数据和空间标记(barcoding)得到的空间转路组数据,输出是每个方格内,不同细胞类型所占的比例及每类细胞个数,该类方法包括SPOTlight,SpatialDWLS,stereoscope,Robust cell-type decomposition及cell2location。
Deconvolution 式整合的示意图
第二类方法映射,是对探针得出的某部分组织的转录本数据(HPRI),根据和单细胞数据进行共聚类或最近邻回归,得到某个区域中最可能的细胞类型或不同细胞类型的概率饼图,该类方法包括pciSeq,Harmony,LIGER,Seurat等。
映射法整合空间转录和单细胞的方法示意图
逆转录和映射这两种方法之间,并不存在清晰的分界线。前者分别关注每个空间中方格的情况,后者则是全局的进行分析。从使用的统计模型,可以将单细胞和空间转录整合的方法,分为以下四种,分别是,基于回归的,基于概率模型店,通过相对聚集程度计算得分的,基于后聚类的方法,每种方法越来越倚重整个切片的全局信息,而不是对每个方格进行独立地判定。
四种统计模型及其和前述的两类方法的对应关系
而第三类方法,可以直接完成空间上的配体受体相互作用分析,例如Fawkner Corbett 等 在2021年提出的方法,可以使用barcoding空间转录组和单细胞数据,算出相邻的以及单个方格内部,一对指定细胞间,是否存在相互通讯的P值和相关系数;Giotto则是根据HPRI或barcoding数据,得出每对不同类型的细胞间相互通讯的分值。SpaOTsc则是得出二维或三维的细胞间通讯地图,而SVCA(空间差异成分分析),则可量化的估计空间上的表达量差异,有多少比例可以被细胞间的互作解释。
在判定细胞间的相互作用是否存在时,具体的机制分为两种,首先是下图A中描述的,相邻的细胞间存在相互作用,而图B描述的,则是对于空间上不相邻的两类细胞,如果一个细胞表达了另一个细胞所需的目标基因,那么也可以判定这两类细胞间存在着相互通信。最下方的图,则说明只基于单细胞数据,可以根据表达的基因判定两类细胞间,并不存在相互通信,但空间组数据的引入,可以预测细胞间通信的最长可能距离,并发现之前根据染色数据得出的,空间上能够相互交流的细胞可位于的最远的距离其实比实际距离要低。
该研究的未来方向,一是关注多个切片放映的组织学特征,而不仅仅是单张切片上细胞间的相互交流,例如 ST-Net,可以根据102个基因的空间变化,通过深度学习识别组织层面的相互作用;二是临床上的应用,例如对肿瘤及神经退行性疾病发展过程中,不同类型细胞发挥的作用的研究。