10X空间转录组Visium与单细胞转录组整合分析
Spatial mapping of cell types by integration of transcriptomics data
众所周知,目前的空间转录组技术还没有达到单细胞水平,所以还不能叫做空间单细胞转录组技术。以10X Visium 为例,每个spots 中的细胞数量在10的某个领域内:
空间转录组芯片上含有上千个捕获的spot,这些捕获探针的 Poly-T 尾可以结合RNA分子的 Poly-A 尾。这些阵列的排列顺序就像一个棋盘,带有相同身份条形码(barcode)的探测位于同一个正方形中。这样就可以确定每个捕获探针及其结合RNA的来源。
我叫空间局部bulk-RNA技术如何借助这两项技术的优势,把空间和单细胞数据关联到一起分析呢?我想这个充满机遇的世界里面已经有人这样做了,这就是与10X 空间流程发布的同一天发表的这篇文章。
空间转录组学和单细胞rna测序对转录表达格局提供了互补的见解。我们在这里提出了一种概率方法,它集成了来自这两种技术的数据,利用它们各自的优势,使我们能够在空间上将细胞类型映射到组织空间信息上去。该方法适用于几种不同类型的组织,并成功地描绘出细胞的空间形态。
他们使用的方法如下
- 选择带注释的单细胞数据和一组具有相似细胞类型内容的ST数据进行分析。
-
由单细胞数据估计出表征该表达的负二项分布的参数,第一个参数(比率,(the rate))取决于基因和细胞类型,第二个参数(成功概率, (the success probability) )只取决于基因。
-
估计参数用于推断每个spot细胞类型的比例。
+细胞类型的空间组织是可视化的,通过让每个点的脸颜色的不透明度代表比例值。
给一个例子, 利用gt-SNE包埋(内区)可视化单细胞海马数据,在mb-B样本的h&e图像(外区)上叠加多个簇的空间比例估计(10x)
Visium阵列,55微米斑点)。亚群标签派生自原始的单细胞数据集(方法)。
在小鼠大脑单细胞数据集中定义的56个簇中的3个簇(这里作为细胞类型)的估计比例。使用mb-A (ST阵列,100微米点)和mb-B两个不同的部分来说明不同阵列分辨率之间的一致性。通过ISH获得的标记基因表达模式见于最下面一行,取自艾伦大脑图谱。Rarres2是室管膜细胞的标记基因,Prox1为齿状颗粒神经元和锥体神经元的Wfs1(后两者都是神经元的亚型)
整个算法以及流程已经发布在github上了。