空间转录组第五讲:10x spaceranger aggr合并多
10x空间转录组数据跑完Space Ranger之后都会生成单个样本的cloupe.cloupe文件,这个文件可以用Loupe Browser来对单个样本进行可视化,Loupe Browser操作简单、结果直观,非常适合不太会写代码的老师或同学来自己挖掘数据。但是,做过单细胞或空间转录组项目的同学应该都知道,实际上做数据分析的时候是需要多个样本合并起来分析的,如果再用单个样本进行可视化就不太合适了,所以我们需要把多个样本的cloupe.cloupe整合成一个合并的cloupe文件,这样就方便自己用Loupe Browser来有效的挖掘有价值的信息。
这里我们来介绍一下,怎么用10x spaceranger aggr来合并多个空间转录组测序的样本数据。
- 第一步
确保单个样本的spaceranger count已经跑完了,假如我们前面运行spaceranger count时生成了三个文件:
$ spaceranger count --id=LV123 ...
... wait for pipeline to finish ...
$ spaceranger count --id=LB456 ...
... wait for pipeline to finish ...
$ spaceranger count --id=LP789 ...
... wait for pipeline to finish ...
第二步
准备样本信息的csv文件,内容格式如下(注意逗号分隔)。
图片列信息说明:
library_id****:样本id
molecule_h5****:运行spaceranger count生成的molecule_info.h5文件路径
cloupe_file****:运行 spacerangercount生成的cloupe.cloupe文件路径
spatial_folder****:运行 spaceranger count生成的spatial文件夹路径
除了上面指定的4列之外,也可以加入其它分类信息的列,最后会在Loupe Browser可视化的时候当成一个分组方式来展示。比如下面,增加一列样本分组信息,不过注意这里因为宽度的原因把spatial_folder列省略掉了,实际上spatial_folder这一列还是有的。
图片另外需要注意,spaceranger aggr是不进行批次校准的,所以不同的染色方法的组织是不能合并到一起的(例如免疫荧光和H&E染色的组织切片)。
第三步
运行spaceranger aggr:
$ spaceranger aggr --id=AGG123 \
--csv=AGG123_libraries.csv \
--normalize=none
参数说明:
--id****:输出文件的id
--csv****:样本信息csv文件
--normalize****:depth归一化的方法,默认是mapped,也可以选none。
有两种归一化模式:
-
mapped
(默认):从更高深度的捕获区域进行子样本读取,直到它们平均每个组织覆盖点都有相同数量的读取,这些读取可靠地映射到转录组。如果包含靶向空间基因表达文库,则基于每个点的平均读数进行标准化,这些读数可靠地映射到靶向转录组。目标空间基因表达文库的子采样率乘以 2,前提是所有文库都可以达到该深度。该倍数与测序深度建议一致,并且这样做也是为了避免在目标文库与整个转录组文库结合时从目标文库中移除大部分读数。 -
none
: 根本不规范化。
结果输出:
成功运行后会到的下面的信息(包括主要的输出文件)
转载来自:https://mp.weixin.qq.com/s?__biz=MzUzOTUxOTMxMg==&mid=2247483810&idx=1&sn=1a16102f3ad447799470a41a535e2d30&chksm=fac6719dcdb1f88b561ea442615adf8d2e45b5a9dc63c2c85d1cf9125cb63eb9a964c33917ee&scene=21#wechat_redirect
官网:https://support.10xgenomics.com/spatial-gene-expression/software/pipelines/latest/using/aggregate