cellranger(二)

2024-01-30  本文已影响0人  bioschool点cn

使用

cellranger提供了五个分析模块用于分析单细胞转录组相关产品

1.cellranger mkfastq

调用bcl2fastq软件将illumina测序仪得到的BCL( raw base call )格式文件拆分为fastq文件。工作流如图所示:


一次上机测序两个不同的文库,执行一次cellranger mkfastq

一次上机测序两个不同的文库,<font color=red>分别</font>执行一次cellranger mkfastq

使用方法

$ cellranger mkfastq --id=tiny-bcl \
                     --run=/path/to/tiny_bcl \
                     --csv=cellranger-tiny-bcl-simple-1.2.0.csv

参数说明

Parameter Function
--run 必选;BCL文件所在目录
--id 可选;mkfastq将会生成相应目录,不接受绝对路径
--samplesheet
--sample-sheet
可选. 样本名字、index等信息;
[Data] Lane,Sample_ID,index,index2
1,test_sample,TGGTCCCAAG,ACGCCAGAGG
--csv
--simple-csv
可选,类似上面参数
... ...
--output-dir 指定FASTQ输出目录
--localcores 运行的最大CPU数
--localmem 运行的最大内存数

2.cellranger count:

分析cellranger mkfastq或者其他方式得到fastq格式的文件。这个模块包括比对、过滤、barcoding计数以及UMI计数。可以生成barcode-UMI信息,进行聚类及基因表达分析。不过我们通常用到表达信息,使用其他方式进行聚类及其他单细胞相关分析。

在分析count之前需要先下载参考基因组:

$ wget "https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-GRCh38-2020-A.tar.gz" #人
$ wget "https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-mm10-2020-A.tar.gz" #鼠

或者参照教程使用cellranger mkref自己构建参考基因组

$ cellranger count --id=sample345 \
                   --transcriptome=/opt/refdata-gex-GRCh38-2020-A \
                   --fastqs=/home/jdoe/runs/HAWT7ADXX/outs/fastq_path \
                   --sample=mysample \
                   --localcores=8 \
                   --localmem=64

输出结果包括以下信息:

Outputs:
- Run summary HTML:                 /outdir/outs/web_summary.html
- Run summary CSV:                  /opt/sample345/outs/metrics_summary.csv
- BAM:                              /opt/sample345/outs/possorted_genome_bam.bam
- BAM index:                        /opt/sample345/outs/possorted_genome_bam.bam.bai
- Filtered feature-barcode matrices MEX: /opt/sample345/outs/filtered_feature_bc_matrix
- Filtered feature-barcode matrices HDF5: /opt/sample345/outs/filtered_feature_bc_matrix.h5
......

count分析完成之后可以使用浏览器打开web_summary.html文件查看报告,网页版报告主要包括以下几个方面的内容:

Summary包括鉴定到的细胞数、reads数中值、基因数中值、比对率、饱和度等基本信息

Gene Expression View包括T-SNE降维结果、初步的聚类及每个cluster的高表达基因。

<font color="red">建议结果部分我们重点关注Summary,来判断文库构建及测序是否合格。</font>

3.cellranger multi:

用于分析细胞混合或者固定RNA数据,和count类似,multi也包括比对、过滤、barcoding计数以及UMI计数。可以生成barcode-UMI信息,进行聚类及基因表达分析等。

上一篇下一篇

猜你喜欢

热点阅读