单细胞pepline的上游是怎么构建的?
说到单细胞的上游,自然离不开cellranger,但是如果问你cellranger上游是怎么操作把数据给处理出来的,估计大多数会单细胞的人张目结舌,半天说不出话来,睁大眼睛说,“上游的什么我不关心,下游才是我的菜……”
上面这句话纯属自我调侃,纯粹是最近突然遇到完全要自定义单细胞上游的处理,才发现自己还是有很多不懂的地方
Comparison of High-Throughput Single-Cell RNA Sequencing Data Processing Pipelines | bioRxiv
image.png看明白了上面这张图,那么自己手撸一个单细胞上游分析的软件也是不是那么复杂的事情了,首先获取fastq之后,将read1和read2合成一个文件,read1作为fastq名字,read2作为序列,然后进行质控,然后进行比对,比对之后可以
2.1.2 一些pepline和软件的评估(当然,由于这篇文章是20年的,所以应该出现了更多工具)
The versions and source urls of the seven pipelines that we evaluated are listed below.
-
Drop-seq-tools (https://github.com/broadinstitute/Drop-seq/releases)
-
Cell Ranger (https://github.com/10XGenomics/cellranger)
-
scPipe (https://github.com/LuyiTian/scPipe)
-
UMI-tools (https://github.com/CGATOxford/UMI-tools)
-
umis (https://github.com/vals/umis)
-
dropEst (https://github.com/hms-dbmi/dropEst)
2.1.3 实验中使用的辅助软件工具
In addition, we used the following data processing and alignment tools.
-
Picard tools version-2.18.14 (http://broadinstitute.github.io/picard)
-
STAR version-2.7.0f (https://github.com/alexdobin/STAR) [29]
-
Rapmap version-0.6.0 (https://github.com/COMBINE-lab/RapMap) [30]
-
SAMtools version-1.9 (https://github.com/samtools/samtools) [31]
-
Nextflow version-19.04.1 (https://www.nextflow.io)