单细胞数据挖掘1-bam-fastq-matrix
2020-05-03 本文已影响0人
大吉岭猹
1. 写在前面
- 数据集介绍
- 测了 LK 和 LSK 细胞的 scRNA-seq,但是作者定义 LK 的方法比较奇怪,之后会把“LK”中 sca-1 阳性的细胞去掉
- 由于作者只提供 bam 和表达矩阵,我们想自己做基于 cellranger 结果的质控就必须先 bam 转 fq,再跑 cellranger count
2. bam-fastq
- 使用 10X 开发的工具 bamtofastq
- 代码
ls bam/Lin*bam | while read id;
do
tmp1=${id%_*}
tmp2=${tmp1%_*}
tmp3=${tmp2%_*}
sample=${tmp3##*_}
echo $sample
bamtofastq-1.2.0 --nthreads=24 $id out_${sample}
done
- 另附曾老师的杂技代码,把上面愚蠢的 4 行代码变成 1 行
a=a_b_c_d
echo $a
b=`echo $a|cut -d"_" -f 3`
echo $b
- 输出结果是三个 bam 各生成了 48 个 fastq 文件
3. fastq-matrix
- 10X 标准流程,cellranger count
- 代码
cellranger count \
--id=lk_cellranger_SIGAH1 \
--transcriptome=/ref/cellranger/refdata-cellranger-mm10-3.0.0 \
--fastqs=/new_lk/step01-bam-fastq-matrix/out_SIGAH1/SIGAH1_MissingLibrary_1_HHW22BBXX \
--sample=bamtofastq \
--nosecondary \
--localcores=18 \
--localmem=30
- 三个标准输出文件位于总的输出文件夹下的
outs/filtered_feature_bc_matrix路径 - 如果要使用未经 cellranger 过滤的数据则使用
outs/raw_feature_bc_matrix路径下的输出文件
友情宣传
- 全国巡讲全球听(买一得五),第二期 ,你的生物信息学入门课
- 生信技能树的2019年终总结 ,你的生物信息学成长宝藏
- 2020学习主旋律,B站74小时免费教学视频为你领路