Linux转录组

4. 质量控制fastqc和multiqc

2019-05-26  本文已影响39人  Y大宽

看这个之前先看下批量对多个测序文件进行fastqc

1 把所有文件进行fastqc,得到QC结果,然后用multiqc整合所有QC结果

$ ls SRR8518*.gz|while read id;do  fastqc -t 4 $id;done 
$ ls *|grep zip
SRR7696207_1_fastqc.zip
SRR7696207_2_fastqc.zip
SRR8707702_1_fastqc.zip
SRR8707702_2_fastqc.zip

这样做显然是不行的,大概做下来得需要7天。所以批量进行,代码如下

$ ls SRR85182*.gz | while read id;do (nohup fastqc $id &);done

这个代码还有很大的改进余地,暂时先这样做,充分利用时间。

2 multiqc进行整合

若没有安装就先安装
国内镜像源不能用了,用下面命令安装

conda install -c bioconda multiqc
multiqc --help
/project/fastqc_result/qc$ multiqc -n wes ./

python3下无法运行multiqc,所以先创建python2的wes环境

$ conda create -n wes python=2
$ source activate wes

因为727个样本中有279个WXS数据,448个RNA-seq数据,所以这一步把html和zip文件分别进行整合到各自的html中,分组信息可以这里下载
https://www.ncbi.nlm.nih.gov/Traces/study/?acc=SRP157974

qc下分别mkdir wes和rnaseq文件夹

wes$ multiqc -n wes_all ./
[INFO   ]         multiqc : This is MultiQC v1.0.dev0
[INFO   ]         multiqc : Template    : default
[INFO   ]         multiqc : Searching './'
[INFO   ]          fastqc : Found 558 reports
[INFO   ]         multiqc : Report      : wes_all.html
[INFO   ]         multiqc : Data        : wes_all_data
[INFO   ]         multiqc : MultiQC complete

打开wes_all.html文件

mean quality scores adapter content

RNA-seq结果

rnaseq$ multiqc -n rnaseq_all ./
[INFO   ]         multiqc : This is MultiQC v1.0.dev0
[INFO   ]         multiqc : Template    : default
[INFO   ]         multiqc : Searching './'
[INFO   ]          fastqc : Found 896 reports
[INFO   ]         multiqc : Report      : rna_all.html
[INFO   ]         multiqc : Data        : rna_all_data
[INFO   ]         multiqc : MultiQC complete

mean quality scores adapter
想看结果的可以下载
wesmultiqc结果 密码:hyrvnh
rnaseqmultiqc结果密码:tp1thn

下一步需要去接头

上一篇下一篇

猜你喜欢

热点阅读