三、数据质控

2021-02-24  本文已影响0人  白米饭睡不醒

1.fastq格式介绍

1.1 1.2 1.3 1.4
#统计reads_1.fq文件种共有多少条reads
zless -SN SRR1039510_1.fastq.gz  | wc -l

#.输出reads_1.fq文件中所有的序列ID(即第一行)
zless -SN SRR1039510_1.fastq.gz  | paste - - - -  | awk  -F  '{print $1}'  | less -S

2.数据质控

2.1 2.2
# 激活conda环境
conda activate rnaseq

# 连接数据到自己的文件夹
ln -s /teach/data/airway/fastq_raw25000/*gz .

# 使用FastQC软件对单个fastq文件进行质量评估,数据放在fqdir路径里,结果输出到qc/文件夹下
qcdir=~/project/Human-16-Asthma-Trans/data/rawdata/qc
fqdir=~/project/Human-16-Asthma-Trans/data/rawdata/fastq
fastqc -t 3 -o $qcdir  $fqdir/SRR1039510_1.fastq.gz

# 多个数据质控
fastqc -t 10 -o $qcdir $fqdir/SRR*.fastq.gz

#nohup sh qc.sh >qc.log &
#jobs

# 使用MultiQc整合FastQC结果(将众多zip文件整合在一起)
multiqc *.zip

3.质控报告的理解(html)

3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 3.11 3.12 3.13 3.14 3.15 3.16 3.17 3.18 3.19 3.20
上一篇 下一篇

猜你喜欢

热点阅读