基因组组装组装基因组组装

生信 | 基因组组装实战(二):Survey数据质控、NT比对

2021-06-15  本文已影响0人  生信卷王

写在前面

1. Survey分析的目的

2. Survey分析所需要的数据

每个序列共有4行信息:
Survey测序数据质量值说明:
Survey测序数据质量值说明

3.质控流程

质控流程
3.1、质控:软件trimmomatic
conda install -c bioconda trimmomatic -y
trimmomatic PE -threads 8 \
./${name}_1.fastq.gz ./${name}_2.fastq.gz \
./cleanData/${name}_1.clean.fq.gz ./dropData/${name}_1.drop.fq.gz \
./cleanData/${name}_2.clean.fq.gz ./dropData/${name}_2.drop.fq.gz \
HEADCROP:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:35
3.2、质检:软件fastqc
conda install -c bioconda fastqc -y
fastqc -t 8 -o ../qcReport $filename
3.3、NT比对:软件BLAST
zcat ${name}_1.clean.fq.gz|head -40000 > reads.fa
blastn \
-query reads.fa \
-db /你下载nt库的路径/nt \
-out reads.csv \
-outfmt "10 evalue length qseqid qlen qstart qend sacc slen sstart send pident nident sstrand qcovs qseq sseq sgi stitle" \
-num_threads 4 -evalue 1e-5 -max_target_seqs 1

4.总结

上一篇 下一篇

猜你喜欢

热点阅读