基因组组装作业
2021-10-17 本文已影响0人
FANHONGZENG
1.数据下载
在Genome Announcements网站找一篇细菌基因组文章
选择的文章找到文章记载的SRA号
SRR11177792prefetch下载
prefetch SRR11177792
生成以sra结尾的文件
fastq-dump解压
fastq-dump --split-3 --gzip SRR11177792.sra
fastq-dump
2.质控,过滤
fastqc质控
fastqc -t 10 -o ./ SRR11177792_1.fastq.gz SRR11177792_2.fastq.gz
生成以zip和html结尾的文件
fastqc
trimmomatic过滤
java -jar /home/fanhz1/miniconda3/share/trimmomatic/trimmomatic.jar PE -phred33 SRR11177792_1.fastq.gz SRR11177792_2.fastq.gz -baseout SRR11177792.fq.gz ILLUMINACLIP:/home/fanhz1/miniconda3/share/trimmomatic/adapters/TruSeq3-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 HEADCROP:8 MINLEN:36
会生成以SRR11177792 开头的4个文件
trimmomatic
3.Spades组装基因组草图
spades.py --careful --pe1-1 SRR1117779_1P.fq.gz --pe1-2 SRR1117779_2P.fq.gz -o ./SPAdesout
这个过程有点耗时,花费将近1个小时
spades
4.Quast评价组装的基因组效果
quast.py SPAdesout/contigs.fasta -o quast_out2
这里的生成文件游pdf和html格式,上传到本地之后可以查看结果。
quast.report