组装基因组组装

基因组组装作业

2021-10-17  本文已影响0人  FANHONGZENG

1.数据下载

在Genome Announcements网站找一篇细菌基因组文章

选择的文章

找到文章记载的SRA号

SRR11177792

prefetch下载

prefetch SRR11177792

生成以sra结尾的文件

fastq-dump解压

fastq-dump --split-3 --gzip SRR11177792.sra
fastq-dump

2.质控,过滤

fastqc质控

 fastqc -t 10 -o ./ SRR11177792_1.fastq.gz SRR11177792_2.fastq.gz

生成以zip和html结尾的文件


fastqc

trimmomatic过滤

java -jar /home/fanhz1/miniconda3/share/trimmomatic/trimmomatic.jar PE -phred33 SRR11177792_1.fastq.gz SRR11177792_2.fastq.gz -baseout SRR11177792.fq.gz ILLUMINACLIP:/home/fanhz1/miniconda3/share/trimmomatic/adapters/TruSeq3-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 HEADCROP:8 MINLEN:36

会生成以SRR11177792 开头的4个文件


trimmomatic

3.Spades组装基因组草图

spades.py --careful --pe1-1 SRR1117779_1P.fq.gz --pe1-2 SRR1117779_2P.fq.gz -o ./SPAdesout

这个过程有点耗时,花费将近1个小时


spades

4.Quast评价组装的基因组效果

quast.py SPAdesout/contigs.fasta -o quast_out2

这里的生成文件游pdf和html格式,上传到本地之后可以查看结果。


quast.report
上一篇 下一篇

猜你喜欢

热点阅读