SPAdes与Velvet拼接序列 及QUAST评价两者差异
背景:目前用于新一代的测序的主要仪器有Illumina/Solexa的Genome Analyzer、ABI的Solid和Roche的454,它们都能高通量的测序,产生大量的测序结果。接下来就要对序列进行拼接,用于拼接的软件也有很多。这里我们将采用SPAdes和Velvet对同一组数据处理并比较。
处理的文件分别为test_7942raw_1.fq.gz和test_7942raw_2.fq.gz
SPAdes组装
1、由于我的fq文件在Seqs目录下,所以在test文件名前加上其路径,且将文件输出到Seqs目录中
image.png 即输入代码:spades.py --careful --pe1-1 ~/Seqs/test_7942raw_1.fq.gz --pe1-2 ~/Seqs/test_7942raw_2.fq.gz -o ~/Seqs/SPAdesout_7942_new
--注:pe1指第一个pe文库,pe1-1是指第一个pe文库的正向,pe1-2是指第一个pe文库的反向 2、运行成功后,进入Seqs中查看:多了一个SPAdesout_7942_new文件 image.png
其中的contigs.fasta文件为quast处理文件
Velvet组装
velvet的使用分为两步:第一步是velveth利用数据构建一个hash表,第二步是velvetg进行序列拼接
1、输入代码:(用velveth命令构建一个hash表)
velveth velvet_out 31 -shortPaired -fastq -separate test_7942raw_1.fq.gz test_7942raw_2.fq.gz
(注意fq文件的路径,若文件当前目录下,则可不用输入路径)
2、输入代码:(用velvetg命令进行组装)
velvetg velvet_out -exp_cov auto -cov_cutoff auto -very_clean yes
3、就可以看到目录下生成velvet.out文件
image.png
其中的contigs。fa为quast处理文件
QUAST判断两个软件的评价效果
①spades
1、输入代码:
quast.py ~/Seqs/SPAdesout_7942/contigs.fasta -o ~/Seqs/SPAdesout_7942/quast_out
结果显示在/Seqs/SPAdesout_7942/quast_out/下
2、在linux下打开report文件
less report.txt
image.png
②velvet
1、输入代码:
quast.py ~/Seqs/velvet_out/contigs.fa -o ~/Seqs/velvet_out/quast_out
输出结果在/Seqs/velvet_out/quast_out/下
2、打开report文件
image.png
③比较
1、输入代码:./表示在当前目录下,使用的文件和输出都在当前目录下
quast.py -o compare_spa_velvet ./SPAdesout_7942_new/contigs.fasta ./velvet_out/contigs.fa
如图
image.png
3、查看比较结果,打开report.txt文件。两个软件拼接结果整合在一起
less report.txt
image.png 根据出来的n50和max contig长度来判断拼接的效果