宏基因组学习

Megahit 组装结果进一步分析

2018-01-25  本文已影响0人  热爱大自然的小和尚

Megahit是一个简单易用,且内存需求低,对micro variation recovery rate较高,assembly N50表现都比较优异的组装软件,EBI-metagenomic 在线分析平台目前就是使用metaSPAdes(默认),Megahit和Minia三个作为候选组装软件

然而,在拿到contig之后,我们有时还想估计read mapping back的情况,以及coverage和未mapping read的情况。下面的内容引自Megahit在Github上的讲解

4. 计算contig coverage和提取未用于组装的reads

Calculate contig coverage and extract unassembled reads

下面的分析主要使用 BBMapsamtools。我们可以使用相似的代码分析我们自己的数据

4.1 下载 & 安装 BBMap 和 samtools:

# BBmap
wget http://downloads.sourceforge.net/project/bbmap/BBMap_35.34.tar.gz
tar zvxf BBMap_35.34.tar.gz
# samtools
wget https://github.com/samtools/samtools/releases/download/1.2/samtools-1.2.tar.bz2
tar xvjf samtools-1.2.tar.bz2
cd samtools-1.2 && make -j && cd ..

4.2 Align reads with bbwrap.sh:

bbmap/bbwrap.sh ref=SRR341725.megahit_asm/final.contigs.fa in=SRR341725_1.fastq.gz in2=SRR341725_2.fastq.gz out=aln.sam.gz kfilter=22 subfilter=15 maxindel=80

Tips:

4.3 用pileup.sh输出每个contig的coverage cov.txt with:

bbmap/pileup.sh in=aln.sam.gz out=cov.txt

4.4 提取unmapped reads (单端数据用unmapped.se.fq,双端数据用 unmapped.pe.fq):

samtools-1.2/samtools view -u -f4 aln.sam.gz | samtools-1.2/samtools bam2fq -s unmapped.se.fq - > unmapped.pe.fq
上一篇 下一篇

猜你喜欢

热点阅读