Assembly--软件PBcR和Canu
2019-06-10 本文已影响39人
晓佥
1.PBcR
下载说明页:
http://wgs-assembler.sourceforge.net/wiki/index.php?title=PBcR
安装:
bzip2 -dc wgs-8.3rc2.tar.bz2 | tar -xf -
cd wgs-8.3rc2
cd kmer && make install && cd ..
cd src && make && cd ..
1.PBcR是混合组装工作流。工作原理是首先提高单分子序列的准确性,然后组装改进的序列
2.组装PacBio或Oxford Nanopore数据
3.perl程序所写,需要的模块较多
4.Celera Assembler算法
5.不再被维护


测试数据: Lambda Phage(噬菌体)
命令行:
PBcR PBcR -length 500 -partitions 200 -l lambda -s pacbio.spec -fastq pacbio.filtered_subreads.fastq genomeSize=50000
fastqToCA -libraryname illumina -technology illumina -type sanger -innie -reads illumina.fastq > illumina.frg
PBcR -length 500 -partitions 200 -l lambdaIll -s pacbio.spec -fastq pacbio.filtered_subreads.fastq genomeSize=50000 illumina.frg
-s pacbio.spec

2.Canu
安装:
git clone https://github.com/marbl/canu.git
cd canu/src && make
Canu是一个分层组装管道,分四个步骤运行:
1.使用MHAP检测高噪序列中的重叠
2.生成校正的序列共识
3.修剪校正序列
4.组装修剪后的校正序列
组装PacBio或Oxford Nanopore序列

测试数据:大肠杆菌K12
下载:
curl -L -o pacbio.fastq http://gembox.cbcb.umd.edu/mhap/raw/ecoli_p6_25x.filtered.fastq
命令行:
canu -p ecoli -d ecoli-pacbio genomeSize=4.8m -pacbio-raw pacbio.fastq