『三代测序』

Assembly--软件PBcR和Canu

2019-06-10  本文已影响39人  晓佥

1.PBcR

下载说明页:
http://wgs-assembler.sourceforge.net/wiki/index.php?title=PBcR

安装:

 bzip2 -dc wgs-8.3rc2.tar.bz2 | tar -xf -
 cd wgs-8.3rc2
 cd kmer && make install && cd ..
 cd src && make && cd ..

1.PBcR是混合组装工作流。工作原理是首先提高单分子序列的准确性,然后组装改进的序列
2.组装PacBio或Oxford Nanopore数据
3.perl程序所写,需要的模块较多
4.Celera Assembler算法
5.不再被维护



测试数据: Lambda Phage(噬菌体)
命令行:
PBcR PBcR -length 500 -partitions 200 -l lambda -s pacbio.spec -fastq pacbio.filtered_subreads.fastq genomeSize=50000
fastqToCA -libraryname illumina -technology illumina -type sanger -innie -reads illumina.fastq > illumina.frg
PBcR -length 500 -partitions 200 -l lambdaIll -s pacbio.spec -fastq pacbio.filtered_subreads.fastq genomeSize=50000 illumina.frg

-s pacbio.spec

2.Canu

安装:
git clone https://github.com/marbl/canu.git
cd canu/src && make
Canu是一个分层组装管道,分四个步骤运行:

        1.使用MHAP检测高噪序列中的重叠
        2.生成校正的序列共识
        3.修剪校正序列
        4.组装修剪后的校正序列

组装PacBio或Oxford Nanopore序列


测试数据:大肠杆菌K12
下载:
curl -L -o pacbio.fastq http://gembox.cbcb.umd.edu/mhap/raw/ecoli_p6_25x.filtered.fastq
命令行:
canu -p ecoli -d ecoli-pacbio genomeSize=4.8m -pacbio-raw pacbio.fastq
上一篇下一篇

猜你喜欢

热点阅读