生物信息组装

NextDenovo 组装基因组

2021-01-22  本文已影响0人  斩毛毛

NextDenovo 是有武汉未来组团队开发出来用于组装ONT,Pacbio, HIFI (默认参数可对60-100X数据更有效),可通过correct--assemble对其进行组装。组装后,每个碱基正确率为98-99.8%, 可进一步通过NextPolish进行polish。

具体详情可阅读githup即可,https://github.com/Nextomics/NextDenovo

1 安装

需要如下:

wget https://github.com/Nextomics/NextDenovo/releases/download/v2.4.0/NextDenovo.tgz
tar -vxzf NextDenovo.tgz && cd NextDenovo

## 测试
nextDenovo test_data/run.cfg

2 简单使用

ls ultra-long-ont.fastq.gz > input.fofn
[General]
job_type = local # sge, pbs
job_prefix = nextDenovo
task = all # all, correct, assemble ;可以进行针对性选择
rewrite = yes # yes/no; 再次运行是否覆盖之前结果
deltmp = yes
parallel_jobs = 22 # tasks 
input_type = raw #  raw, corrected; 输入数据是否是correct
read_type = ont # clr, ont, hifi; 输入数据类型
input_fofn = input.fofn # reads 文件
workdir = HG002_NA24385_son_assemble # 输出文件

[correct_option]
read_cutoff = 1k
genome_size = 3g # estimated genome size 基因组大小评估
sort_options = -m 50g -t 30
minimap2_options_raw = -t 8
pa_correction = 5
correction_options = -p 30

[assemble_option]
minimap2_options_cns = -t 8
nextgraph_options = -a 1
nohup nextDenovo run.cfg &

最终结果

HG002_NA24385_son_assemble/02.cns_align/01.seed_cns.sh.work/seed_cns*/cns.fasta
HG002_NA24385_son_assemble/03.ctg_graph/nd.asm.fasta

后续可进行三代以及二代对纠错即可

参考

上一篇下一篇

猜你喜欢

热点阅读