NextDenovo 组装基因组
2021-01-22 本文已影响0人
斩毛毛
NextDenovo 是有武汉未来组团队开发出来用于组装ONT,Pacbio, HIFI (默认参数可对60-100X数据更有效),可通过correct--assemble对其进行组装。组装后,每个碱基正确率为98-99.8%, 可进一步通过NextPolish进行polish。
具体详情可阅读githup即可,https://github.com/Nextomics/NextDenovo
1 安装
需要如下:
wget https://github.com/Nextomics/NextDenovo/releases/download/v2.4.0/NextDenovo.tgz
tar -vxzf NextDenovo.tgz && cd NextDenovo
## 测试
nextDenovo test_data/run.cfg
2 简单使用
-
Step1 准备输入文件
ls ultra-long-ont.fastq.gz > input.fofn
-
Step2 配置文件
[General]
job_type = local # sge, pbs
job_prefix = nextDenovo
task = all # all, correct, assemble ;可以进行针对性选择
rewrite = yes # yes/no; 再次运行是否覆盖之前结果
deltmp = yes
parallel_jobs = 22 # tasks
input_type = raw # raw, corrected; 输入数据是否是correct
read_type = ont # clr, ont, hifi; 输入数据类型
input_fofn = input.fofn # reads 文件
workdir = HG002_NA24385_son_assemble # 输出文件
[correct_option]
read_cutoff = 1k
genome_size = 3g # estimated genome size 基因组大小评估
sort_options = -m 50g -t 30
minimap2_options_raw = -t 8
pa_correction = 5
correction_options = -p 30
[assemble_option]
minimap2_options_cns = -t 8
nextgraph_options = -a 1
-
Step3 运行
nohup nextDenovo run.cfg &
最终结果
-
corrected reads
HG002_NA24385_son_assemble/02.cns_align/01.seed_cns.sh.work/seed_cns*/cns.fasta
-
Final assembly result:
HG002_NA24385_son_assemble/03.ctg_graph/nd.asm.fasta
后续可进行三代以及二代对纠错即可