科研信息学宏基因组学习生信研究生必备

宏基因组分箱(Binning)技术

2019-09-28  本文已影响0人  胡童远

导读

一、分箱工具盘点

分箱工具 发表杂志 发表时间 引用量
ProxiMeta Genome Biology 2019 1
MetaBAT2 PeerJ 2019 4
MetaWRAP Microbiome 2018 14
DAS Tool Nature Microbiology 2018 59
Binning_refiner Bioinformatics 2017 13
COCACOLA Bioinformatics 2017 56
CoMet BMC Bioinformatics 2017 4
MetaBAT PeerJ 2015 465
MaxBin 2.0 Bioinformatics 2015 211
VizBin Microbiome 2015 110
Anvi’o PeerJ 2015 279
CONCOCT Nature Methods 2014 429
GroopM PeerJ 2014 188
MetaCluster 5.0 Bioinformatics 2012 115
PhyloPythiaS Plos One 2012 99

二、分箱工具比较

  1. 2017年Nature Methods上一篇文章对宏基因组数据处理各个过程中的软件进行了评估[ Critical Assessment of Metagenome Interpretation-a benchmark of metagenomics software ]。从文章的分析结果来看,不同的方法各有优缺(下图),MaxBin2可能是相对较好的一个分箱软件。
  1. 加利福利亚大学在通过整合多个算法设计出了新的Binning软件DAS tool并在2018年发表在Nature Microbiology上 [ Recovery of genomes from metagenomes via a dereplication, aggregation and scoring strategy ]。集合了多个算法的DAS tool各项Binning指数要明显优于CONCOCT,MaxBin 2,MetaBAT等方法,比较分析结果如下:
  1. 同年,Microbiome上发表了另一个整合了多个工具的分箱分析流程MetaWRAP [MetaWRAP—a flexible pipeline for genome-resolved metagenomic data analysis. Microbiome]。

三、分箱实战

1. 准备

测试数据.png

2. 统计contig深度

jgi_summarize_bam_contig_depths --outputDepth depth_var.txt *.bam

3. 分箱(4线程,21秒)

time metabat2 -t 4 -i assembly.fa -a depth_var.txt -o metabat2/bin –v

4. 分箱评估 (4线程,32分钟)

time checkm lineage_wf -f metabat2/checkm.txt -t 4 -x fa metabat2/ metabat2/checkm/
##  评估结果保存在checkm.txt文件中。

5. 评估结果:

grep 'bin' checkm.txt | sed 's/^  //' | awk '{print $1,$2,$13,$14}' | sed 's/\ /\t/g'| sed 's/\./\t/' | sort -n -k 2 | sed 's/\t/./' > test.txt
##  从checkm.txt提取

第一列:Bin Id
第二列:Marker lineage
第三列:Completeness
第四列:Contamination

结束语

参考:

  1. 句句干货!一文读懂宏基因组binning
  2. Microbiome:宏基因组分箱流程MetaWRAP简介
  3. 宏基因组分箱Binning以及MaxBin的使用

\color{green}{😀😀原创文章,码字不易,转载请注明出处😀😀}

上一篇下一篇

猜你喜欢

热点阅读