进化树作图专题:盘点绘树的14款本地软件(转载)
原文链接:https://mp.weixin.qq.com/s/5xIj1bZSFfx6ah53FTB9bw
未经作者同意,仅做学习,不做商业使用,如作者表示异议我会立刻删除。建议大家关注原文微信号
大家好!很高兴再次见面。本期,让我们进入最重要的主题:让数据说话,看看高水平专业期刊上发表的论文更青睐哪些软件进行进化树绘图。
请注意,本期关注的内容全部是——本地软件!很多朋友也会选用在线工具作图,比如生信人往期栏目中介绍过的iTOL,以及evolview等工具作图,关于它们的情况我们将在以后的推送里进行介绍。
这里,小编选取了12种专业进化树作图软件进行比拼。另外,MEGA和Mesquite两大“万能”软件,虽然其开发初衷并非为了作图,但由于其包罗万象的功能和巨大的影响力,作为外卡持有者特邀参赛。加在一起,共计14种软件,按照英文字母顺序排列如下:Archaeopteryx,Dendroscope,DensiTree,FigTree,HyperTree,MEGA,Mesquite,NJplot,PHYLIP,PhyloDraw,TreeDyn,TreeGraph,TreeView,Treevolution。
我们的目的很简单,就是为了一窥哪些软件更受到高水平的领域内杂志的欢迎。方法很简单,就是统计这14种软件在高水平分子进化和系统发育学(phylogenetics)期刊出现的频数。为了确保全面,小编挑选了以下四本期刊:Molecular Biology and Evolution,Genome Biology and Evolution,Molecular Phylogenetics and Evolution,BMC Evolutionary Biology(小编窃认为这几本期刊基本上涵盖了分子进化和系统发育学的各个重要方向),在这里我们姑且将这四本杂志称为“四大”。为防止杂志选择上的偏差,小编又增加了两本杂志,分别是侧重于系统分类学(systematics)的Systematic Biology和基因组学领域的高产杂志BMC Genomics,同上述四大杂志组成“六大”,以更加全面地了解软件的使用情况。
BTW:这里面,Molecular Biology and Evolution(业内一般简称MBE)和Systematic Biology凭借近年来几乎年年上双的IF当仁不让占据了领域内的头两把交椅。剩下四个的IF加起来还没前两个多,每个在4.0上下浮动。所以,各位生化、分子、结构的实验大侠还求轻虐。
进行统计的时间是在18年的1月5号、6号两天,工具是谷歌学术。
这14种软件在大家心目中的位次是怎样的呢?
让我们来揭晓答案:
image*实际上指的是Phylip整个package里面的DRADIAGRAM 和DRAWTREE
请注意,为确保时间上的相对公平,这里名次是按照2015-2018在“四大”(BIG4)的引用频数进行排列的。此外,引用MEGA和Mesquite的文献很多是对软件其他功能的引用。
小编根据结果,把这14种软件分为三个梯队。
第一集团:(Figtree,MEGA,Meqsuite)
Figtree,MEGA,Mesquite,这三大软件毫无争议地位列三甲,引用次数也是较为接近。不过考虑到MEGA和Mesquite并非是进化树作图的专业软件,引用它们的文章很多并非是单纯拿来做图,小编认为Figtree作为最受欢迎的作图软件是令人信服的。
BTW:同很多生物学软件一样,这三款软件的名字都巧妙地运用到了英语中的双关语。Figtree:无花果树,MEGA:巨大,Mesquite:一种豆类。
Figtree:此处无花胜有花
实际上,自2006年横空出世以来,Figtree就逐渐成为了领域内炙手可热的作图软件。有趣的是,其作者,来自英国格拉斯哥大学(University of Glasgow)的Andrew Rambaut似乎对publication没什么兴趣,以至于大家不得不直接附上网址http://tree.bio.ed.ac.uk/software/figtree/才能完成对Figtree的引用。以下几幅图都是出自Figtree之手。
image小编作图,tree provided by Figtree 1.4.3
imageAdapted from [1]
imageAdapted from [2]
Figtree对进化树的tip和branch的阴影绘制功能(如上图所示)是十分出色的。当然,类似的工作也可以通过MEGA加ps完成。其更多细节生信人公众号将在以后的文章中进行介绍。
MEGA:弄潮儿向潮头立
MEGA(Molecular Evolutionary Genetics Analysis)的鼎鼎大名,想必不需小编多费口舌了。其神通广大的功能包括序列编辑、进化树构建、祖先序列重构(reconstruction of ancestral sequence)、进化模型选择(model selection)、选择压检验(selection test)等等。不过回到我们的主题进化树作图上来,MEGA对于进化树的展示十分方便而且选项较多,又方便和其神通广大的功能相结合,是很多专业人士的首选。不过其也有美观度有所不足的缺陷,从外对于“大树”的应对能力也显得有些单薄。
BTW:包括MEGA建树在内的系统发育树构建的一系列经典操作在生信人公众号最新出炉的24课时视频教程《Hello!树先生》中有详尽介绍。
BTW:MEGA以一己之力撑起了分子进化领域顶级期刊Molecular Biology and Evolution影响因子的半壁江山。MEGA现已更新到第七版,从第四版开始全部发表于Molecular Biology and Evolution。论文的通讯作者,来自美国天普大学(Temple University)的Sudhir Kumar(第七版中为第一作者,通讯为Koichiro Tamura),恰是该杂志的现任主编,可谓真正做到了肥水不流外人田。由于影响因子的计算是以两年为期限,所以该杂志的IF受MEGA影响呈潮汐式规律浮动:涨潮时(新版MEGA发表两年内)可以飙升到14,退潮时(旧版MEGA发表过了超过两年而新版尚未发表的空歇期)又能跌到7.0以下。17年恰逢退潮,IF只有6.2。借用巴菲特的一句名言就是:退潮了才知道谁在裸泳。不过不必担心,该杂志今年又将迎来天文大潮,因为新时代的弄潮儿MEGA7(发表于16年)即将兴风作浪,卷起巨澜至上九霄。像MEGA这样一篇文章对杂志IF的起落到决定性作用的现象,被来自瑞士洛桑大学(Université de Lausanne)的进化生物学家Marc Robinson-Rechavi形象地称为:MEGA Effect [3]。
Mesquite:从来打虎亲兄弟
第一集团里的最后一位就是Mesquite。其作者是我们第一期提到的Maddison兄弟。同MEGA一样,Mesquite功能繁多,而且MEGA能做的基本上它都能做,还包含很多复杂的群体遗传学检验、性状分析和模拟。但这也可能成为其最大缺点,很多功能大家平时是很难用到的,这就难免造成整个软件显得有些凝重。不过说回作图,小编认为其作图还是比较精美的:
imageMesquite Project Team, CC-BY-3.0
同Figtree的作者Andrew Rambaut一样,Mesquite的作者Maddison兄弟似乎也缺少对文章和影响因子追求的热情(Mesquite已更新到第三版,这意味着三篇业内顶尖杂志的publication被白白放弃了),大家使用的时候需要直接引用其网址http://mesquiteproject.org/。而今,Wayne Maddison醉心于跳蛛进化的研究工作,而David Maddison则对甲虫的系统发育情有独钟——也许这才是他们合伙开发Mesquite的初心所在?不知此时此刻,二位爷又在哪里逍遥。
image2010年摄于厄瓜多尔热带雨林,
Wayne Maddison Lab,CC3.0
第二集团:(Dendroscope, TreeGraph, DensiTree, Archaeopteryx)
排在4-7名的四个软件组成了第二集团,下面逐一为大家介绍。
Dendroscope:一手掌握无限大
imageDendroscope是由德国图宾根大学(University of Tübingen)的Daniel Huson团队开发的一款优秀进化树作图软件。现在出到了第三版。该软件标志性特征就是handle超大型树的能力非常强悍,这在一定程度上弥补了其对作树美观性不足的缺憾。另外该软件有趣的放大镜功能,也很好地配合了处理大型树的特点。所以,如果你的树集结了过多的基因或物种,以至于在其他软件中不能正常显示的话,不妨试一试Dendroscope!
TreeGraph:惜君生晚不逢时
TreeGraph的开发人员来自德国明斯特大学的Kai F Müller实验室。小编认为该软件作图还是非常精美的,操作也很简洁。不过为什么只排在这个位次呢?小编认为原因有三。一是时间晚了(真正意义上比较方便的第二版在2010年才发表),输给了Figtree。二是,平台一般,发表在BMC Bioinformatics上,不像MEGA可以在Molecular Biology and Evolution上反复“弄潮”。三就是人脉不足,开发者(们)不像前面几位早就在业内享有鼎鼎大名。总之,天时地利人和都输了,排名不尽如意也不足为奇。
image该软件对Newick,Neuxs和PhyloXML三种格式都可以很好地支持,允许用户对树进行添加、修改等操作(包括如上图所示的五角星等注释),根据branch length等特征自动上色或修改(如上图所示),还具有将不同树的支持度叠加,比如最大似然法,邻接法(NJ)或贝叶斯法等不同方法得到的树的自展值bootstrap或后验概率(见下图)叠加显示。其主要缺点是对树的展示同Figtree相比变化较少,比如不支持环形(circular)或三角形的树,也不可以像MEGA或Figtree那样collapse clades。
image[4]
DensiTree:树在虚无缥缈间
DensiTree是一款十分有特色的作图软件,虽然引用量不大,但其凭借着独特的绘图功能在作图软件里还是抢得一席之地:每当你的manuscript里出现诸如下图的进化树时,大概都少不了一个对R.R. Bouckaert DensiTree: making sense of sets of phylogenetic treesBioinformatics, 26 (2010), pp. 1372-1373这篇文章的引用。类似的图其实是大量的树叠加的产物,可以是consensus tree,也可以把群体数据结合起来。
imageArchaeopteryx:鸟随鸾凤飞腾远
排在第七位的是Archaeopteryx,拉丁文直译就是:始祖鸟。其最大特点就是血统正宗。所谓“血统”,指的就是对phyloXML格式的支持。第一期提到了,PhyloXML是一款2009年横空出世的进化树新格式(官网:http://www.phyloxml.org/)。其最大的优点在于可以融合物种(taxonomy)、基因加倍(gene duplication)、成种(speciation)、蛋白质结构域等诸多信息,并通过灵活的XML加以编排,与Newick和NEXUS渐成三足鼎立之势。该款软件的开发者Christian Zmasek,也正是phyloXML格式的发明者之一。因此,该软件对phyloXML格式有很好的支持。其次,该软件对大型树的显示能力十分出众(这一点上可与Dendroscope媲美)。第三,该软件可以直接呈现pfam,treefam,Tree of Life等在线数据库中树的信息,方便用户直接调用。个人认为美中不足是其操作方便度相比Figtree和MEGA有一定欠缺。
第三集团:****TreeView,NJplot,PHYLIP
顾名思义,第三集团分为两个部分。TreeView,NJplot,PHYLIP(其中的DRADIAGRAM 和DRAWTREE两个程序),这三款软件都可以追溯到上个世纪,故并成为“上古三神器”。大家千万不要因落后的排名小觑了这三大神器,要知道,这三大神器在当年那个物资匮乏的时代,为系统发育学和基因组学的发展立下了汗马功勋,让我们默默地向上古三神器和它们的开发者们致敬。
然而,时代在发展,生物学在进步。尽管总引用数,这三款软件和其他几款软件一样,排在积分榜的末端,甚至险些在“四大”杂志中无一斩获(所谓“四大皆空”)。
最后,请大家注意,这次的排名并不完全意味着排在后面的软件被时代的马车所抛弃,而只能说明小编挑选的这几本杂志(四大或六大)的作者们对它们不太感冒。具体用什么软件,怎么用,还要取决于使用者自己和实验的需求。此外,小编的统计是针对发表的进化树图而言,相信大家在大多数情况下作图都并非是就是为了直接发表,在非publication作图的情况下,小编的统计显然有一定局限,比如,小编和身边的一些朋友都会用到TreeView对一棵树“大致扫描”,其短小精悍的特点即使在今天依然令其保持有一定的日常使用率,只不过在发表文章的时候大家更青睐figtree等新时代软件。
到这里,本期的文章将要告一段落。下期将带来在线工具的比拼结果。更多精彩内容,请锁定生信人公众号!
参考资料
-
Ke HM et al. Comparative genomics of Vibrio campbellii strains and core species of the Vibrio harveyi clade. Sci. Rep. 7, 41394 (2017)
-
Geering, A. D. W. et al. Endogenous florendoviruses are major components of plant genomes and hallmarks of virus evolution. Nature Commun. 5, 5269 (2014).
-
B. C. Stöver, K. F. Müller, TreeGraph 2: Combining and visualizing evidence from different phylogenetic analyses. BMC Bioinformatics 11, 7 (2010)