走进转录组基因家族相关GWAS/群体分析

进化树-itol上色美化

2020-10-15  本文已影响0人  xiaoji_hb

进化树或者系统发育树在微生物及群体结构分析中是很常见的分析条目。进化树构建有很多方法,结果也大体相似,但是最终呈现的形式确是多种多样的,今天给大家介绍使用itol进行进化树的上色美化。

进化树数据

itol支持多种进化树数据,包括Newick, Nexus, PhyloXML和Jplace。上传的数据必须是文本格式,其中Jplace格式的文件后缀必须是*.Jplace,否则会出现加载错误的问题,以下是具体的进化树上传文件的说明信息。

Tree with bootstraps and branch lengths:  
   (A:0.1,(B:0.1,C:0.1)90:0.1)98:0.3);   
   A, B, C  : leaf names    
   0.1, 0.3 : branch lengths    
   90,98    : bootstrap values  

Tree with internal node IDs:   
  (A:0.1,(B:0.1,C:0.1)INT1:0.1[90])INT2:0.3[98]);    
   A, B, C    : leaf names    
   INT1, INT2 : internal node IDs    
   0.1, 0.3   : branch lengths    
   90,98      : bootstrap values  

Tree with NHX style metadata:   
   (A:0.1,(B:0.2,(C:0.2,D:0.3):0.4[&&NHX:conf=0.01:name=NODE1]):0.5);    
   A, B, C   : leaf names    
   internal node will have the ID NODE1    
   metadata value 'conf' will be available for visualization  

MrBayes tree with full metadata:  
 ( n1[&prob=1.00000000e+00,prob_stddev=0.00000000e+00,prob_range={1.00000000e+00,1.00000000e+00},           prob(percent)="100",prob+-sd="100+-0"]:7.827820e-02[&length_mean=7.95052056e-02,           length_median=7.82782000e-02,length_95%HPD={5.41722800e-02,1.09222000e-01}],        
  n2[&prob=1.00000000e+00,prob_stddev=0.00000000e+00,prob_range={1.00000000e+00,1.00000000e+00},           prob(percent)="100",prob+-sd="100+-0"]:1.029146e-01[&length_mean=1.03620749e-01,           length_median=1.02914600e-01,length_95%HPD={7.64916100e-02,1.34490900e-01}]   )[&prob=1.00000000e+00, prob_stddev=0.00000000e+00,prob_range={1.00000000e+00,1.00000000e+00},        prob(percent)="100",prob+-sd="100+-0"]:1.905703e-01[&length_mean=1.91679099e-01,        length_median=1.90570300e-01,length_95%HPD={1.37001000e-01,2.53530500e-01}];     
  n1, n2: leaf names     
  prob, prob_stddev, prob(percent) ... : various metadata fields which can be used in'Bootstraps/metadata' section

进化树绘制类型

itol能绘制的图形主要包括以下几种:正常进化树(矩形,上下对比,a)、三角进化树(三角形,b)、圆形进化树(非封闭圆环,c)、正常进化树(圆角分支,d)、普通无根进化树(无根树,e)以及分支无根进化树(分支,f)等六种。

tree-modules

对于图形的选择,可以参考样本及数据的实际情况,比如热图、添加比对序列、蛋白模块等的进化树必须使用normal形式的数据(a, b, d),对于主要显示进化分组的差别,可以优先选择circle或者unroot格式的进化树(c, e, f),这样篇幅不会太长,比较直观。

进化树美化上色

itol所有的美化上色均可以通过配置文件来完成,主要分为参数设置及数据表两种类型。

对于参数设置,只要按照既定的要求给出设定阈值即可,示例如下。

LABELS
DATA
#NODE_ID,LABEL
#Examples
#defined a name for an internal node
9606|9031  Metazoa
#change the label for leaf node 9606
4530  Oryza sativa
45157  Cyanidioschyzon merolae
237895  Cryptosporidium hominis
184922  Giardia lamblia
56636  Aeropyrum pernix
3702  Arabidopsis thaliana
33169  Eremothecium gossypii
222523  Bacillus cereus ATCC 10987
1423  Bacillus subtilis
216816  Bifidobacterium longum

以上是修改标签显示的配置文件,第一行显示修改的内容,第二行DATA显示接下来的内容为设置参数,其后的正文部分是对每一个样本或者分支节点进行设置。

数据表类型的文件主要是增加进化树上的显示数据,比如增加比对序列,热图,样本间的互作关系,蛋白模块等。

DATASET_CONNECTION
#NODE1,NODE2,WIDTH,COLOR,LABEL
155864  1299  26  rgba(217,112,113,0.5)  dashed  Connection 155864 to somewhere...
155864  1488  19  rgba(1,220,217,0.7)  normal  Connection 155864 to somewhere...
83334  562  17  rgba(8,180,164,0.2)  dashed  Connection 83334 to somewhere...
83334  36329  11  rgba(15,57,145,0.1)  normal  Connection 83334 to somewhere...
217992  7227  27  rgba(233,166,147,0.5)  normal  Connection 217992 to somewhere...
217992  183190  30  rgba(136,199,114,1.0)  normal  Connection 217992 to somewhere...
562  184922  12  rgba(229,41,244,1.0)  dashed  Connection 562 to somewhere...
562  56636  16  rgba(6,233,101,0.8)  dashed  Connection 562 to somewhere...

以上是添加互作关系的数据表设置格式,与参数设置基本一致,唯一的区别在于文件第一行要指定作图的类型,此处是互作关系图。

作图示例

以下是通过设置不同的数据表及参数设置文件,实现不同类型的进化树示例。

该类型进化树表现样本的分组关系,便于分析进行关系及样本分布情况。

add-group

该类型进化树反应的是结果的准确程度,自展值越大,进化树反应的结果越准确。

add-bootstrip

添加样本对应的数据,比如丰度,表达量等。

add-bar

添加样本/物种对应的比对序列,直观反应基因的相似性程度。

add-alignment

添加环境因子效应值,用于展示不同样本/物种对特定影响因子的表现。

add-factor

热图就不用说了,很常见。

add-heatmap

该类型进化树主要反应的样本间的相互关系。

add-connection

该类型的进化树添加了物种/样本特异性蛋白结果模块或者特征标签。

add-protein-domain

除此之外,还可以添加文字、图片、饼状图等其他类型,有兴趣的话可以去试试。

如果有作图需求,欢迎来聊。

参考资料

[1] https://itol.embl.de/help.cgi

上一篇下一篇

猜你喜欢

热点阅读