进化树-itol上色美化
进化树或者系统发育树在微生物及群体结构分析中是很常见的分析条目。进化树构建有很多方法,结果也大体相似,但是最终呈现的形式确是多种多样的,今天给大家介绍使用itol进行进化树的上色美化。
进化树数据
itol支持多种进化树数据,包括Newick, Nexus, PhyloXML和Jplace。上传的数据必须是文本格式,其中Jplace格式的文件后缀必须是*.Jplace,否则会出现加载错误的问题,以下是具体的进化树上传文件的说明信息。
Tree with bootstraps and branch lengths:
(A:0.1,(B:0.1,C:0.1)90:0.1)98:0.3);
A, B, C : leaf names
0.1, 0.3 : branch lengths
90,98 : bootstrap values
Tree with internal node IDs:
(A:0.1,(B:0.1,C:0.1)INT1:0.1[90])INT2:0.3[98]);
A, B, C : leaf names
INT1, INT2 : internal node IDs
0.1, 0.3 : branch lengths
90,98 : bootstrap values
Tree with NHX style metadata:
(A:0.1,(B:0.2,(C:0.2,D:0.3):0.4[&&NHX:conf=0.01:name=NODE1]):0.5);
A, B, C : leaf names
internal node will have the ID NODE1
metadata value 'conf' will be available for visualization
MrBayes tree with full metadata:
( n1[&prob=1.00000000e+00,prob_stddev=0.00000000e+00,prob_range={1.00000000e+00,1.00000000e+00}, prob(percent)="100",prob+-sd="100+-0"]:7.827820e-02[&length_mean=7.95052056e-02, length_median=7.82782000e-02,length_95%HPD={5.41722800e-02,1.09222000e-01}],
n2[&prob=1.00000000e+00,prob_stddev=0.00000000e+00,prob_range={1.00000000e+00,1.00000000e+00}, prob(percent)="100",prob+-sd="100+-0"]:1.029146e-01[&length_mean=1.03620749e-01, length_median=1.02914600e-01,length_95%HPD={7.64916100e-02,1.34490900e-01}] )[&prob=1.00000000e+00, prob_stddev=0.00000000e+00,prob_range={1.00000000e+00,1.00000000e+00}, prob(percent)="100",prob+-sd="100+-0"]:1.905703e-01[&length_mean=1.91679099e-01, length_median=1.90570300e-01,length_95%HPD={1.37001000e-01,2.53530500e-01}];
n1, n2: leaf names
prob, prob_stddev, prob(percent) ... : various metadata fields which can be used in'Bootstraps/metadata' section
进化树绘制类型
itol能绘制的图形主要包括以下几种:正常进化树(矩形,上下对比,a)、三角进化树(三角形,b)、圆形进化树(非封闭圆环,c)、正常进化树(圆角分支,d)、普通无根进化树(无根树,e)以及分支无根进化树(分支,f)等六种。
tree-modules对于图形的选择,可以参考样本及数据的实际情况,比如热图、添加比对序列、蛋白模块等的进化树必须使用normal形式的数据(a, b, d),对于主要显示进化分组的差别,可以优先选择circle或者unroot格式的进化树(c, e, f),这样篇幅不会太长,比较直观。
进化树美化上色
itol所有的美化上色均可以通过配置文件来完成,主要分为参数设置及数据表两种类型。
- 参数设置
对于参数设置,只要按照既定的要求给出设定阈值即可,示例如下。
LABELS
DATA
#NODE_ID,LABEL
#Examples
#defined a name for an internal node
9606|9031 Metazoa
#change the label for leaf node 9606
4530 Oryza sativa
45157 Cyanidioschyzon merolae
237895 Cryptosporidium hominis
184922 Giardia lamblia
56636 Aeropyrum pernix
3702 Arabidopsis thaliana
33169 Eremothecium gossypii
222523 Bacillus cereus ATCC 10987
1423 Bacillus subtilis
216816 Bifidobacterium longum
以上是修改标签显示的配置文件,第一行显示修改的内容,第二行DATA显示接下来的内容为设置参数,其后的正文部分是对每一个样本或者分支节点进行设置。
- 数据表
数据表类型的文件主要是增加进化树上的显示数据,比如增加比对序列,热图,样本间的互作关系,蛋白模块等。
DATASET_CONNECTION
#NODE1,NODE2,WIDTH,COLOR,LABEL
155864 1299 26 rgba(217,112,113,0.5) dashed Connection 155864 to somewhere...
155864 1488 19 rgba(1,220,217,0.7) normal Connection 155864 to somewhere...
83334 562 17 rgba(8,180,164,0.2) dashed Connection 83334 to somewhere...
83334 36329 11 rgba(15,57,145,0.1) normal Connection 83334 to somewhere...
217992 7227 27 rgba(233,166,147,0.5) normal Connection 217992 to somewhere...
217992 183190 30 rgba(136,199,114,1.0) normal Connection 217992 to somewhere...
562 184922 12 rgba(229,41,244,1.0) dashed Connection 562 to somewhere...
562 56636 16 rgba(6,233,101,0.8) dashed Connection 562 to somewhere...
以上是添加互作关系的数据表设置格式,与参数设置基本一致,唯一的区别在于文件第一行要指定作图的类型,此处是互作关系图。
作图示例
以下是通过设置不同的数据表及参数设置文件,实现不同类型的进化树示例。
- 添加分组信息
该类型进化树表现样本的分组关系,便于分析进行关系及样本分布情况。
add-group- 添加boostrip
该类型进化树反应的是结果的准确程度,自展值越大,进化树反应的结果越准确。
add-bootstrip- 添加柱状图
添加样本对应的数据,比如丰度,表达量等。
add-bar- 添加比对序列
添加样本/物种对应的比对序列,直观反应基因的相似性程度。
add-alignment- 添加环境因子效应
添加环境因子效应值,用于展示不同样本/物种对特定影响因子的表现。
add-factor- 添加热图
热图就不用说了,很常见。
add-heatmap- 添加互作网络
该类型进化树主要反应的样本间的相互关系。
add-connection- 添加蛋白模块
该类型的进化树添加了物种/样本特异性蛋白结果模块或者特征标签。
add-protein-domain除此之外,还可以添加文字、图片、饼状图等其他类型,有兴趣的话可以去试试。
如果有作图需求,欢迎来聊。