生信基础知识生信进化分析

关于如何分析进化树

2019-05-21  本文已影响26人  野生拟南芥

参考1:

http://blog.sina.com.cn/s/blog_1774c102e0102y3p7.html

进化树

(1)水平方向:遗传变量的变化程度
水平方向上的分支代表进化谱系随着时间的变化,分支长度越长表示该分支对应物种的变化越大。
(2)标尺:底部的短线
标尺下部的数字0.07指该长度的分支代表基因组的遗传变异度为0.07。其中,遗传变异度通常表示基因组中每个位点碱基的替换频率,计算公式为:变异度=变异碱基数/总碱基数(%)。通常情况下会以百分比的方式展示,进而可解释为每100个碱基位点的变异度。
(3)垂直方向:无特别含义
(4)节点:彩色圆圈
进化树上的节点有外部节点和内部节点两种。外部节点又称为叶节点(上图中绿色圆圈),代表参与分析的基因组数据(例图中是病毒的基因组序列),一般情况下一个基因组也即带代表一个物种。内节点用蓝色的圆圈表示假定祖先。
进化树的根(红色圆圈)告诉我们终极祖先的位置,基于这个点依据不同分支在水平方向上的长度可以对不同物种近似进化时间进行排序。例如:在上图中我们可以说A物种比B和C物种在进化时间上更早,同时也可以认为水平方向上进化时间从左到右依次增加。
(5)分支
因为分支长度代表基因序列相似度,只能代表近似进化时间。因此,需要根据基因序列相似度与进化时间假说对这种进化距离进行转换,即分子钟。
(6)Bootstrap值
图中每个节点左边的灰色数字代表该节点的bootstrap值。该值范围从0-1,也可用百分比的形式代表,值越大该节点置信度越高。

参考2:

https://www.sohu.com/a/196872269_675868
系统发育树构建的基本方法有如下几种:

1、Distance-based methods 距离法:

(基于距离的方法:首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。进化树的构建则是基于这个矩阵中的进化距离关系。)

· Unweightedpair group method using arithmetic average(UPGMA)非加权分组平均法

· Minimum evolution(ME)最小进化法

· Neighbor joining(NJ)邻位归并法

2、Character-based methods 特征法:

(基于特征的方法:不计算序列间的距离,而是将序列中有差异的位点作为单独的特征,并根据这些特征来建树。)

· Maximum parsimony(MP) 最大简约法

· Maximum likelihood method(ML) 最大似然法

进化树

距离标尺:进化树可以显示序列的差异度,这里的标尺就可以当做为进化树的“比例尺”。

分支长度:在树形结构中,枝长累积距离越近的样本差异越小,反之差异越大。比如OTU16与Nitrosospira multiformis的差异度是A1+A2,OTU16与Nitrosospira briensis的距离是A2+A3+A4,以此类推。

自展值(Bootstrap):刚才已经讲过关于自展值的评估方法。自展值可以显示可信度。一般低于50%的会隐去。那啥情况下会低于50%呢,两种情况,相似度太低或太高。一般来说,低自展值靠近分支末端,可能是由于相似度太高难以区分,这时建议可以换一个基因建树。如果低自展值靠近根,可能是由于相似度太低。

上一篇下一篇

猜你喜欢

热点阅读