生信猿生物信息学与算法生物信息学习

比较两个序列的方法

2019-03-31  本文已影响2人  Gnaw

打点法:

是最简单的比较两个序列的办法,理论上可以用纸笔完成。

如果要比较这两个序列


我们需要把序列1整齐水平的书写,然后把序列2整齐竖直的书写,然后依次横横竖竖比较每一个位置的残基。相同的话就在位置上打个点。
序列1和序列2的打点图
我们可以发现,这个矩阵中打点打出了一条较为明显的对角线。
在打点矩阵中,连续的对角线及对角线的平行线代表两条序列中相同的区域,这个矩阵中在主对角线位置上连续的红色的对角线说明这个位置对应的序列1的部分和序列2的部分是完全相同的,都是THEFA。此外,跟红对角线平行的绿色平行线,同样指出了序列1和序列2两条相同的序列。也就是序列1和序列2对应位置的TCAT,以及序列1和序列2中对应位置的AT。由这三条线,我们找到了序列1和序列2中三条相同的子序列。最后,我们放眼全局,红色的线和蓝色的线加起来基本上构成了一条主对角线。由此我们可以得出结论:序列1和序列2是比较相似的两条序列。事实上,如果直接看一下两条序列,确实是很相似的。如果是风牛马不相及的两条序列,做出的打点矩阵中是不会出现对角线的,哪怕是模糊的对角线,也不会出现。比如让序列1和序列3打点做出的打点图中,完全是散点。
序列1和序列3的打点图

还可以用一条序列自己对自己打点。

从而可以发现序列中重复的片段。这样的打点矩阵必然是对称的,并且有一条主对角线。在横向或纵向上,与主对角线平行的短平行线所对应的序列片段就是重复的部分。


自己与自己打点

用这种方法我们可以快捷的发现序列中的串联重复序列以及重复的次数。

我们只要数出在半个矩阵中包括主对角线在内的所有等距的平行线的个数,就可以知道重复的次数,而且最短的平行线对应的序列就是重复单元。短的串联复序列具有高度多态性,也就是说不同的个体间重复次数存在差异,而且这种差异在基因遗传过程中一般遵循孟德尔共显性遗传规律,所以快速查找某些特定的短的串联复序列的重复次数可以用于法医学的个体识别或亲子鉴定等领域。

打点法寻找串联重复序列

打点法在线软件:Dotlet

上一篇下一篇

猜你喜欢

热点阅读