【名词解释】synteny / collinearity / i
2020-11-18 本文已影响0人
生信师姐
1. synteny 和 collinearity 用来描述基因组的共线性
synteny 共线性:同源基因在相应染色体上的保留
collinearity 同线性:在synteny的基础上,要求基因方向的保守性。
2. identity(一致度)和similarity(相似度)这两个指标来定量描述这两个序列有多相似
如何定量描述呢?简单来说,就是比较两条序列相同位置上的残基是否相同或相似,这些相同或相似的残基所占的比例。
怎么判断两个碱基或氨基酸是否相似?——
替换记分矩阵是反映残基之间相互替换率的矩阵,它描述了残基两两相似的量化关系。核酸和蛋白质的替换记分矩阵不可混用。根据表中两两比对的得分可知是否相似。
≥0 的得分代表对应的一对氨基酸为相似氨基酸,<0 的是不相似的氨基酸
image image怎么判断是在相同位置?——
全局比对,计算在哪个位置插入空格会使得分最大。(长度相同的两个序列也要先进行全局比对,可以在两条序列中都插入空格,长度不同的也要先全局比对。最后保证序列长度相同即可。)
空位罚分(gap)就是当字母对空位的时候应该得几分,设置为负值,如-5。
则:
- identity :全局比对中一致字符的个数,除以全局比对的长度
- similarity:全局比对中一致字符的个数加相似字符的个数,再除以全局比对的长度
- homology 同源性:来源于共同祖先的相似序列,只能定性描述,不能定量描述。可以说有同源性或无同源性,也可以说同源性性远,同源性近,但不存在同源性百分之多少的说法(但目前有很多人犯这个错误)。可以用系统进化树重建的方法进行分类,看是否同源。
ref: