比较基因组分析
2023-02-21 本文已影响0人
Bioinfor生信云
什么是比较基因组分析?
基因组的比较分析是对一个物种的多个个体基因组(种群内)或多个相似或差异很大的物种基因组(跨物种)的综合分析。通过跨物种基因组的比较分析,我们尝试解释如下问题:
1.这些物种的进化关系如何,是什么时候分化的?(进化树构建与分歧时间估算)
2.染色体片段如何重组、复制、进化?(共线性与WGD)
3.基因家族有哪些差异?(基因家族的鉴定、特异、收缩、扩张)
4.哪些基因受到正选择?(正选择分析)
基因家族聚类
基因家族指来自诸多物种的MRCA(最近共同祖先,Most Recent Common Ancestor )的同一个始祖基因演化而来的一组基因。
- 直系同源(orthologs):
因物种形成而产生的同源基因 -
旁系同源(paralogs)
因种内基因复制而产生的的同源基因
常用方法
-
推断两两物种的基因之间的成对关系得到ortholog group,然后通过结果整合,从而将同源性扩展到多个物种。
-
直接进行多物种分析,得到所有物种的最近共同祖先中的一个基因所产生的一组基因。
常用软件
OrthoMCL:OrthoMCL
聚类流程
MCL原理
1.将相似性矩阵转化为马尔科夫矩阵 N
2.扩张过程(Expansion):即为矩阵 N 相乘,得到矩阵 M
3.膨胀过程(Inflation):对随机矩阵(M)执行膨胀(Inflation)操作
4.重复2、3, 直至稳定
膨胀过程强化紧密的点,弱化松散的点,重复扩张、膨胀的过程,直至矩阵没有变化。
OrthoFinder:https://github.com/davidemms/OrthoFinder
它的主要功能是,找到了正交群和直系同源物,推断出所有正交群的根基因树,并识别那些基因树中的所有基因重复事件。它还为所分析的物种推断出有根的物种树,并将基因重复事件从基因树比对到物种树的分支中。
正交群中的所有基因都来自单个祖先基因。因此,正交群中的所有基因都有类似的序列和功能。由于基因重复和丢失在进化中经常发生,一对一的直系同源物很少见,通过分析orhtogroup所有直系同源的情况(一对一,多对一,多对多),我们可以分析所有的情况。