1 生物信息学科研 博士DNA

基因的一大家子-Gene Family

2018-09-25  本文已影响70人  刘小泽

刘小泽写于18.9.25

今天接触到一个新名词——基因家族分析,不搜不知道,一搜吓一跳。2018年关于基因家族分析的文章已经超过了180篇,并且门槛不高,甚至用公共数据库就能做。

什么是基因家族?

想想我们人的家族,肯定是一大家子,一个共同的祖先的后代。尽管子子孙孙长相各异,但是血缘关系维持着我们的亲疏远近

基因家族,当然也是来源一个祖先,经过基因重复和突变而产生的一组具有序列结构与功能相似性的基因,它们编码相似的蛋白质产物。当然同一个家族的可以紧密排列在一起,构成一个大“宗亲”(基因簇)。但更多时候,“人各有志”(子孙基因也各有作用),同一个家族的基因们分散在同一个染色体的不同位置,或者在不同染色体(相当于我们和周围的亲人都身处各行各业),每个基因有着自己不同的表达调控模式。

重复主要分为:基因片段复制、串联重复、逆转录转座【一般拷贝数会增加】

突变主要有:核苷酸插入、缺失、转换、颠换;基因重组;基因转换。这些因素再加上后来群体的遗传漂变、自然选择过程将这种趋势进行扩散,并逐步确定下来突变【一般拷贝数不增加,基因重复性比较小】

简而言之,基因家族就是一组功能相似、序列具有同源性的基因

因此,如果不从“共同祖先”的角度出发,考虑“结构域”的话:对于一个基因家族,它的特点就是编码蛋白都有同一个结构域,因为一般来讲,结构域决定某种功能,保守的结构域序列,容易形成稳定的三维结构【结构域:Protein domain,是构成蛋白质(三级)结构的基本单元,Pfam和InterPro都是结构域网站】

为什么做基因家族?

基因的远近

我们人类即便是同一个祖先,在长期繁衍过程中,也会产生亲疏远近,所以才有了“远亲不如近邻”这样的俗语,那么基因呢?

Homolog: A gene related to a second gene by descent from a common ancestral DNA sequence. The term, homolog, may apply to the relationship between genes separated by the event of speciation (see ortholog) or to the relationship betwen genes separated by the event of genetic duplication (see paralog).
同源基因:来自共同祖先DNA序列的基因,包括了物种间的同源“ortholog”、物种内的因基因复制导致的同源"paralog")

出自 https://homepage.usask.ca/~ctl271/857/def_homolog.shtml

一般来讲,在描述同源性和相似性时,可以理解成:同源性为“质”,即有没有同源性;相似性为“量”,即相似性有80%、90%

同源、直系、旁系基因 直系与旁系的差异

基因家族能做的事

图片来自文章:Genome-wide investigation of WRKY gene family in pineapple: evolution and expression profiles during development and stress
红色表示基因家族成对复制,灰色表示共线性关系

基因结构、motif分析

欢迎关注我们的公众号~_~  
我们是两个农转生信的小硕,打造生信星球,想让它成为一个不拽术语、通俗易懂的生信知识平台。需要帮助或提出意见请后台留言或发送邮件到Bioplanet520@outlook.com

Welcome to our bioinfoplanet!
上一篇下一篇

猜你喜欢

热点阅读