分子进化理论(11)蛋白质进化速率
进化速率
进化速率既可指分子的进化速率(蛋白质或核酸等大分子中的氨基酸或核苷酸在一定时间内的替换率),也可指某一类群的物种分化速率,甚至可指特定性状(如体高)的进化速率。因此,笼统地说,进化速率指在进化过程中,单位时间内发生的改变。对有性生殖的物种来说,一般体制越简单,可塑性越大,成种速率越快,而进行无性生殖微生物的种类稀少,它们从公共基因库中进行组合物种以实现快速的适应需求。
分子进化速率取决于蛋白质或核酸等大分子中的氨基酸或核苷酸在一定时间内的替换率。生物大分子进化的特点之一是,每一种大分子在不同生物中的进化速度都是一样的,并且与年代间隔以及所处环境无关。蛋白质分子进化速率计算公式:
Kaa=(daa/Naa)/2T。
式中:daa为两种同源蛋白质中氨基酸的差异数,Naa为同源蛋白质中氨基酸残基数,T为2种生物的分歧进化时间。每个密码子每年的突变频率约为(0.3-9)×10^-9
进化速率的最佳相关性不是蛋白质的功能重要性,而是蛋白质的表达水平。
基因表达量越高,进化越慢
必须基因的进化应该更慢,因为序列越保守的基因,其产物对生物的重要性越大
图中x轴是基因表达量,y轴是蛋白质进化速率,每个小图上沿标示了物种的种名。图上每个点是该物种里的一个基因,点密度太大,画不下的地方用色阶(蓝色到红色,红色为密度最高)表示。图上还标示了X-Y的Spearman相关性系数。
Drummond等人在2005年提出了翻译稳健性(Translational Robustness)假说:
高表达基因由于产生的蛋白质分子更多,其中发生误折叠的分子也更多,为了避免误折叠分子对细胞的负面作用,高表达基因的蛋白质序列在进化上受到更大的限制(发生误折叠的概率比低表达基因更低),因此进化很慢。
后来,有人发现基因的表达量越高,其mRNA的二级结构越稳定。换句话说,高表达的基因序列对mRNA二级结构有额外的要求,从而导致了RNA序列和蛋白质序列在进化上受到更大的限制,因此进化更慢。后来,有人发现基因的表达量越高,其mRNA的二级结构越稳定。换句话说,高表达的基因序列对mRNA二级结构有额外的要求,从而导致了RNA序列和蛋白质序列在进化上受到更大的限制,因此进化更慢。