2022-09-16多倍化以及二倍化
今天读了一篇综述很有趣,把关键知识点记录一下。
1. 多倍化分为同源多倍化和异源二倍化,区分两者的关键且唯一之处是 multisomic inheritance。
Differences in pairing behavior are often used to distinguish the two major categories of polyploid species, allopolyploids and autopolyploids. Distinguishing allo- and autopolyploids by pairing behavior is considered to be the genetic classification of polyploid species. In allopolyploids, divergence between the parental taxa is expected to limit pairing among the homoeologous chromosomes, and the homologous chromosomes are expected to form pairs of bivalents during meiosis. In contrast, autopolyploids are expected to have homologous chromosomes that form either bivalents or multivalents. The bivalent pairing expected to occur in allopolyploids should lead to mostly disomic inheritance (i.e., two alleles at each of two distinct loci), whereas autopolyploids are expected to have multisomic inheritance (i.e., multiple alleles at a single locus). It is important to point out that even though strictly bivalent pairing can occur in some autopolyploids, random segregation of homologous chromosomes during meiosis can result in multisomic inheritance. Therefore, multisomic inheritance is a unique feature that can define autopolyploids.
ps:实际上这种分类学角度的定义很有问题,因为随着时间,基因组会动态演化。曾经是同源多倍体的状态会变成异源二倍体,这点综述作者也提到了:两者的区分是依据情况而定的。但这个定义是基于当下状态的,当我们探讨其真实起源时,多倍体其诞生之时到底是异源还是同源是既定事实,这时候对这次加倍的定义就需要使用基于演化分析的策略来区分两者,能清楚找到两个或多个祖先的即为异源,反之为同源。
2. mixosomic inheritance
定义倍性不能同源异源非此即彼,实际上两者是亚基因组分化的两个极端,很多时候两者间还有中间状态: mixosomic inheritance,即在染色体配对观测中,发现既有二价配对也有多价配对的状态。添加这个概念对于理解二倍化很有必要,因为并非所有多倍体都经历同一模式的二倍化。例如,如果一个多倍体物种出生时具有类似二倍体的双价配对和二价体遗传,那么这些同源染色体正在进行的基因组进化真的是常规概念上的二倍化吗?它是否等同于多价同源四倍体中的二价配对进化? 所以对近期和古代多倍体基因组的二倍体化分析需要更好地了解物种的起源,测定其起源时间,以评估这些基因组中哪些是真正在二倍体化,哪些不是。
3. 二倍体化 diploidization
简单定义就是多倍体向二倍体状态转变的过程。陆生植物的演化历程里经历了若干独立的“加倍-二倍化-再加倍-再二倍化”循环的状态。
Although many mechanisms of genome evolution contribute to diploidization, it can be broadly described as involving two major and largely independent processes: cytological diploidization and genic diploidization/fractionation. Cytological diploidization occurs via sequence divergence, chromosomal rearrangements, fission, fusion, and other large-scale chromosomal evolution events that produce significant changes in genome structure and eventually lead to diploid-like chromosome pairing behavior during meiosis. During fractionation, many genes duplicated during the WGD event are lost, and only a subset of genes are retained as paralogs over time. These two processes occur largely independently of each other and at different rates, yielding a diversity of genomes with different patterns of diploidization following polyploidy across lineages.
ps: 这解释了我一直以来的一个疑问,即染色体序列水平上观测到的加倍痕迹与同源基因水平识别到的共线性水平并不一致,原来这是因为两个水平上的二倍化速率不一致导致的。通常染色体水平上二倍化要更快,当然这很好理解,速率不快的都已经因为减数分裂异常被淘汰了。基因上的重复则没有那么极端致命,相对冗余的剂量优势有时反而是优势。
4.二倍化完成的标志是什么?
回答这个问题并不能统一而论。首先要区分同源异源或中间状态,它们的二倍化模式是有差别的,例如同源多倍体更倾向于大规模的染色体重组丢失,而异源多倍化则可以通过亚基因组优势使两套亚基因组更长久地相对共存。至于二倍化完成的标志是什么,这仍是一个悬而未决的科学谜题。
成功的bivalent pairing and disomic inheritance,或者 meiotic stability, 是生物学二倍化的重要标志。
ps:我自己的思考:有两个角度的序列分析或许可以解决这个问题:a, 比较多倍体及其祖先状态的序列特征,例如四倍体和其二倍体的比较,理论情况下,二倍体祖先状态就是四倍体二倍化完成的理想状态;同样,异源多倍体两个祖先种之间非冗余的序列集合,也或许是多倍体二倍化完成的终极目标。但其局限很明显,没有考虑真实环境下的演化过程。b,大量经历同一次加倍的物种/个体的细胞学调查,尤其是对于同源多倍化(现今古多倍化大部分被默认为同源多倍化)而言,其细胞学层面的二倍化往往非常迅速,而整个科属经历一次多倍化的类群比比皆是,自然选择下它们二倍化的程度也各不相同,比较它们之间的异同对于理解二倍化的完成标志很重要。但我内心来说,这个问题本身或许也是个伪命题,或许压根没有二倍化的终点,基因组时刻在动态演化,某个状态的完成似乎是没有必要去界定的。但假如非要给一个界定的话,能够稳定地减数分裂,具有竞争优势地遗传繁殖应该是一个理想标志,而这很难通过细胞学或者单一的序列分析去解决。但何种程度的序列或结构差异下,减数分裂能够在一定比例上正常进行了,或许是一个有些价值的科学问题,研究表明,太多或者一次没有的染色体间crossover会让减数分裂不稳定,只有单次的同源染色体间的crossover会让减数分裂稳定下来。因此对于同源多倍体而言,同源染色体间只存在一次crossover或许是一个可量化的很好的指标。但总的而言,与其讨论二倍化何时完成,不如换成另一个相近但更有科学意味的问题:二倍化的底层机制是什么,即基因组以何种模式二倍化,为什么?
5.基因水平的二倍化机制
几个比较有趣的结论:
a, 基因的丢失是主要模式;多倍化之后的基因丢失称之为fractionation。
b, 基因丢失中,又以非法重组illegitimate recombination为主。高频的非法重组,有时会收到TE促进,但都是fractionation and genome size reduction的重要推动力量。
c, 一些重组频率低的区域,如着丝粒周围,则会形成较多假基因,这种功能上的丢失也可看作一种“丢失”。假基因在陆生植物中很普遍,但并不是多倍化后fractionation的主要模式,非法重组造成的丢失才是主要模式。假基因在脊椎动物里反而是fractionation的主力,这或许是因为其相对植物来说,脊椎动物基因组更不容易重组,这个特性使得脊椎动物二倍化速率缓慢,更不容易解决基因剂量
d, 异源多倍体或古同源多倍体中,biased fractionation 会引起 subgenome dominance,即某一套亚基因组上的基因表达程度普遍偏高。这与TE的分布和甲基化相关。某套亚基因组中,TE密度高且甲基化程度高的话,其周边的基因会被附带着影响从而整体表达程度偏低,而不占据主导。
e, 多倍化后重复基因保留有几种假说,其中一种是剂量效应假说,这个假说认为,具有更多相互作用伙伴如转录因子的paralog会更容易被保留下来,因为它们要共同作用配合形成特定化合反应。而伙伴少的拷贝则因为功能的相对冗余会更容易被清除。还有两种假说 neofunctionalization (i.e., a gene copy acquiring a novel function) or subfunctionalization (i.e., each gene copy retaining part of the original function) 。
f, 整体来看,多倍化后的基因fractionation 必然发生,且并不随机。保留的问题即是什么因素影响了gentic fractionation从而决定了重复基因的命运。无论什么因素,显然都不是单一的,而是一套复杂的机制在起作用。
6.二倍化速率
经历不同加倍的不同类群间速率不同;经历同一次加倍的不同类群也不同。
不同类群间的二倍化模式也不同。
速率差异看起来跟加倍时间有关系,但不大.
具体什么推动二倍化,并使得二倍化速率差异,未知。
Reference: Li, Zheng et al. “Patterns and Processes of Diploidization in Land Plants.” Annual review of plant biology vol. 72 (2021): 387-410. doi:10.1146/annurev-arplant-050718-100344.