跟 Susan R. McCouch 学习单基因的进化分析

2024-09-17  本文已影响0人  风知秋

基于 Susan R. McCouch 同期的两篇文献学习一下单基因的进化分析,一篇是发表在 PNAS 上关于水稻香味基因 BADH2 的分析,另一篇是发表在 Genetics 上关于水稻粒形基因 GS3 基因的分析。


一、 BADH2 

关于 BADH2 基因的背景介绍

水稻的芳香性(fragrance)是影响稻谷品质的一个重要影响因素。早先正向遗传学的研究定位到了一个影响水稻香味的主效基因 BADH2,该基因中一个 8 bp 的缺失变异造成基因的移码突变和提前终止,从而产生香味。回补正常基因可导致香味消失,香味是隐性性状。

基于过往的许多研究,水稻可以清楚地划分为六个品种群:indica, aus, temperate japonica, tropical japonica, aromatic and rayada。其中,indica 和 aus 属于籼稻亚种,其余 4 个品种群属于粳稻亚种,这是水稻中类群的基本划分。

含有芳香性气味(fragrance)的水稻不仅在我们常说的香稻/香米(aromatic )中被发现,aromatic 只是含香味水稻的一类,包含常说的 Basmati 和 Sadri 品种。迄今,至少在 3 个品种群中发生了芳香水稻的存在,除了 aromatic 之外,在 indica 和 tropical japonica 中也有报道。

研究目的

The goal of this study was to investigate the origin of this allele and trace its ancestry among the genetically divergent subpopulations of rice.

We also set out to identify additional functional mutations in the BADH2 gene that may be responsible for independent, local origins of the fragrant phenotype.

研究方法

文章的思路并不复杂,主要分为以下几个步骤:

选择研究材料;调查研究材料中 BADH2 基因中 8 bp 缺失(badh2.1)的存在情况;追溯 badh2.1 等位的起源和扩散路径;选择分析;BADH2 基因的其它突变。

1)研究材料

280 accessions of wild rice (Oryza rufipogon/Oryza nivara)

绝大多数样本都不包含 badh2.1 等位,仅有一份样本在 BADH2 基因位置是杂合状态,进一步调查发现该样本表现出了一些驯化特征,应该是和水稻杂交后的产物。可以推断,野生稻中不存在 badh2.1 等位。

176 O. sativa accessions

先前研究基于 SSR 标记坚定了这些样本的分类(正文图一)。样本的鉴定对于群体遗传学的研究至关重要,作者在这一方面还是蛮严谨的。

在这些水稻中,17 份样本中鉴定到了 badh2.1 等位。

2)badh2.1 等位的起源(重头戏)

作者在这部分进行了单倍型分析。接下来的分析是分步骤进行的,这个次序对于逻辑思路的理解很关键。

首先,作者调查了基因附近 5 kb 的序列,鉴定到 106 个变异,其中 54 个为非稀有突变(frequency >5%),这一步相当于对位点进行了过滤,去除噪音。

剩余的位点构成了 8 个单倍型。

在关注目标变异(8 bp deletion)之前,作者基于 STRUCTURE 分析对整个单倍型进行了聚类,K=2 时最优,第一个 cluster 中包含了野生型,第二个 cluster 中 74% 的成分都是 Indica 亚种,故分别命名为 Jap_GH 和 Ind_GH。

然后再看目标变异(8 bp deletion),重点关注的有两个点,1)仅有一种单倍型(bahd2.1)携带了 8 bp 的丢失,表明 bahd2.1 等位是单次起源;2) bahd2.1 落在了 Jap_GH group 中,表明其起源于 Japonica-like 的遗传背景。

(这里作者的描述很准确,使用了 Japonica-like 的描述)

在这里,BADH2 基因树和物种树出现了冲突,带有香味的 indica 中携带了的 Japonica like 的BADH2 基因。是不是渐渗造成的呢?

为了验证,作者扩大了单倍型分析的范围,上下游延伸了共计 5.3 Mb 的区域,共计检测到了 426 个变异位点,其中 271 个变异位点的频率大于 0.05,为了减少单倍型的数目,从中鉴定到了 78 个 ancestrally informative polymorphisms。

ancestrally informative polymorphisms 确定的标准:1)籼稻亚种和粳稻亚种之间存在显著的频率差异;2)群体内频率在 20% 以上。

可以明显看出,indica 中芳香性的 badh2.1 等位来自渐渗。同样地,部分非芳香粳稻在 BADH 基因位点和籼稻聚到了一起,从扩展单倍型图中可以明显看出这部分粳稻的 BADH 基因同样来自渐渗。

而且,单倍型主要可以分为 6 种,携带芳香气味的水稻可以分为 3 类,基于 3 个绿色的多态位点,可以判断 indica 中芳香性的 badh2.1 等位来自于 aromatic。

3)选择的作用

为了探究 badh2.1 基因型在驯化过程中是否受到了人工选择,作者计算了两个指标,一是最常见的多态性降低,即是否产生了 sweep;二是计算 Extended haplotype homozygosity (EHH),即随机选择的基因组区域在遗传上一致的区域长度。

关于选择信号的检测,我之前单独介绍过一篇综述,详见:基因组选择信号检测

结果表明,badh2.1 等位基因所在附近 5 kb 序列范围内多态性急剧降低(表二);badh2.1 中FNP 附近表现出了延伸的 extended LD,而 BADH2 基因附近 LD 急剧降低。

以上显示出 badh2.1 受到了强烈的正选择。

4)BADH2 上的其它功能突变

部分有芳香气味的水稻 BADH2 基因并不含之前报道的 8 bp deletion(badh2.1),为了检测是否是该基因的其它变异影响的性状,作者对 26 份芳香气味水稻的 BADH2 进行了检测,发现了 5 种不同的功能突变,以及一些不确定是否影响基因功能的变异,包含这些变异的材料具有明显的特定地理分布。

此外,有 2 份材料没有发现可能引起 BADH2 基因表达水平升高的变异。

总结:

文章科学问题明确,内容严谨,逻辑清晰,结构工整。结果部分清楚地分为了 4 节,而且所下的结论也并不冒进,有待商榷的点都放进讨论中了。

文章讨论部分分为了 3 节,第一部分是探讨 badh2.1 的起源;第二部分根据文章最后一节的结果探讨了 BADH2 多个功能突变的独立起源;第三部分从一个更宽广的角度,层层递进,结合了其它基因如 Rc、GS3 基因的研究,发现许多水稻中鉴定到的衍生等位基因在水稻中具有单一起源的证据,但由于渐渗在籼稻和粳稻之间共享。本研究的 BADH 基因同样如此,凸显了杂交和基因流在水稻进化过程中的重要性,与此同时,相反的力量位置了籼粳亚种之间的分化,未来需要更多的研究来增加我们对此过程的认识。


二、GS3

本文对 GS3 的研究,和 BADH2 基因的研究策略相似,同样是从正向的手段出发,确定 FNP 后研究基因的起源和进化历史。

不同的是,本文第一步部分是通过 QTL mapping 确定了目标基因,并通过转基因实验确定了 FNP 的作用,但由于该基因先前已被报道,尽管之前的研究并未对此做功能实验验证,但不是首发,重要性和意义有所下降,不过本文的重点并不在此,故我也不对背景部分做过多介绍,从基因的进化分析部分开始讲起。

需要了解的是本研究确定了 GS3 上一个 SNP(C165A)会影响水稻的粒形。

1)材料调查

本文作者调查的范围进一步增加,出了野生稻 O. rufipoogn / O. nivara 外,还调查了稻属的其它物种,结果表明造成粒长增加的 A 等位存在于野生稻,但不存在于稻属其它物种,栽培稻中该等位存在于调查的所有品种群中,但不同品种群中等位基因频率存在差异。

2)关联分析

首先,作者对该等位的基因型和种粒表型进行了关联分析,发现和栽培稻不同的是,尽管野生稻中存在 A 等位的突变,但该突变似乎并不会影响种粒表型。

栽培稻中该基因和粒长、粒宽、粒长宽比均存在显著关联。

结果表明,GS3 的效应和遗传背景有关,在栽培稻和野生稻遗传背景下可能有着不同的功能。

进一步地,作者对不同品种群进行了 GS3 基因和表型的关联分析。相同 GS3 基因等位的情况下(均为 C),不同品种群之间的粒长仍存在差异,表明除了 GS3 之外,仍有其它位点影响该性状。但当 GS3 基因中为 A 等位时,不同品种群中粒长不存在差异了,GS3 基因掩盖了其它造成粒形变异位点的影响。

此外,GS3 对于粒长的表型解释方差在不同品种群中存在差异(见下表);对于粒宽,仅在 indica 中存在显著关联,对于粒长宽比,仅在 indica 和 aromatic 中存在显著差异(附表)

3)单倍型分析(重头戏)

GS3 基因相较于 BADH2,表型效应稍显复杂,对此有一个基本认识后,开始分析该基因的单倍型。同样,要注意其中的步骤次序,观察逻辑关系。

基于 54 份种质,扩增基因附近 6.57 kb 的序列,共鉴定到 114 个变异位点。筛选等位基因频率大于 0.05 的位点,共得到了 70 个变异位点的 14 个单倍型。

先不管 FNP,不包含 FNP 的 11 个单倍型,基于 STRUCTURE 可以分为 2 个 cluster,同样根据成分中比较高比例的样本分为 Jap_GH 和 Ind_GH,有 2 个单倍型混杂了两种成分被划分为 admixed。

再来看 FNP,包含 FNP 的有 3 种单倍型,一种(GH12)和 Jap_GH 一致,两种(GH13 和 GH14)和 admixed 聚到一起。GH12 和 Jap_GH1 仅在 FNP 存在差异,因此可以推测 GH1 应该是 C165A 变异的直接祖先。

三种含 FNP 的单倍型在 GS3 基因具有共同的遗传来源,为了探究籼稻和粳稻中长粒表型是否是单次 Japonica-derived 的突变,作者使用了更大范围的样本(56 A-allele 和 116 C-allele 的样本),检测了更广泛的区域(66.2 Kb)。

共检测到 30 种扩展单倍型,其中 4 种包含 FNP。

不包含 FNP 的单倍型可以归为 3 类,Jap_GH、 Ind_GH 和 Aus_GH。

包含 FNP 的单倍型,91% 是 EH31 单倍型,和 Jap_GH 聚在一起,和上面 G12 的情况一致。EH32 和 EH31 只有一个位点差异,同样属于 Jap_GH。

EH33 和 EH34 则是重组类型,尽管被纳入到 Ind_GH 中,但 GS3 基因附近仍是粳稻类型。

结果表明,所有携带 FNP 位点的材料 GS3 基因附近都和 ancestral Japonica 密切相关,该变异是源自 Japonica gene pool 或 Japonica-like ancestor,通过渐渗到籼稻。

4)粳稻亚种内 C165A 变异的起源

为了探究该变异在 temperate japonica、tropical japonica 和 aromatic 哪个类群中起源,作者对单倍型做了进一步分析。

首先来看 aromatic,在上面的单倍型图(B)中,aromatic 中既有 A 类型,又有 C 类型。C 类型的样本均包含 1 一个 SNP(S306),该变异位点不存在于其它所有类群。然而,A 类型的样本没有任何一份种质携带有该 SNP,表明 aromatic 中的 A 突变是由另一个 Japonica ancestor 渐渗过来的。

temperate 和 tropical japonica 由于缺少多态性,无法进一步区分。

5)选择分析

这部分同 BADH2 的研究相同,计算了 多态性和 EHH 两个指标。

基于 C165A 位点的等位类型,将材料分为两类,C 类型的多态性远高于 A 类型;后者位点附近的 LD decay 下降的速度较慢。

6)水稻和 O. rufipogon 之间在 GS3 位点的基因流

前部分内容曾发现野生稻部分样本中存在 C165A 变异,为了探究这些样本代表了 GS3 的祖先来源,还是水稻渐渗回去的,其一,作者计算了野生稻中两种等位样本的多态性,发现含 A 等位的样本多态性是 0,而 C 等位多态性位为 0.00883;其二,野生稻 A 等位样本中 GS3 附近的单倍型均为 EH31。

如果野生稻中是祖先,那多态性应该较栽培稻 A 等位样本要高,但事实并非如此。因此,作者推测野生稻中的 A 等位为栽培稻渐渗。

总结:

文章逻辑清晰,内容严谨。同之前的文章一样,针对野生稻中的异常样本,并未略过,而是深入分析了该现象产生的原因,杂交或者渐渗。


在讨论中,作者也对其中多个有意思的点进行了探讨:1)野生稻中 A 等位没有表型效应,表明该基因并非驯化早期基因;2)即使是栽培稻中,含 A 等位的不同品种群,表型仍有差异,八日后还有哪些基因对此负责,值得进一步探究;3)野生稻和栽培稻之间存在基因流,和 badh2.1 以及 sh4 基因报道的情况一致;4)A 等位起源于 Japonica ancestor,籼稻中是渐渗而来,在粳稻中,热带粳稻中频率远高于温带粳稻,可能是起源于热带粳稻。5)探讨了 GS3 在控制种粒大小时可能的遗传途径;6)和 GW2 之间的相互作用无法解释品种群间粒形大小的差异。


以上两篇文章的分析方法很相似,内容翔实可靠,多个基因的类似分析对于我们理解驯化过程是有增益的。

上一篇下一篇

猜你喜欢

热点阅读