顶刊文献阅读

2023-07-12 | 系统基因组分析提供灵长类进化的见解

2023-07-11  本文已影响0人  千万别加香菜

●英文题目:《Phylogenomic analyses provide insights into primate evolution》

●期刊: SCIENCE

●影响因子:2023_IF=56.9;中科大类: 综合性期刊1区; 中科小类: 综合性期刊1区; JCR分区: Q1
●发文单位:中科院昆明动物所、浙江大学、西北大学、西北工业大学及国外学校等多个机构

●文章作者:中科院昆明动物所邵涌、浙江大学周龙为共同第一作者;中科院昆明动物所吴冬冬、浙江大学张国捷、西北大学齐晓光为共同通讯作者

●摘要:
在系统发育背景下对灵长类基因组进行比较分析,对于理解人类遗传结构的进化和灵长类的多样性至关重要。此研究包括50个灵长类物种,涵盖14科38属,有27个基因组首次在此报道,其中许多来自以前不太有代表性的群体,如新世界猴(New World monkeys)和原猴(Strepsirrhini)。我们的分析揭示了灵长类谱系中基因组重组和基因进化的异质率。在不同谱系中,有数千个受到正选择的基因在神经、骨骼和消化系统中发挥作用,可能对灵长类动物的创新和适应做出了贡献。我们的研究表明,许多关键的基因组创新发生在类人猿下目(Simiiformes)祖先节点上,并可能对类人猿的适应性辐射和人类进化产生影响。

●前言:
灵长类目包括16科79属500余种,并还有新物种被不断发现,使灵长类成为现存哺乳动物中仅次于蝙蝠(翼手目)和啮齿类(啮齿目)的第三大特种目。 非人灵长类动物作为我们现存的近亲,在人类社会的文化和宗教中扮演着重要的角色。 许多非人灵长类动物因其遗传、生理和解剖上与人类相似而被广泛用作动物模型,从而使新开发的药物和疫苗的有效性和安全性得以检验。 例如,自新冠病毒出现以来,猕猴(macaques)就在疫苗的研发中充当了重要的模型。 灵长类动物表现出相当多的血液学、行为学和生理学的多样性,是理解我们物种进化的关键,尤其是人类表型的进化,如高级认知。

非人灵长类动物在亚洲、中美洲和南美洲以及非洲的热带森林、稀树草原、半荒漠和亚热带地区占据着广泛多样的栖息地,而人类已经遍布地球表面的大部分地区。 然而,根据国际自然保护联盟 (IUCN) 的红色名录,超过33%的灵长类物种处于极度濒危或易危状态,60%的物种濒临灭绝,75%的物种正在经历种群数量下降。 随着全球气候变化和人为干扰的加剧,灵长类动物的保护状况引起了全球科学界和公众的关注。

尽管非人灵长类动物特别重要,但仅有不到10%的物种的参考基因组被测序,这既阻碍了科学研究及对其的保护工作。 在这里,通过灵长类基因组计划(PGP)的第一阶段项目中的长读长测序数据,我们提供了27个灵长类物种的高质量参考基因组。

●结果:

1、27个新灵长类参考基因组的组装和注释
我们应用长读基因组测序技术,包括PacBio和Nanopore,对11科26属27个非人灵长类物种的基因组进行了测序。 我们还利用高通量染色体构象捕获技术(CCC)产生的测序数据,将组装的序列锚定到4个物种的染色体上。研究中的灵长类物种的新基因组序列的大小从~2.4×109碱基对(Gbp)(Daubentonia madagascariensis)到~3.1 GBp(Erythrocebus patas),与基于K-mer的序列基本一致,其平均连续N50长度为~15.9×106个碱基对。 所有基因组组装的BUSCO完全得分>92%。 以人类、黑猩猩、大猩猩、猩猩和小鼠的蛋白质序列为同源性预测的参考模型,采用从头和基于同源性的策略对所有基因组进行注释。 我们预测了20,066-21,468个蛋白质编码基因。此外,我们还利用所有灵长类动物和其他9种哺乳动物之间的全基因组比对,鉴定了~24.2Mbp的灵长类特异性高度保守元件。

灵长类基因组计划还为另外16个灵长类物种产生了高质量的参考基因组,这些基因组被用于相关论文中,以揭示猕猴快速辐射期间的杂种形成、金丝猴属的同倍体杂种形成、亚洲叶猴在寒冷适应下的社会进化和懒猴的进化适应。 所有基因组数据在NCBI数据库中公开发布并可自由访问。

2、现存灵长类动物的基因组系统发育关系

Fig1. 灵长类系统发育关系

接下来,我们进行了系统基因组分析,包括27个新生成的基因组,另外22个已发表的灵长类基因组,一个来自懒猴 Nycticebus pygmaeus 在相关论文中报道的长读基因组,以及两个灵长类动物的近亲,圣达飞狐猴 (Galeopterus varigatus) 和树鼩 (tupaaia belangeri chinensis) 为外群。我们在 GTR+GAMMA 模型下使用 ExaML 构建了全基因组系统发育树。总而言之,从全基因组比对中获得了约 433.5 Mbp 的同构同源序列数据,并用于推断灵长类系统发育,生成了高分辨率的全基因组核苷酸证据树,其拓扑结构与之前从186个现存灵长类动物的54个核基因区域获得的树相同。这棵树对所有进化节点都具有100%的 bootstrap 支持,除了长臂猿属中具有90% bootstrap支持的节点 ((Symphalangus syndactylus, Hoolock leuconedys), pileatus Hylobates pileatus) 之外(Fig. 1)。长臂猿的进化以其快速的核型变化为特征,其灵长类系统发育关系中仍存在属水平的争议。为了证实该节点的系统发育,我们还用同源蛋白质编码基因、第一和第二位的外显子密码子四倍简并位点保守的非外显子元件生成了不同树。保守的非外显子元件树产生了与全基因组核苷酸证据树相同的长臂猿谱系拓扑结构。然而,同源蛋白编码基因外显子密码子的树分别支持 ((Nomascus, Hylobates)、(Symphalangus, Hoolock))((Nomascus,(Symphalangus, Hoolock)), Hylobates)。在之前对白颊长臂猿 Nomascus leucogenys 将短读长reads比对至参考基因组的研究中也显示这两种拓扑。

我们的分析再次证实了长臂猿谱系中的系统发育挑战,它在极短的进化时期内经历了明显的适应性辐射(PS:可称之为物种大爆发,我的理解是)。 在系统发育上,我们一致地观察到这个谱系中极短的内部分支。 使用 CoalHMM 跨灵长类谱系的比较分析表明,长臂猿谱系代表了不完全谱系分选 (ILS) 频率最高的谱系之一,支持了以前基于种群数据的研究。 具体地说,这两个长臂猿分支的 ILS 比例分别为57%和61%,但从 ILS 分析中推断出的物种拓扑与本文提出的相同(PS:也就是基于溯祖理论推断出的拓扑,个人理解)。

利用全基因组核苷酸证据和化石校准数据(Fig 1),用 MCMCtree 算法估计了现存灵长类动物的分化年代。 我们估计所有灵长类动物最近的共同祖先发生在64.95-68.29百万年(Ma)前,这与最新的哺乳动物系统发育研究中给出的估计接近,表明灵长类动物群的起源在66 Ma前的白垩纪-三叠纪界线附近。 我们还估计,原猴亚目最近的共同祖先出现在52.57~56.56Ma前,而类人猿下目最近的共同祖先出现在35.65~42.55Ma前(Fig 1)。

PS: 这一部分主要是解决了对现存灵长类动物中长臂猿科由于其短期的快速适应性辐射而造成的我们对物种系统发育关系评估的困难,提供了一个比较清晰的现存灵长类动物的系统发育关系。其短期快速适应性辐射使得我们使用不管是基因树、4D sites树还是同源蛋白树或是其他的一些方式构建的树均存在ILS的影响。因此使用基于溯祖理论的 CoalHMM 进行系统发育关系中ILS的评估,以此来推断拓扑结构。

3、灵长类基因组结构与进化
3.1、核型进化与基因组重排
物种形成过程往往伴随着核型进化,核型进化也影响基因组进化和基因功能。 我们重建了跨灵长类谱系的祖先核型进化过程,并观察到染色体水平的整体保守模式(图2A)。 Catarrhini(2n=46)和Hominoidea(2n=48)的祖先核型数与以前由细菌人工染色体荧光原位杂交数据(图2A)得出的推断一致。 然而,我们推论出primates和Siimiformes的祖先核型都是 2n=52(图2a),而不是以前认为的2n=50。恢复了在灵长类共同祖先(图2A)中发生的8号染色体分裂事件。 融合和分裂是灵长类核型进化中最常见的机制,如2号染色体的融合,这在人类谱系中特异发生。 我们的分析进一步确定了在Simiiforms出现期间至少有一次分裂和一次融合,以及与Catarrhini节点(图2B)相关的一次分裂和四次融合,导致了我们自己的当代核型结构。 Simiiforms核型的快速变化也导致了新世界猴染色体数目的增加,其染色体数目是灵长类中最多的。 我们进一步估计了基因组重排的速率,包括从灵长类共同祖先谱系到人类谱系的关键进化节点的所有大规模基因组重排事件,包括逆转、易位、融合和分裂。 我们观察到在Homininae(Gorillahomo-Pan)中重排率增加(~ 2.38/ma),特别是在Hominini(Homo-Pan)中(~5.56/ma)(图2B),这与关于 Hominini 核苷酸替换率 “减慢假说” 相矛盾。

图2

3.2、谱系特异性区段重复
接下来,我们绘制了灵长类和5个外群物种的区段重复图谱(区段重复长度≥5kbp)。与其他灵长类谱系相比,我们在大猩猩(Great apes)基因组中观察到谱系特异性片段重复的数量显著增加(n = 221)(图3A),这与之前描述大猩猩祖先中片段重复激增的发现一致。大猩猩中这些特异的片段重复与57个蛋白编码基因重叠,其中20个在人脑中高度表达。我们还在其他灵长类群体中观察到谱系特异性的片段重复,产生了可能对这些谱系进化有贡献的谱系特异性的新基因。我们进一步探索了灵长类基因组中所有基因重叠片段重复的功能与人类基因突变数据库的对比,发现这些基因中有很大一部分(52.8%)被报道与遗传病有关,包括自闭症、智力障碍、和其他发育障碍(图3B)。

图3

3.3、基因组大小和转座元件的进化
与其他哺乳动物类群相比,灵长类动物的平均基因组大小相对较大。 在灵长类动物中,狐猴 Lemurs(Lemuriformes and Chiromyiformes)的基因组(~ 2.36GBP)显著小于其他类群,如Lorisdae and Galagidae ~ 2.70GBP、新世界猴类(~ 2.82GBP)、旧世界猴类(~ 2.91GBP)、人猿总科(~ 2.96GBP) (P<0.05),Mann-Whitney U检验)。 类人猿下目Simiiforms基因组大小的增加可归因于转座元件的扩展,尤其是 Alu 元件,即约300个核苷酸短的散在序列元件(SINEs),占人类基因组的11%。 我们观察到狐猴基因组中SINEs相对较少,尤其是 Alu (3.87%),不到其他谱系所占比例的三分之一。 相比之下,在Simiiforms和Lorisiforms中Alu元素分别在40~45Ma和34~39Ma前经历了较大的反转转位活性爆发。

3.4、核酸替代率的变化
我们估计灵长类动物的总核苷酸替换率为每百万年每个位点约1.1 ×10−3次替换(图3C),远低于哺乳动物(~2.7 ×10−3)和鸟类(~1.9 ×10−3)的平均替换率。然而,在灵长类谱系之间,核苷酸取代率表现出高度的异质性,这可能是由生活史特征的差异引起的。新世界猴的进化速度最快,每百万年每个地点更替约1.4 × 10−3次(图3C)。我们通过检测减少的人猿替代率(~0.8 × 10−3个取代点每百万年),证实了人猿“减速”假说。

3.5、蛋白编码基因的进化
我们获得了一个高度可信的同源基因集,包括50种灵长类动物的10,185个同源基因,以及巽他飞狐猴 Sunda flying lemur 和中国树鼩Chinese tree shrew。在灵长类动物的全基因组核苷酸证明拓扑结构的基础上,我们计算了每个同源物的非同义(dN)和同义(dS)替换率,以探索编码区域的进化限制。基于观察的组织特异性表达基因通常在不同物种中保守,我们对灵长类动物进化节点下的不同组织估计了组织特异性表达基因的进化率,并观察到与其他组织特异性表达基因相比睾丸和脾特异性表达基因通常表现出更高的dN/dS(图3d),证实了灵长类动物生殖和免疫系统的快速进化。相比之下,尽管灵长类动物的认知功能正在快速进化,但大脑特异性表达的基因通常表现出高度的保守性——dN/dS值却较低。

接下来,我们在 PAML 中使用分支位点模型下的 codeml 算法和似然率检验,通过与其他哺乳动物物种的比较,在灵长类共同祖先谱系中检测到82个正选择基因。 我们发现这些正选择基因在脑、骨髓和睾丸中表现出高水平表达的基因中显著富集。 特别是,近37%(30个基因)的正选择基因在大脑中表现出偏向性表达,我们发现其中一些基因(如SPTAN1、MYT1L和SHMT1)可能在大脑功能中发挥重要作用,因为这些基因的有害突变已被报道导致癫痫和精神分裂症等大脑疾病。 这些基因可能是参与灵长类大脑进化的重要候选基因,因为它们在功能上很重要。 我们的结果表明,尽管脑特异表达基因普遍保守,但灵长类祖先谱系中一些正选择基因可能参与了它们脑功能的快速进化。 此外,几个免疫基因(如XRCC6和CD2)在灵长类祖先中也经历了正选择,这表明适应性免疫系统可能也对灵长类进化做出了贡献。

PS:这一部分主要是全面的解析了灵长类动物基因组结构(核型进化、基因组重排、谱系特异性片段重复、基因组大小、转座元件)进化及基因的进化。最后对灵长类共同祖先进化中的正选择基因进行了概述(特别是脑的进化)。

4、在类人猿下目中祖先基因组改变的增加
为了对灵长类表型进化的遗传基础提供新的见解,我们进行了各种比较基因组分析,包括识别正选择基因、具有保守的非编码区的基因,与谱系特异的快速进化区域overlap的基因,以及在不同灵长类谱系中扩展的基因家族的基因。 在Simiiformes祖先(图4A)中观察到基因组进化变化的水平增加,这反映在正选择基因、谱系特异快速进化区域和基因家族的扩增。 与原猴亚目Starsiiformes和眼镜猴下目Tarsiiformes不同,类人猿下目也经历了一系列复杂性状的快速进化。 例如,与Strepsirrhini和Tarsiiformes(图4b)相比,Simiformes通常表现出更大的脑容量和身体质量。 功能富集分析表明,与这些快速基因组变化有关的Simiformes祖先的相关基因在与神经系统和发育相关的功能中被过度表达,如突触后密度、突触和典型Wnt信号通路的负调控。

图4

其他分析表明,在Simiformes祖先谱系中的各种候选基因,包括168个正选择基因,273个与谱系特异性快速进化区域相关的基因和14个基因家族扩张的基因,在中枢神经系统terms中富集,即大脑、小脑、海马体和大脑皮层。 更具体地说,有五个基因参与了轴突引导通路(图4C),在人脑中以高水平表达。 轴突引导代表了神经网络形成的关键阶段,并且可能对脑容量有重要影响。 在这一途径中,两个与中枢神经系统模式有关的信号蛋白基因 Sema3b和Sema3d 分别经历了正选择和作为谱系特异性快速进化区域相关的基因。 这两个基因,连同另外三个与谱系特异性快速进化区相关的基因,EPHA3、RAC1和NTNG2,已知对大脑发育很重要。 此外,八个基因被归属于terms “河马信号通路”(图4D),这是一种进化上保守的信号通路,通过调节从苍蝇到人类的一系列动物的细胞生长、增殖和凋亡来控制器官或身体大小。 参与神经元网络形成和控制器官大小的基因似乎在Simiforms祖先谱系中经历了适应性进化,并可能负责特定的表型变化,特别是与Strepsirrhini和Tarsiiformes相比,大脑容量和身体尺寸的渐进增加。

Strepsirrhini, Tarsiiformes和Simiformes的主要表型差异是夜间生活和白天生活。Strepsirrhini和Tarsiiformes与Simiformes的视觉系统有很大的差异,因此,与Strepsirrhini和Tarsiiformes相比,白天活动的Simiformes的角膜尺寸要小得多(与它们的眼睛相关),视力也要高得多。与这种表型差异相一致的是,我们在3个与眼睛发育相关的基因NPHP4、GRHL2和SLC39A5中检测到了正选择信号(Gene Ontology identifier: 0001654)。GRHL2编码一个转录因子,抑制上皮-间质转化;突变引起的GRHL2异位表达加速细胞状态转变,导致后侧多形性角膜营养不良和视力功能破坏。与其他参与眼睛发育的基因相比,GRHL2基因在类人猿祖先中具有最多的正选择位点。TAS1R1编码一种味觉受体,该受体可以与TAS1R3形成异源二聚体,以激发鲜味、。我们发现TAS1R1也经历了正选择,在Simiformes祖先中有四个正选择位点(图4E)。味觉感受器和视觉的快速而协调的进化可能帮助了白天活动的Simiformes定位和识别食物。这些氨基酸变化的详细功能后果可能值得进一步研究。

与Strepsirrhini和Tarsiiformes相比,Simiformes的皮肤色素一般较深,被毛颜色不那么鲜艳。我们鉴定了两个与色素沉积相关的基因,KIT和CREB3L4,它们参与了在正选择下进化的黑素生成途径(通过分支位点模型检测)(图4E)。黑素细胞通过调节与黑色素相关的基因在哺乳动物皮肤和毛色的形成过程中发挥重要作用。KIT,编码一种受体酪氨酸激酶,调节黑素细胞的迁移、增殖和分化,并在黑素沉积中发挥关键作用。KIT还与MITF(黑色素形成的关键基因,调节黑素细胞的发育)沟通。

PS:因类人猿下目Simiformes与原猴亚目Strepsirrhini和眼镜猴下目Tarsiiformes相比,具有更大的脑容量及身体大小,且具有日行性,皮肤色素以及被毛颜色也有所不同。将Simiformes与Strepsirrhini和Tarsiiformes进行比较找出Simiformes中的正选择基因、扩张的基因家族及谱系特异性快速进化区域。

5、灵长类动物表型进化的遗传机制
5.1、大脑的进化
在灵长类动物中,狐猴的<~ 2cm3到人类的~1300cm3。为了揭示灵长类动物大脑进化背后的遗传变化,我们利用灵长类动物系统发育中关键进化节点的PAML分支位点模型检测了大脑发育基因的正选择信号。在灵长类动物进化节点中,共发现34个大脑基因处于正选择状态。其中4个SLC6A4、NR2E1、NIPBL和XRCC6在所有灵长类的共同祖先中处于正选择,而30个在其他灵长类祖先节点中正选择,导致人类进化。这些结果似乎表明,灵长类动物在一段较长的进化时间内经历了持续的大脑进化。在小鼠身上对许多这些积极选择基因的敲除实验显示大脑功能受损。例如,NIPBL基因与ZFP609相互作用,调节皮层神经元的迁移,其突变经常涉及包括智力残疾和癫痫发作在内的大脑神经缺陷。我们在NIPBL蛋白中发现了两个氨基酸残基,它们在所有灵长类动物的共同祖先中都经历了适应性变化。

小头症的特征是严重的神经缺陷,由于神经细胞的增殖受到干扰而导致大脑体积较小。一些与小头畸形有关的基因已经被提出作为参与大脑大小进化的候选基因。我们还在1113个与小头畸形相关的编码基因(g:Profiler identifierHP:0000252)中寻找了正选择信号。总的来说,在灵长类祖先到人类谱系祖先中,已经确定了65个在小头畸形中具有功能作用的正选择基因,这表明,小头畸形基因可能参与了灵长类动物大脑尺寸的显著进化扩展。特别是在那些关键的进化节点,其特征是皮层折叠程度(脑回变性)和脑容量的急剧增加。

接下来,我们试图研究灵长类动物大脑大小进化中的调控元件的作用。 我们首先在所有灵长类动物中鉴定出高度保守和经过强烈纯化选择的非编码区域,并在四个谱系中检测到加速进化的信号:Simiiformes祖先、Catarrhini祖先、 great apes祖先和human谱系,它们代表了灵长类动物大脑尺寸扩大的关键进化节点。 这些谱系特异的快速进化区域应该在特定的谱系中处于强烈的正选择之下,并可能有助于这些谱系的适应或创新。 我们在great apes的共同祖先中发现了15个与谱系特异加速区域相关的基因,这些基因在人类胎儿大脑中表现出特别高的表达。 据报道,这些基因中有一半以上在大脑发育和功能中起作用。 例如,在小鼠模型中敲除编码MEF2C的转录因子导致神经祖细胞中神经元分化受损和体细胞大小变小。 巧合的是,在great apes谱系中检测到了该基因的谱系特异性加速区。 DLG5基因是有丝分裂神经前体中香橼激酶极化所需的基因,在great apes谱系中也含有谱系特异性加速区,DLG5-/-小鼠具有更小的大脑和更薄的新皮质。

我们进一步研究了神经递质的进化,这些递质介导神经发生过程,并在大脑大小的调节中发挥作用。 我们检测了12个正选择基因和39个与导致人类谱系的祖先节点中谱系特异加速区域相关的基因,这些基因被发现参与神经递质信号的释放、运输和接收(图5a)。 这些基因参与不同的神经递质系统:谷氨酸能、多巴胺能、胆碱能和GABA能突触和突触囊泡周期。 其中5个正选择基因和33个与谱系特异加速区相关的基因在人脑中高表达。 很可能,这些影响神经递质信号通路的基因组变化中至少有一些可能在灵长类大脑进化中发挥了作用。 图5

5.2、骨骼肌系统和四肢的进化
树栖生活方式与骨骼系统和四肢发育的适应性变化共同进化。 在骨骼发育中起作用的基因可能对灵长类动物的适应性辐射特别重要。 我们在灵长类祖先中鉴定了4个参与骨发育的正选择基因:PIEZ01、EGFR、BMPER和NOTCH2。 骨的发育需要破骨细胞前体从周围的间充质中募集,从而启动骨生长的关键事件,如骨髓腔形成、毛细血管侵入和基质重塑。 机械传感蛋白PieZo1通过破骨细胞-成骨细胞串音调节骨稳态。 破骨细胞通过分泌一些可溶性因子影响成骨细胞的形成和分化。 EGFR在成骨细胞分化过程中负向调节mTOR信号以控制骨发育。NOTCH2 基因在成骨细胞前体中调节松质骨体积和微构筑。

虽然尾巴的长度和形状在灵长类动物中各不相同,但它们通常在运动中起着关键作用。 尽管如此,尾巴在一些灵长类谱系中丢失了,包括猿类的共同祖先。 我们在猿类apes的共同祖先谱系中检索到151个与谱系特异加速区相关的基因,包括KIAA1217KIAA1217的突变与人类脊索和尾椎的畸形有关,在小鼠中,它们影响脊椎的发育,导致尾椎数量减少导致特征性短尾。 因此,谱系特异性加速区可能作为KIAA1217表达的调节因子,因为位于猿谱系中KIAA1217附近的谱系特异性加速区与增强子EH38E1455433(Pels)重叠。 高通量染色体构象捕获数据(CCC)也表明,这种谱系特异的加速区与KIAA1217位于相同的拓扑相关结构域,提示它们可能在物理上相互作用。 此外,较小的猿类(长臂猿)由于它们主要的运动方式,臂式,是非常感兴趣的。 这种运动适应伴随着独特的形态特征的获得,特别是拉长的前肢,代表了长臂猿耐人寻味的表型特征之一,使它们能够以高速运动通过树荫。 我们发现在长臂猿祖先谱系中,正选择已经对与上肢骨形态相关的四个基因进行了作用。 其中编码丝氨酸或苏氨酸激酶的NEK1包含最多的正选择的位点(图5b)。 功能研究表明,该基因的遗传变异可以影响骨骼长度,缩短人类肱骨和股骨。 因此,正选择作用于与上肢骨形态相关的基因可能在长臂猿获得伸长的前肢(长臂猿独特的臂式运动方式的一个关键适应性特征)方面起着重要作用。

5.3、灵长类动物中身体大小的进化
像其他哺乳动物群体一样,现存的灵长类物种表现出很大的体型范围,从矮猴和狐猴(约60 - 70克)的一端到雄性大猩猩(某些个体重达200公斤)的另一端。因此,灵长类动物的体型经历了显著的差异,尤其是great apes,它们的体型大幅扩大。我们在great apes的共同祖先中发现了一些正选择基因,这些基因可能促成了这种特性的进化。DUOX2编码一种参与甲状腺激素合成关键步骤的蛋白质,已知DUOX2 的突变会导致小鼠和熊猫的体型减小。该基因在great apes祖先谱系中经历了强烈的正选择(P =0.018, c2检验)(图5C)。此外,我们还发现了几个涉及转化生长因子-b (TGF-b)信号通路(如LTBP1)或Wnt信号通路(如MBD2、YAP1和DISC1)的基因,这是参与骨骼发育和体型的两个最著名的通路。这些基因要么是在great apes的强正选择下,要么是在这个谱系中具有谱系特异性加速区域(图5C)。

在河马信号通路中,一些正选择基因和与great apes祖先中谱系特异加速区相关的基因也显著过高表达,这与器官和身体大小的确定有关。 当组合所有正选择基因、与谱系特异加速区相关的基因以及与非Simiiformes谱系(图4b)相比显著增加体型的Simiiformes祖先谱系中的扩展基因家族时,我们还检测到了不同的Hippo信号通路适应性变化的候选基因。 这些结果表明,在灵长类进化过程中,这两个节点中的河马信号通路在身体结构中扮演着潜在的重要角色。

5.4、消化系统的进化
灵长类谱系进化出不同的饮食习惯和专门的消化功能。 特别是,食叶猴,一个非洲和亚洲的亚科(colobinae)的旧世界猴子,已经进化出一个独特的专业化和分区的前肠,其中有离散的碱性和酸性部分来应对他们的叶食性和微生物发酵可以发生。 虽然叶猴吃叶子、水果、花和种子,但它们通常把大部分的摄食时间集中在叶子上(估计范围:34%-81%的年食量)。 因此,这些食叶动物在满足其能量代谢需求和平衡微量营养素和蛋白质摄入的同时也处理其食物植物中所含的毒素方面适应良好。

在Colobinae的祖先中,我们发现了一些经历正选择的关键消化基因。ACADM基因编码的酰基辅酶a脱氢酶是一种重要的脂解酶,催化线粒体脂肪酸b氧化每个循环的初始步骤,并在从摄入食物中代谢脂肪酸过程中发挥关键作用。富含能量的短链挥发性脂肪酸由微生物发酵过程产生并被宿主吸收,因此对colobines的能量消耗做出了重要贡献。因此,该基因的快速进化,以及两个正向选择位点(V75M和A138C),可能对colobines吸收脂肪酸很重要(图5D)。在结肠中高表达的NOX1在Colobinae的祖先中被鉴定为正选择(图5D)。NOX1依赖的活性氧产生可以进一步调节小鼠回肠微生物的内稳态。反刍动物的瘤胃和colobines的囊胃已经发展出一种类似的适应策略,允许微生物发酵高纤维食物,因此是趋同进化的一个例子。我们发现MYBPC1也在Colobinae的祖先中发生了正选择(图5D), MYBPC1已被证明有助于牛瘤胃的形态和功能差异。此外,在Colobinae的祖先谱系中确定了100个与谱系特异性加速区相关的基因。其中一些基因在胃、结肠、胰腺和小肠中也有高表达(图5D)。其中,RNASE4编码一种重要的消化酶——胰腺核糖核酸酶4,是RNASE1的类似物,已知RNASE1通过基因复制在食叶的colobines和吼猴中经历了适应性进化。因此,colobines可能已经获得了适应能力,使它们能够消化脂肪酸和核糖核酸,而且它们独特的前肠和肠道微生物群使它们能够适应它们的叶食性饮食。

5.5、感觉器官的进化
在许多哺乳动物中,嗅觉是主要的感觉,并为交配提供了许多感觉信息,动物赖以导航、觅食、躲避捕食者或进行社会行为和求偶。 大多数Strepsirrhini物种是夜间活动的,而大多数Simiiforms是白天活动的,其色觉系统发达,与它们在白天活动中的优先次序相一致。 相比之下,与Strepsirrhini相比,Simiiforms的嗅觉敏感度似乎有所下降。 与这些发现一致的是,我们发现几个特定嗅觉受体基因家族的拷贝数在Simiiformes中显著减少。 例如,嗅觉受体基因家族OR52A在Simiiformes(40种)中经历了显著的收缩,平均只有0.7个拷贝,而在Strepsirrrhini(9种)中平均只有3.4个拷贝。 解剖学上,Strepsirrrhini的特征是鼻尖周围有一个鼻腔、表皮和裸露的表面,这在大多数哺乳动物中都存在,包括狗和猫,但在Simiiformes中已经消失。 与嗅觉感受器神经元数量有关的嗅球体积,在Strepsirrrhini中也比在Simiiformes中大。 参与嗅球发育的LHX2基因在Strepsirrrhini的祖先中经历了正选择。

PS:从大脑、四肢、骨骼肌、体型大小、消化系统、感觉器官这些方面的进化进行研究,找出位于进化节点的关键正选择基因、位于谱系特异性快速进化区域的基因等。分析的确实很全面了

6、非人灵长类的群体动态历史

图6

世界自然保护联盟将超过三分之一的灵长类动物列为极度濒危或易受攻击。 为了评估气候变化和人类活动对这些灵长类动物最近种群数量下降的影响,我们在本研究中对每个物种使用成对序列马尔可夫聚结模型(PSMC)推断了它们在过去百万年中的种群历史。 我们的数据显示,大多数非人灵长类物种在更新世晚期经历了快速的种群下降(图6a),与这一时期哺乳动物大规模灭绝的记录一致。 虽然我们没有观察到濒危物种与其他物种在核苷酸多样性方面的显著差异,但我们确实检测到过去~ 2万年的有效种群规模中位数(Ne)与核苷酸多样性之间存在显著的正相关(P=0.002)(图6B),表明了Ne下降对遗传多样性丧失的长期影响。 根据历史人口学模式,我们进一步对所有具有相似历史Ne趋势的非人灵长类物种进行聚类,发现有20种物种在过去300万年中经历了Ne持续下降(图6c)。 这些物种中有65%现已被列为濒危或极度濒危物种(图6c)。 这一比例是其余物种的两倍,表明史前环境影响(例如,栖息地破碎化)也可能在现代人类干预之前就导致了种群下降,并导致了这些物种目前的濒危状态。

最后通过分析其群体动态历史进行收尾,提出可能在人类干预之前这些物种的群体规模就已经下降了,目的呼吁我们对他们的关注和保护。

上一篇下一篇

猜你喜欢

热点阅读