文献阅读 | 考拉基因组学研究其适应与保护
这篇文章是关于考拉基因组的研究,名称是《Adaptation and conservation insights from the koala genome》,2018年发表在Nature Genetics。它主要从基因组的层面来揭示了考拉的一系列有趣的适应现象(如解毒机制、食物选择能力、母乳提供的免疫机制等),并为考拉的保护问题提出了有根据的解决措施。
文章获取: PMCID: PMC6197426 DOI: 10.1038/s41588-018-0153-5
1 Introduction
考拉是澳大利亚所特有的一种有袋类动物,化石记录大约有15-20种;大约在30到40个百万年前,树袋熊科(Phascolarctidae) 从陆地袋熊科(Vombatidae) 分化出来;现代考拉,Phascolarctos cinereus ,是现在树袋熊科中唯一的一个种,它的化石记录最早出现在35万年前。
考拉独特的适应性
解毒机制:专一性地取食桉树叶,而桉树叶对于大多数的哺乳动物来说都是有毒的,甚至是致命的。母乳的免疫保护:怀孕35天左右就分娩了,生出未的幼崽是未发育完全的。因此,幼崽缺乏免疫组织和器官,它们的免疫系统的发育完全是在母亲的育儿袋中进行的,这就意味着早期考拉幼崽的生存完全依赖于母乳所提供的免疫保护。
当前考拉面临的困境
种群数量分布不均匀,澳大利亚北部数量急剧下降,南部数量有所上升。面临的威胁主要是由于生境的丧失和破碎、城市化、气候变化和疾病造成的。疾病的影响,尤其是考拉逆转录病毒(KoRV)和衣原体(Chlamydia)的侵入,使考拉的保护变得更加复杂。
总的来说,这篇文章利用组学手段解决了以下问题:
2 Materials and methods
2.1 测序
选取了3个样本进行二、三代结合测序。
测序样本
2.2 组装
2.3 中心区和重复结构的分析,进而得到着丝粒序列及相关的特征
2.4 基因组注释和基因家族分析
2.5 序列进化分析
2.6 考拉结膜组织中的RNA-seq分析
2.7 考拉的逆转录病毒
2.8 考拉种群基因组,分析考拉历史种群数量(PSMC法)及当代种群遗传结构
3 Results and Discussion
3.1 Genome landscape
考拉基因组组装情况如下,组装得到3.42G的基因组,并且还用到了光学图谱和有袋类动物保守的同源基因信息进一步将contigs组装到super-contig的水平。
组装结果与其他有袋类动物的比较
考拉基因组的特征:①重复序列大约有47.5%,其中转座子占44%;②长散在核元件占考拉基因组的32.1%;③已组装的考拉基因组具有很高的编码区覆盖率:其95.1%的基因覆盖到了4104种哺乳动物的单拷贝同源基因上;④考拉RSX代表了第一个对其结构进行全面注释和结构预测的有袋类RSX。⑤考拉着丝粒全长2.6Mb,并且缺乏难以处理的高阶卫星阵列。
3.2 考拉耐受高毒性饮食的能力
考拉取食桉树叶,桉树叶会分泌植物次生代谢物、酚类化合物、萜类化合物等,这些物质对于大多数哺乳动物来说都是有毒的。对此,作者就提出了这样一个问题,桉树叶对考拉的异物代谢能力具有选择作用。接下来,就需要寻找解毒功能相关的酶的编码基因以及这些基因是否有发生序列进化。
证据:作者找到了细胞色素P450基因家族(CYP基因),它编码的蛋白质参与了解毒的第一个阶段中的氧化代谢。①作者通过对考拉以及其他几种动物的CYP基因的系统发育树的比较分析,发现考拉的CYP基因家族中有2个亚家族C,CYP2Cs存在单系扩增;再通过转录组分析,发现CYP2C在肝脏中的表达量最高,这和解毒一致;②通过比较发现,考拉的CYP2C基因的侧翼标记有高度的串联重复;③CYP扩张在序列水平上,大多数保守区域经历了负选择,④但单个CYP密码子却存在片段式的多样性选择。综上,CYP的重复和适应扩张、负选择和多样性选择是协调工作的,使考拉的CYP新功能化,增强解毒的作用。(结论来自下图,篇幅限制,图片详见文章)
②侧翼标记有高度的串联重复
③c图表明CYP扩张在序列水平上,大多数保守区域经历了负选择;④d\e\f\g图表明单个CYP密码子却存在片段式的多样性选择
那么,这个结论又有什么现实意义呢?简单来说,CYP2Cs的特性和考拉的治疗有关,CYP2Cs(在肝脏中表达量高),其产物蛋白能快速降解NSAID这种药物(用于麻醉)以及像氯霉素这种抗衣原体的抗生素,所以考拉的用药剂量和用药的时间就得相应的增多和增长。CYP2Cs基因的高表达为考拉药物动力学的开发有重大意义。
3.3 考拉的味觉、嗅觉和食物选择
考拉是著名的选择性进食动物,只取食目标营养食物并规避植物次生代谢物。取食前会先闻一闻,能灵敏地识别植物次生代谢物的复杂程度和浓度,那么考拉的食物选择就应该是和其嗅觉、犁鼻器以及味觉有关。一般,食草动物都会通过解一种或几种化合物的毒从而来应对植物的化学攻击。桉树的次生代谢物多且复杂,推测考拉的食物选择能力和解毒能力肯定更强。那么,作者通过检验考拉的嗅觉和味觉基因,看是否发生了基因扩张,从而来说明其食物选择的能力是否有增强。
证据:①V1R犁鼻器基因发生了扩张,它能检测非挥发性气体;②考拉嗅觉受体基因的数量比其他的物种的小,作者将这个解释为考拉嗅觉受体的宽松选择;③味觉基因扩张,可以优化摄取桉树叶中的水分、营养物质;④味觉受体基因TAS2R也发生了扩张,TAS2R能识别多种有苦味的有毒物质。
味觉受体基因TAS2R发生了扩张2
3.4 诱导排卵的基因组学
找到了一些和诱导排卵相关的基因。例如,雌性诱导排卵的关键基因有这些;前列腺素合成基因在分娩等过程中也起到了重要作用;精液诱导雌性排卵的基因;凝固精液的基因,它们的作用是防止精液漏出。
3.5 考拉乳汁的基因组学特征
幼崽刚出生时只有菜豆大小,前6到7个月都在育儿袋中,1岁左右离开育儿袋但继续吸奶。作者通过基因组学+乳腺转录组+乳汁蛋白组来分析乳汁的主要成分。
发现:①4个晚期泌乳蛋白基因(LLP)和 trichosurin 和 β-lactoglobulin基因紧密关联,这可以在哺乳期根据幼崽对营养物质的需要对乳汁蛋白进行调整;②发现了1个新基因(MM1),推测其功能是其分泌的蛋白在乳汁中具有抗菌功能。
3.6 考拉的免疫组学和疾病
考拉的分布范围缩小,目前仅限于澳大利亚东部沿海,考拉被列为易受伤害的物种。保护考拉的挑战主要来自于两个方面,一方面是阻止高发病率,尤其是这个衣原体侵染;另一方面是缺乏考拉免疫、疾病的了解。长读长基因组测序的好处:对高杂合、高重复的免疫基因家族进行从头组装、对免疫基因簇进行完全注释。
衣原体疫苗接种试验的五只考拉的初步病例/对照关联试验:①发现这些MHCII DMA 、DMB、CD8-a基因参与了衣原体疫苗的不同免疫反应;②尸检考拉结膜组织中的RNA表达水平,发现在患病个体中,有1508个注释基因双重上调,685个下调,与健康个体相比,死亡率也是两倍以上;③多种促炎症介质也被上调等。
考拉基因组遭到了逆转录病毒的入侵:①将逆转录病毒的基因序列比对到考拉基因组中,发现有73个插入序列,且多数为内源性的;②分析鉴定了24处蛋白编码基因插入,它们都不干扰蛋白编码的能力。
3.7 考拉基因组信息的保护
使用PSMC分析其他两只考拉的长读参考基因组和短读数据,从而来推断考拉的历史种群数量的变化,这是得到的有效种群变化图。
根据这个图我们可以发现:①考拉的种群数量最初有所增加,随后在约3到4万年前其数量发生了迅速而广泛地减少,这与澳大利亚的多个物种在4到5万年前及3到4万年前迅速减少的化石证据是一致的;②这两个地区的考拉的PSMC图谱不同,且不能结合在一起,表明它们之间存在区域差异,阻碍了基因流动。
作者从考拉的所有分布区中取样(49只野生考拉),测它们的mtDNA并提取到了1200个SNPs分析了最近的树袋熊样本的种群,这些SNPs被映射到考拉基因组上。
b左-考拉种群的分布及地理障碍;b右-考拉种群的聚类(PCA分析);c-49只考拉平均近交指数
发现:①b右图是对49只野生树袋熊的1200SNPs进行的主成分分析,北部三个地区的遗传多样性比较高,由于各个区域间的长期以来都存在连通性,所以它们的分化程度有限,南部两个地区的遗传多样性比较低;②左图表示澳大利亚野生考拉的地理聚类与生物地理障碍之间的关系,北部地区的种群各自聚在了一起,说明了这两个峡谷和河流就是阻止北部考拉种群基因流的地理屏障, 南部两个地区的遗传多样性比较低又各自聚在一起,分析原因,应该是与近期南方种群在地理位置上发生了转移有关;③右图表示49只野生考拉的平均近交指数,我近亲繁殖的水平在不同区域之间不同,北部两个地区的近交指数很高,很容易发生遗传缺陷。
这个部分研究的意义就在于利用地理屏障和种群内部的基因流来来保护和扩大考拉的种群数量。南部由于基因异常和近交衰退导致其遗传多样性低,而北部遗传多样性高,这种差异表明:未经监测就将小的孤立的种群进行地理转移转移,是不能作为拯救种群的基石。以及最后,通过分析近期转移考拉种群和种群现有的遗传结构表明,尽快将南部已经转移的但却发生了遗传缺陷的种群所在的栖息地连接起来,促进基因交流,从而确保考拉长期的遗传健康。
蠢萌蠢萌的考拉~写在最后 | 重新梳理了一下这篇文章,之前在组会上有讲过。实验方法部分只简单罗列了他们主要做的内容,可细看原文。其中若有错误的地方,欢迎各位指出。