生物信息学从零开始学微生物信息学生物信息学习

真菌首次报道存在第21种密码子

2020-02-15  本文已影响0人  montreal_sxr

原创 montreal 生信人 2019-02-21

大家都知道,蛋白质是由氨基酸组成的。生命体内的氨基酸到底有多少种呢?如果你的回答是20种,那么,你就错了。因为实际上,某些生物的某些蛋白还使用硒半胱氨酸和吡咯赖氨酸两种特殊的氨基酸。我们这里重点关注硒半胱氨酸

硒半胱氨酸的英文名称是selenocysteine,缩写为Sec,单字母简称为U。其结构同半胱氨酸相仿,其中的硫原子被取代(图1)。

图1 硒半胱氨酸的化学结构

中心法则指出,密码子表包含64个密码子,其中61个密码子编码20个氨基酸,剩余的3个密码子负责编码终止密码子,指导翻译的终止。问题来了,硒半胱氨酸由什么密码子负责呢?研究表明,其中一个终止密码子UGA,将完成这一神圣的使命(下图)。如果在翻译过程中,硒半胱氨酸插入原本为UGA的密码子的位置,那么将导致一个硒半胱氨酸插入进来【1】。当然,硒半胱氨酸的掺入需要有属于其自己的独特的tRNA,以及一套由许多蛋白组成的硒半胱氨酸“机器”(Sec machinery)(请大家留心,这一点对后面的内容很有帮助)。

图2硒半胱氨酸在翻译中

下面进入我们今天的主题——进化。硒半胱氨酸到底可以在哪些生物的蛋白质中找到呢?自然界中很多神奇的现象都发生在演化历史最漫长、生境最多样的细菌和古菌,不少神奇的代谢途径和生物学现象也都发生在这些需要显微镜才能看到的生物里。照这个逻辑,也许你会猜:就是它们了。

这个答案没错,但显然低估了硒半胱氨酸的威力。实际上,硒半胱氨酸广泛存在于生物界,动物、藻类、少数原生生物,以及20%的原核生物中,都可以找到含有硒半胱氨酸的蛋白质。在人体内,有25个基因所编码蛋白质中包含硒半胱氨酸,其中比较著名的蛋白包括谷胱甘肽过氧化酶、甲状腺素5'-脱碘酶、硫氧还蛋白还原酶、甲酸脱氢酶、甘氨酸还原酶和一些氢化酶【2】。这些含有硒半胱氨酸的蛋白,也叫作硒蛋白(Selenoprotein

尽管分布广泛,在真菌——这一真核生物中的重要分支——里,科学家从未找到过硒半胱氨酸的踪迹。所以,学界普遍认为,真菌在进化的早期丢失了这一功能。

然而,就在几天前,人类对硒半胱氨酸的这一认知被一篇发表在Nature Microbiology上的论文【3】颠覆了。该文作者通过纯生物信息学分析,指出在早期分化的真菌(basal lineages of fungi)中,也存在使用硒半胱氨酸的现象!

本文作者的初衷很简单:你们都说真菌没有硒半胱氨酸,可那是之前的报道了。现在基因组测序那么快,老子就是想看一看,这个说法在基因组时代,到底还能不能站得住(有点当年李四光带领科考队摘掉中国贫油国帽子的万丈豪情)?

未探究这一假说,作者们沿着两条路线展开研究。第一,前面提到了,硒半胱氨酸有自己独特的tRNA:tRNASec;此外,其生物合成和翻译过程中的掺入需要一系列相关的蛋白,称为Sec machinery,包括Sec-specific eukaryotic elongation factor (EFsec),phosphoseryl-tRNA kinase (PSTK), SECIS binding protein 2 (SBP2), Sec synthase (SecS), and selenophosphate synthetase (SPS),等等。第二条线是,这些基因若要发挥生物学作用,基因组中应该有真正编码含有硒半胱氨酸的蛋白质(也就是前面提到的硒蛋白Selenoprotein,注意和Sec machinery区分)的基因。沿着这两条思路,作者试图找寻以上这些基因是否存在于真菌基因组内。

首先,作者们从NCBI的Genbank数据库下载了所有真菌的基因组,一共1201个。然后,作者利用搜索基因组中的Sec machinery基因,采用的工具是Secmarker。出于对某些基因组中潜在的污染的,警惕,作者对结果进行了细致的分析和检查。最终,他们在以下九个真菌基因组中找到了硒半胱氨酸的tRNA和Sec Machinery,分别是Bifiguratus adelaidae, Gonapodya prolifera, Capniomyces stellatus, Zancudomyces culisetae, Smittium culicis, Smittium simulii, Smittium megazygosporum, Smittium angustum, Furculomyces boomerangus

接下来,沿着第二条线,作者们在以上九个基因组中寻找编码硒蛋白(也就是包涵硒半胱氨酸的蛋白)的基因。结果表明,在这些基因组内,全部找到了硒蛋白!这其中包括两个在其他生物中已知的硒蛋白(SelenoH和SPS),以及多个真菌中独有的硒蛋白(见图3)。

图3硒半胱氨酸tRNA,Sec machinery,以及硒蛋白在真菌中的的分布

特别地,为确定Sec Machinery、tRNASec和硒蛋白的表达证据,作者们对硒蛋白最丰富的G. prolifera的转录组进行了分析,并基本验证了他们的假说(除tRNA外都有转录)。

通过以上分析作者通过生信分析表明了真菌中的九个基因组中包含硒半胱氨酸。接着,作者把放在了系统发育学(phylogenetics)的框架内,看一看这硒半胱氨酸密码子的使用在真菌里有着怎样的进化历程。作者发现,这九个基因组分布在真菌中不同的分支,分别来自毛霉门Mucoromycota,壶菌门Chytridiomycota,以及捕虫霉门Zoopagomycota(好神奇的名字)。对此,一个简单的解释是硒半胱氨酸密码子发生过多次单独的丢失。当然,作者指出在一些真菌基因组内未找到硒半胱氨酸并不能直接表明它们不使用这种独特的氨基酸,因为其中一些基因组的测序和拼接质量不佳,比如较低的基因组完整度(completeness),会直接影响他们的分析结果。由此,作者认为是否发生多次丢失,以及到底丢失几次,还要仰仗未来更多以及更高质量的真菌基因组。此外小编还想再加一个猜测:是否是横向基因传递(lateral gene transfer)的可能,不过也许因为只有9个真菌基因组这一猜测不好判断吧。

图4 硒半胱氨酸密码子进化图

到此为止,文章的主要内容介绍完了。另外,作者们还做了很多其他的分析,包括硒蛋白在真菌和其他生物之中可能存在的不同调控机制,以及硒半胱氨酸对于真菌对环境适应的潜在意义。这些内容,感兴趣的读者可以在原文里查看详细信息。

本文为硒半胱氨酸在生物界中的存在拓宽了疆界。然而,针对硒半胱氨酸还有很多未解之谜。其存在的意义是什么?与其他氨基酸有什么不同?生物体内仅有少数硒蛋白,却需要一整套Sec machinery去保证其稳定运作,看起来十分浪费,为什么硒半胱氨酸密码子又保留至今?其进化中的不断丢失又是什么原因导致的?这些问题,都有待未来的研究进一步揭示。

本文的通讯作者是来自哈佛大学医学院的Marco Mariott和Vadim Gladyshev,其中Gladyshev是该领域研究的泰山北斗,而Mariotti也是文章的第一作者。其他作者包括来自乌拉圭Universidad de la República的Gustavo Salinas以及西班牙Centre for Genomic Regulation的Toni Gabaldón。原文链接和专题博文请见下方引文。

引文

1. Mariotti, Selenocysteine, the 21st amino acid, discovered in fungi, 2019

2. 维基百科

3. Mariotti M, Salinas G, Gabaldón T, Gladyshev VN. Utilization of selenocysteine in early-branching fungal phyla. Nat Microbiol. 2019

作者原创,原载于生信人公众号

更多生信分析需求,请联系电话(同微信号):13120220117

上一篇下一篇

猜你喜欢

热点阅读