基因的表达
所有在这个世界中存在的生物,都具备自我的一套遗传物质。因为这些遗传物质,生物们展现着各式各样的性状和形态,会让我们感到生命的神奇。但是,生物体内的遗传物质(基因)与外在所表现的状态有什么关联?通过什么样的方式进行关联?
通过已有经验,我们可以得知生命活动的主要承担者是蛋白质,但是蛋白质这家伙如何和基因扯上联系?但事实又证明两者是有关联的,比如通过转基因技术创造的超级鼠和荧光鼠,以及风靡如今前沿科学界的复活恐龙,都是基因的另类表达。但是这样的控制表达该如何实现?基因如何指导蛋白质的合成?我猜想可能是因为基因的不同,从而所产生的蛋白质性状也不同,然后不同的蛋白质就会产生不同的生物性状。另一方面,生物性状也会受到外在的环境影响,成为最终的生物形态。那么这样的想法正不正确呢?
让我们回到亚显微结构中来探索一番。我们知道基因是在细胞核中的,但是产生蛋白质的细胞器~核糖体存在于内质网中,而内质网则处在细胞质中,距离基因有不少距离。如果为了让基因体现作用,难道它必须亲自从细胞核孔出来前往核糖体进行工作吗?这可能并不合适。作为一个皇帝(生命中枢),如果亲自工作则会导致效率低下,同时造成生物DNA的损失,不利稳定性。很显然,细胞核之内的基因需要一个使者,既能代表自己也能够承担起工作的任务。没错,这个任务就交给了与DNA同为核酸的RNA。
虽然两者并不完全相同,但是两者都具备碱基互补配对的原则。所以,RNA并可以通过转录来承载一部分DNA(也就是基因)的信息,代表DNA去核糖体工作。所以这种拥有特殊功能的RNA就被称为信使RNA,也就是messenger RNA(mRNA)。那么RNA是如何形成的呢?除了DNA自身具备的碱基模板,还需要合成RNA的蛋白酶以及构成其的原材料。另一方面也需要供给酶的能量~ATP。在这时候工作的蛋白酶其实是一种复合酶,既承担着解DNA双链的功能,也可以通过互补配对来合成RNA。从上一篇章,我们认识到DNA的复制是从3‘到5’的(所以复制出来的链条是5’到3‘),所以RNA的合成也离不开这一原则。于是RNA聚合酶便会不断向DNA模板链(与之对应的就是编码链,合成的RNA所代表的就是这一段信息)的3’端移动,一边解旋,另一边又一边再次螺旋。由于RNA在工作之后便会消亡,所以破碎的核糖核苷酸又会成为新信使RNA的合成材料。所以mRNA的种类不仅多同时代谢活跃,这一位生命的高效活动提供了保障。
那么RNA在合成之后会去哪里呢?没错,通过我们的推理就是穿过细胞核孔前往核糖体行驶使命。但是这里就会牵扯到另一个问题:蛋白质的主要构成成分是氨基酸,信使RNA所携带的信息是碱基,那么核糖体如何将碱基信息转化为氨基酸的序列从而合成蛋白质?毋庸置疑,生命需要设定一个特定的转化关系,同时让这种转化关系体现在一个同时携带碱基和氨基酸的中间体上。基本思路是这样,那么碱基如何决定氨基酸的种类?自然界中一共存在21种氨基酸,人体都会有对应的需求,但是RNA的碱基只有4种啊。如果一个碱基对应一种氨基酸,显然远远不够。如果两个碱基对应一种氨基酸,就会有4的二次方种可能,但16小于21,同样不够。如果是三个碱基对应一种氨基酸呢?四的三次方等于64,64是大于21的。所以生命应该是利用三种剪辑来决定一种氨基酸,借用这种逻辑完成蛋白质质的生产。但是显然64远远大于21,剩下的情况该怎么分配处理呢?于是科学家的猜想可能多种组合会对应一种氨基酸。于是我们变得出一个三连体密码假说,肯定需要实验的证明。
那么实验该如何设计呢?如果说三种碱基对应一种氨基酸,那么如果将“三个一体”的RNA序列打乱(也就是像其中增添或者删除两个一个碱基),生命的运行肯定会受到限制。于是,科学家们仍然选择了我们熟悉的老朋友~大肠杆菌和噬菌体。科学家将一组T4噬菌体的RNA碱基顺序增添/删除了一到两个相邻碱基,而另一组噬菌体的RNA碱基顺序增添/删除三个相邻碱基,最后将其分别制入含有大肠杆菌的培养液中进行观察。一段时间后,第一组中噬菌体巨人并没有将大肠杆菌侵染,前面的处理居然影响的噬菌体的正常增值。而第二组的噬菌体居然仍然可以侵染细菌,说明处理并没有影响细菌的增值。这样的现象说明一个氨基酸就是需要三个碱基进行对应,否则就会有顺序错乱,影响生命的正常活动。
所以我们便可以根据三个碱基的组合特性,将其称为密码子coden。但是事情到这里还并没有结束,如果科学家想要彻查这个世界中生命的本质以及应用,就需要了解每个不同类型的密码子对应哪种氨基酸。这样的过程就是在破译基因密码。所以科学家又设计了一组实验,他们人工合成了一种比较容易翻译的RNA片段,全部由尿嘧啶核糖核苷酸组成(UUU…),将其分别放进了含有21种氨基酸的21试管中,试管中没有DNA,也没有mRNA,所以不能进行转录。但是里面存在着核糖体和酶。如果哪个试管中出现了多聚氨基酸(也就是形成肽键之后的蛋白质),那么对应形成的氨基酸就是密码子UUU所对应的氨基酸。最终实验结果是含有苯丙氨酸的试管中出现了多具苯丙氨酸肽键链。如此,科学家便完成了对一种密码子的破译。于是按照这样的方法,通过很长一段时间,他们分别把剩余的63个密码子全破译出来了。最终形成了一张简单,但来历及其艰辛的密码子表(Genetic code)。
通过这样一张密码子表,我们可以看到有几种密码子对应一种氨基酸,这样的重复利用对于生命来说有什么意义呢?很显然这样不仅可以保证翻译的速率还可以减少有害突变。如果某几种密码子因为客观原因不能进行合成(从而失效),还可以有其他组合的密码子,同样可以表示两者共同对应的氨基酸,不影响最终的翻译结果。其实就是“他不行的话,我能上”的思路。另一方面,信使RNA的翻译也具备连续性。如果其中一个碱基丢失,那么后面的剪辑便会一一对应上来形成新的密码子,这样不会使翻译的过程结束。
而在64种密码子中,还存在两种特例,分别是起始密码子(AUG、GUG)以及终止密码子(UAA、UAG、UGA)。顾名思义,两者分别对应核糖体最开始的翻译点以及结束的翻译点。而在这两个特殊点位上,分别对应甲硫氨酸/缬氨酸,以及特殊情况下的半胱氨酸。两者在真核生物和原核生物中也有一些应用的差别,这点我们后续会讲到。
大家可能还有问题,我前面提到过一种同时具备氨基酸和碱基的中间体,这个家伙存在吗?是用来干嘛的?显然如果缺少一个中间体,那么细胞质中游离的氨基酸无法与mRNA的信息进行配对。这边是我们要了解的转运RNA,也就是tRNA。他作为搬运工,是一条由70到80个核苷酸链构成的RNA单链。从一级结构变成三级结构后,有四个环状结构,有四个地方具备双链结构。在第二个环状结构上便含有可以与信使RNA对应的配对位点,而这一段RNA的3‘端便包含有一种类型的氨基酸。而根据密码指的特性,可以推断出一种转移RNA,可以携带一种氨基酸,但是一种氨基酸可以被多种转运RNA携带。这便是生命的奇妙之处。
但是,我们,