第02章 基础课,什么是基因?

2018-07-04  本文已影响0人  珜守約
基因,人体微观世界执行者 作者:珜守约

什么是基因?

        古时候,民间有“龙生九子,不成龙,各有所好”的说法,一般是用来比喻同胞兄弟品质、爱好各不相同。实际上,这句谚语背后所体现的,正是基因起着关键性作用。基因,控制着生命体的基本构造和功能运行,储存着很多遗传的信息,包括血型、身高、长相、繁育、疾病和衰老等。从基因早期概念的提出,到最终明确基因的结构和功能,中间经历了漫长的岁月,无数科学家在这中间薪传相随,才有了现在我们能在一定程度上揭开遗传它的神秘面纱。

         要说基因的源头,还是得从达尔文说起。

         很多人都知道达尔文,他在1858年提出进化论,第二年出版《物种起源》,几年后又提出了遗传假说“泛生假设”。这个假说可以看成是一种错误的对基因的理解,该学说认为,生物体各部分的细胞,都带有特定的可以自身繁殖的粒子,称为“微芽”或“泛子”,这种粒子传递给子代,使它们呈现亲代的特征,而环境的改变可使“微芽”或“泛子”的性质发生变化,再通过特别的繁殖方式,传给子代。但“微芽”或“泛子”的存在,未得到科学上的证明,他所假想的微芽,与后来的基因也相去甚远,被后来的遗传学所否定,达尔文因此没能成为遗传学奠基者。

遗传学说的奠基者:孟德尔

孟德尔(Johann Gregor Mendel,1822-1884)

        孟德尔是个孤独的天才,在当时的科学界始终未得到承认,他甚至把写好的论文寄给了生物领域的学术权威达尔文,但是在达尔文去世后,人们整理他的书库时发现,孟德尔的那篇论文,还没有拆封,安静的躺在角落,甚至上面已经落了灰尘,这说明当初达尔文根本没看这篇论文,究竟是什么原因已经不得而知。孟德尔当时的工作,即便是同领域里的一些大牛科学家,也不能理解。

        孟德尔的出生地现在是捷克境内,当时属于奥匈帝国。他的父亲是个农民,命运似乎注定了孟德尔终其一生都与种植分不开,他热爱生物学,即便是做了修道士,每年在修道院里也会种豌豆。只不过,他种豌豆却是为了可续,观察豌豆的各种性状:植株是高的、还是矮的,种子是圆的、还是皱的……期间经历了八年,始终乐此不疲,终于发现了遗传规律,并提出因子学说:细胞里的因子控制豌豆的性状。这比达尔文的泛生假设还早2年,可是却未引起任何反响。

        他的这个理论,大多数读过高中的人都知道,看似简单,实际上即便是数学很好的人,也很难从一堆数字中,轻易发现被上帝隐藏起来的遗传规律。直到2007年,还有人认为孟德尔当年的豌豆数据做了假,有人怀疑他的数据过于完美,是一种伪造的统计学数据。可是要知道,那时候还没有统计学这门学科,如果孟德尔利用了统计学的方法进行数据篡改,只能证明,他不但是个生物学领域的奇才,更是一个数学方面的天才。孟德尔不是因为利益而做研究,他是一个纯粹的科学家,死后却在相当长的一段时间里,仍被人怀疑数据造假,这是不公正的,好在百年后的今天,多数人相信他是位伟大的科学家。

        为什么说孟德尔天才?

        很多科普作者都有过相似的总结,这是大家较为一致的结论。以前的遗传性状研究者,在比较亲代与子代的异同时,是把亲代与子代分开来看待,他们认为亲代与子代都是单一的个体,不存在关联。但孟德尔在做豌豆的实验时,思维上就已经和前人不同,他认为子代必须看成是一个群体,每一个小豌豆都有它们的价值,是独一无二的,个体变异正是遗传的表现,所以每一个小豌豆都值得观测研究,不但观测性状,还仔细的数每一粒豌豆种子,最终是这份坚持,带来了伟大的发现。感兴趣的读者,可以阅读《花园里的修道士》(The Monk in the Garden:The Lost and Found Genius of Gregor Mendel),作者:Robin Marantz Henig。

        在孟德尔死了的18年后,他的论文终于重新被其他的科学家翻出来,发现其背后的价值。1909年,丹麦遗传学家约翰森,创造了gene一词,这个单词的写法与拉丁语、希腊语里的血统、氏族、种族相近,因此被广泛接受。gene作为遗传学的核心名词,渐渐取代孟德尔的因子。后来,中国有个留学生叫谈家桢,被称为中国遗传学之父,在国内很多大学任教过,期间他给国内的刊物写科普文章时,第一次将gene音译为基因。

        不过,真正证实基因存在的科学家,却不是约翰逊,而是美国进化生物学家摩尔根,他发现基因存在于染色体上。染色体的名字正如它的字面意思:当时科学家们发现,在给细胞染色后,通过显微镜观测到,有一个个长短不一样的棒状物,于是给这些东西起了名字,叫染色体。摩尔根在前人的理论基础上,最终通过果蝇实验证实了基因的存在于染色体上。

托马斯·亨特·摩尔根 (Thomas Hunt Morgan,1866-1945)

        那么,为什么摩尔根会选择果蝇来做实验?因为果蝇个体小,繁殖快,这样有利于实验的观测,缩短周期。更关键的原因,果蝇这个小生物身上只有四对染色体,基因数目也不多,差不多就100多个基因,这种客观的事实,给他的研究带来了巨大的成功。以致后来有人说,果蝇是上帝专门为摩尔根创造的。

        1911年,摩尔根根据他的实验结果,提出了“染色体遗传理论”,1928年,出版《基因论》一书,1933年,获得诺贝尔生理学或医学奖,可见他的伟大成绩。因为孟德尔和摩尔根的科学贡献,遗传学也被称为孟德尔—摩尔根遗传学。

        再到后来,又经过一大批科学家、几代人的努力,才终于知道了基因到底是什么。实际上,大家熟知的DNA并不是基因,简单来说,DNA中那部分有明确功能的序列,才叫基因。

DNA并不是基因

        很多没有进行过系统生物学学习的朋友,会以为DNA就是基因,但实际上并不是,这里首先需要弄清楚:细胞、染色体、DNA、基因之间的关系,它们实际上是一种包含关系,我们来慢慢理清楚。

        身体上的组织或器官,比如:心脏、大脑、眼睛、鼻子、手、脚等等,其实是由无数个体细胞组成的,在每一个体细胞里,都有46条染色体,而每一条染色体上,都有一段段的遗传信息序列,叫做DNA,它们高度螺旋化之后,和其他的一些化学物质共同形成了染色体,而DNA中间的某些部分,才被称为基因。

一张图看懂基因在哪里

        从这个图中,我猜读者应该已经清楚一个事实:基因只是DNA的一个个片段,它们的结构相同,都是由四种碱基组成,简写成A、T、C、G,按照一定的顺序排列起来,形成一段段特殊序列,而每一段序列就代表着一种遗传信息(序列长短不同,代表的功能不同,传递的信息不同)。

        举个例子来理解,某个人想通过短信表白,说出我爱你三个字。那么,他首先要用拼音打出“wo ai ni”,形成文字,才能传递这么一个语言信息。在人的身体里,就是这4种碱基随机组合形成的基因,代表着身体的语言,传递着关键信息,来精细控制细胞在身体每个部位中的具体功能。

        人类基因组计划完成后,我们终于搞清楚人体的全部基因,大约是2.5万个,由30亿个A、T、C、G组成,如果你能知道自己的30亿个碱基是怎么排列的,和人类基因组计划中公布的草图进行比对,就能在某种程度上知道自己生、老、病、死的规律。正是由于这么多个基因的存在,才能做到对身体的精细化管理,如果它们发生了基因突变,就可能会产生严重的后果。

什么是基因突变?

        基因突变是碱基水平上的永久性变化,有先天突变,也有后天突变。以爱情里的表白为例来解释突变的含义:当你准备打拼音“wo ai ni”时,可能只是刚好手抖了一下,拼错成了“wo ti ni”,也就是“我踢你”的意思。试想想看这样的信息发出去的后果,表白应该会注定失败。

        基因突变的过程就类似于此。本来正常的碱基,可能因为一些环境因素的改变,比如辐射,导致碱基发生了变化,这会让原本基因要表达的功能发生改变,带来对人体的影响。当然,在多数情况下,身体内损坏的DNA,可以被特定的基因进行修复,比如著名的“人体警察”TP53基因,会修复受损的DNA。如果这些特定的基因也发生了突变,身体很可能会出现严重的疾病。只有全部的基因协同作用,才能发挥人体的正常功能。

        如果我们把全部的基因比作是一个交响乐团,那么,当突变发生在不太重要的位置,可能不会造成严重影响,就像乐团的沙锤缺了一拍,很多听众无法发觉。如果突变发生在重要环节,则可能是致命的,就像首席小提琴手在主旋律上出现了一个错误,可能对整体效果产生明显影响。

常见的突变

        常见的突变有单个位点突变(SNP)、片段的插入(Indel)、结构变异(SV)、拷贝数变异(CNV)等等。如果用一个交响乐团来形容人体和基因的关系:

        ① 点突变:指某个碱基发生了变化。相当于一个音符的错误,一般观众很难听出问题。

        ② 插入或缺失:指某个位置处多了或少了一个碱基。相当于某个乐手的乐谱多了一节或者少了一节,严重时将会影响听到的效果。

        ③ 结构突变:指若干个碱基的位置变了。相当于乐谱的几个段落顺序被打乱,原本的乐曲自然也就发生了明显的变化。

        ④ 拷贝数变异:指基因的数目发生了变化,正常基因是一对儿有2个,如果发生拷贝变异后,基因的数目不等于2,会产生严重的影响,导致多了或少了基因。相当于乐谱中有一段重复了多次,或者本应重复的部分重复次数不够,听着就会很不舒服。

3种常见的突变简化模型

        基因的突变,可能是坏事,也可能是好事。我们人类文明能发展到现在,在生物学层面上,就是由一系列好的突变所带来的,保证人类能在恶劣的自然环境下存活下去。需要指出的是,突变是随机的,正常情况下突变频率很低,可能几千年才会形成一个稳定可遗传的突变,但在一些特殊环境影响下,如:放射性辐射、致癌化学制品等不利条件刺激下,突变频率会大大提升。

        人类在数万年的演化中,也产生了很多有害突变,比如有些人生下来就患有先天疾病,这是因为遗传到了不好的基因。在后面的章节中,我会通过很多具体的案例,解读基因在这中间起到的关键性作用。


附表:基因发现的时间史

        在整个基因发现的过程中,是由一个个关键的历史事件促成的,我们需要感谢这些科学家,正因为他们数百年来薪传相随,才有了我们今天对基因等生命领域的了解。本部分内容翻译自yourgenome.org。

1871年,Friedrich Miescher发表了一篇论文,指出细胞核中存在“核素”(现在称为DNA)。

这一年,第一次国际橄榄球联盟赛在英国和苏格兰之间进行。

1904年,Walter Sutton和Theodor Boveri提出了染色体遗传学说,发现其中一条遗传自母亲,另一条来自父亲。

这一年,罗斯福当选为美国总统。

1910年,Albrecht Kossel因发现五个碱基、腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶和尿嘧啶,被授予第一届诺贝尔生理学或医学奖。

这一年,第一部恐怖片上映。

1950年,Erwin Chargaff算出碱基A、C、G和T的配对模式,A与T进行配对,C与G进行配对。

这一年,朝鲜军队入侵韩国引发朝鲜战争。

1952年,Alfred Hershey和Martha Chase进行了实验,证明DNA才是遗传物质,而非蛋白质。

这一年,修女特丽萨为加尔各答垂死和穷困的人们建了一个家。

1953年,Francis Crick,Francis Crick,和Maurice Wilkins发现DNA的双螺旋结构。

这一年,伊丽莎白二世的加冕典礼在伦敦的威斯敏斯特教堂举行。

1961年,Marshall Nirenberg, Har Gobind Khorana 和colleagues发现了密码子,每个密码子会参与形成氨基酸的过程。

这一年,肯尼迪成为美国总统。

1968年,Marshall Nirenberg, Har Gobind Khorana 和Robert Holley因为对tRNA分子进行了测序,而获得尼伦伯格生理学和医学奖。

这一年,美国民权活动家马丁路德金在孟菲斯遇刺身亡。

1977年,Frederick Sanger开发了第一代测序技术,测出了历史上第一个完成的基因组,是一种叫做PHIX174的病毒基因组。

这一年,美国摇滚歌手埃尔维斯·普雷斯利逝世。

1980年,Sanger与Wally Gilbert和Paul Berg因为开创性的测序技术,获得了诺贝尔化学奖。

这一年,英国歌手兼作曲家约翰列侬在纽约被枪杀。

1983年,James Gusella和他的团队,确定了亨廷顿氏病的基因定位。

这一年,英国强制驾驶员和前排乘客使用安全带。

1985年,Alec Jeffreys开发了一种DNA图谱分析方法。

这一年,B·贝奇克成为温网男子单打中最年轻的冠军。

1990年,人类基因组计划启动,该项目希望在15年内完成人类基因组中的所有30亿个碱基的草图绘制。

这一年,曼德拉在南非监狱被释放。

1992年,美国和英国的科学家团队揭示了在胚胎发育过程中检测胚胎的技术。

这一年,欧洲迪士尼在法国巴黎附近开业。

1995年,流感嗜血杆菌基因组序列完成,是第一个被测序完成的细菌基因组序列。

这一年,汤姆·汉克斯主演的《阿甘》获得奥斯卡最佳男主角奖。

1996年,酵母基因组测序完成,第一个克隆动物Dolly the Sheep在爱丁堡大学罗斯林学院出生。

这一年,说唱歌手Tupac Shakur在拉斯维加斯被枪杀。

1998年,John Sulston和Bob Waterston发表了线虫基因组测序结果。

这一年,谷歌搜索引擎问世。

1999年,第一个被测序的人类22号染色体测序完成。

这一年,欧元开始流通。

2000年,完成了模型生物果蝇的全基因组序列。

这一年,圣克鲁斯(UCSC)推出UCSC基因组浏览器。

2001年,人类基因组序列草图发布。

这一年,基地组织的恐怖分子袭击了纽约世贸中心。

2002年,完成了第一个哺乳动物小鼠的全基因组序列。小鼠基因组比人类基因组小14%,但超过95%的小鼠基因组与人类的基因组相似。

这一年,伊丽莎白女王去世,享年101岁。

2003年,人类基因组计划已经完成,并确认人类有大约20000到25000个基因。人类基因组测序准确率为99.99%,比计划提前了2年。

这一年,萨达姆被抓获。

2005年,HapMap(人类遗传变异图谱)发表在《自然》杂志上。黑猩猩基因组测序完成。

这一年,飓风卡特丽娜袭击了美国路易斯安那州、密西西比州州和阿拉巴马州沿海地区。

2007年,新一代测序技术出现,速度提升70倍。

这一年,苹果推出iPhone。

2008年,千人基因组计划开始。

这一年,奥巴马成为第一个黑人美国总统。

2010年,千人基因组计划结果发布。

这一年,海地发生了七级地震。

2012年,确认人类基因组包含20687个蛋白质编码基因。

这一年,“好奇”号火星车成功登陆火星。

还有很多的生物学上的科学进展,都应该被列入到其中,就留给细心读到此处的你去发现吧,或许那样才更有趣。


原创作品,谢绝任何形式的转载。有事联系,请发Email:1929917766@qq.com

上一篇下一篇

猜你喜欢

热点阅读