害群之马:基因、细胞及癌的性质
癌症,它几乎肆虐横行在人体的每一个部位。肿瘤袭击大脑和脏腑、肌肉和骨骼。有一些潜移默化,有一些则来势汹汹。人体组织中出现肿瘤意味着正常功能毁于一旦,大厦将倾,混乱不堪。人体的生物机制原本是如此完美、精密、妙不可言,然而这一切都因癌症发生了令人沮丧的变化。无论癌症在何处现身,它们总是以外来生命形式的面目出现,鬼鬼祟祟地潜入人体,然后在人体内启动毁灭之旅。然而这只不过是一种假象:真相远比它复杂、有趣。
肿瘤并非入侵的外敌。它们和构建人体组织的物质系出同门。肿瘤同样是人体细胞筑就的噩梦,它们侵蚀生物秩序,破坏生物功能,假如一路绿灯,所向披靡,它们将令整个复杂的生命体系土崩瓦解。
细胞是怎样组合成人体组织的呢?想来该是有一些技艺高超的建筑师监督着成群工人各就各位,形成或正常或恶性的组织吧?事实上,这种发号施令、调遣细胞排列组合的角色并不存在。人体组织的复杂性来源于构筑大厦的每一块砖石——个体细胞本身。变化自下而上地发生着。
正常细胞和肿瘤细胞都知道自己的使命。每一个细胞都携带着自己的程序,告诉自己何时成长、何时分裂、如何和别的细胞联手构造器官及组织。我们的身体就是由高度自治的细胞组成的极为复杂的社会。作为一个完全独立的个体,每一个细胞都各具特质。
正是在这一领域,我们发现了惊人的协调,同时又蕴涵着巨大的风险。无数细胞戮力同心创建了统一的、协调一致的人体,这是多么美妙啊!然而,由于缺少一个俯瞰众生的总建筑师,生命体又是处在怎样的危险中啊!数以兆计的工人完全自治,混乱自然难以避免。通常情况下,细胞们行为规范,热心公益,人体秩序井然。但是,在器官或组织内部,偶尔会有那么一个细胞特立独行。这时,人们避之惟恐不及的灾难——癌症来临了。
在人们不经意之间,多数肿瘤已发展成拥有几十亿个甚至更多细胞的庞然大物。一个肿瘤内的细胞在很多方面,诸如外形、生长特性、新陈代谢,都和它们在正常情况下的表现大相径庭。突然之间出现了这么一大帮怪异的细胞,说明存在着集体倒戈的现象,有几百万个正常细胞一夜之间投入了肿瘤体的麾下。
可是,这又是假象。肿瘤的形成是一个旷日持久的过程,常常要持续几十年的时间。所有的肿瘤细胞都是同一个先祖、一个存活在肿瘤体显山露水之前许多年的祖先的直系后裔。这一个离经叛道、恣意妄为的细胞,它在人体的某个组织内开始了自己独特的生长道路。自此以后,是它自身内部的程序而不再是周围细胞群体的需要决定着它的扩张行径。
所以,不是几百万个新生力量,而是一个始作俑者,产生了数目巨大、一脉相承的叛乱后裔。肿瘤中那几十亿个细胞同它们叛逆的祖光如出一辙,它们对于周围组织的健康成长毫无兴趣。同先祖一样,它们抱定一个宗旨:快快成长,快快裂变,无限扩张。
这些细胞制造的混乱说明,让人体内每一个细胞自作主张是极其危险的。然而,6亿年来, 不独人体,所有复杂的多细胞生物都是这么构造的。有鉴于此,我们认识到,癌症并不是摩登祸患,而是从古至今所有多细胞生物体共有的危难。实际上,想想人体内那数以兆计的细胞,癌症没有在我们漫长的人生旅途中频源亮相已经是一个奇迹了。体内蓝图为了理解肿瘤生长的方式,我们必须了解构成肿瘤的细胞。纯洁的个体细胞为什么一反常态、胡作非为起来?概言之,正常细胞或者癌细胞,它们怎么能知道何时开始生长?难道细胞有自我意识吗?如果答案是否定的,那么在人体细胞内部,究竟是何种复杂的决策机制决定细胞的生长、休眠或者死亡呢?
本书的焦点问题是正常人体细胞拥有的内部机制。这种机制告诉细胞如何、何时成长并与其他细胞联手创造功能高度协调的人体组织。不同细胞携带的程序反映了它们各自行为的复杂生物方案及蓝图。我们将会看到,当癌症发生时,这种内部程序起了变化。只有理解了这种程序的正常及缺陷状态,我们才能弄懂驱策癌细胞的动力。
人体内有几百种细胞。不同种类的细胞聚合形成不同的组织和器官。鉴于细胞个体的差异性,我们可能会猜测,由于每一种细胞都携带着不同的方案,每种方案都指示着独特的成长以及构筑组织的能力,因此人体内存在着数目巨大的方案群。直觉令我们误入歧途。事实上,尽管人体内不同部分——不论大脑、肌肉、肝脏还是肾脏——一的细胞外表各异,但它们又非常相似,出人意料地携带着一模一样的蓝图。
这种同一性可以追溯到它们的共同起源。如同肿瘤细胞一样,正常人体细胞也源自一个共同的祖细胞。它们属于一个大家庭,彼此有着血缘关系,通过反复生长、分裂,受精卵从单细胞变成了几万亿个细胞,形成了整个人体。一个成年人体的细胞数量——超过了几十万亿——远远超乎人们的想象力。
指引着人体细胞的蓝图最初见诸于早先的受精卵,而后代代相传。实际上所有的人体后代细胞都不变地继承了这一蓝图。可是,尽管几万亿个细胞拥有同一套行为规范体系,它们的外表、行为仍然大异其趣。在细胞共同的内部蓝图与它们还异的外表之间,有着惊人的悻离。看来外表并不能告诉我们多少指引细胞生命轨迹的内部程序。
单一、共同的规划怎会产生如此差异呢?在过去的几十年里,人们找到了一个简单的答案:人体细胞携带的复杂的主导规划中,含有的信息量大大超出了单个细胞可能利用的数量。单细胞有选择地对待它们拥有的共同蓝图。从巨大的信息库中读取某些特定信息来设计自身行为。这种选择性的阅读方法使得全身每一个细胞都各具特色,和它们的亲戚们(无论亲疏)泾渭分明。
卵子受精后不久就开始分裂,而后它的两个女儿继续这一过程。随后的胚胎发育过程则是细胞的疯狂生长和分裂。受精卵产生的最初几代细胞看上去极其相似;它们紧密结合成一个无差别、同根生的细胞簇,形成一个细小的浆果。伴随着胚胎的发育进程,这些细胞的后代开始显露出差异。它们开始分化为肌肉、大脑或者血液细胞群的成员。这一个选择不同命运的过程——差别化过程——是人体发育的核心秘密,也是缠绕在研究者们胸中的不解之谜。
胚胎一隅的某个细胞读取了产生血红蛋白的基因指示,成长为一个血红细胞;别处的某个细胞考虑了制造消化酶的信息,变成了胰腺的一部分;还有一个细胞学会了如何释放出电信号,成为大脑的一分子。
胚胎细胞有选择地读取基因内容从而选择了调异的性状,这一决策并非是细胞必须作出的惟一重要决定。在它的基因蓝图中,它尚需考虑另一个举足轻重的议题:何时开始生长、分裂,何时又该驻足休息。
这些关于成长的指令不仅在早期、而且在以后相当长的时间内仍有重要意义。在大多数成熟组织内部,细胞不断地新陈代谢。事实上,一个成熟组织维持正常构造的能力,取决于前仆后继的机制,即由大量候补者的生长来补偿前任细胞的偶尔缺失。如果候补者过少,组织会枯萎衰竭。如果候补者太多了,组织又会扩张出正常界限,也许会畸变成肿瘤。适度控制细胞的扩张是非常重要的,这一任务贯穿生物体的一生。
要理解癌症,我们必须搞清正常细胞的内部蓝图是如何告诉他们开始繁殖的时间,我们必须明白癌细胞的蓝图是如何发生了错乱。癌症的根源就在于这一蓝图。基因的数目, 一直存在争议。最确切的估计大概在7万一10万之间。这些基因共同组成的基因库,就是被称作人类基因组的总体蓝图。
蓝图一词意味着精确、严谨、一丝不苟。斟酌后确定的蓝图可以避免秩序混乱。生物学家们很早就意识到这种蓝图的存在,尽管那时他们对于细胞的内部机制所知寥寥。人们最初将蓝图同整个生物体联系在一起,以后才发现蓝图对于单细胞的生存也是不可或缺的。
19世纪中叶,奥地利修土孟德尔确立了生物体遗传原理。他着重研究豌豆属植物基因性状的传递——例如花的颜色、种子的性状。他的研究成果一度湮没,在20世纪初能够重见天日要归功于三位遗传学家。后世所称的孟德尔遗传定律以几个简单概念为基础。首先,从豌豆属植物到人类,所有复杂的生物体都通过同一种遗传机制将基因从父母传递给子女。其次,一个生物体的性状在理论上可以分解为大量独立性状的组合,譬如豌豆花的颜色和豆粒形状、人类眼珠的颜色或者身高。再次,每一性状都可以追溯到通过有性繁殖由父母传给子女的某些肉眼不可见的信息包的作用结果。这些信息包的有效传递使得子女能够取得与其父母极为相似的性状。
这种信息包被称作基因;每一个人类基因都担负着组建一种人体性状的功能。随着我们对基因的了解越来越多,很显然,人体的所有领域,直到肉眼不可见的单细胞的内部工作机制,都是由个人从他(她)的父母处承袭的基因决定的。它说明所谓的总体蓝图就是基因的大汇合。
我们已经知道,蓝图基因并不是存放在人体某个单一的中枢库房内。相反,几万亿个细胞中的每一个都携带着全部蓝图的一份完整副本。这一简单事实迫使我们重新考虑,在复杂的生物体内,基因是如何组织其内部构造的:基因直接控制着细胞个体的行为。在自身基因的操纵下,单细胞同其他所有细胞共同创建了生物体的形式和功能。因此,整个生物体的复杂性正代表了体内所有个体细胞的行为总和。也就是说,主导细胞活动的基因组就是控制生物体外观和行为的那个基因组。
长久以来,围绕组成人类遗传蓝图的不同信息包——个体基因——的数目,一直存在争议。 最确切的估计大概在7万一10万之间。这些基因共同组成的基因库,就是被称作人类基因组的总体蓝图。
基因组分为不同的基因部门,这一事实产生了几个后果。如前所述,细胞可以在它的基因库中,从书架上有选择地抽取书卷——不同的基因——来阅读。此外,由于信息包是由父体或母体传递给子女,它们彼此之间是独立的。这就能更好地解释为什么我们继承的是父母各自拥有的某些基因了。受精卵的基因库是此前父母各自拥有的基因的混合。
然而将基因描述为信息包还是不能使人满意,因为这种想象缺乏物质基础。我们迟早要涉足基因的物质内容。同生物体的其他组成部分一样,基因也是物质实体,因此它必然表现为可识别的各种分子。
自1944年起,我们知道了基因的物质表现是DNA(脱氧核糖核酸)分子。DNA分子携带有遗传信息。 它们的结构非常简单:每个DNA分子都是由两条相互盘绕的链组成的双螺旋。每条链都是由单一成分首尾相接纵向排列构成的长聚合物,为讨论方便,可称此单一成分为碱基。
DNA碱基有四种——A、 C、G、T“。重要的是这四种碱基可以任意组合。碱基序列决定了DNA的信息内容。碱基可以无限地排列组合,相应地,DNA链可以长达几千万个碱基。从这样一条长链中截取一个片段,就是特定的碱基序列,例如ACCGGT.一CAAGTTTCAGAG. 现代基因技术使得我们能够通过”DNA测序“过程发现碱基序列。迄今为止,从细菌、蠕虫、苍蝇到智人,人们已经确定了不同生物体的几千万种碱基序列。
DNA碱基序列的变化多端意味着,在理论上,DNA分子足以容纳任何信息,无论生物信息还是其他。初初一看,仅仅四个字母的组合提供的信息携带能力非常有限,但实际上,四个字母已经绰绰有余。摩尔斯电码三个字符(点“·”,破折号“一”,空格“‘),计算机二进位制代码的两个字符(0和1)同样有无限的信息存储能力。
DNA双螺旋事实上携带着两套遗传信息, 相互盘绕的两条链各带一套。自1953年詹姆斯·沃森( 和弗朗西斯·克里克划时代的发现以来, 我们知道双螺旋一条链中的A总是与对面那条链中的T对应;C则必然对应着G. 因此一条链上ACCGGTCAA序列将与另一条链上的互补序列TGGCCAGTT相互盘绕。
由一链的碱基序列能够推知另一链上的序列,因此一条链携带的信息也体现在另一条链中,虽然表现为互补语言。这种信息储备有很多益处,其中最重要的是螺旋因之能够被复制。尤其如图1.1所示,两部分各自可以作为独立的模板来复制新的互补序列,新序列再包裹着自己的模板。结果,两个双螺旋子体彼此之间、以及同它们的双螺旋母体之间,都是一模一样的。
当细胞生长、分裂时,碱基序列的复制显出其重要性。在此过程中,一个母细胞把精确复制自身DNA螺旋的能力赋予它未来的子细胞。母子传递使最初受精卵DNA中含有的遗传信息在几百回合的细胞分裂过程中连续传递给几十亿个后代细胞,这些细胞最终形成成年人体。
那么抽象的基因概念究竟是如何同DNA分子的物质结构联系起来的呢? 细胞染色体中包含的DNA双螺旋常常有几亿个碱基对的长度。 这些碱基长链按其信息区划可以分成不同部分, 每一区划构成一个基因。一个普通的人类基因由几万个DNA碱基组成。在四个字母代码组成的碱基序列中,有某些标点符号标志着基因的始终。在英文中,句首是一个空格再加一个大写字母;基因的开头则是一个特别的几千个碱基组成的短序列。同样,英文句子用句号结尾,基因尾部也有其独特的碱基序列起着标点符号的作用。在螺旋链上,一个基因的结尾后,标志下一个基因开端的标点序列之前,往往有一个由好几干个碱基组成的序列,这个序列是无意义的遗传杂音。
人类基因组的全部信息内容由30亿个碱基对组成的DNA序列组成,可分为7万一10万个代表不同基因的区域。这些基因以不同组合在我们的细胞内工作,创造出结构极其复杂的人体,包括大脑这个高度精密的器官。
基因、 DNA双螺旋、碱基序列的故事为我们理解人类、甚至是地球上所有的生命形式提供了一把金钥匙。但我们在此关注的,仅仅是这一复杂集合中的一小个片段,即人类的癌症。我们可以略过基因是如何指令细胞组合构成组织和器官这个艰难的问题,而把注意力集中在基因是怎样影响个体细胞的成长行为这个范围比较小的问题。
因此我们收拢视线,聚焦控制个体细胞生长的一小部分基因。这些基因将直接引导我们进入癌症问题的核心,它们揭示了癌症的起源,终有那么一天,它们也将给我们指出战胜癌症的光明道路。