CRISPR-Cas9 原理
注:转自一位师兄的个人网站(王进的个人网站),我觉得写的挺好挺清楚的,所以直接引用了。(如有侵权,请联系撤回)
CRISPR/Cas技术是什么?
CRISPR/Cas系统是一种原核生物的免疫系统,用来抵抗外源遗传物质的入侵,比如噬菌体病毒和外源质粒。同时,它为细菌提供了获得性免疫:这与哺乳动物的二次免疫类似,当细菌遭受病毒或者外源质粒入侵时,会产生相应的“记忆”,从而可以抵抗它们的再次入侵。CRISPR/Cas系统可以识别出外源DNA,并将它们切断,沉默外源基因的表达。这与真核生物中RNA干扰(RNAi)的原理是相似的。正是由于这种精确的靶向功能,CRISPR/Cas系统被开发成一种高效的基因编辑工具。在自然界中,CRISPR/Cas系统拥有多种类别,其中CRISPR/Cas9系统是研究最深入,应用最成熟的一种类别。CRISPR/Cas9是继锌指核酸内切酶(ZFN)”、“类转录激活因子效应物核酸酶(TALEN)”之后出现的第三代“基因组定点编辑技术”。凭借着成本低廉,操作方便,效率高等优点,CRISPR/Cas9迅速风靡全球的实验室,成为了生物科研的有力帮手。在TALEN和ZFN的时代,科学家们往往要花费重金,把基因编辑工作交给生物公司。而现在,在实验室里,人们就可以使用CRISPR/Cas9技术轻松的实现基因编辑。
CRISPR/Cas9如何工作?
CRISPR簇是一个广泛存在于细菌和古生菌基因组中的特殊DNA重复序列家族,充当了防御外源遗传物质的“基因武器”。CRISPR全称Clustered Regularly Interspersed Short Palindromic Repeats—成簇的规律间隔的短回文重复序列,分布在40%的已测序细菌和90%的已测序古细菌当中。图1展示了完整的CRISPR位点的结构。其中,CRISPR序列由众多短而保守的重复序列区(repeats)和间隔区(spacer)组成。重复序列区含有回文序列,可以形成发卡结构。而间隔区比较特殊,它们是被细菌俘获的外源DNA序列。这就相当于细菌免疫系统的“黑名单”,当这些外源遗传物质再次入侵时,CRISPR/Cas系统就会予以精确打击。而在上游的前导区(leader)被认为是CRISPR序列的启动子。另外,在上游还有一个多态性的家族基因,该基因编码的蛋白均可与CRISPR序列区域共同发生作用。因此,该基因被命名为CRISPR关联基因(CRISPR associated,Cas)。目前已经发现了Cas1-Cas10等多种类型的Cas基因。Cas基因与CRISPR序列共同进化,形成了在细菌中高度保守的CRISPR/Cas系统。
图1:CRISPR位点结构图那么,CRISPR序列是如何与Cas蛋白配合来执行防御功能的呢?整个过程大体分为3步。
1.外源DNA俘获:“黑名单”登记
简单来说,CRISPR/Cas系统在这一步实现了一个“黑名单登记”功能。CRISPR/Cas系统将识别出入侵者的“名字”(PAM)并找到它的“身份证”(原间隔序列),然后把入侵者身份信息作为“档案”(间隔序列)记录到“黑名单”(CRISPR序列)中。图2展示了第一阶段的工作原理。当噬菌体病毒首次入侵宿主细菌,病毒的双链DNA被注入细胞内部。CRISPR/Cas系统会从这段外源DNA中截取一段序列作为外源DNA的“身份证”,然后将其作为新的间隔序列被整合到基因组的CRISPR序列之中。因此,这段与间隔序列对应的“身份证”被称为原间隔序列(protospacer)。然而,“身份证”的选取并不是随机的。原间隔序列向两端延伸的几个碱基都十分保守,被称为原间隔序列临近基序(protospacer adjacent motif,PAM)。PAM通常由NGG三个碱基构成(N为任意碱基)。病毒入侵时,Cas1和Cas2编码的蛋白将扫描这段外源DNA,并识别出PAM区域,然后将临近PAM的DNA序列作为候选的原间隔序列。随后,Cas1/2蛋白复合物将原间隔序列从外源DNA中剪切下来,并在其他酶的协助下将原间隔序列插入临近CRISPR序列前导区的下游。然后,DNA会进行修复,将打开的双链缺口闭合。这样一来,一段新的间隔序列就被添加到了基因组的CRISPR序列之中。
图2:第一阶段:外源DNA俘获2. crRNA合成:”军火“制造
战争总需要武器,CRISPR/Cas系统也要制造足够的”军火“来打击入侵者。目前的研究表明,CRISPR/Cas系统共有三种方式(Type Ⅰ、Ⅱ、Ⅲ)来制造”军火“。CRISPR/Cas9系统属于Type Ⅱ,是目前最成熟也是应用最广的类型。因此,图3将重点介绍CRISPR/Cas9的原理。当入侵者到来,CRISPR序列会在”指挥官“(前导区)的调控下转录出两种“军火材料”:pre-CRISPR-derived RNA (pre-crRNA)和trans-acting crRNA(tracrRNA)。其中,tracrRNA是由重复序列区转录而成的具有发卡结构的RNA,而pre-crRNA是由整个CRISPR序列转录而成的大型RNA分子。随后,pre-crRNA,tracrRNA以及Cas9编码的蛋白将会组装成一个小型“兵工厂”。它将根据入侵者的类型,选取对应的“身份证”(间隔序列RNA),并在RNase Ⅲ的协助下对这段间“身份证”进行剪切,最终形成一段短小的crRNA(包含单一种类的间隔序列RNA以及部分重复序列区)。crRNA,Cas9以及tracrRNA组成的复合物,就是最终的“战斗武器”。
图3:第二阶段:crRNA合成3.靶向干扰:强大火力,精确打击
武器已经制造完成,战争就要打响。图4展示了靶向干扰的过程。Cas9/tracrRNA/crRNA复合物就像是一枚制导导弹,可以对入侵者的DNA进行精确的打击。这个复合物将扫描整个外源DNA序列,并识别出与crRNA互补的原间隔序列。这时,复合物将定位到PAM/原间隔序列的区域,DNA双链将被解开,形成R-Loop。crRNA将与互补链杂交,而另一条链则保持游离状态。随后,Cas9蛋白发起猛烈攻势,其HNH酶活性将剪切crRNA互补的DNA链,而其RuvC活性位点将剪切非互补链。最终,Cas9强大的火力使双链断裂(DSB)形成,外源DNA的表达被沉默,入侵者被一举歼灭。
第三阶段:靶向干扰如何应用CRISPR/Cas技术?
CRISPR/Cas是进行基因编辑的强大工具,可以对基因进行定点的精确编辑。在向导RNA(guide RNA,gRNA)和Cas9蛋白的参与下,待编辑的细胞基因组DNA将被看作病毒或外源DNA,被精确剪切。但是,CRISPR/Cas9的应用也有一些限制条件。首先,待编辑的区域附近需要存在相对保守的PAM序列(NGG)。其次,向导RNA要与PAM上游的序列碱基互补配对。图5展示了最基础的两种CRISPR/Cas9技术应用。以基因敲除为例,在待敲除基因的上下游各设计一条向导RNA(向导RNA1,向导RNA2),将其与含有Cas9蛋白编码基因的质粒一同转入细胞中,向导RNA通过碱基互补配对可以靶向PAM附近的目标序列,Cas9蛋白会使该基因上下游的DNA双链断裂。而生物体自身存在着DNA损伤修复的应答机制,会将断裂上下游两端的序列连接起来,从而实现了细胞中目标基因的敲除。如果在此基础上为细胞引入一个修复的模板质粒(供体DNA分子),这样细胞就会按照提供的模板在修复过程中引入片段插入或定点突变。这样就可以实现基因的替换或者突变。对受精卵细胞进行基因编辑,并将其导入代孕母体中,可以实现基因编辑动物模型的构建。随着研究的深入,CRISPR/Cas技术已经被广泛的应用。除了基因敲除,基因替换等基础编辑方式,它还可以被用于基因激活,疾病模型构建,甚至是基因治疗。
图5:CRISPR/Cas9技术应用