一、二、三、四代测序技术原理详解
测序技术是基因组学的核心技术,上期的推送【LAI:基因组组装质量评估新标准】简单介绍了测序技术的发展进程。其实,测序技术的发展主要基于两个非常具有里程碑意义的理念:“生命是序列的”和“生命是数据的”。序列是基因组学最基本最重要的数据,也是生命科学领域大数据时代的核心组成部分。简单来说,测序技术就是将DNA/RNA分子中碱基ATGC的排列顺序显示出来。
1953年,Watson和Crick提出DNA双螺旋结构。
DNA双螺旋模型以及“生命是序列的”观点的发表,直接推动了测序技术的发展,因为解读生命遗传信息的前提就是得到它的载体——序列。
从20世纪70年代到现在有很多测序技术和平台的产生,其中包括SBC法、454、Ion Torrent、SBL法、Sanger法、Illumina、Pacbio、Nanopore等。今天主要跟大家分享后四种常用的测序技术。
第一代测序技术
Sanger法是基于DNA合成反应的测序技术,又称为SBS法、末端终止法。1975年由Sanger提出,并于1977发表第一个完整的生物体基因组序列。
核心原理:由于双脱氧核苷酸(ddNTP)的3’位置脱氧,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断DNA合成反应,在4个DNA合成反应体系中分别加入一定比例带有放射性同位素标记的ddNTP(分为:ddATP,ddCTP,ddGTP和ddTTP),通过凝胶电泳和放射自显影,根据电泳带的位置确定待测分子的DNA序列。
在每个反应体系中,ddNTP相对于dNTP是很少的,所以只有部分新链在不同的位置特异性终止,最终就会得到一系列长度不一的序列。
第二代测序技术
以Illumina平台为代表的第二代测序技术实现了高通量测序,有了革命性进展,使得大规模并行测序成为现实,极大推动了生命科学领域基因组学的发展。Illumina循环SBS法(cycle SBS)即SBRT(Sequencing By Reversible Termination,可逆终止)的核心技术是DNA合成的可逆性末端循环,即3'-OH可逆性的修饰和去修饰。
基本原理:将dNTP的3'-OH以叠氮集团RTG(Reversible Terminating Group,可逆末端基团)进行修饰;将4种碱基分别与不同的荧光分子连接;DNA合成时,RTG能起到类似于ddNTP的作用终止反应;每次合成反应终止并读取信号之后,洗脱RTG和荧光分子,进行下一轮循环。
主要过程:
a, DNA待测文库构建
利用超声波把待测的DNA样本打断成小片段,并在这些小片段的两端添加上不同的接头,构建出单链DNA文库。这些文库中的DNA在通过flowcell(吸附流动DNA片段的槽道)时会随机附着在flowcell表面的channel上。每个Flowcell有8个channel,每个channel的表面都附有很多接头,这些接头能和建库过程中加在DNA片段两端的接头相互配对,并能支持DNA在其表面进行桥式PCR的扩增。
b,c 桥式PCR以Flowcell表面所固定的接头为模板,进行桥形扩增。经过不断的扩增和变性循环,最终每个DNA片段都将在各自的位置上集中成束,每一个束都含有单个DNA模板的很多份拷贝,进行这一过程的目的在于实现将碱基信号强度放大,以达到测序所需的信号要求。
测序方法采用边合成边测序的方法:
1. dNTP模型
2. dNTP加上可终止反应的基团RTG和荧光信号
3. 反应体系中同时添加DNA聚合酶、接头引物和带有碱基特异荧光标记的4种dNTP
4. 脱掉-OH和二磷酸,进行合成
5. 反应因RTG终止,激发荧光进行信号采集。
6. 洗脱RTG和荧光分子,进行下一轮循环
第三代测序技术
以Pacbio平台为代表的SMRT(Single-Molecule Real Time Sequencing,单分子实时测序)测序技术具有高通量、长读长的特点。
基本原理:Pacbio仍然采用边合成边测序的原理,但实现了两个重要的技术突破。一个是将荧光分子标记在磷酸上,这样在反应停止且捕获荧光信号以后,可直接随磷酸基团脱落,解决了因噪音污染导致的读长很短的问题;二是由于不需要PCR扩增,信号的有效提取成为了关键。通过引入零模波导孔(ZMW)技术解决这一问题。在纳米室底部有一个孔径70nm的小孔,由于远远小于激光的波长,所以激光从底部照射时,只会照亮一个小的区域,提高了信噪比。
主要过程:如下图所示,类似于Illumina部分展示的模式图,也是边合成边测序。
第四代测序技术
纳米孔测序技术是单分子实时测序的新一代技术,主要是通过ssDNA或RNA模板分子通过纳米孔而带来的“电信号”变化推测碱基组成进行实时测序。
基本原理:当纳米孔充满导电液时,两端加上一定电压,分子模板通过纳米孔生成可测量电流。纳米孔的直径只能容纳一个核苷酸,单链模板就会在电场作用下依次通过纳米孔而引起电流强度变化,通过检测相应的电流峰判断碱基,实现实时测序。
四大测序技术的优缺点:
Sanger法测序读长长、准确度高,但是通量不高;
Illumina测序读长短、通量高、准确度高,在进行基因组组装或者结构变异分析的时候没有优势,可用作三四代测序read的纠错;
Pacbio测序读长长、通量高、准确度不高,但可通过测序深度弥补,GC偏差低,可进行甲基化的直接测序。
Nanopore测序读长长、通量高、准确度低,不可通过测序深度弥补,但可通过Illumina read 纠错。
第一、二、三代测序技术都是基于边合成边测序的原理,因此Nanopore技术被一些人(包括我)称为第四代测序技术;
随着测序技术的发展和成熟,逐渐形成基因测序产业链
本期对于测序技术的介绍到此为止,主要是同大家交流学习,欢迎指出不足之处。另外推荐一本2016年出版的杨焕明院士的《基因组学》,非常好的一本书。