DNA测序原理:illumina和Pacbio
今天分享DNA测序技术和原理,包括illumina和pacbio测序原理、基本介绍和优缺点对比。
Illumina测序技术
- 原理:边合成边测序
- 测序长度:150bp
- 通量:6TB
测序原理
文库构建
-
DNA片段需要加接头修饰才能进行上机测序,这个过程称为二代测序的文库构建
-
流程及其原理:末端修饰-添加接头-磁珠纯化-PCR扩增-磁珠纯化
-
测序是以单链为单位的,建库完成后的每条DNA的单链均一端连有测序引物-Rd1Sp和P5,另一端为Rd2 SP、Index和P7。
-
Index用来区分不同的文库,因为测序仪一个run产生数据量巨大,由于实际情况不同,一次上机常会进行多个文库测序,因此需要加上Index来区分。
上机测序
- 三个系统:
温度控制系统;酶控制系统;荧光信号收集系统
- 过程:
首先以寡核苷酸为引物、文库片段为模板进行DNA复制,复制完成后解链,将文库片段洗去,留在流通池表面的为与文库模板互补的DNA链。
因为单链DNA另一端为不同的接头序列,可以与相邻的另一种寡核苷酸互补结合,之后进行“桥”式扩增。
桥式扩增后一个DNA簇都是由最初的一个文库模板复制而来,但是这时候P7上的序列与P5上的序列是分别从两端开始的,测序要保证每个片段一致性,因此再次解链线性化,切割并洗去P5上的DNA链,只留P7上的DNA单链。
加入测序引物Read1 SP和修饰过的DNA聚合酶,则在测序引物3’端开始DNA复制。
双末端测序,进行另一个方向的测序,洗掉前面复制合成的片段,从另一端进行序列读取。
测序数据
优缺点
- 优点: 一次能够同时得到大量的序列数据,相比于一代测序技术,通量提高了成千上万倍; 单条序列成本非常低廉
- 缺点: 序列读长较短,Illumina平台最长为250-300bp
Pacbio测序技术
- 原理:边合成边测序
- 测序长度:30kb
-
通量:20GB
测序原理
单分子实时测序SMRT
SMRT 中有很多 ZMW 小孔。ZMW(Zero-Mode Waveguides)孔,即零模波导孔。每一个SMRT Cell 中含有大量这种圆形纳米小孔,直径为50~100nm,该小孔利用了一种物理效应零模波导,外径比激发光波长小,当 DNA 分子进入小孔后,因激发光从孔底发出的光不能穿透小孔进入上方的溶液区,仅被限制在底部一个足以覆盖被检测 DNA 部分的区域,进而收集该区域的信号,将背景噪音降到最低。
在纳米孔底部,锚定着测序模板(DNA 单链)和 DNA 聚合酶,同时包含着四种被不同荧光基团修饰的 dNTP。由于每次添加的 dNTP 所携带的荧光颜色是不同的,在激光的激发下可以发出不同的荧光,根据散射出的荧光信号可以判断添加的碱基类型
HIFI reads
在这种测序模式下,酶读长一般大于插入片段长度,因此酶会绕着模板进行滚环测序,插入片段会被多次测序。单次测序中造成的随机测序错误,可以通过算法进行自我纠错校正,最终得到高准确度的 HiFi reads.
Pacbio优缺点
-
pacbio 的优点
1、超长读长
2、准确性高
3、测序速度快
-
pacbio 的缺点
1、数据量小,一张芯片目前最多只有 800 万个孔;
2、单分子测序原始数据的错误率高,需要重复测序降低错误率;
3、测序价格较高,SMRT 的成本是二代测序的 6-7 倍;
4、测序仪成本较高,不适合小规模组织购买;
5、提高准确性需要牺牲测序长度和数据量;
总结补充
1·第二代测序是基于PCR发展的高通量测序技术,第一代测序末端终止法,而二代测序使用可逆终止末端,能够实现边合成边测序。
2·特殊标记碱基的荧光信号是确定序列的关键,在测序过程中,必须将单DNA扩增成DNA簇,目的是增强信号。
3·若读取长度太长,基因簇的协同性降低,准确性下降,因此具有高通量,读长短的特点。
4·基因组DNA需要使用鸟枪法打成小片段,测序完成后拼装,而扩增子等小片段可以直接测序。
公众号:生信分析笔记
本文由mdnice多平台发布