测序基础介绍-NGS方法小结
1 测序方法分类
测序方法分类2 基因组测序
2.1 全基因组测序
- 大型全基因组测序
对人类、植物或动物基因组等大型基因组(>5 Mb)测序,可为疾病研究和群体遗传学提供有价值的信息。 - 小型全基因组测序
小型基因组测序(≤ 5 Mb)涉及对细菌、病毒或其他微生物的整个基因组进行测序,并将序列与已知参考序列进行比较。小型微生物基因组的测序对公共卫生领域的食品检测、传染性疾病监控、分子流行病学研究和环境宏基因组学很有用。 - 从头测序
从头测序是指在没有任何参考序列的情况下对某个未知基因组进行测序。NGS可以对任何物种进行快速而准确的特征分析。 - Phased测序
Phased测序(即基因组phasing)能区分同源染色体上的等位基因,获得全基因组单倍型信息。此信息通常对遗传病的研究很重要。
2.2 全外显子组测序
摘自“纳昂达科技”公众号《全外显子捕获那些事》—https://mp.weixin.qq.com/s/wZqmMc0WXaAy0AYkLCeDAg
外显子组测序是一种广泛采用的靶向测序方法。全外显子测序(Whole Exome Sequencing, WES)仅对人基因组约2%的区域测序,便可覆盖绝大多数基因的编码序列和>99%(临床基因组资源库,ClinGen)疾病相关区域。借助WES可检测基因的点突变、小片段插入缺失、基因重排及拷贝数变异等信息。
2.3 靶向基因组测序
采用靶向测序,一组基因或基因组区域可被分离出来并对其进行测序。靶向测序让研究人员能够将时间、费用和数据分析集中在感兴趣的特定区域,并在更高的覆盖度水平上开展测序。在目标富集中,感兴趣的特定区域通过与生物素标记的探针杂交而被捕获,之后通过磁性分离。扩增子测序采用高度多重PCR 寡核苷酸组对感兴趣的区域进行扩增和纯化。
-
杂交捕获技术
通过设计与目标片段互补的生物素化探针,使其与含目的基因的片段进行杂交,以达到将目的基因片段富集后进行高通量测序的目的。根据支持物的不同,探针杂交捕获技术分为液相杂交与固相杂交两种。固相杂交由于其在花费与操作上的劣势,已基本被淘汰;液相杂交是在溶液中,目标片段和带有生物素标记的探针直接杂交,然后利用被链霉亲和素包裹的磁珠对杂交了生物素探针的片段进行吸附。洗去游离DNA后,将富集得到的DNA进行扩增,构建高通量测序文库。
杂交捕获流程 -
扩增子捕获技术
扩增子捕获测序技术是一种目标区域高通量测序技术,利用特异性引物来对感兴趣的DNA区域进行PCR扩增,形成高度富集的DNA库,将PCR产物纯化后再进行文库构建和高通量测序。
image.png -
富集方法对比
捕获方法对比
2.4 文库构建试剂盒
试剂盒及厂家3 转录组测序
RNA seq3.1 RNA分类
人RNA大小及分布Boivin V, Faucher‐Giguère L, Scott M, et al. The cellular landscape of mid‐size noncoding RNA[J]. Wiley Interdisciplinary Reviews: RNA, 2019, 10(4): e1530.
人类基因组编码及非编码RNA分布
Malek E, Jagannathan S, Driscoll J J. Correlation of long non-coding RNA expression with metastasis, drug resistance and clinical outcome in cancer[J]. Oncotarget, 2014, 5(18): 8027.
3.2 全转录组测序(Total RNA)
全转录组是指特定组织或细胞在特定状态下转录出的所有转录本的总和,包括mRNA和所有的non-coding RNA。全转录组测序应用RNA-Seq技术,通过构建两种文库(small RNA文库和去rRNA的链特异性文库),对四种RNA(miRNA,lncRNA,mRNA,circRNA)的表达及调控关系进行分析。
技术路线及参数设置
3.3 转录组测序(mRNA)
转录组(Transcriptome)是指细胞内所有转录产物的集合,包括mRNA、non-coding RNA等。转录组具有时空特异性,通过转录组能够从转录水平研究基因功能以及基因结构,揭示特定生物学以及疾病发生过程中的分子机理。转录组测序(RNA-seq)是利用高通量测序获取转录组中mRNA的信息,通过分析基因表达量以及结构的变化,挖掘致病机制,阐明发病机理,指导用药以及药物研发。
mRNA seq
3.3.1 干扰rRNA去除
由于直接对样本的total RNA进行测序将会产生大量无用rRNA冗余信息,因此在提取到total RNA之后,需要对其中的背景RNA进行去除(如占total RNA约80%-90%的rRNA),去除背景干扰的方法有两种:
1)“+”法,也即poly A富集法
该方法的原理是基于真核生物的mRNA及部分长链非编码RNA(lncRNA)均带有poly A尾巴,但是该方法具有3’末端偏好性,适用于低RNA样本量时的rRNA去除,另外需要注意的是,不适用于RNA降解较为严重的的样本(如FFPE)。
- oligo dT引物富集
引物捕获由于特异性差和富集度低,因此在实际操作中还是以磁珠纯化的方法较多 -
oligo dT磁珠捕获
oligo dT磁珠捕获
2)“-”法,rRNA直接去除法
针对不含有poly A尾的转录本,以及存在部分降解的total RNA(如FFPE)
Sorek R, Cossart P. Prokaryotic transcriptomics: a new view on regulation, physiology and pathogenicity[J]. Nature Reviews Genetics, 2010, 11(1): 9-16.
-
rRNA特异探针杂交消减法
通过使用与 rRNA 互补的DNA寡核苷酸探针与总 RNA 样品杂交去除 16S 和 23S rRNA;然后使用RNase H去除DNA-rRNA杂交链的rRNA,随后用DNase I去除DNA probes。如Ribo-Zero rRNA removal kit (Epicentre);
image.png -
选择性引物扩增法
image.png -
5’单核苷酸依赖的外切酶处理法
mRNA-ONLY prokaryotic mRNA isolation kit (Epicentre)
image.png - 依赖于双链特异核酸酶的cDNA均一化法
这种方法从真核生物借鉴而来, 是在 cDNA 水平上降低 rDNA 和 tDNA 所占的比例, 在原核生物中应用的还不多。相应的试剂盒主要有trimmer-direct cDNA normalization kit(Evrogen); -
免疫共沉淀法
与 RNA 结合蛋白 Hfq 等免疫共沉淀法由于 Hfq 能够高效地结合 sRNA, 并能辅助它们与靶标 mRNA 结合, 因此常用于 sRNA 及其靶标 mRNA 的研究。
image.png
3.3.2 片段化处理
mRNA纯化之后的文库构建通常有两种思路,一种是先用oligo(dT)引物反转录mRNA,再进行cDNA的片段化,另外一种则是先将mRNA打断,再结合随机引物进行反转录。
-
先用oligo(dT)引物反转录mRNA,再进行cDNA的片段化
此方法先得到长片段的cDNA,反转成双链cDNA之后再利用DNA片段化的方法进行片段化(酶切法或机械法),得到片段化dsDNA之后的建库方法与DNA建库方法完全一致。 -
先将mRNA打断,再结合随机引物进行反转录
此方法中的mRNA打断方法包括碱处理法、金属离子(Mg2+、Zn2+)溶液处理法、酶(RNaseIII)处理法,mRNA片段化之后应立即进行一链cDNA合成,因为mRNA在该体系下非常容易降解。选择金属离子(Mg2+、Zn2+)溶液处理法打断时需根据需要的文库片段大小选择合适的打断温度和时间。(一般设置为150-200bp 94°C,15 min; 200-300bp 94°C,10 min; 250-550 bp 94°C,5 min),两种片段化结果,对后期的转录本有不同的偏好性,对应数据可参考下图:
不同方法建库对后期读数的偏好性,红线代表RNA片段化,绿线代表反转为cDNA后片段化
先针对mRNA进行打断再进行反转录获得测序reads主要是针对基因本体的;若先反转录,尤其是结合oligo(dT)进行反转录获得的测reads对转录本3'端具有比较强的偏好性,所以在mRNA-Seq中建议采用先对mRNA打断再进行反转录的文库构建方法。
3.3.3 反转成双链cDNA
在做mRNA测序文库构建的时候,一般分为常规建库和mRNA链特异性建库。链特异性文库和常规mRNA文库最大的区别在于合成第二链cDNA时加入的核苷酸种类,如果要构建常规mRNA文库,则加入dNTP,而如果要构建链特异性mRNA文库则加入dNTP中使用dUTP代替dTTP,这样合成的第二链cDNA含有U碱基,后期再通过识别U碱基的方法去除第二链cDNA,从而达到构建链特异性mRNA的效果,具体方法包括:使用特殊酶不扩增带有U碱基的链;使用UDG酶去除带有U碱基的合成链。
3.4 小RNA测序
Small RNA是一大类调控分子,几乎存在于所有的生物体中。Small RNA包括:miRNA、ncRNA、siRNA、snoRNA、piRNA、rasiRNA等等。Small RNA通过多种多样的作用途径,包括mRNA降解、翻译抑制、异染色质形成以及DNA去除,来调控生物体的生长发育和疾病发生。
现行的RNA纯化方法如:1)硅胶膜离心柱通常只富集较大分子的RNA(200 nt以上),Small RNA往往被淘汰掉,因而不适用于Small RNA的分离纯化。2)有机溶剂抽提能够较好的保留Small RNA,但是后继的沉淀步骤比较费时费力。2)目前还有另外一些Small RNA分离专用的试剂盒。如MirVana miRNA Isolation Kit是采用玻璃纤维滤膜离心柱(glass fiber filter,GFF),既能够富集10 mer以上的RNA分子,又兼备离心柱快速离心纯化的特点。4)PAGE胶电泳对小RNA进行分离可以选择感兴趣的Small RNA长度进行研究。Small RNA的长度为18-30nt。推荐测序长度为35bp,之后对序列信息进行修剪,去除接头序列仅留下Small RNA序列。
image.png
3.5 环状RNA测序
环状RNA(circRNA)是一类特殊的非编码RNA分子,与传统的线性RNA(linear RNA)不同,circRNA分子合呈封闭环状结构,且不受RNA外切酶影响,表达更稳定,不易降解。
circRNA 测序对total RNA 的要求与普通的RNA-seq 相同,所以抽提方法也相同。但是由于 circRNA建库需要去除 rRNA和线性RNA,所以需求大量的total RNA,需提供 ≥22μg的 total RNA,其中20μg 用于 circRNA 建库。
全长转录组也可以获得circRNA 序列信息。但是不同之处在于全转录组测序除了circRNA 序列信息外,还可以获得mRNA和lncRNA的序列信息,可以进行circRNA-mRNA、lncRNA-mRNA 关联分析和网络构建,lncRNA的调控机制(cis和trans)等分析;但由于建库方式的差异和测序数据量的限制,全转录组测序所获得的 circRNA类型通常比circRNA测序要少。而circRNA测序,只能获得 circRNA 序列信息,但circRNA测序可以获得比全转录组测序更多的circRNA 类型,可以对circRNA的剪接模式和circRNA类型进行更细致、深入的分析,便于发现新的 circRNA。
image.png
4 表观遗传学测序
4.1 甲基化测序
人类大约有30亿个碱基对,DNA主要发生在CpG二核苷酸上,基因组中大约有2800万个CpG位点。这些CpG位点中,大约6080%被甲基化,而在一些特定的区域,比如启动子,存在CpG位点富集的序列,我们称之为CpG岛,CpG岛通常未被甲基化。但是在肿瘤细胞中,整体甲基化水平降低至2050%,与正常细胞相比,即可能有1060%的CpG位点的甲基化状态发生了改变,也就是大约2801680万个CpG位点。
DNA甲基化是指生物体在DNA甲基转移酶(DNA methyltransferase,DMT)的催化下,以s-腺苷甲硫氨酸(SAM)为甲基供体,将甲基转移到特定的碱基上的过程。DNA甲基化可以发生在腺嘌呤的N-6位、鸟嘌呤的N-7位、胞嘧啶的C-5位等。但在哺乳动物中DNA甲基化主要发生在5’-CpG-3’的C上生成5-甲基胞嘧啶(5mC)。
DNA甲基化测序方法有上百种,大多数方法依赖DNA的亚硫酸氢盐转化来检测未甲基化的胞嘧啶。在文库制备过程中,亚硫酸氢盐的转化会将未甲基化/未羟甲基化的胞嘧啶转化为尿嘧啶。在弱酸性条件下,亚硫酸氢根会结合到没有甲基化的C碱基的6位。而甲基化了的C碱基不会和亚硫酸氢根发生这个反应。然后用碱来处理。结合了亚硫酸氢根的非甲基化的C,就被脱氨基、脱亚硫酸根。被转化成U碱基。用亚硫酸氢盐来处理DNA,可以让99%左右的非甲基化的C碱基变成U。经过亚硫酸氢盐转化过的DNA,再经过PCR合成出来的链,U碱基的位置,就会被替换成了“T”。而甲基化的C,因为没有被亚硫酸氢盐所转化,所以,在接下来的测序过程中,被测到的,还是“C”碱基。通过测序看一个位置是“C”还是“T”。如果是“C”,就说明这个位置是被甲基化/羟甲基化。如果是“T”,则说明这个位置是没有被甲基化/羟甲基化。
重亚硫酸氢盐处理碱基变化1
重亚硫酸氢盐处理碱基变化2
4.2 染色质免疫共沉淀(Chromatin Immunoprecipitation,ChIP)
通过染色质免疫沉淀(ChIP)检测和测序技术相结合,ChIP测序(ChIP-Seq)成为鉴定转录因子及其他蛋白因子在全基因组范围内的DNA结合位点的强有力方法。在ChIP操作之后,通过特异抗体将DNA结合蛋白免疫沉淀。结合的DNA被同时沉淀、纯化并测序。
image.png