陈巍学基因视频学习笔记--视频8:外显子测序
前期笔记
陈巍学基因视频学习笔记--视频1:Illumina测序化学原理
陈巍学基因视频学习笔记--视频7:RNA-seq方法和应用
第一部分:外显子测序技术
1. 外显子测序工作原理
针对人外显子序列设计的生物素标记的捕获探针库(可以想起PolyT探针没),这些探针和人外显子DNA序列互补。
2. DNA文库
image.pngimage.png
使用链霉亲和素磁珠将生物素标记的探针捕获,简介将被探针捕获的外显子捕获,收集磁珠后洗脱,PCR扩增之后就可以使用HiSeq测序。
3. HiSeq测序
image.png-
无效数据
(1)杂交捕获不够精确
由于基因组中许多序列和外显子有同源性,因此要把同源序列去掉
(2)杂交捕获的片段,只有一部分是在目标区域,另外一部分在目标区域之外,需要去除,这里有一个捕获效率的指标,安捷伦在65-70%
(3)duplication:建库过程中,PCR扩增的时候出现重复的模板。判断依据:两个DNA分子的5'和3'的位置完全一样,则认为是同一个PCR的结果,此时留下数据质量较高的那一个,这个过程叫做去duplication。duplication的比例会随着测序量的增加而增加。
(4)HiSeq V4 P125方法引起的:
image.png
image.png
由于左右两个方向读下来的数据,有重叠的部分,这个重叠的部分就是冗余数据。
image.png
除了有效数据量之外,read的均匀分布情况也会影响数据质量,当然是越均匀越好。
4. 主要应用在肿瘤外显子测序
测序深度好控制,比较容易测到low allele frequency的体细胞突变。
image.png
外显子测序主要能够得到SNP和插入缺失突变Idel。外显子测序对基因组结构变异不敏感,是因为外显子测序只测外显子这一部分,是基因组中非常小的一部分;对小片段拷贝数变异(CNV)也不敏感,主要原因是杂交捕获过程偶然性比较大,而对大片段的拷贝数变异还是可以检测出来的。
因为外显子测序对结构变异和拷贝数变异不敏感,但又容易到达较高的测序深度,所以一般是如下使用的:
image.png
此外,还有针对若干个基因做的捕获试剂盒,叫做Panel。例如针对实体瘤的Panel one,包含315肿瘤相关基因和28个经常发生重排的基因。因为基因捕获少,可以用比较小的数据量得到很高的测序深度,数据量小分析简单。
第二部分:外显子测序可提供的生物信息
略