No.6 陈巍学基因--人的全基因组测序
1. illumina HiSeq X10
2014年推出,关注点在于,测人的全基因组约90G的成本降到1000美金以下。
总体 特点:
(1)速度快,跑一圈,2张芯片,3天跑完。比Hi Seq 2000 快出2倍以上。
(2)每张芯片的数据产量非常大。可以达到0.9-1T的数据产量。Hi Seq 2000是0.3T左右。
(3)读长增加了。从Hi Seq 2000 的双端各100个碱基,到现在的150碱基。
(4)测序成本下降。
X10 技术创新点:
(1)Nano Well 整齐排列的cluster的小孔。cluster可以长的更密集,更有利于扫描仪的判断。
左边:Hi Seq2000,右边:X 10(2)ExAmp Reagent RPA 方法长cluster。RPA(recombinant ploymerse amplification ):是模拟自然条件下的DNA的扩增技术。在这里不靠热解链DNA,而是用DNA解链酶打开,再用聚合酶合成新的DNA链。好处,提高了小孔的利用效率。在桥式PCR中,只有1/3的单克隆的孔是有效的。而现在提高到了60%。并且对于加入模板的浓度耐受性更好了。
(3)高速照相机。是原来的扫描的6倍。
(4)使用新版的酶。带修饰的dNTP,带有两个化学基团的修饰,第一个是叠氮集团,是终止可逆反应。第二是在碱基上连出去一个长柄,长柄上带有荧光基团。当循环结束的时候,切掉的荧光基团,碱基上还存在一个长柄,因此合成的DNA链不是天然的DNA链,因此酶要更好的耐受dNTP的修饰,耐受长柄,并有更高的活性。
2.X10为我们带来什么样的生物信息
(1)SNP信息
单核苷酸多态性。与Hi Seq 2000确认的SNP信息,达到95%以上。
(2)indel=insertion +deletion <50bp的微小插入或缺失。
如果引起移码突变,完全不一样。
如果落在阅读框中,也会产生蛋白的氨基酸的增加或者缺少。
(3)SV=基因组的结构变异信息。(structure viration)
染色体内部的位移、染色体之间的移位、大片段的缺失、大片段的增加、大片段的加倍、大片段的到位
(4)拷贝数变异信息(CNV=copy number variation ):染色体片段的拷贝数的变异,包括拷贝数增加和减少。和结构变异SV的变异相关的。
3. 测序深度和覆盖度
测序深度和覆盖度(1)对于germline变异,90G,30X,测序深度就够了
(2)对于肿瘤的somatic突变,需要更大的测序数据量、更深的测序深度。一般进行50X-100X的测序深度,同时检测血液中白细胞的基因组DNA作为对照。从而找出突变。或者对肿瘤或者白细胞都做30X的测序。但是可以对肿瘤加测一个100X或200X的外显子测序。