简化基因组分析注意事项
2018-04-17 本文已影响104人
xuzhougeng
简化基因组的方法一定要问清楚
建库前无论公司说的是RAD-seq,还是说的是GBS,都不要太当真,因为这两个名词定义越来越不清了,你只要问清楚,他们建库是检测哪个部分:
1)对单酶切位点邻近片段测序,如最初的RAD-seq
2)对酶切位点两翼片段测序,如Genoytping-by-Sequencing
具体看我写的这篇文章: 简化基因组的测序方法
关于建库的选择:
如果没有参考基因组: 使用RAD-seq双端测序,或者亲本50x以上进行组装,然后是GBS
如果有参考基因组: 使用GBS,这个很便宜。
分析时一定不能去重复
- 比对之后的预处理,不能去重,可以标记重复,当然这一步可以省去
- 如果上一步标记了重复,那么在使用GATK HaplotypeCaller时, 3.x版本参数需要增加
-drf DuplicateRead
4.x版本则是-DF NotDuplicateReadFilter
。 其实-drf
和-DF
都是--disable-read-filter
的缩写。
具体原因见https://gatkforums.broadinstitute.org/gatk/discussion/6124