生信入门参考资料全基因组/外显子组测序分析

使用oncotator做突变注释

2018-01-17  本文已影响433人  因地制宜的生信达人

突变注释

功能:vcf格式突变数据进一步注释成maf格式

做过癌症数据分析的童鞋都知道,TCGA里面用maf格式来记录突变!那么maf格式的数据是如何得来的呢,我们都知道,做完snp-calling一般是得到vcf格式的突变记录数据文件,然后再用annovar或者其它蛋白结构功能影响预测软件注释一下,还远达不到maf的近100条记录。

而大名鼎鼎的 broad institute 就规定了maf格式的突变注释文件,他就是利用了十几个常见的已知数据库来注释我们得到的vcf突变记录,通常是对somatic的突变才注释成maf格式的数据!

大名鼎鼎的broadinstitute出品的突变注释工具:

http://www.ncbi.nlm.nih.gov/pubmed/25703262

源码在github: https://github.com/broadinstitute/oncotator

软件官网是: https://www.broadinstitute.org/oncotator/

说明书:

http://gatkforums.broadinstitute.org/gatk/discussion/4154/howto-install-and-run-oncotator-for-the-first-time

需要提前自己下载14G的数据:http://www.broadinstitute.org/~lichtens/oncobeta/oncotator_v1_ds_Jan262015.tar.gz

软件可以在官网下载:

https://github.com/broadinstitute/oncotator/archive/v1.8.0.0.tar.gz

本身也是一个在线工具:

input data数据指南
https://www.broadinstitute.org/oncotator/help/#inputformat

集成了下面所有的分析资源,

而且还提供了API。

Genomic Annotations

Protein Annotations

Cancer Variant Annotations

Non-Cancer Variant Annotations

因为要下载的数据有点多,我这里就不用自己的电脑测试了,安装过程也很简单的!

上一篇 下一篇

猜你喜欢

热点阅读