遗传病分析之有害性预测利器- InterVar
软件名:InterVar
版本号:0.1.7
1. 软件用途综述
InterVar是一种生物信息学软件工具,用于通过ACMG / AMP 2015指南对遗传变异进行临床解释。 InterVar的输入是从ANNOVAR生成的注释文件,而InterVar的输出是将变体分类为“良性”,“可能良性”,“不确定重要性”,“可能致病性”和“致病性”码。 2015 年美国医学遗传学和基因组学学会(ACMG) 开发了针对序列变异的解读的标准和指南, 。 ACMG 开发的变异分类系统并推荐使用特定的标准术语,该系统将变异分为 pathogenic(致病的 ) 、 likelypathogenic(可能致病的) 、 uncertain significance(致病性不明确的) 、 likely benign(可能良性的) 、 benign(良性的) 来描述孟德尔疾病致病基因中发现的突变。 ACMG 的变异分类系统中共有 28 个证据类别,根据 28 个证据的组合形式进行变异位点的有害性分类。
网址:https://github.com/WGLab/InterVar
2. 分析原理
王凯教授开发这款疾病变异分析解读工具 InterVar旨在帮助遗传病数据解读人员 更高效地应用2015版ACMG指南的28条评估标准,能够对海量变异位点信息实现半自动化分析(18条自动,10条需要手动调整),加快遗传病基因分析和诊断速度。下图是intervar的工作流程:变异位点信息输入,软件对变异初步判读分类,手动调整必要条件后,得到最终判读结果。
image.png
3. 实现方法
3.1 使用示例
python /*/bin/InterVar/InterVar-master/Intervar.py
-b hg19
-i /*/bin/InterVar/InterVar-master/example/test.hg19_multianno.txt
--input_type=AVinput
-o /*/bin/InterVar/InterVar-master/example/test
--table_annovar /*/Software/Annovar_201602/table_annovar.pl
--convert2annovar /*/Software/Annovar_201602/convert2annovar.pl
--annotate_variation /*/Software/Annovar_201602/annotate_variation.pl
-d /*/bin/InterVar/test/humandb/
-t /*/bin/InterVar/InterVar-master/intervardb
--skip_annovar
3.2 程序说明
该程序可以输入文件可以是VCF格式(单样本或者群体均可)或者是AVinput格式,该程序可调用ANNOVAR进行注释,故可接受未注释的文件,也可以接受注释后的文件,主要参数说明如下
-b 基因组版本;
-i 输出文件,vcf格式或者AVinput格式(完成ANNOVAR注释或者未完成ANNOVAR注释均可)
--input_type输入文件格式
-o 输出文件前缀
--table_annovar=./table_annovar.pl table_annovar.pl脚本路径
--convert2annovar=./convert2annovar.pl convert2annovar.pl脚本路径
--annotate_variation=./annotate_variation.pl annotate_variation.pl脚本路径
-d humandb, --database_locat=humandb annovar注释数据库路径
--skip_annovar 基于现有的注释结果,不重新进行注释
3.3软件参数详细说明
*Usage: Intervar.py [OPTION] -i INPUT -o OUTPUT ...*
*Intervar.py --config=config.ini ...*
*Options:*
*--version* *输出版本信息并退出*
*-h, --help**显示帮助信息并退出*
*-c config.ini, --config=config.ini* *配置文件,可以将所有的参数都写到配置文件中*
*-b hg19, --buildver=hg19* *基因组版本,目前支持**GRCh37 hg18**,后期会支持* *GRCh38*
*-i example/ex1.avinput, --input=example/ex1.avinput* *包含变异的输入文件*
*--input_type=AVinput* *输入文件的格式,可以是**AVinput**、**VCF(**单样本**sample)**、**VCF_m(**多样本**)*
*-o example/myanno, --output=example/myanno* *输出文件的前缀*
*InterVar Other Options:*
*-t intervardb, --database_intervar=intervardb InterVar**自带数据库*
*-s your_evidence_file, --evidence_file=your_evidence_file* *用户自己构建的证据*
*Annovar Options:*
*--table_annovar=./table_annovar.pl table_annovar.pl**脚本路径*
*--convert2annovar=./convert2annovar.pl convert2annovar.pl**脚本路径*
*--annotate_variation=./annotate_variation.pl annotate_variation.pl**脚本路径*
*-d humandb, --database_locat=humandb annovar**注释数据库路径*
*--skip_annovar* *基于现有的注释结果,不重新进行注释*
3.4 结果展示及说明
1) Chr:染色体
2) Start:变异位点在染色体上的起始位置
3) End:变异位点在染色体上的终止位置
4) Ref:参考基因组碱基型
5) Alt:样本基因组碱基型
6) Ref.Gene:基于refGene注释的基因名称,列出该变异所在的基因
7) Func.refGene:对变异位点所在的区域进行注释
8) ExonicFunc.refGene:外显子区的SNV 或 InDel变异类型
9) Gene.ensGene:基于ensembl注释的基因号
10) avsnp147: dbSNP数据库关于该位点的描述
11) AAChange.ensGene:基于ensembl的氨基酸改变注释结果
12) AAChange.refGene:基于refGene的氨基酸改变注释结果
13) Clinvar: Clinvar:clinvar注释
14) Intervar: InterVar and Evidence:intervar关于ACMG的注释
15) Freq_ExAC_ALL:ExAC_ALL数据库中的次等位基因频率
16) Freq_esp6500siv2_all:ESP6500数据库中的次等位基因频率
17) Freq_1000g2015aug_all:千人数据库中的次等位基因频率
18) CADD_raw:CADD初始分值
19) CADD_phred:CADD_Phred分值
20) SIFT_score:SIFT分值,表示该变异对蛋白序列的影响。
21) GERP++_RS:注释变异位点的保守性的GERP++_RS分值
22) phyloP46way_placental:
23) dbscSNV ADA_SCORE和dbscSNV RF_SCORE:dbscSNV数据库的ADA分值
24) dbsc SNV _RF_SCOR:是一个关于splicing区的变异注释数据库,基于不同算法给出Ada 和RF分值,作者建议使用0.6作为阈值。
25) Interpro_domain:蛋白序列和蛋白分类数据库interpro中关于结构域的注释
26) AAChange.knownGene:基于ncbi的氨基酸改变注释结果
27) rmsk:rmsk数据库注释结果
28) MetaSVM_score:dbNSFP数据库整合的预测分值
29) Freq_ExAC_POPs:
30) OMIM:OMIM数据库注释的疾病号
31) Phenotype_MIM:基于OMIM的表型注释
32) OrphaNo.:注释Orphanet号
33) Orpha:Orpha库注释内容
34) Otherinfo:其他信息
4. 注意事项
a) ANNOVAR必须是2016-02-01以后的版本。
b) Python >=2.6.6.(实测部分功能需要python3)
c) 需要提前从OMIM数据库中下载 mim2gene.txt (2016-09以后的)文件,并拷贝到软件自带的数据库目录内.
d) 当选用--skip_annovar参数跳过ANNOVAR注释时,-i和-o参数需要有相同的路径相同的文件前缀,且该步仅可在python3上完成。
5. 软件相关文献引用
Am J Hum Genet. 2017 Feb 2;100(2):267-280. doi: 10.1016/j.ajhg.2017.01.004. Epub 2017 Jan 26.InterVar: Clinical Interpretation of Genetic Variants by the 2015 ACMG-AMP Guidelines. Li Q(1), Wang K(2). Author information: (1)Zilkha Neurogenetic Institute, University of Southern California, Los Angeles, CA 90089, USA