Clinvar数据库
Clinvar简介:
ClinVar数据库的目的在于整合这些分散的数据、将变异、临床表型、实证数据以及功能注解与分析等四个方面的信息,通过专家评审,逐步形成一个标准的、可信的、稳定的遗传变异-临床表型相关的数据库。

功能介绍

1.使用数据库
数据库介绍,数据词典,数据下载,常见问题,订阅源,使用说明
2.工具
ACMC 遗传风险告知患者建议,临床基因组再比对分析,参考基因序列分析,变异分析,上传数据等工具
3.相关资源
dbGaP, GTR, ICCG, MedGen, Variation, GeneReviews 等数据库或书籍
Clinvar主页
搜索:搜索ClinVar中基因符号,HGVS表达式,条件等

Clinvar工具栏:

以乳腺癌(Breast cancer)为例:

变异信息详解:
title信息:
http://varnomen.hgvs.org/recommendations/DNA/variant/substitution/

Variation ID:一个独特的数字编码,代表一系列的序列改变,一个由五种SNP导致的变异具有一个独特的数字编码,但每个SNP由Allele ID代表

Review Status:审查状态,星多的比较可靠

Interpretation 信息:

该变异由提交者通过数据整理得出的部分解释
Number of submissions:提交数量,此处为提交总数(可一人提交多次),可能比之前的Review Status中的提交数量多
Condition(s):检测到该变异出现的所有条件(状态),附有该状态的定义信息和数据库链接,若提交者未填写此项则为空白
See supporting ClinVar records:该链接将跳转至相关的RCV记录
Allele(S) 信息:

Allele(s)为变异中的等位基因的信息整合,如果变异只存在于单个基因中,则基因名也会给出。
Allele ID:每个变异具有一个独特的编号
HGVS表现:在现在和之前的染色体序列(NC登记)上,现在的NM/NP和参考基因(NG)上,在含NM/NP注释的参考基因版本上(如果不是当前版本),提交者提供
cytogenetic and genomic locations:染色体位置和基因组位置
protein change:蛋白质改变
links:其它数据库的链接
GMAF:1000 Genomes工程中测定的全球少数等位基因频率
allele frequency:等位基因频率
molecular consequence:分子推论,序列改变可能导致的后果的推测
Suspect:怀疑,变异引起的现象中至少有一项可能被旁系同源基因或DNA错配影响
其他略
variant_summary.txt
从ClinVar可以下载整合的数据variant_summary.txt,包括以下内容:
allele ID:变异的编号
type:变异的类型,共有16种不同的类型,后面给出各种类型具体信息
name:变异的名字
geneID:变异设计基因的ID
gene symbol:基因名字
clinical significance:临床意义,共16种,后面给出
clin sig simple:简单临床意义,有意义1,无意义0
last evaluated:最后更新时间
RS# (dbSNP):dbSNP编号,前面省略RS#,单核苷酸变异
nsv/esv (dbVar):dbVar编号,与dbSNP对应,多核苷酸变异
RCV accession:RCV检索号
phenotype IDS:其它数据库中该表型ID
phenotype list:该变异的表型
origin:变异来源
origin simple:简化变异来源,主要来源
assembly:参考基因组
ChromosomeAccession:染色体检索号
chromosome:变异所在染色体
start/stop:变异位置
ReferenceAllele:参考等位基因
AlternateAllele:候补等位基因
Cytogenetic:染色体位置
ReviewStatus:审查状态
OtherIDs:其它一些ID
..........

