【数据库-5】ESP6500
欢迎关注:oddxix
如果觉得写的不错记得点个赞~
1.简介
官网:http://evs.gs.washington.edu/EVS/
ESP全称是NHLBI GO Exome Sequencing Project(国家心肺和血液研究所外显子组测序计划),包含了SNP和InDel变异。通过注释可以找到突变在ESP6500中的变异频率。主要目的是通过NGS技术对不同人群进行SNP分型,来辅助心脏,肺,血液相关疾病的研究。目前有6503个样本:
ESP6500共包含了7个项目,分别由不同的机构承担:
-
Seattle GO - University of Washington, Seattle, WA
-
BroadGO - Broad Institute of MIT and Harvard, Cambridge, MA
-
WHISP - Ohio State University Medical Center, Columbus, OH
-
Lung GO - University of Washington, Seattle, WA
-
WashU GO - Washington University, St. Louis, MO
-
Heart GO - University of Virginia Health System, Charlottesville, VA
-
ChargeS GO - University of Texas Health Sciences Center at Houston
2.使用
通过首页的Data Browser按钮,可以检索数据库。可以通过以下4种方式进行检索:
-
HUGO命名的gene symbol
-
Entrez Gene ID
-
染色体区域
-
dbSNP rs ID
以EGFR为例,搜索后,
点击display
2.1基因相关信息
这部分内容会给出基因的symbol, ID,染色体区域等基本信息,还会给出pathway, COSMIC, STRING, OMIM等数据库的链接
2.2通过单选框,对变异位点的表头进行筛选
2.3 变异位点的详情页面
根据前面筛选的表头,展示每个变异位点对应的信息。不同类型的变异位点填充色是不同的,颜色和变异类型的对应关系如下:
2.4选择覆盖度
可以链接到UCSC上查看EGFR 基因的各种信息,或者下载查看所有位点的覆盖信息
2.5 下载
检索的结果可以下载,点击右上角的download
按钮即可下载,支持text
和vcf
两种格式。
除了检索之外,还可以一次下载整个数据库中的内容,点击首页的Download
按钮即可跳转到下载页面。
该页面提供的数据是对6503例样本的分析结果,变异位点的位置是基于hg19版本的,为了适配hg38版本,新增了字段来存储hg38版本上的位置信息。提供了5个文件供下载,可以分成3类
1.SNP分型结果
ESP6500SI-V2-SSA137.GRCh38-liftover.snps_indels.txt.tar.gz
ESP6500SI-V2-SSA137.GRCh38-liftover.snps_indels.vcf.tar.gz
2.测序覆盖度结果
ESP6500SI-V2.GRCh38-liftover.coverage.all_sites.txt.tar.gz
ESP6500SI-V2.coverage.seq_blocks.txt.tar.gz
3.外显子目的区域文件
agilent_nimblegen_exome_targets_esp_project.tar.gz
通常情况下,下载VCF文件就可以。