生信猿

【数据库-5】ESP6500

2018-11-23  本文已影响0人  oddxix

欢迎关注:oddxix
如果觉得写的不错记得点个赞~


1.简介

官网:http://evs.gs.washington.edu/EVS/

首页

ESP全称是NHLBI GO Exome Sequencing Project(国家心肺和血液研究所外显子组测序计划),包含了SNP和InDel变异。通过注释可以找到突变在ESP6500中的变异频率。主要目的是通过NGS技术对不同人群进行SNP分型,来辅助心脏,肺,血液相关疾病的研究。目前有6503个样本:

ESP6500共包含了7个项目,分别由不同的机构承担:


2.使用

通过首页的Data Browser按钮,可以检索数据库。可以通过以下4种方式进行检索:

以EGFR为例,搜索后,

点击display


2.1基因相关信息

这部分内容会给出基因的symbol, ID,染色体区域等基本信息,还会给出pathway, COSMIC, STRING, OMIM等数据库的链接


2.2通过单选框,对变异位点的表头进行筛选


2.3 变异位点的详情页面

根据前面筛选的表头,展示每个变异位点对应的信息。不同类型的变异位点填充色是不同的,颜色和变异类型的对应关系如下:


2.4选择覆盖度

可以链接到UCSC上查看EGFR 基因的各种信息,或者下载查看所有位点的覆盖信息


2.5 下载

检索的结果可以下载,点击右上角的download按钮即可下载,支持textvcf两种格式。

除了检索之外,还可以一次下载整个数据库中的内容,点击首页的Download按钮即可跳转到下载页面。

该页面提供的数据是对6503例样本的分析结果,变异位点的位置是基于hg19版本的,为了适配hg38版本,新增了字段来存储hg38版本上的位置信息。提供了5个文件供下载,可以分成3类

1.SNP分型结果

ESP6500SI-V2-SSA137.GRCh38-liftover.snps_indels.txt.tar.gz
ESP6500SI-V2-SSA137.GRCh38-liftover.snps_indels.vcf.tar.gz

2.测序覆盖度结果

ESP6500SI-V2.GRCh38-liftover.coverage.all_sites.txt.tar.gz
ESP6500SI-V2.coverage.seq_blocks.txt.tar.gz

3.外显子目的区域文件

agilent_nimblegen_exome_targets_esp_project.tar.gz

通常情况下,下载VCF文件就可以。

上一篇下一篇

猜你喜欢

热点阅读