Ensembl数据库

2018-06-07  本文已影响0人  Wee_001f

简介

Ensembl :http://www.ensembl.org/info/data/ftp/index.html,常用的参考基因组和GTF文件下载网站。


Ensembl提供的参考基因组有2种组装形式和3种重复序列处理方式,分别是primary,toplevel,unmasked(dna),soft-maskked(dna_sm),masked(dna_rm)。一般选择dna.primarydna_sm.primary

Ensembl的基因注释文件与GeneCode(http://www.gencodegenes.org/)V26版本一致。
Ensembl中基因组和GTF文件中染色体名字都没有添加chr,最好自行添加,保持和UCSC或下游操作一致。

Ensembl数据库的BioMart:http://www.ensembl.org/biomart/martview为下载基因的功能信息、序列信息、结构信息、ID的转换提供便利。
下载页面可见XML按钮,将XML中内容调整为一行,并在行尾添加一个单引号即可反复使用。如果想换一个物种,只需修改对应的Dataset name即可。

来自:生信宝典

上一篇 下一篇

猜你喜欢

热点阅读