物种Genome文件下载方法
2020-07-18 本文已影响0人
Htt_1996
现有的参考基因组存储网站三个:
ENSEMBL
UCSC
NCBI
- UCSC 的命名是hg/mm系列,之前最常用的就是hg19参考基因组了。
- ENSEMBL的命名规则则是采用GRCh/m的方式,GRCh37对应hg19,hg38对应GRCh38。
- NCBI的命名是NP_/NM_等
1.Ensembl数据库
- 物种参考基因组下载网址:ftp://ftp.ensembl.org/pub/release-99/fasta/homo_sapiens/(人类为例)
2.RefSeq数据库(NCBI)
箭头分别选择Genome和输入物种的拉丁学名
image.png
按箭头下载文件(下载氨基酸序列就可以,protein)
image.png
3.UCSC网站
http://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/hg38.fa.gz
image.png4.Gencode数据库
最权威的人类和小鼠基因组的注释还属Gencode数据库:https://www.gencodegenes.org/
进入官网后直接下载对应hg19的最新人类的基因组注释文件 Data-----Human-----GRCh37-mapped Releases