通过ensembl/gencode下载基因组注释文件
2021-12-19 本文已影响0人
Z_bioinfo
1.下载hg19版本的gtf格式
1.打开ensemble
image.png
2.选择FTP.site
image.png
3.选择current
image.png
4.选择要下载的格式,是gff3还是gtf,我选择的是GTF
image.png
5.点进去之后,选择homo_sapiens
image.png
6.选择注释文件,我下载的是图中的那个,关于这几个的区别,还没研究,研究下再写文章吧
image.png
2.下载hg19版本的gff3格式
1.在上述步骤中的第四步选择gff3格式,会出现这个
image.png
2.点击homo_sapiens
image.png
下载hg38版本的,这个比hg19的要简单了,因为ensemble上优先发布的是最新版的,找hg19还得需要自己找
1. image.png2.根据自己的格式选择
image.png
使用gencode下载参考基因组注释文件
1.通过Linux命令下载
#下载基因组注释文件37版本的
cd /home/zhangyihui/my_data/ref_data/hg19/
$ wget ftp://ftp.sanger.ac.uk/pub/gencode/Gencode_human/release_39*/GRCh37_mapping/gencode.v39lift37.annotation.gff3.gz
$ gunzip *.gz && rm -rf *.gz
wget https://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_39/GRCh37_mapping/gencode.v39lift37.annotation.gtf.gz
$ gunzip *.gz && rm -rf *.gz
#下载人类基因组注释文件38版本的
wget http://ftp.ensembl.org/pub/release-105/gff3/homo_sapiens/Homo_sapiens.GRCh38.105.gff3.gz
2.本地下载,之后传到服务器
hg38版本的,百度搜索gencode,进入界面
image.png
直接下载
image.png
hg19的:点击旧版本
image.png
image.png