NCBI下载数据的提取
2019-03-22 本文已影响5人
chaimol
NCBI下载玉米基因组的各种数据。
下载地址:
ftp://ftp.ncbi.nlm.nih.gov/genomes/refseq/plant/Zea_mays/latest_assembly_versions/
这是最新的版本。对于其他的物种,只需要更改后缀即可。
或者是直接在https://www.ncbi.nlm.nih.gov/
选择genome,之后输入物种的拉丁名,之后按照图示选择,即可进入ftp下载地址。
-
FTP站点的文件结构
文件目录结构一般会有readme文件。
image.png
readme文件会详细介绍目录结构,文件结构。
本次的重点是实现基因编号和GID变好的互相转换。
下载*_feature_table.txt.gz文件,提取基因信息和GID编号。