一起生信啦啦啦

构建基因染色体坐标文件

2018-09-16  本文已影响2人  苏牧传媒

如图:

# 下载mm10的gtf:

ftp网址:ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_mouse/release_M17/

axel -n 10 ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_mouse/release_M17/gencode.vM17.annotation.gtf.gz

# 脚本:

zcat gencode.vM17.annotation.gtf.gz |perl -alne '{next unless $F[2] eq "gene";/gene_name \"(.*?)\";/; print"$F[0]\t$F[3]\t$F[4]\t$1"}' > allGene.mm10.position

# head查看:

good

ref:根据gtf格式的基因注释文件得到人所有基因的染色体坐标-生信人必练的200个数据处理任务-生信技能树

ref2:基因组标准注释文件-Gencode数据库 | 生信菜鸟团

上一篇下一篇

猜你喜欢

热点阅读