数据-R语言-图表-决策-Linux-Python

[R]生物信息各类ID转换攻略

2018-11-03  本文已影响21人  郑宝童

前几天,一位小师妹问了我,ID转换的相关问题。确实,生物信息学经常会碰到ID转化,转换的方法有很多,接下来我将列举我所知晓的几个ID转换方法。

一、网站类

二、软件类

生信人开发的小工具sangerbox,其中有个便捷ID转换工具

image.png
使用方法可以查看ID便捷转换工具使用教程
image.png

三、R代码转换

示例:将表达谱geneexp中的symbol,替换成gene id

#加载包
library(AnnotationDbi)
library(org.Hs.eg.db)

#转换示例代码
genesymbol<-as.character(row.names(geneexp))
#获取两列的对应关系
annoutu13<-select(org.Hs.eg.db,keys = genesymbol,columns ="ENTREZID",keytype = "SYMBOL")
gzsindex<-match(genesymbol,annoutu13$SYMBOL)
geneid<-annoutu13$ENTREZID[gzsindex]
#获取匹配为空的位置,并删除对应行
quNAindex<-which(is.na(geneid))
geneexp<-geneexp[-quNAindex,]
geneid<-geneid[-quNAindex]
table(duplicated(geneid))
row.names(geneexp)<-geneid

嘿嘿,上面的代码其实支持很多类型的ID转换,我们用keytypes函数看看支持什么ID转换。

image.png

你也可以参看生信菜鸟团gene的各种ID转换终结者-bioconductor系列包生信技能树:ID转换大全来了解更多的ID转换。

上一篇下一篇

猜你喜欢

热点阅读