[R]生物信息各类ID转换攻略
2018-11-03 本文已影响21人
郑宝童
前几天,一位小师妹问了我,ID转换的相关问题。确实,生物信息学经常会碰到ID转化,转换的方法有很多,接下来我将列举我所知晓的几个ID转换方法。
一、网站类
二、软件类
生信人开发的小工具sangerbox,其中有个便捷ID转换工具
使用方法可以查看ID便捷转换工具使用教程
image.png
三、R代码转换
示例:将表达谱geneexp中的symbol,替换成gene id
#加载包
library(AnnotationDbi)
library(org.Hs.eg.db)
#转换示例代码
genesymbol<-as.character(row.names(geneexp))
#获取两列的对应关系
annoutu13<-select(org.Hs.eg.db,keys = genesymbol,columns ="ENTREZID",keytype = "SYMBOL")
gzsindex<-match(genesymbol,annoutu13$SYMBOL)
geneid<-annoutu13$ENTREZID[gzsindex]
#获取匹配为空的位置,并删除对应行
quNAindex<-which(is.na(geneid))
geneexp<-geneexp[-quNAindex,]
geneid<-geneid[-quNAindex]
table(duplicated(geneid))
row.names(geneexp)<-geneid
嘿嘿,上面的代码其实支持很多类型的ID转换,我们用keytypes
函数看看支持什么ID转换。
你也可以参看生信菜鸟团的gene的各种ID转换终结者-bioconductor系列包,生信技能树:ID转换大全来了解更多的ID转换。