蛋白质组学:蛋白ID的转换

2021-03-01  本文已影响0人  佳名

参考:https://www.bilibili.com/read/cv5465226/
蛋白质组学的输出结果是如下一些ID,如果要做KEGG分析的话,需要将其转换为entrezgene_id,如:57874。

蛋白ID.png
可以使用在线软件:
https://www.uniprot.org/uploadlists/
步骤:
上传ID列表,选择需要转换的ID,submit,download,另存为txt。即可完成。
或者使用biomaRt包
library(biomaRt)
mart <- useMart("ensembl","mmusculus_gene_ensembl")##选择物种:
listFilters(mart)
gene_name<-getBM(attributes=c("uniprotswissprot","external_gene_name","entrezgene_id"),
                 filters = "uniprotswissprot",
                 values = rownames(matrix), 
                 mart = mart)

biomaRt包检出的ID要比在线软件少几个,好处是可以一对多转换,而在线工具只能一对一。biomaRt包有时会因为网络原因转换失败。

KEGG分析

library('clusterProfiler') 
kegg <- enrichKEGG(gene= gene_name$entrezgene_id, 
                   organism = "mmu", maxGSSize=10000,
                   keyType = "kegg", pvalueCutoff =1,
                   use_internal_data = FALSE)#һ??ΪTRUE,???Ը?ΪFALSE
View(as.data.frame(kegg))
dotplot(kegg,showCategory=20,orderBy = "Count")
上一篇 下一篇

猜你喜欢

热点阅读