用R语言实现基因富集功能

2023-09-19  本文已影响0人  expgene

探序基因计算机工作室整理

1. 能实现基因富集功能的网站

MetascapeDAVIDKOBASGOEAST

参考:简书-Metascape 专门为生物学者设计的基因富集分析网站

知乎-去东方,最好用的在线GO富集分析工具

2. 安装R包

KEGG富集的时候转换基因标志要用到:org.Mm.eg.db、org.Hs.eg.db

BiocManager::install("clusterProfiler",ask=F,update=F)

BiocManager::install("org.Mm.eg.db",ask=F,update=F)

BiocManager::install("org.Hs.eg.db",ask=F,update=F)

如果用BiocManager::install方法安装比较慢的话,可以去bioconductor.org下载org.Hs.eg.db包源代码及相关依赖的包的代码,在服务器上用R CMD INSTALL xxx来安装。

3. 使用

案例1,给定基因做GO富集分析

library(org.Hs.eg.db)

library(clusterProfiler)

#基因存到一个向量中,然后转换成数字ID的形式

#idlist2为:"3604" "9452" "2115" "1493" "939" "3902" "56253"

id_list <- c("TNFRSF9","ITM2A","ETV1","CTLA4","CD27","LAG3","CRTAM")

idlist2 <- as.character(mapIds(org.Hs.eg.db,id_list,"ENTREZID","SYMBOL"))

go <- enrichGO(gene = idlist2, # Entrez ID列表

              OrgDb = org.Hs.eg.db, # 指定物种数据库

              keyType = "ENTREZID", # 指定给定的名称类型

              ont = "ALL", # 可选,BP(生物学过程)/CC(细胞组分)/MF(分子功能)/ALL(同时指定)

              pAdjustMethod = "BH", # P值校正方法,还可以是fdr

              pvalueCutoff = 0.05,qvalueCutoff = 0.2, # p/q值阈值

              readable = T # 将ID转换为symbol

)

#转换成数据框的形式,方便查看结果

go.res <- data.frame(go)

做KEGG富集分析

keggtab <- enrichKEGG(

gene = idlist2,  #基因列表文件中的基因名称

keyType = 'kegg',  #KEGG 富集

organism = 'hsa',  #例如,oas 代表绵羊,其它物种更改这行即可

 pAdjustMethod = 'fdr',  #指定 p 值校正方法

 pvalueCutoff = 0.05,  #指定 p 值阈值(可指定 1 以输出全部)

 qvalueCutoff = 0.2)  #指定 q 值阈值(可指定 1 以输出全部)

organism 参数中的物种名称列表在:https://www.genome.jp/kegg/catalog/org_list.html

但是作者在运行时,遇到错误:

Reading KEGG annotation online:

fail to download KEGG data...

Error in download.KEGG.Path(species) :

  'species' should be one of organisms listed in 'http://www.genome.jp/kegg/catalog/org_list.html'...

此外: Warning message:

In utils::download.file(url, quiet = quiet, method = "libcurl",  :

  URL 'https://rest.kegg.jp/link/hsa/pathway': status was 'Failure when receiving data from the peer'

------------------------------------------------------

参考:知乎-R语言进行富集分析及画图

简书-R包 clusterProfiler 比较不同dataset富集结果

4. 富集结果绘图

待补充

上一篇 下一篇

猜你喜欢

热点阅读