2021-07-01

2021-07-01  本文已影响0人  wangyantao1991

昨天忙着做实验,没时间鼓捣数据,今天也得做实验,不过在试验开始之前还是先整理一下吧:

首先是安装R包

尝试本地运行后发现,报错:

本地内存太小,程序无法运行。

到集群上运行,使用大神的R软件,修改.bashrc,添加R软件的调用路径。

export PATH=/public/home/liuxiaofeng/miniconda3/envs/R.4/bin:$PATH

export R_LIBS=/public/home/liuxiaofeng/R/x86_64-conda_cos6-linux-gnu-library/4.0

启动R软件,运行如下脚本:

library(org.Hs.eg.db)

swiss_id <- read.delim('/vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_go.sae1',header = F)

colnames(swiss_id) <- c('gene_id','GO')

ev_id <- select(org.Hs.eg.db,keys = as.vector(swiss_id$GO),columns = c('EVIDENCE'),keytype = "GO")

library(dplyr)

swiss_goev <- left_join(swiss_id,ev_id[,1:2])

write.csv(swiss_goev,'/vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_goev_sea.csv',row.names = F,quote = F)

生成的结果文件竟然足足有28.7个GB,额度个娘嘞。

内存太小了,根本跑不起来。。。

继续搞其他的:

上一篇下一篇

猜你喜欢

热点阅读