GEO数据挖掘R语言从零开始生物信息学从零开始学

一文 解决geo数据集生存分析

2019-11-20  本文已影响0人  柳叶刀与小鼠标

第一步下载geo数据集文件(原始数据)

# # =======================================================
# ####    ######################################
# # =======================================================

setwd('D:\\work\\F4\\analysi\\F3\\gse')

library(GEOquery)

rm(list=ls())

# getGEOSuppFiles('GSE65194')

rm(list=ls())

setwd('D:\\work\\F4\\analysi\\F3\\gse\\GSE65194\\data')

setwd("data/") ##进入下载目录

getwd()

dir() ##查看文件内容

untar("GSE65194_RAW.tar") ##解压文件

files <- dir(pattern="gz$") ##加载文件

sapply(files, gunzip) ##合并文件

filelist <- dir(pattern="CEL$")

##统一处理CEL文件

library(affy)

library(annotate)

data <- ReadAffy(filenames=filelist)

affydb<-annPkgName(data@annotation,type="db")

require(affydb, character.only=TRUE)

eset<-rma(data,verbose=FALSE)

eset.e <- exprs(eset)  ##得到的矩阵文件

eset.e <- as.data.frame(eset.e)

library(annaffy)

symbols<-as.character(aafSymbol(as.character(rownames(eset)),affydb))

genes<-as.character(aafUniGene(as.character(rownames(eset)),affydb))

eset.e$symbol <- symbols

eset.e$id <- rownames(eset.e)

aanot <- subset(eset.e, select =c('id', 'symbol'))

save(eset.e, file = 'eset.e.Rdata')

save(aanot, file = 'aanot.Rdata')

write.csv(aanot, file = 'aanot.csv')
上一篇下一篇

猜你喜欢

热点阅读