一文 解决geo数据集生存分析
2019-11-20 本文已影响0人
柳叶刀与小鼠标
第一步下载geo数据集文件(原始数据)
# # =======================================================
# #### ######################################
# # =======================================================
setwd('D:\\work\\F4\\analysi\\F3\\gse')
library(GEOquery)
rm(list=ls())
# getGEOSuppFiles('GSE65194')
rm(list=ls())
setwd('D:\\work\\F4\\analysi\\F3\\gse\\GSE65194\\data')
setwd("data/") ##进入下载目录
getwd()
dir() ##查看文件内容
untar("GSE65194_RAW.tar") ##解压文件
files <- dir(pattern="gz$") ##加载文件
sapply(files, gunzip) ##合并文件
filelist <- dir(pattern="CEL$")
##统一处理CEL文件
library(affy)
library(annotate)
data <- ReadAffy(filenames=filelist)
affydb<-annPkgName(data@annotation,type="db")
require(affydb, character.only=TRUE)
eset<-rma(data,verbose=FALSE)
eset.e <- exprs(eset) ##得到的矩阵文件
eset.e <- as.data.frame(eset.e)
library(annaffy)
symbols<-as.character(aafSymbol(as.character(rownames(eset)),affydb))
genes<-as.character(aafUniGene(as.character(rownames(eset)),affydb))
eset.e$symbol <- symbols
eset.e$id <- rownames(eset.e)
aanot <- subset(eset.e, select =c('id', 'symbol'))
save(eset.e, file = 'eset.e.Rdata')
save(aanot, file = 'aanot.Rdata')
write.csv(aanot, file = 'aanot.csv')