R|包|AnnoProbe
2020-01-17 本文已影响0人
高大石头
1.下载数据——GSE27447
rm(list = ls())
options(stringsAsFactors = F)
library(AnnoProbe)
library(Biobase)
library(GEOquery)
gset <- getGEO("GSE27447", getGPL = F,destdir = ".", AnnotGPL = F)
gse27447 <- gset[[1]]
exprSet <- exprs(gse27447)
boxplot(exprSet,las=2) #可视化数据情况
原始数据
2.判断是否log2处理
exprSet1 <- log2(exprSet+1)
boxplot(exprSet1,las=2)
log2转化后
3.用limma包进行标准化
library(limma)
exprSet2 <- normalizeBetweenArrays(exprSet1)
boxplot(exprSet2,las=2)
limma标准化
4.获取注释信息,并对表达矩阵取子集
gse27447@annotation
checkGPL(gse27447@annotation) #结果为TRUE,说明存在这个平台数据
ids <- idmap(gse27447@annotation) #提取probe2symbol注释信息
dat <- filterEM(exprSet,ids) #将探针名直接转为转为gene symbol,且去重去NA
dat <- dat[order(rownames(dat)),] #按照从A-Z排序,并取子集
5.获取临床信息
pd <- pData(gse27447)
library(stringr)
group_list <- str_split(pd$title, ' ', simplify = T)[,1]
table(group_list)
样品分组
Tips:
exprs( ) #获取表达矩阵
pData( ) #获取样品临床信息
boxplot(<表达矩阵> ) #可视化原始数据
idmap( ) #提取probe2symbol注释信息
filterEM( ) #探针名直接转为gene symbol,且去重去NA