Agilent之miRNA差异分析
2020-05-09 本文已影响0人
柳叶刀与小鼠标
最近在做 Agilent来源的数据集时发现常用的下载套路可能不适合需求。
setwd('D:\\SCIwork\\F17\\UCEC\\miRNA\\GSE35794')
rm(list=ls())
library(dplyr)
library(tibble)
library(tidyr)
#####加载必要的软件包和设置路径#####
# biocLite()
library(GEOquery)
library(Biobase)
library(limma)
gsename = "GSE35794"
# 下载基因芯片数据,destdir参数指定下载到本地的地址
gse<- getGEO(gsename, destdir = ".")
##根据GSE号来下载数据,下载_series_matrix.txt.gz
gse <- getGEO(filename = 'GSE35794_series_matrix.txt.gz')
# 构建表达矩阵
exprSet <- as.data.frame(exprs(gse)) # 得到表达矩阵,行名为ID,需要转换
gpl<- getGEO('GPL10850', destdir = ".")
##根据GPL号下载的是芯片设计的信息, soft文件
exprSet$ID <- rownames(exprSet)

通过上面的图片我们可以看出来,表达矩阵有很多负值(可能是原作者进行了scale标准化),而负值是不太适合做差异分析的。因此我需要一个 Agilent之miRNA的工作流程,因此写下笔记,方便后续查阅。
流程
