简书付费文章

Agilent之miRNA差异分析

2020-05-09  本文已影响0人  柳叶刀与小鼠标

最近在做 Agilent来源的数据集时发现常用的下载套路可能不适合需求。

setwd('D:\\SCIwork\\F17\\UCEC\\miRNA\\GSE35794')


rm(list=ls())
library(dplyr)
library(tibble)
library(tidyr)
#####加载必要的软件包和设置路径#####
# biocLite()
library(GEOquery)
library(Biobase)
library(limma)


gsename = "GSE35794"

# 下载基因芯片数据,destdir参数指定下载到本地的地址
gse<- getGEO(gsename, destdir = ".") 
##根据GSE号来下载数据,下载_series_matrix.txt.gz


gse  <- getGEO(filename = 'GSE35794_series_matrix.txt.gz')


# 构建表达矩阵
exprSet <- as.data.frame(exprs(gse)) # 得到表达矩阵,行名为ID,需要转换

gpl<- getGEO('GPL10850', destdir = ".") 
##根据GPL号下载的是芯片设计的信息, soft文件


exprSet$ID <- rownames(exprSet)

通过上面的图片我们可以看出来,表达矩阵有很多负值(可能是原作者进行了scale标准化),而负值是不太适合做差异分析的。因此我需要一个 Agilent之miRNA的工作流程,因此写下笔记,方便后续查阅。

流程

上一篇 下一篇

猜你喜欢

热点阅读