GEO-芯片数据

找不到某些GEO数据的表达矩阵肿么办

2020-07-19  本文已影响0人  小洁忘了怎么分身

举个栗子,GSE99410和GSE78200。

library(GEOquery)
gse = "GSE78200"
eSet <- getGEO(gse,  destdir = '.',getGPL = F)

exp <- exprs(eSet[[1]])
#Error in exp[1:4, 1:4] : subscript out of bounds
exp[1:4,1:4]
boxplot(exp)
#Error in names(groups) <- nam : 'names' attribute [10] must be the same length as the vector [0]

代码看起来没有问题,怎么就画不了图?

dim(exp)
#[1]  0 10

因为它是空数据啊。

有两种情况

第一类,不是芯片数据,用于后续分析的文件以其他形式存储了,这是GSE99410的



这是GSE78200的:


第二类,就是作者没有并上传表达矩阵,而是只提供了原始数据文件,如CEL、txt、gpr等格式。
原始数据的处理,有法可依呀。
CEL格式的芯片原始数据处理方法
aglient 家txt格式的芯片原始数据处理方法
gpr格式的芯片原始数据处理方法
如果是illumina的bead芯片,可以用lumi试试,还没有整理。

处理原始数据的技能搞定,还有一个问题可以一并解决:

表达矩阵里有负值,无法正常用limma包做下游分析了,也可以找找原始数据去处理它 ~

上一篇下一篇

猜你喜欢

热点阅读