2020-12-04
2020-12-04 本文已影响0人
果果爸_2019
自己的代码记录
illunima 芯片数据注释(ID转换):
##ID 转换
library(idmap1)
ids=getIDs('GPL10558')
head(ids)
probe2symbol = ids[,1:2]
head(probe2symbol)
colnames(probe2symbol) <- c("probeset","symbol")
library(dplyr)
library(tibble)
exprSet <- data.frame(exprSet) %>%
rownames_to_column(var="probeset") %>%
#合并探针的信息
inner_join(probe2symbol,by="probeset") %>%
#去掉多余信息
select(-probeset) %>%
#重新排列
select(symbol,everything()) %>%
#求出平均数(这边的点号代表上一步产出的数据)
mutate(rowMean =rowMeans(.[grep("GSM", names(.))])) %>%
#去除symbol中的NA
filter(symbol != "NA") %>%
#把表达量的平均值按从大到小排序
arrange(desc(rowMean)) %>%
# symbol留下第一个
distinct(symbol,.keep_all = T) %>%
#反向选择去除rowMean这一列
select(-rowMean) %>%
# 列名变成行名
column_to_rownames(var = "symbol")
save(exprSet,pdata,file = "GSE130404.Rdata")