GEO SRA ArrayExpress ENA 数据挖掘R语言做生信R语言与统计分析

处理芯片--多个基因对应一个探针的情况

2018-12-21  本文已影响6人  小洁忘了怎么分身

在geo数据库的表格中,一个探针对应多个基因的情况,是这样表示的



我需要的是一行只对应一个基因,不要多个基因写在一行,几个基因就写几行。
基于这个需求,再次造轮子。
感觉搜索还不如我自己开发来的快,我还是自己来吧。毕竟明天还得开组会。。。

library(tidyverse)
a <- tibble(probe = c("101a","102a","103a"),symbol = c("aad///ddd",'bbb',"aad///ddv///xxx"))

test1 <- apply(a,
              1,
              function(x){
                str_split(x[2],'///',simplify=T)
})

test2 <- apply(a,
               1,
               function(x){
                 paste(x[1],
                 str_split(x[2],'///',simplify=T),
                 sep = "...")
               })
unlist(test2)
x <- tibble(unlist(test2)) 
colnames(x) <- "lala" 
x2 <- separate(x,lala,c("id","symbol"))
上一篇下一篇

猜你喜欢

热点阅读