处理芯片--多个基因对应一个探针的情况
2018-12-21 本文已影响6人
小洁忘了怎么分身
在geo数据库的表格中,一个探针对应多个基因的情况,是这样表示的
![](https://img.haomeiwen.com/i9475888/7d70a8442f880990.png)
我需要的是一行只对应一个基因,不要多个基因写在一行,几个基因就写几行。
基于这个需求,再次造轮子。
感觉搜索还不如我自己开发来的快,我还是自己来吧。毕竟明天还得开组会。。。
library(tidyverse)
a <- tibble(probe = c("101a","102a","103a"),symbol = c("aad///ddd",'bbb',"aad///ddv///xxx"))
test1 <- apply(a,
1,
function(x){
str_split(x[2],'///',simplify=T)
})
test2 <- apply(a,
1,
function(x){
paste(x[1],
str_split(x[2],'///',simplify=T),
sep = "...")
})
unlist(test2)
x <- tibble(unlist(test2))
colnames(x) <- "lala"
x2 <- separate(x,lala,c("id","symbol"))