把pdata的多余列去掉

2019-02-20  本文已影响89人  小洁忘了怎么分身

GEO数据分析中用到pdata表格,为了从中找出分组信息,可谓非常费眼睛。有的表格友好一点,十几列。有的夸张起来六十页不成问题。
所以我搞定了一个函数,取名small,把多余的列(即所有行都相同的列)去掉,起到缩小表格的作用。
可以用你的pdata表格试试,也可以在生信星球公众号回复“pd”获取示例数据pd.Rdata

load(file="pd.Rdata")
small <- function(df){
  library(tibble)
  library(dplyr)
  colname <- vector("character")
  count <- vector("integer")
  for(i in 1:ncol(df)){
    colname[i] = colnames(df)[[i]]
    count[i]=nrow(df[!duplicated(df[,i]),])
  }
  o <- tibble(colname,count) 
  output=df[,o$count>1]
}
pd=small(pd)

以我的示例数据为例,从34列变成了5列。

上一篇下一篇

猜你喜欢

热点阅读