生信星球培训第八期

学习小组Day6笔记——四海

2018-10-27  本文已影响56人  寂静之巅

学习R包

获取R包小抄的方法
初步了解tidyr
  1. 数据框的变形 2. 处理数据的空值 3. 根据一个表格衍生出其他表格 4. 实现行或者列的分割
install.packages("tidyr")#安装
library(tidyr) #载入

rep,重复,括号中填要重复的字符和重复次数。
paste,连接两个字符串,括号要填两个代连接字符并指定分隔符(sep),没有分隔符就填sep=“”。
函数后面一般都要加括号,括号里第一个参数是都数据框名
字符串要加双引号
行 raw, 列 column,简化写法为col

创建一个练习数据

图片.png
gather(a,`hai`,`dou`,key = "name",value = "case")#正规用法
gather(a,"name","case",hai,dou)#懒人用法
图片.png

gather括号里的分别是:数据框名,需合并的列名(两个),合并后的key列名,value列名。

处理缺失值

  • 删除整行
  • 根据上下文(瞎)蒙一个
  • 同一列的空值填上同一个数
X <- data.frame(x1=c("A","B","C","D","E"),x2=c(1,NA,NA,3,NA))
X
View(X)
drop_na(X,x2)
?drop_na
fill(X,x2)
X
replace_na(X,list(x2=2))
图片.png
pin2<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
View(pin2)
expand(pin2,GeneId,SampleName,Expression)
base```
- expand三列排列组合
上一篇 下一篇

猜你喜欢

热点阅读