生信星球培训第十三期

学习小组 Day 6 继续学习R 笔记-- Panda

2019-03-11  本文已影响21人  熊猫人和熊猫猫

今天继续学习R,不得不说周末或许是一周中最忙的时候,难得的约约约都无可安置得集中在众所周知的空闲里,昨天偷懒看到选修就跳过了,Day 6 好好做下笔记,不辜负豆花辛苦的教程。

1. 获取 R cheatsheet 的方法

2. 了解数据框

通过这段命令学习一下数据框的构建以及相关函数

a<-data.frame(GeneId=rep("gene5",times=3),SampleName=paste("sample",1:3,sep=""),Expression=c(14,19,18))

3. 了解 tidyr

3.1 主要功能

4. 下载和安装 tydir

5.了解Tidy Data

定义:是一种组织表格数据的方式,提供了一种能够跨包使用的“统一”的数据格式(实质上变成非常整齐的三列:variable-case-observation)。

6. tydir 的应用

6.1 Reshape Data

引自 生信星球

定义一个数据框a,然后通过gather将它统一格式:

a<-data.frame(country=c("a","b","c"),"1999"=paste(c(0.7,37,212),"k"),"2000"=paste(c(2,80,213),"k"))

gather(a,X1999,X2000,key="year",value="cases")
gather(a,"year","cases",X1999,X2000)#花花教的优秀偷懒做法
gather(a,year,cases,-country)#花花教的高效做法(整合除country以外的列)

key键-统一格式的第二列
value值-统一格式的数值列(别忘记 给他一个列名哦)

6.2 Handle Missing Values

引自 生信星球

6.3 Expand Tables

引自 生信星球

6.4 Split Cells

引自 生信星球
引自 生信星球
上一篇 下一篇

猜你喜欢

热点阅读