生信星球培训第八十二期

学习小组Day5笔记--summer

2020-09-30  本文已影响0人  夏目14

小白速记

星球.png

向量

向量.jpg

数据框

读取本地数据

1、首先你的工作目录下要有要读取的文本文件,可以是txt格式(字符间用分隔符隔开),也可以是csv格式(字符间用逗号隔开)
2、R代码:

读取文件.png
其中sep参数指定文件使用什么分隔符,默认是空白分隔,如果是以逗号隔开的csv文件,sep应设置为","。
header参数是读取文件的时候是否将第一行视为变量的名称,而不是当成具体的数值来处理。如果读取第一行为表头名称,此参数应该设为header = TRUE,否则就是FALSE。
数据框X.png

3、设置行名和列名
colnames(X) #查看列名

查看列名.png

rownames(X) #查看行名,默认值的行名就是行号

查看行名.png

colnames(X)[1]<-"bioplanet"#将第一行的名称定义为字符串bioplanet

更改列名.png

X<-read.csv(file = "huahua.txt",sep = ",",header =T,row.names=1)#最后row.names的意思是修改第一列为行名

修改行名.png
4、数据框的导出
write.table(X,file = "yu.txt",sep = ",",quote=F) #分隔符改为逗号,字符串不加双引号(默认格式带由双引号) 数据框导出.png
5、变量的保存与重新加载

这次没有处理完的数据下次想接着用怎么办?--学会保存和重新加载。保存的格式是RData。

save.image(file="bioinfoplanet.RData") #保存当前所有变量
save(X,file="test.RData") #保存其中一个变量
load("test.RData") #再次使用RData时的加载命令

保存格式.png
6、提取元素
  • X[x,y] #第x行第y列
  • X[x,] #第x行
  • X[,y] #第y列
  • X[y] #也是第y列
  • X[a:b] #第a列到第b列
  • X[c(a,b)] #第a列和第b列
  • X$列名 #提取列(优秀写法,不用写括号,支持Tab自动补全,但只能提取一列)
例如: 数据框X.png
提取数据框X的X2列.png



作业:

如果save(X,file="test.RData"),这句代码如果报错object X not found。原因?

报错提示:没有发现对象X,这应该是因为你的工作目录下不存在X这个文件(对象)。
上一篇 下一篇

猜你喜欢

热点阅读