学习小组Day5笔记--summer
2020-09-30 本文已影响0人
夏目14
小白速记
星球.png
向量
向量.jpg数据框
读取本地数据
1、首先你的工作目录下要有要读取的文本文件,可以是txt格式(字符间用分隔符隔开),也可以是csv格式(字符间用逗号隔开)。
2、R代码:
其中sep参数指定文件使用什么分隔符,默认是空白分隔,如果是以逗号隔开的csv文件,sep应设置为","。
header参数是读取文件的时候是否将第一行视为变量的名称,而不是当成具体的数值来处理。如果读取第一行为表头名称,此参数应该设为header = TRUE,否则就是FALSE。
数据框X.png
3、设置行名和列名
colnames(X) #查看列名
rownames(X) #查看行名,默认值的行名就是行号
colnames(X)[1]<-"bioplanet"#将第一行的名称定义为字符串bioplanet
更改列名.pngX<-read.csv(file = "huahua.txt",sep = ",",header =T,row.names=1)#最后row.names的意思是修改第一列为行名
4、数据框的导出
write.table(X,file = "yu.txt",sep = ",",quote=F) #分隔符改为逗号,字符串不加双引号(默认格式带由双引号) 数据框导出.png
5、变量的保存与重新加载
这次没有处理完的数据下次想接着用怎么办?--学会保存和重新加载。保存的格式是RData。
save.image(file="bioinfoplanet.RData") #保存当前所有变量
save(X,file="test.RData") #保存其中一个变量
load("test.RData") #再次使用RData时的加载命令
6、提取元素
例如: 数据框X.png
- X[x,y] #第x行第y列
- X[x,] #第x行
- X[,y] #第y列
- X[y] #也是第y列
- X[a:b] #第a列到第b列
- X[c(a,b)] #第a列和第b列
- X$列名 #提取列(优秀写法,不用写括号,支持Tab自动补全,但只能提取一列)
提取数据框X的X2列.png
作业:
如果save(X,file="test.RData"),这句代码如果报错object X not found。原因?