学习小组Day5笔记--summer
2020-09-30 本文已影响0人
夏目14
小白速记
星球.png
向量
![](https://img.haomeiwen.com/i6040682/62c3f13b9e1aba49.jpg)
数据框
读取本地数据
1、首先你的工作目录下要有要读取的文本文件,可以是txt格式(字符间用分隔符隔开),也可以是csv格式(字符间用逗号隔开)。
2、R代码:
![](https://img.haomeiwen.com/i6040682/20304e2dc5ec51f3.png)
其中sep参数指定文件使用什么分隔符,默认是空白分隔,如果是以逗号隔开的csv文件,sep应设置为","。
header参数是读取文件的时候是否将第一行视为变量的名称,而不是当成具体的数值来处理。如果读取第一行为表头名称,此参数应该设为header = TRUE,否则就是FALSE。
![](https://img.haomeiwen.com/i6040682/d7703eeeef04ec84.png)
3、设置行名和列名
colnames(X) #查看列名
![](https://img.haomeiwen.com/i6040682/6b7696998ddb94a3.png)
rownames(X) #查看行名,默认值的行名就是行号
![](https://img.haomeiwen.com/i6040682/6891cde5cb7fab2d.png)
colnames(X)[1]<-"bioplanet"#将第一行的名称定义为字符串bioplanet
![](https://img.haomeiwen.com/i6040682/22ad2538f2352219.png)
X<-read.csv(file = "huahua.txt",sep = ",",header =T,row.names=1)#最后row.names的意思是修改第一列为行名
![](https://img.haomeiwen.com/i6040682/b26fba4fb6069457.png)
4、数据框的导出
write.table(X,file = "yu.txt",sep = ",",quote=F) #分隔符改为逗号,字符串不加双引号(默认格式带由双引号)
![](https://img.haomeiwen.com/i6040682/28e6720fcc7b6ef4.png)
5、变量的保存与重新加载
这次没有处理完的数据下次想接着用怎么办?--学会保存和重新加载。保存的格式是RData。
save.image(file="bioinfoplanet.RData") #保存当前所有变量
save(X,file="test.RData") #保存其中一个变量
load("test.RData") #再次使用RData时的加载命令
![](https://img.haomeiwen.com/i6040682/d45c2a73e2233ea5.png)
6、提取元素
例如:
- X[x,y] #第x行第y列
- X[x,] #第x行
- X[,y] #第y列
- X[y] #也是第y列
- X[a:b] #第a列到第b列
- X[c(a,b)] #第a列和第b列
- X$列名 #提取列(优秀写法,不用写括号,支持Tab自动补全,但只能提取一列)
![](https://img.haomeiwen.com/i6040682/deca3321d2296d1d.png)
![](https://img.haomeiwen.com/i6040682/cf81fb887556eb97.png)
作业:
如果save(X,file="test.RData"),这句代码如果报错object X not found。原因?