生信星球培训第八十二期

学习小组Day5笔记--summer

2020-09-30 本文已影响0人夏目14

小白速记

星球.png

向量

向量.jpg

数据框

读取本地数据

1、首先你的工作目录下要有要读取的文本文件，可以是txt格式（字符间用分隔符隔开），也可以是csv格式（字符间用逗号隔开）。
2、R代码：

读取文件.png
其中sep参数指定文件使用什么分隔符，默认是空白分隔，如果是以逗号隔开的csv文件，sep应设置为","。
header参数是读取文件的时候是否将第一行视为变量的名称，而不是当成具体的数值来处理。如果读取第一行为表头名称，此参数应该设为header = TRUE，否则就是FALSE。

数据框X.png

3、设置行名和列名
colnames(X) #查看列名

查看列名.png

rownames(X) #查看行名,默认值的行名就是行号

查看行名.png

colnames(X)[1]<-"bioplanet"#将第一行的名称定义为字符串bioplanet

更改列名.png

X<-read.csv(file = "huahua.txt",sep = ",",header =T,row.names=1)#最后row.names的意思是修改第一列为行名

修改行名.png
4、数据框的导出
write.table(X,file = "yu.txt",sep = ",",quote=F) #分隔符改为逗号，字符串不加双引号（默认格式带由双引号）

数据框导出.png
5、变量的保存与重新加载

这次没有处理完的数据下次想接着用怎么办?--学会保存和重新加载。保存的格式是RData。

save.image(file="bioinfoplanet.RData") #保存当前所有变量
save(X,file="test.RData") #保存其中一个变量
load("test.RData") #再次使用RData时的加载命令

保存格式.png
6、提取元素

X[x,y] #第x行第y列

X[x,] #第x行

X[,y] #第y列

X[y] #也是第y列

X[a:b] #第a列到第b列

X[c(a,b)] #第a列和第b列

X$列名 #提取列（优秀写法，不用写括号，支持Tab自动补全，但只能提取一列）

例如：

数据框X.png

提取数据框X的X2列.png

作业：

如果save(X,file="test.RData"),这句代码如果报错object X not found。原因？

报错提示：没有发现对象X，这应该是因为你的工作目录下不存在X这个文件（对象）。

上一篇下一篇

猜你喜欢

热点阅读