生信星球培训第107期

《学习小组Day5笔记--寒鹤》

2021-04-30  本文已影响0人  寒鹤冷月

R语言之数据结构

今天的学习内容是R语言的数据结构。R语言的数据结构主要有向量(vector),矩阵(matrix),数组(array),数据框(data frame),list等,我们重点学习的是向量和数据框。

向量

向量是指由多个元素(数字、字符串)组成的变量。在使用过程中,一般会给向量赋值,即赋予变量一个数值、字符串或数据框等。

x<-c(1,2,3)
x
[1] 1,2,3

seq()函数是产生等距间隔数列的函数
rep()函数是重复函数,可以将某一变量或向量重复若干次

x<- seq(1,10,by = 0.5)
x
[1] 1.0  1.5  2.0  2.5  3.0  3.5  4.0  4.5  5.0  5.5  6.0
[12]  6.5  7.0  7.5  8.0  8.5  9.0  9.5 10.0
x<-rep(1:3,times=2)
 x
[1] 1 2 3 1 2 3

从向量中提取元素

#根据位置提取
x[4]
[1] 1
> x[x %in% c(1,2,5)]
[1] 1 2 1 2
#根据值提取
x[x==10]
x[x<0]
x[x %in% c(1,2,5)

数据框

读取本地数据,将要读取的数据文件放在工作目录下。

read.table(file="huahua.txt",sep="\t",header=T)
  X1 X2
1  A  1
2  B NA
3  C NA
4  D  3
5  E NA

sep函数实现多个字符串之间的拼接
header函数是逻辑参数,指定是否文件第一行为变量名

设置行名和列名,colnames()设置行名,rownames()设置列名

X<-read.csv('doudou.txt')
> colnames(X)
[1] "X1" "X2"
> rownames(X)
[1] "1" "2" "3" "4" "5"
> colnames(X)[1]<-"bioplanet"
> X<-read.csv(file="huahua.txt",sep="",header = T,row.names=1)

数据框的导出

write.table(X,file = "yu.txt",sep = ",",quote=F)#分隔符改为逗号,字符串不加双引号(默认格式带由双引号) 

变量的保存与重新加载

save.image(file="bioinfoplanet.RData")#保存当前所有变量
save(X,file="test.RData")#保存其中一个变量
load("test.RData")#再次使用RData时的加载命令

提取元素

 X[x,y]#第x行第y列
X[x,]#第x行
X[,y]#第y列
X[y] #也是第y列
X[a:b]#第a列到第b列
X[c(a,b)]#第a列和第b列
X$列名#也可以提取列(优秀写法,而且这个命令还优秀到不用写括号的地步,并且支持Tab自动补全哦,不过只能提取一列)

思维导图构建

屏幕截图 2021-04-30 174846.png

思考:
save(X,file="test.RData")这句代码如果报错object X not found,是为什么,应该怎么解决?
检查"X"有没有被赋予值,看Rstudio的右上角环境变量区是否存在名为X的变量,若存在变量,检查一下是不是大小写的问题,修改名称重新保存变量;若不存在X这个变量,则重新赋予X变量,再进行保存。

这两天学习R语言的基础知识,进一步加深对R语言的了解。不知不觉已经第五天了,剩下几天的学习继续加油!

上一篇下一篇

猜你喜欢

热点阅读