生信星球培训第134期

学习小组Day5笔记-Young

2022-04-22  本文已影响0人  我有柳叶刀

数据结构

数据类型

  1. <-赋值符号
  2. 显示工作路径get()
  3. 命令查看帮助:?read.table

Part1: 向量

1.标量和向量的区别
标量:一个元素组成的变量
向量:多个元素组成的变量(一个向量是一排有序排列的元素)
2.从向量中提取元素
(1) 根据元素位置

#x是赋值的变量名
x [4] #x第4个元素
x [-4] #排除法,除了第4个元素之外剩余的元素
x [2:4] #第2到4个元素
x [-(2:4)] #除了第2-4个元素
x [c(1,5)] #第1个和第5个元素

(2) 根据值

x [x==10] #等于10的元素
x [x<0]
x [x %in% c(1,2,5)] #存在于向量c (1,2,5)中的元素

Part2:数据框

header: 逻辑值,指示文件的第一行是否包含变量名,header设置TRUE,则要求第一行要比数据列的数量少一列。
sep:分开数据的分隔符。默认sep="",函数可以将1个或多个空格、tab制表符、换行符或回车符作为分隔符。
(1)读取本地数据

read.table(file = "young.txt",sep = "\t",header = T)
a<-read.table(file = "young.txt",sep = "\t",header = T)

(2)设置行名和列名

X<-read.csv('young.txt') #在示例数据里有young.txt 注意这里的变量x是一个数据框
colnames(X) #查看列名
rownames(X) #查看行名,默认值的行名就是行号
colnames(X)[1]<-"Anything"#有的公司返回数据,左上角第一格为空,R会自动补为x,用这个命令来修改
X<-read.csv(file = "young.txt",sep = "",header = T,row.names = 1) #row.names的意思是修改第一列为行名

(3)数据框的导出

write.table(X,file = "young2.txt",sep = ",",quote = F)#分隔符改为逗号,字符串不加双引号(默认格式带由双引号) 

(4)变量的保存与重新加载

save.image(file="young.RData")#保存当前所有变量
save(X,file="young2.RData")#保存其中一个变量
load("young2.RData")#再次使用RData时的加载命令

(5)提取元素

X[1,2]#第1行的第2列
X[1,]#第1行
X[,2]#第2列,按行展示
X[2]#也是第2列,按列展示
X[1:2]#第1列到第2列
X[c(1,2)]#第1列和第2列
#X$列名,也可以提取列(不用写括号,并且支持Tab自动补全,不过只能提取一列)
X$X1

作业

save(X,file="test.RData")这句代码如果报错object X not found,是为什么,应该怎么解决?
答:没有对X进行赋值,赋值后即可。

上一篇 下一篇

猜你喜欢

热点阅读