学习小组D5笔记-年糕

2020-09-11 本文已影响0人沏茶年糕团子

照例先上思维导图

D5.png

一、从向量中提取元素

根据元素位置

x[4] #第4个元素
x[-4] #排除法，除了第4个元素之外剩余的元素
x[2:4] #第2到4个元素
x[-(2:4)] #除了第2-4个元素
x[c(1,5)] #第1个和第5个元素

根据值

x[x==10] #等于10的元素
x[x<0] #小于10的元素
x[x %in% c(1,2,5)] #存在于向量c（1，2，5）中的元素

二、数据框

读取数据

read.table(file="文件路径/文件名"，sep="\t",header=T，row.names=1) #读取文件并转换成数据框形式数据

file：文件路径/文件名，当前工作目录下的文件可以省略路径，注意一定用双引号
sep：分隔符，\t为制表键，\n为换行符，" "为空格，默认为" "
header：是否有表头，即第一行是否为列名。T为是，F为不是，默认为F
row.names=1：即将第一列作为行名

读取数据

colnames(X)[1]<-"sample"  #有的数据左上角第一格为空，R会自动补为x, 可用这个命令来修改第一列的列名

数据框的导出

write.table(X,file = "yun.txt",sep = ",",quote=F) #分隔符改为逗号，字符串不加双引号（默认格式带双引号）

变量的保存与重新加载

保存格式是RData

save.image(file="bioinfoplanet.RData")#保存当前所有变量
save(X,file="test.RData")#保存其中一个变量
load("test.RData")#再次使用RData时的加载命令

提取元素

按行提取

X[x,] #第x行

按列提取

X[,y]  #第y列
X[y]   #也是第y列
X[a:b]   #第a列到第b列
X[c(a,b)]   #第a列和第b列，注意与X[a,b] 意义不同
X$列名   #也可以提取列，但只能提取一列

按行、列提取

X[a,b]  #第a行第a列

直接使用数据框中的变量

首先创建一个数据框，并画出散点图

options(stringsAsFactors = T) 
a <-data.frame(case=paste0("S",1:9),values=runif(9))
plot(a$case,a$values)

（1）options(stringsAsFactors = T) ：环境设置函数，用来更改R对数据框数据的读取方式，即设定是不是把字符串形式的元素当作数据框中的数据，默认为FALSE。
（2）paste/paste0函数：用于连接字符（向量）， paste 可以设置连接字符，默认以空格作为连接字符； paste0 以空字符串连接字符，不能设置 sep 值。collapse 参数可以实现用 sep 连接后的字符向量的元素间的再次连接。具体举例参见认真聊一聊R语言中的paste/paste0函数

用常规的方法数据框名a在代码中重复出现，若想高效大量处理此数据框的数据，则可用到以下方法：

(1) attach

将数据框名添加到搜索环境中：attach（a）,作图时就只需输入列名(连$都不用了)

attach(a)
plot(case,values)
detach(a) #作图完成后将a删除出搜索环境

局限性：两个以上数据框的列名有冲突时，同时attach会报错；且若是某个向量名和数据框的列名相同时，索引该列名时会优先返回向量的值而非attach的数据框的值

(2) with

with函数就是把数据框作为环境，所有操作都限制在数据框上，举例：

with(a,{
 plot(case,values)
x<<-summary(values)   #求和并赋值给x,<<-的意思是作为全局变量，也就是出了大括号仍有效。
})
x #运行完后输出x

with函数的标准用法为：with(data ,expr, ...)
expr是指R语言的表达式，...代表要进行的修改
（1）只执行一个expr时：with(mydata ,cbind(a1,a2)) 即为调用mydata数据框中的a1,a2列； with(mydata ,a1+a2) 即为输出mydata数据框中a1与a2列数值之和。参见http://www.360doc.com/content/20/0306/10/52334415_897178228.shtml
（2）执行多个expr：将表达式写在大括号{}内，且expr表达式执行一条语句占一行，执行多条语句需要换行；或者多条语句在同一行，则中间应当用分号 ;隔开。
（3）使用with函数时，里面设置的变量在外部无法访问，在本例中若x赋值为x<-summary(values) ，则在with之外输出x时会报错，因此使用<<-的全局赋值符号。

学习小组D5笔记-年糕

一、从向量中提取元素

根据元素位置

根据值

二、数据框

读取数据

读取数据

数据框的导出

变量的保存与重新加载

提取元素

直接使用数据框中的变量

(1) attach

(2) with

猜你喜欢

热点阅读