生信星球培训第123期

学习小组Day5笔记-阿树

2021-09-28  本文已影响0人  浮出海面_d825

思维导图

Day5

tip:使用?read.table查看read.table帮助文档

一、向量

1、几个赋值函数

x<-c(1,2,3) #由元素1,2,3组成的向量
x<-1:10 #1到10之间的所有**整数**
x<-seq(1,10,by=0.5) #1到10范围内每0.5取一个数
x<-rep(1:3,2) #1到3之间的所有整数,重复两次
image.png

2、从向量中提取标量
(1)根据元素位置

x[4] #x第4个元素
x[-4]#排除法,除了第4个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)] #第1个和第5个元素
image.png

(2)根据值

x<-1:10
x
a<-x[x==10]#等于10的元素
a
a<-x[x>5]
a
a<-x[x %in% c(1,2,11)]#存在于向量c(1,2,11)中的元素
a
image.png

二、数据框

在目录下新建的

使用`X<-read.csv('doudou.txt')读取


NA表示空值

(1)读取本地数据

read.table(file="huahua.txt",sep="\t",header=T)
a<-read.table(file="huahua.txt",sep="\t",header=T)
a

sep 是函数的形式参数,多数情况下, sep 参数用来指定字符的分隔符号。不仅用在你所提到的输出,也用在输入,也用在字符串的合并与拆分上。csv 文件是用逗号分隔的,故而 sep = "," txt文件是用制表符分隔的,故而 sep = "\t" 常用的分隔符还有空格 sep = " "分隔符是任意的。
使用read.table函数读入,txt文件可以不用指定sep,csv文件指定sep=",",不指定不会报错但是会出现你读入的数据只有一列的情况。
使用read.csv函数读入,txt文件必须指定sep="\t",读入csv文件不强制指定sep参数,因为默认sep=','。
header=TRUE代表读入数据时将第一行作为列名(若是FALSE则相反,不使用文件中第一行作为列名),也可以简写问header=T(或是header=F)
(来自:https://www.cnblogs.com/hanweiblog/p/9281854.html

image.png

(2)设置行名和列名

X<-read.csv('doudou.txt') #变量X是数据框
colnames(X) #查看列名
rownames(X) #查看行名,默认值的行名就是行号,1.2.3.4...
colnames(X)[1]<-"bioplanet" #有的公司返回数据,左上角第一格为空,R会自动补为x,用这个命令来修改(改名为bioplanet)
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1) #最后row.names的意思是修改第一列为行名
结果如图

(3)数据框的导出

write.table(X,file = "yu.txt",sep = ",",quote=F) 

sep=","表示分隔符改为逗号,quote=F表示字符串不加双引号(默认格式带由双引号)

(4)变量的保存与重新加载

save.image(file="bioinfoplanet.RData")#保存当前所有变量
save(X,file="test.RData")#保存其中一个变量
load("test.RData")#再次使用RData时的加载命令

(5)提取元素

X[x,y]#第x行第y列
X[x,]#第x行
X[,y]#第y列
X[y] #也是第y列
X[a:b]#第a列到第b列
X[c(a,b)]#第a列和第b列
X$列名#也可以提取列

(6)【选修部分】直接使用数据框中的变量
iris是R语言的内置数据,可以直接使用。提取某两列作散点图:
sepal length(花萼长度) sepal width(花萼宽度)

plot(iris$Sepal.Length,iris$Sepal.Width)
散点图

脚本的使用和保存:


我保存的脚本文件

脚本文件的后缀就是R

作业:

save(X,file="test.RData")这句代码如果报错object X not found,说明没有找到X,可能是被赋值的是x而不是X,或者前面的代码里没有给X进行赋值。

上一篇下一篇

猜你喜欢

热点阅读