学习小组Day5笔记——冬梅
2020-03-07 本文已影响0人
冬梅_afe6
生信星球学习笔记-Day4
新手须知
Console输入命令相当于linux的命令行
R的代码都是带括号的,括号必须是英文的
表格在R语言中改名叫数据框
? 查看帮助文档
重点数据类型:向量(vector)、数据框(Data frame)
向量
标量是一个元素组成的变量,向量是多个元素组成的变量
从向量中提取元素
a <- c(1,11,2,3,4,5,7,6,8,9,0) #赋值
a[2] #根据元素位置提取元素
[1] 11
a[a %in% c(1,2,5)] #根据值提取元素
[1] 1 2 5
a[-c(2,4)] #删除第二个和第四个
[1] 1 2 4 5 7 6 8 9 0
a
[1] 1 11 2 3 4 5 7 6 8 9 0
提取值不影响向量
数据框
将示例数据放在你的工作目录下(!!!重要)
读取本地数据###
read.table(file = "huahua.txt",sep="\t",header = T)
X1 X2
1 A 1
2 B NA
3 C NA
4 D 3
5 E NA
read.table(file = "huahua.txt",sep="",header = T)
Error in scan(file = file, what = what, sep = sep, quote = quote, dec = dec, :
line 2 did not have 2 elements
>
> read.table(file = "huahua.txt",sep="",header = T)
X1 X2
1 A 1
2 B 2
3 C 2
4 D 3
5 E 2
> read.table(file = "huahua.txt",sep="\t",header = F)
V1 V2
1 X1 X2
2 A 1
3 B
4 C
5 D 3
6 E
sep="",以空白分隔文件;sep="\t",文件中有空值使用这个代码,直接使用sep=""会报错
header = T是指第一行为变量名且第一行比其他行少一个字段,可以给列命名
设置行列名###
> X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)
> colnames(X)
[1] "X2"
> rownames(X)
[1] "A" "B" "C" "D" "E"
> X
X2
A 1
B NA
C NA
D 3
E NA
colnames(X)查看列名
rownames(X)查看行名
row.names=1将第一列作为行名
CSV 逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号)
数据框的导出###
write.table(X,file = "yu.txt",sep = ",",quote=F)
> x
Error: object 'x' not found
> X
X2
A 1
B NA
C NA
D 3
E NA
分隔符改为逗号,字符串不加双引号

大小写是不同的
变量的保存与重新加载
save.image(file="bioinfoplanet.RData") #保存当前所有变量

save(X,file="test.RData") #保存其中一个变量

load("test.RData") #再次使用RData时的加载命令
提取元素
X[x,y],第x行第y列
> X<-read.csv('doudou.txt')
> X[,2]
[1] 1 NA NA 3 NA
