R语言

数据框

2021-07-13  本文已影响0人  三点水的番薯

1. 数据框的属性

nrow行,rownames()行名
ncol列, colnames()列名

2. 数据框取子集

① 数据框$列名

按列取子集
df$Gene

②按坐标取子集

df[2,2]#第二行第二列
df[2,]#取第二行
df[,2]#取第二列
df[c(1,3),1:2]#取第一行和第三行的第1-2列

③按名字

df[,"gene]
df[,c("gene","change")]

④按条件

df[df$score>0,]
df$gene[df$score>0]#只要括号里的和括号外的可以对应起来就行了

3. 数据框修改

df$score <- c(10,20,30,40)#给列名为score这一列修改数值
df$P.value <- c(0.01,0.02,0.03,0.05)#新加入一列P.value
#现有列名就是修改,新出现的列名就是新增

4.去除含有缺失值的行

na.omit(df)

5.两个表格连接

cbind按列连接
rbind按行连接

思考Q

图片来自生信技能书.png

回答A

load("matchtest.Rdata")
table(x$file_name%in%colnames(y))#x的列名都存在于y中
z=x$file_name[match(colnames(y),x$file_name)]#将序列排成一致的
identical(z,colnames(y))#判断两个变量是否完全一致,TRUE是完全一致,反之则不是
#一句代码分析完成的版本
colnames(y)=x$ID[match(colnames(y),x$file_name)]
上一篇 下一篇

猜你喜欢

热点阅读