R语言数据框2021.1.29
2021-01-29 本文已影响0人
R语言_茶味先生
数据框
一、定义
数据框是一种表格式的数据结构,与excel原表很像,形状上很像矩阵,每一列必须同一类型,每一行可以不同。数据框旨在模拟数据集,与其他统计软件例如SAS或者SPSS中的数据集的概念一致。数据集通常是由数据构成的一个矩形数组,行表示观测,列表示变量。不同的行业对于数据集的行和列叫法不同。
数据框实际上是一个列表。列表中的元素是向量,这些向量构成数据框的列,每一列必须具有相同的长度,所以数据框是矩形结构,而且数据框的列必须命名。
——引用自B站基因学苑up主教学视频中的一段文字
二、数据框与矩阵的区别
1、数据框形状上很像矩阵;
2、数据框是比较规则的列表;
3、矩阵必须为同一数据类型;
4、数据框每一列必须同一类型,每一行可以不同。
三、创建数据框
我们如果想将数据存储到R中进行进行分析,只需要每个数据单独存储为一个向量,用data.frame()函数合并即可。
state<-data.frame(state.name,state.abb,state.region,state.x77)
四、访问数据框
1.访问数据框子集合
数据框访问数据和向量,列表等类似
- 用数据框名称[数值],例如state[1]输出数据框第一列。
- 用数据框名称[数组],例如state[c(2,4,6)]输出数据框第2,4和6列。
这种访问方法会输出数据的列命和对应元素值
2.访问数据框子集合(不包含字段名称)
例如:
- 索引访问: state[,2]
- 字段访问:state[,"state.abb"]
- $符号访问(大佬推荐使用),不是数据框则没有办法用$:
state$state.abb
- attach函数访问:attach(数据框名)加载数据框到R搜索目录中,运行该命令后就可以在当前窗口中直接输入数据框列的名字就可以了,使用完数据之后可以使用detach(数据框名)取消加载。
- with函数访问:with函数也可以完成和attach类似的功能,形如**with(数据框名,{数据框中列的名字})
- 双中括号访问:[[ ]]与列表用法相似,返回是向量
3.访问数据框元素
输入对应行和列即可输出对应元素
例如:
- 索引访问: state[1,2]
- 字段访问:state["Alabama","state.abb"]
4.计算数据框的长度和宽度 - dim(数据框名称)
- length(数据框名称)
- 计算某一列长度length(数据框名称$列名)
五、删除数据框子集合
- 负索引方法
用数据框名称[-数值],例如state[-1]删除数据框第一列。同样的,用数组的方法可以一次删除多列。 - 赋空值方法
将数据框某一列赋值为NULL,以达到删除目的
state[5]<-NULL
attach():加载数据框到R搜索目录中