Day 5 - Data structure
2020-03-17 本文已影响0人
咚_e4c6
Day 5.pngLunaprimRose 2020.03.17
Vector
原子型向量就是最简单的包含数据的向量
- 在
R
中,最简单的对象类型叫做原子型向量(atomic vector) - 在
R
中,可以将一组数据用c
函数组合在一起,形成一个原子型向量
die <- c(1,2,3,4,5,6)
die
[1] 1 2 3 4 5 6
is.vector(die) # is.vecrot 用来测试某个对象是否为原子型向量
[1] TRUE
- 在
R
中,可以生成只含有一个值的原子型向量
five <- 5
five
[1] 5
is.vector(five)
[1] TURE
length(five) # length 函数返回原子型向量的长度
[1] 1
-
每一个原子型向量都将其值存储在一个一维向量中,并且只能是一种类型的数据
- 双整型 双整型向量用来存储普通的数值型数据
die <- c(1,2,3,4,5,6) die [1] 1 2 3 4 5 6 typeof(die) [1] "double"
- 整型 整型向量用来存储整型的数据,不需要小数点成分
int = c(-1L,2L,4L) int [1] -1 2 4 typrof(int) [1] "interger"
- 字符型 字符型向量存储一小段文本,字符型向量中的单个元素称作字符串(
srting
)
text <- c("Hello","World") text [1] "Hello" "World" typeof(text) [1] "character" typeof("World") [1] "character"
- 逻辑型 逻辑型向量用来存储
TRUE
(真)和FALSE
(假),这是R
中布尔数据的表现形式
3 > 4 [1] FALSE logic <- c(TRUE,FALSE,TRUE) logic [1] TRUE FALSE TRUE typeof(logic) [1] "logical"
- 复数类型 复数类型向量用来存储复数
comp <- c(1 + 1i,1 + 2i,1 + 3i) comp [1] 1+1i 1+2i 1+3i typeof(comp) [1] "complex"
- 原始类型 原始类型向量用来存储数据的原始字节
raw(3) [1] 00 00 00 typeof(raw(3)) [1] "raw"
Data Frame
数据框是列表的二维版本
-
数据框将向量组织在一个二维的表格之中
-
每一个向量都是这个表格中的一列
-
数据框中的每一列都可以用来存储一种类型的数据
-
列与列之间的数据类型可以不同
-
每一列中的所有元素都必须是同一种类型的数据
-
数据框中的每一列都必须具有相同的长度
df <- data.frame(face = c("ace","two","six"),
suit = c("clubs","clubs","clubs"),value = c(1,2,3))
df
face suit value
1 ace clubs 1
2 two clubs 2
3 six clubs 3
Sign system of R
可以通过 R 的记号体系来实现 R 对象中值的选取
- 正整数索引
deck[i,j]
会返回deck
数据框中第i
行第j
列的元素
head(deck)
face suit value
1 king spades 13
2 queen spades 12
3 jack spades 11
4 ten spades 10
5 nine spades 9
6 eight spades 8
deck[1,1]
[1] "king"
- 要提取多个值,使用正整数向量代替单一整数作为索引
deck[1,c(1,2,3)]
face suit value
1 king spades 13
- 如果在索引中重复某个数值,
R
就会在相应的索引位置重复提取相应的数据,在最后的“数据子集”中重复出现
deck[c(1,1),c(1,2,3)]
face suit value
1 king spades 13
1.1 king spades 13
- 负整数索引 在索引时使用负整数返回的元素将不包括负整数索引所对应的元素
deck[-(2:52),1:3]
face suit value
1 king spades 13
- 零索引 在索引时使用0会返回一个空的对象
deck[0,0]
data frame with 0 columns and 0 rows
- 空格索引 使用空格索引提取该索引所代表维度的所有元素
deck[1,]
face suit value
1 king spades 13
- 逻辑值索引 如果在索引时提供一个包含
TRUE
和FALSE
逻辑值的向量,会匹配索引值为TRUE
的行位置(或者列)并提取出相应的元素,而忽略所有索引值为FALSE
的行位置
deck[1,c(TRUE,TRUE,FALSE)]
face suit
1 king spades
row <- c(TRUE,F,F,F,F,F)
deck[row,]
face suit value
1 king spades 13
- 名称索引 被索引的对象由名称属性,可以采用待提取元素的名称作为索引值
deck[1,c("face","suit","value")]
face suit value
1 king spades 13
deck[,"value"]
[1] 13 12 11 10 9 8