学习小组Day6笔记-数据框的操作(李其龙)
2018-09-15 本文已影响2人
李其龙_ec81
加载tidyr包
加载包数据框的简单操作
新建数据框
新建数据框列名称后用等于
rep 重复的缩写 重复字符型gene5
times 表示三次
paste 这个函数很有趣 是粘贴 像是一个吸铁石 吸住前后两个字符 seq是间隔
提取test_frame中的列和行并查看属性
这个应用到昨天缩写
提取第一行
提取第一列
这里很有趣,第一列变成了因子。这个是由于本身的data.frame所局限的。
tidy data 的初步探索
建立测试数据框2因为本身数据框不能接受特殊的行名,所以会在前面加上x。见数据科学P94页
使用fix函数修改一下
i理解gather
使用gather整理数据
将宽数据变成长数据格式,类似于reshape2中的melt函数
一般还会出现这种情况
mtcars2 <- mtcars %>% gather(attribute, value, -carb)
#head(mtcars)
mpg cyl disp hp drat wt
Mazda RX4 21.0 6 160 110 3.90 2.620
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875
Datsun 710 22.8 4 108 93 3.85 2.320
Hornet 4 Drive 21.4 6 258 110 3.08 3.215
Hornet Sportabout 18.7 8 360 175 3.15 3.440
Valiant 18.1 6 225 105 2.76 3.460
qsec vs am gear carb
Mazda RX4 16.46 0 1 4 4
Mazda RX4 Wag 17.02 0 1 4 4
Datsun 710 18.61 1 1 4 1
Hornet 4 Drive 19.44 1 0 3 1
Hornet Sportabout 17.02 0 0 3 2
Valiant 20.22 1 0 3 1
这里很明显的发现,gather没有转换mtcars2的carb数据