生信星球培训第五期

学习小组Day6笔记-数据框的操作(李其龙)

2018-09-15  本文已影响2人  李其龙_ec81

加载tidyr包

加载包

数据框的简单操作

新建数据框

新建数据框

列名称后用等于
rep 重复的缩写 重复字符型gene5
times 表示三次
paste 这个函数很有趣 是粘贴 像是一个吸铁石 吸住前后两个字符 seq是间隔

提取test_frame中的列和行并查看属性

这个应用到昨天缩写


提取第一行
提取第一列

这里很有趣,第一列变成了因子。这个是由于本身的data.frame所局限的。

tidy data 的初步探索

建立测试数据框2

因为本身数据框不能接受特殊的行名,所以会在前面加上x。见数据科学P94页
使用fix函数修改一下


i理解gather
使用gather整理数据

将宽数据变成长数据格式,类似于reshape2中的melt函数
一般还会出现这种情况

 mtcars2 <- mtcars %>% gather(attribute, value, -carb)
#head(mtcars)
                  mpg cyl disp  hp drat    wt
Mazda RX4         21.0   6  160 110 3.90 2.620
Mazda RX4 Wag     21.0   6  160 110 3.90 2.875
Datsun 710        22.8   4  108  93 3.85 2.320
Hornet 4 Drive    21.4   6  258 110 3.08 3.215
Hornet Sportabout 18.7   8  360 175 3.15 3.440
Valiant           18.1   6  225 105 2.76 3.460
                   qsec vs am gear carb
Mazda RX4         16.46  0  1    4    4
Mazda RX4 Wag     17.02  0  1    4    4
Datsun 710        18.61  1  1    4    1
Hornet 4 Drive    19.44  1  0    3    1
Hornet Sportabout 17.02  0  0    3    2
Valiant           20.22  1  0    3    1



这里很明显的发现,gather没有转换mtcars2的carb数据

处理缺失值 来源生信星球截图

参考文档
https://www.cnblogs.com/nxld/p/6060533.html

上一篇 下一篇

猜你喜欢

热点阅读