2020-10-29 学习小组Day6--文惠

2020-10-29  本文已影响0人  Sally_wen

R包安装,有多种方法:包括install.package装载和直接下载R包拖进文件夹

dplyr包用法不是很熟悉,重点写一下:
test <- iris[c(1:2,51:52,101:102),]

  1. 新增一列:mutate(test, new = Sepal.Length * Sepal.Width)
    其中new即是新一列数据的名字

  2. 筛选列的功能感觉不是特别好用,和[,n]用法类似
    select(test,c(n,m))或者c(n,m)换成列名也可

  3. filter功能蛮好用的,与which的用法类似,但更简单
    filter(test, Species == "setosa")
    filter(test, Species == "setosa"&Sepal.Length > 5 ) 和which函数一致,表示且用&
    filter(test, Species %in% c("setosa","versicolor"))

  4. arrange()函数对数据进行排序(是针对某一列的数据,对整个表格改变顺序)
    arrange(test, Sepal.Length)默认的是从小到大,如果要变成从大到小换成desc(Sepal.Length)即可

  5. %>%管道操作,其实不太明白

  6. count(test,Species)统计出现次数

  7. 连接函数,其实不如用merge函数,但反连接:返回无法与y表匹配的x表的所记录anti_join
    anti_join(x = test2, y = test1, by = 'x')
    test1 <- data.frame(x = c(1,2,3,4), y = c(10,20,30,40))

上一篇下一篇

猜你喜欢

热点阅读