数据处理-4(基于R语言)
2021-03-14 本文已影响0人
北欧森林
- 保存tiff图片:
tiff(filename = "nom.tif", width = 600, height = 900)
-
sample()
抽样函数
sample(c(1,2,3,4), 100, replace=TRUE, prob=c(0.15, 0.2,0.3,0.35))
3.factor(x = character(), levels, labels = levels)构造一个因子序列。x为原数据,levels是x中的不同水平,labels是与x中每个水平对应的标签。
x <- c("Man", "Male", "Man", "Lady", "Female")
xf <- factor(x, levels = c("Male", "Man" , "Lady", "Female"),
labels = c("Male", "Male", "Female", "Female"))
xf
#[1] Male Male Male Female Female
#Levels: Male Female
- R中的管道符号为“%>%”。如果要使用管道,需要加载
magrittr
包。其实Rstudio出的各种包都默认支持管道,如果加载了tidyverse
包也是可以。
library(magrittr)
library(ggplot2)
mtcars %>% ggplot(aes(x=cyl,y=mpg,group=cyl))+geom_boxplot()
- 默认加载包
如果一些包经常使用,想要启动R之后自动加载,可以在配置文件中进行设置,例如每期启动R,自动加载ggplot2包。
# Method 1
file.edit("~/.Rprofile")
.First <- function() {
library(ggplot2)
}
# Method 2
local({old <- getOption(“defaultPackages”)
options(defaultPackages = c(old, “ggplot2”))})
- 在绘图的时候,想要快速设置几个不同的颜色,又嫌生成颜色比较麻烦。可以使用rainbow()函数,给定一个数据,快速生成颜色。
rainbow(4)
#[1] "#FF0000" "#80FF00" "#00FFFF" "#8000FF"
- ggplot2中,使用%+%替换画图数据
library(tidyverse)
p1 %+% dat2
- 交集
intersect()
、并集union()
、找不同setdiff()
# 找x中不同于y的元素
setdiff(x, y)
# 找y中不同于x的元素
setdiff(y, x)
- 查看R包里有哪些函数(要先加载这个R包)
ls("package:clusterProfiler")
- 不等长合并
M1.dplyr
包
dplyr::bind_rows() #不匹配到的放在最后,且等于NA
M2.plyr
包
rbind.fill 函数可以很好将数据进行合并,并且补齐没有匹配到的缺失值为NA。
rbind.fill 函数只能合并数据框格式
source: https://blog.csdn.net/sinat_26917383/article/details/50676894