R语言学习

R语言可视化及作图1--基础绘图(par函数,散点图,盒形图,条

2021-04-21  本文已影响0人  Hayley笔记

R语言绘图系统
基础绘图包 ⚠️
Lattice (语法复杂)
ggplot2家族 ⚠️
其他,比如:sjplot; plots; plotrix...

1. 基础绘图包的绘图函数

高级绘图函数

函数 含义
plot() 绘制散点图等多种图形
hist() 频率直方图
boxplot() 箱线图
stripchart() 点图
barplot() 柱状图
dotplot() 点图
pieplot() 饼图
matplot() 数字图形

低级绘图函数见R语言可视化及作图2--低级绘图函数

2. par函数(进行绘图参数的设置)

参数 含义
bg 设置背景颜色
bty 设置边框
cex 设置字符和点的大小
col 设置颜色 有657种颜色可供选择
family 设置字体格式 (family='serif'就是times new roman字体)
font 改变字体风格 如粗体黑体斜体等等
lab 定义图片的x轴和y轴,传入的是字符串
las 定义坐标轴上刻度的和坐标轴的关系(垂直还是平行)
lend 设置线段两端的格式,比如方角,圆角等
lty 线的形式。实线/虚线/点划线等等
lwd 设置线的粗细 默认为1
mai mar mex 调整画布的大小
mar 定义图形上下左右距离边框的距离
mfcol mfrow 切分画布大小(如:mfrow=c(2,2) 就是把画布切分为四部分,可以在一张画布上画四张图)
pch 点的形状(25种)
srt 定义图中字体的角度
tck 定义坐标轴上刻度的长短和方向
xpd 当xpd设置为NA的时候,画图区域就是整个画布了
xlog 对x轴取log值
ylog 对y轴取log值
fig和new 当new参数定义为TRUE时,是在原有图形上添加一张新图,而fig参数定义的是新图形四个角的坐标位置。(new参数默认为FALSE,也就是新生成一张图)
bty=c('o','l','7','c',']','u') #将bty所有格式设置为 一个向量
par(mfrow=c(3,2)) #切分画布
for (i in 1:6){
  par(bty=bty[I])
  plot(1:5,main = paste('the bty is',bty[i],sep = ':'))
}
bty参数
plot(rep(1:5,times=5),rep(1:5,each=5),pch=1:25,cex=1.5,bty='l',xlim=c(1,5.4))
text(rep(1:5,time=5)+0.15,rep(1:5,each=5),labels=1:25,col='red')
pch参数。R语言中默认有25种点的形式

3. 散点图 plot函数

type=c('p','b','l','s','o','n')
par(mfrow=c(2,3))
for (i in 1:6){plot(1:10,type=type[i],main=paste('The plot type is: ',type[i]))} 

4. box plot盒形图

par(mfrow=c(1,3)) #mfrow设置横轴可以画三张图
set.seed(100)
data=rnorm(40)
boxplot(data,range=0.5,xlab='range is 0.5') #range determines how far the plot whiskers extend out from the box. 
boxplot(data,range=1,xlab='range is 1')
boxplot(data,range=1.5,xlab='range is 1.5')

boxplot(len~dose,data = ToothGrowth,#根据dose对len画图
        boxwex=0.25,at=1:3-0.2,
        #boxwex设置盒子宽度,at参数定义了盒形图中盒子横坐标的位置,传入一个向量,也就是1-0.2=0.8,2-0.2=1.8,3-0.2=2.8)
        subset = supp=='VC',col='orange',
        names=c('dose=0.5','dose=1.0','dose=2.0'),
        main="Guinea Pigs' Tooth Growth",
        xlab='Vitamin C dose mg',
        ylab='Tooth Length',
        xlim=c(0.5,3.5),ylim=c(0,35),yaxe='i') #xlim和ylim设置xy轴的取值范围,yaxe设置y轴样式

boxplot(len~dose,data = ToothGrowth, add = TRUE, #在原有图上增加新图
        boxwex=0.25,at=1:3+0.2,
        names=c('dose=0.5','dose=1.0','dose=2.0'),
        subset = supp=='OJ',col='yellow')

#准备数据 
names=c(rep('Maestro',20),rep('Presto',20),
        rep('Nerak',20),rep('Eskimo',20),rep('Nairobi',20),rep('Artiko',20))
value=c(sample(3:10,20,replace = T),sample(2:5,20,replace = T),sample(6:10,20,replace = T)
        ,sample(6:10,20,replace = T),sample(1:7,20,replace = T),sample(3:10,20,replace = T))
data=data.frame(names,value)

boxplot(data$value~data$names,
        col=ifelse(levels(data$names)=='Nairobi',rgb(0.1,0.1,0.7,0.5),
                   ifelse(levels(data$names)=='Eskimo',rgb(0.8,0.1,0.3,0.6),'grey90')),
        ylab='disease',xlab='-variety-') #没有颜色不知道为什么
legend('bottomleft',legend = c('Positive control','Negative control'),
       col=c(rgb(0.1,0.1,0.7,0.5),rgb(0.8,0.1,0.3,0.6)),bty='n',pch=20,pt.cex = 3,)

order_name <- with(data,reorder(names,value,median,na.rm=TRUE))
boxplot(data$value~order_name,col='darkorchid',ylab='disease',xlab='-variety-') #按均值排列

5. bar plot 条形图(离散型数值)

data <- sample(c(50:80),5)
barplot(data,col=heat.colors(5))

my_matrix <- matrix(data=sample(10:40,9),nrow = 3,dimnames = list(c('A','B','C'),paste('dose',1:3)))
my_matrix
barplot(t(my_matrix),beside = TRUE,col = rainbow(3))

par(mfrow=c(2,2))
average_gdp <- c(6500,8000,13000,9200)
country <- c('China','Korea','Japan','Singapore')
barplot(average_gdp,names.arg=country)
barplot(average_gdp,names.arg=country,horiz=TRUE)
barplot(average_gdp,names.arg=country,horiz=FALSE,width=0.5)
barplot(average_gdp,names.arg=country,horiz=FALSE,space=1.2)

#加error bar(基础绘图包中不能直接添加,需要手动添加,ggplot2可以直接添加)
data(iris)
data_mean <- apply(iris[,1:3],2,mean)#生成均值
data_sd <- apply(iris[,1:3],2,sd)#生成标准差
barcenters <- barplot(data_mean,name.arg=names(data_mean),ylim=c(0,8),main='ugly')
barcenters
#将barplot()存入一个对象中,这个对象保存的是条柱中心位置的横坐标。这一步的目的是找到三个bar的横坐标最中心,用于确定error bar的位置
segments(barcenters,data_mean-data_sd,barcenters,data_mean+data_sd,lty=1.2) #添加中间的线段
arrows(barcenters,data_mean-data_sd,barcenters,data_mean+data_sd,code = 3,angle = 90) #添加上下的横杠

6. hist 直方图(连续型数值)

op <- par(mfrow=c(2,3))
data <- rnorm(100,10,5)
hist(data,col = 'light green')
hist(data,col='sky blue',breaks = 10) #分成10组(break传入数值表示分成多少组)
hist(data,col = 'orange',breaks = seq(-5,25,1)) #自定义组距(break也可通过seq()设置组距)
hist(data,col = 'pink',breaks = seq(-5,25,1),density = TRUE) #加shading line
hist(data,col = 'pink',breaks = seq(-5,25,1),freq = FALSE) #概率密度图
lines(density(data),col='blue',lty=1,lwd=2)
#添加概率密度曲线。注意:添加概率密度曲线前,一定要把freq设置成FALSE。
par(op) #释放参数


#同向叠加直方图
titanic <- carData::TitanicSurvival
#数据读入
hist(titanic$age,main = 'Passenger Survival by Age',xlab = 'Age',col = 'sky blue',breaks = seq(0,80,2))
hist(titanic$age[which(titanic$survived=='no')],col = 'orange',add=TRUE,breaks = seq(0,80,2)) #在原图上添加一个死亡人数的直方图


#背靠背直方图
df=data.frame(x=rnorm(100),x2=rnorm(100,mean = 2)) #创建数据
h1=hist(df$x,plot=FALSE)
h2=hist(df$x2,plot = FALSE)
#绘制两个直方图,储存在h1和h2这两个对象中
h2$counts=-h2$counts
#将h2的值反转过来
hmax=max(h1$counts)
hmin=min(h2$counts)
#这两步是为了找到y轴的取值范围
X=c(h1$breaks,h2$breaks)
xmax=max(X)
xmin=min(X) #这三步是为了找到x轴的取值范围
plot(h1,ylim = c(hmin,hmax),col = 'green',xlim = c(xmin,xmax))
lines(h2,col='blue')#注意,用敌机会图函数lines将h2添加上去
上一篇下一篇

猜你喜欢

热点阅读