R语言学习笔记-0626
作图技巧补充
问题:在R中,设置了par(mfrow=c(2,2))一个2*2的网格,后面想只画一张图,如何清楚这个设置?
par(mfrow=c(1,1))是一个办法,但绝不是最正确的那个。
RStudio中,有按钮可以清除。
操作示例
barplot,柱状图
main,标题,xlab,横轴名称,ylab,纵轴名称,horiz=TRUE,横向分布。
未标注horiz horiz=TRUE 未表明beside beside=TRUEbeside=TRUE,将三个内容横向排列,而不是堆积。
pie chart 饼图
edges,整个图形的面积(不是饼图面积),radius饼图的半径,默认0.8。
左radius=1;右radius=5paste函数,连接字符串。sep参数,将每个标签内容分开。
paste(c('A','B','C'),c(1,2,3),sep = '-')
## [1] "A-1" "B-2" "C-3"
#此外需要注意的是如果传入的两个或多个对象的长度不一样,对应关系会发生变化,比如
paste(c('A','B','C','D','E'),c(1,2),sep = '-')
## [1] "A-1" "B-2" "C-1" "D-2" "E-1"
来源:CSDN用户 蓝翔肄业博士后
3D 饼图
plotrix包里的pie3D函数
explode参数,分离程度。
反斜杠+n \n 换行。
标题换行了,标签内容也换行了mytable <- table(state.region)
lbls3 <- paste(names(mytable),"\n",mytable,sep="")
pie(mytable,labels=lbls3,
main = "Pie Chart from a Table\n(with sample size)",
edges=300,radius=1)
扇形图
par(mfrow=c(1,1))
slices <- c(10,12,4,16,8)
lbls <- c("US","UK","Australia","Germany","France")
fan.plot(slices,labels=lbls,main="Fan plot")
点图
dotchart函数,cex,点的大小。
dotchart(mtcars$mpg,
labels=row.names(mtcars),cex=0.9,
main="Gas Mileage for Car Models",
xlab="Miles Per Gallon")
散点图,纵横坐标都是数值,点图,某个坐标是数值,另一个不是,如下图,纵坐标是值对应的标签。
点图
一些统计学的基本方法
概览
head函数,取前几行的数据,用于概览。
summary,看每个变量的数据特征,最小值,4分位数,平均值,中位数,最大值。
表格
table,对每个变量内的数据进行分类计数。
计数table(cyl)
4有11个,6有7个,8有14个。
table(cut(mpg,seq(10,34,by=2)))
把mpg分为几组,10为起点,34为终点,每组相隔2。
分组相关 correlation
cov,协方差。
var,方差,当输入的数据有多组的变量时,var自动识别,两两分析他们的关系。
cor,即correlation,相关性系数。
cov(states)
var(states)
cor(states)
T检验
x = rnorm(100,mean = 10, sd = 1)
y = rnorm(100,mean = 30, sd = 10)
t.test(x,y,alt = "two.sided",paired=TRUE)
paired=TRUE,一一对应。
T检验P值非常小,XY有显著的差异。
P值 >0.5P大于0.05,即可认为无显著差异。
wilcoxon检验
秩和检验;符号秩和检验;威尔科克森。
P值也是极小。因为设置了alt="less",所以证明的是y大于x。
y明显大于x
案例
nortest包
验证是不是正态分布,其中很多检验方法。
P值大于0.05,算正态分布。
箱型图显示正态分布 直方图显示,满足正态分布P值极小,不是正态分布。
箱型图显示,似乎是正态分布 直方图显示,数值太少