欧剑虹老师BOOK学习记录:第一章 R/Bioconductor
2019-05-04 本文已影响29人
热衷组培的二货潜
首先最重要的参考链接:
image.png啊啊啊,如有侵犯版权, 麻烦请私信我,看到立马删除!
主要用来记录自己可能要用的一些知识点。(基本复制粘贴,建议直达链接)
欧剑虹老师BOOK学习记录:第一章 R/Bioconductor入门(1)
欧剑虹老师BOOK学习记录:第一章 R/Bioconductor入门(2):生物字符串 Biological strings
这一节可以学到,外加一句:基础函数强大超乎你的想象!!!
- 如何保存一个图像?
- 如何绘制散点图?
- 如何绘制饼图?
- 如何绘制箱线图?
- 如何绘制线图?
- 如何绘制柱状图?
保存图像
- 格式
XXX("xxx.XXX")
绘图代码
dev.off()
## 保存为PDF文件(好喜欢这种类型的总结,自己又懒得去总结)
pdf("output.pdf"); plot(wt, mpg); dev.off()
## 保存为WMF文件
win.metafile("output.wmf"); plot(wt, mpg); dev.off()
## 保存为PNG文件
png("output.png"); plot(wt, mpg); dev.off()
## 保存为JPEG文件
jpeg("output.jpg"); plot(wt, mpg); dev.off()
## 保存为BMP文件
bmp("output.bmp"); plot(wt, mpg); dev.off()
## 保存为PS文件
postscript("output.ps"); plot(wt, mpg); dev.off()
散点图和趋势图
-
一维散点图:
dotchart
- 看到这个图我想到了GO富集分析等涉及分类的可视化中的图完全可以采用此包
> head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
> x <- mtcars[order(mtcars$mpg),] # 将数据按照mpg列数据大小来排序
> x$cyl <- factor(x$cyl) # cyl转换成factor
# 这一段也可以使用ifelse以及tidyverse包中的case_when函数指定,推荐后者
> x$color[x$cyl==4] <- "red" # 指定cyl为4时,颜色用红色
> x$color[x$cyl==6] <- "blue" # 指定cyl为6时,颜色用蓝色
> x$color[x$cyl==8] <- "darkgreen" # # 指定cyl为4时,颜色用墨绿色
> dotchart(x$mpg,labels=row.names(x),cex=.7,groups= x$cyl,
+ main="Gas Milage for Car Models\ngrouped by cylinder",
+ xlab="Miles Per Gallon", gcolor="black", color=x$color)
顺带放一个参考了万年了的被我收藏在QQ表情图中的case_when
实例, 自行比较一下 ifelse
和case_when
的区别。
- 按汽缸数分组不同车型油耗
- 二维散点图使用plot函数。直趋势线使用abline函数,拟合曲线在拟合后使用line函数绘制。
> attach(mtcars)
> plot(wt, mpg, main="Scatterplot Example",
+ xlab="Car Weight ", ylab="Miles Per Gallon ", pch=19)
# 添加拟合曲线
# http://www.360doc.com/content/13/0418/08/11922517_279125397.shtml (R语言曲线拟合函数)
> abline(lm(mpg~wt), col="red") # 渐近线 (y~x) # 线性回归方法
> lines(lowess(wt,mpg), col="blue") # lowess line (x,y) # 局部回归的方法
- 曲线使用lines函数。其type参数可以使用"p", "l", "o", "b", "c", "s", "S", "h", "n"等。
-
通过
for
循环来批量绘图,有时候明明你都会,但是思维很重要
。
> x <- c(1:5); y <- x
> opar <- par(pch=22, col="blue") # 使用蓝色绘制散点
> par(mfrow=c(2,4)) # 将画布分割成两行四列
> opts <- c("p","l","o","b","c","s","S","h")
> for(i in 1:length(opts)){
+ heading <- paste("type=", opts[i], sep="")
+ plot(x, y, main=heading)
+ lines(x, y, type=opts[i])
+ }
> par(opar)
注意!
: R语言笔记--par()函数详解
- 通过par( )函数对图形参数进行设置后,当需要还原为系统默认值时又该如何做呢?有两种方式可实现:
- 一是在调用
par()
函数设置图形参数之前先执行op <-par(no.readonly=TURE)
保存系统当前的环境,待需要还原时执行par(opar)
即可; - 二就是
直接关闭图形对话框
,下次重新打开时即为默认设置。
- 一是在调用
柱状图
- 普通的柱状图使用
barplot
函数。其参数horiz=TRUE
表示水平画图,beside=TRUE
表示如果是多组数据的话,并排画图,否则原位堆叠画图。
> op <- par(mfrow=c(1,2)) # 创建一个一行两列的画布
> counts <- table(mtcars$vs, mtcars$gear) # 使用table函数进行计数
> barplot(counts, main="Car Distribution by Gears and VS",
+ xlab="Number of Gears", col=c("darkblue","red"),
+ legend = rownames(counts),horiz=TRUE)
> barplot(counts, main="Car Distribution by Gears and VS",
+ xlab="Number of Gears", col=c("darkblue","red"),
+ legend = rownames(counts), beside=TRUE)
> par(op)
- 柱状统计图使用
hist
函数。其breaks
参数设置每组的范围,比如1:5
。可以使用loess
回归后计算出一条拟合曲线。对于hist图像,还可以使用density
函数拟合曲线。
> h <- hist(mtcars$mpg, breaks=12)
> h
$`breaks`
[1] 10 12 14 16 18 20 22 24 26 28 30 32 34
$counts
[1] 2 1 7 3 5 5 2 2 1 0 2 2
$density
[1] 0.031250 0.015625 0.109375 0.046875 0.078125 0.078125 0.031250 0.031250 0.015625 0.000000 0.031250 0.031250
$mids
[1] 11 13 15 17 19 21 23 25 27 29 31 33
$xname
[1] "mtcars$mpg"
$equidist
[1] TRUE
attr(,"class")
[1] "histogram"
> lo <- loess(h$counts~h$mids)
> x<- seq(min(h$breaks), max(h$breaks), (max(h$breaks)-min(h$breaks))/1000)
# 表示之前的breaks指定的从最小值到最大值分成1000个bin。
> lines(x, predict(lo, x), col="red")
> dens<-density(mtcars$mpg) # mpg的分布密度
> dens
Call:
density.default(x = mtcars$mpg)
Data: mtcars$mpg (32 obs.); Bandwidth 'bw' = 2.477
x y
Min. : 2.97 Min. :6.481e-05
1st Qu.:12.56 1st Qu.:5.461e-03
Median :22.15 Median :1.926e-02
Mean :22.15 Mean :2.604e-02
3rd Qu.:31.74 3rd Qu.:4.530e-02
Max. :41.33 Max. :6.795e-02
> t <- dens$n * length(dens$x) / sum(h$counts) / length(h$counts) / sum(h$density) # 这里没咋看懂。。。
# dens$n 32
# length(dens$x) 512
# sum(h$counts) 32 表示mpg中统计的数值的个数
# length(h$counts) 12 表示区间的个数
# sum(h$density) 0.5
> lines(dens$x,dens$y*t,col="blue")
饼图: 直接使用
pie
函数即可
> x<-table(mtcars$gear)
> pie(x,label=paste("gear=",rownames(x),sep=""))
箱线图:
boxplot
函数
- 绘图之前需要了解的一些符号
-
markdown
表格格式:表格
| 左对齐标题 | 右对齐标题 | 居中对齐标题 |
| :------| ------: | :------: |
| 短文本 | 中等文本 | 稍微长一点的文本 |
| 稍微长一点的文本 | 短文本 | 中等文本 |
:--- 代表左对齐
:--: 代表居中对齐
---: 代表右对齐
符号 | 示例 | 意义 |
---|---|---|
+ | +x | 包括该变量 |
- | -x | 不包括该变量 |
: | x:z | 包括两变量的相互关系 |
* | x*z | 包括两变量,以及它们之间的相互关系 |
/ | x/z | nesting: include z nested within x |
| | x|z | 条件或分组:包括指定z的x |
1 | -1 | 截距:减去该截距 |
> op <- par(mfrow=c(1,2))
> boxplot(mpg~cyl,data=mtcars, main="Car Milage Data",
+ xlab="Number of Cylinders", ylab="Miles Per Gallon")
> head(ToothGrowth)
len supp dose
1 4.2 VC 0.5
2 11.5 VC 0.5
3 7.3 VC 0.5
4 5.8 VC 0.5
5 6.4 VC 0.5
6 10.0 VC 0.5
> boxplot(len~supp*dose, data=ToothGrowth, notch=TRUE,
+ col=(c("gold","darkgreen")),
+ main="Tooth Growth", xlab="Suppliment and Dose")
> par(op)
坐标轴,图例,标记与标题
- 以上基础图像的坐标轴,图例,标记与标题等,大多可以通过下列参数来控制:
参数 | 描述 |
---|---|
main | 主标题 |
sub | 副标题 |
xlab | x轴标记 |
ylab | y轴标记 |
xlim | x轴上下限(范围) |
ylim | y轴上下限 |
- 增加一个新的坐标轴使用axis()函数。
参数 | 描述 |
---|---|
side | 坐标轴所在的位置,1:下,2:左,3:上,4:右 |
at | 坐标轴具体位置,通常由自动给出。 |
labels | 坐标字符串 |
pos | 坐标轴线所在的行,默认值为重绘所在位置上的原坐标 |
lty | 线型 |
col | 颜色 |
las | 坐标标记与坐标轴方位关系,=0为平等,=2为垂直 |
lwd.ticks | 坐标刻度线宽度 |
col.ticks | 坐标刻度线颜色 |
-
绘制双纵坐标图
-
yaxt
: 是否显示y轴坐标值;默认显示,值为'n'
时,不显示 -
las
:标签是否平行于(=0
)或垂直于(=2
)坐标轴 -
side
坐标轴所在的位置,1:下
,2:左
,3:上
,4:右
-
> x <- c(1:10); y <- x; z <- 10/x
> op <- par(mar=c(5, 4, 4, 8)+ .1) ##右侧多留点空
> plot(x, y,type="b", pch=21, col="red",
+ yaxt="n", lty=3, xlab="", ylab="") ##设置不画纵坐标
> lines(x, z, type="b", pch=22, col="blue", lty=2)
> axis(2, at=x,labels=x, col.axis="red", las=2) ##绘制左侧纵坐标
> axis(4, at=z,labels=round(z,digits=2),
+ col.axis="blue", las=2, cex.axis=0.7, tck=-.01)##绘制右侧坐标
> mtext("y=1/x", side=4, line=3, cex.lab=1,las=2, col="blue") ##右侧坐标加标注
> title("An Example of Creative Axes", xlab="X values",
+ ylab="Y=X") ##为图像加主标题
> par(op)
- 绘制有细节的坐标轴
> plot(x, y, yaxt="n")
> majorat <- seq(0, 10, by=2)
> majorlab <- majorat
> axis(2, at=majorat, labels=majorlab)
> minorat <- seq(0, 10, by=.4)
> minorat <- minorat[!minorat %in% majorat]
> axis(2, at=minorat, tcl=par("tcl")*.5, label=FALSE, lwd=0, lwd.ticks =1)
图例使用legend()函数控制
- 图例所在位置,可以使用
bottom
,bottomleft
,left
,topleft
,top
,topright
,right
,bottomleft
,center
来指定。 inset
设置在主绘图边距title
图例的标题legend
图例的内容
> boxplot(mpg~cyl, main="Milage by Car Weight",
+ yaxt="n", xlab="Milage", horizontal=TRUE,
+ col=terrain.colors(3))
> legend("topright", inset=.05, title="Number of Cylinders",
+ c("4","6","8"), fill=terrain.colors(3), horiz=TRUE)