工作生活

2019-07-04 Venn图的绘制

2019-07-04  本文已影响0人  LiuYueRR

title: "Vennplot"
author: "Liu Yue"
date: "2019_7_04"


Venn(维恩图)的绘制

Venn(维恩图)是一种可以反映不同数据集之间交集和并集情况的展示图。在数据可视化过程中具有重要的作用。

现如今可以使用R语言和一些在线网站进行Venn图的绘制,今天这篇文章给大家讲解一下如何使用R语言进行Venn的绘制。

rm(list = ls())
options(stringsAsFactors = F)
setwd('C:/Users/42403/Desktop/Single-cell-RNA-seq/tcga-4-pipeline')
#配置文件
muse.mut=read.table('muse.mut',header = T,stringsAsFactors = F)
varscan.mut=read.table('varscan.mut',header = T,stringsAsFactors = F)
somaticsniper.mut=read.table('somaticsniper.mut',header = T,stringsAsFactors = F)
mutect.mut=read.table('mutect.mut',header = T,stringsAsFactors = F)

一、基础的Venn图的基本绘制 gplots包

library(gplots)
?venn #根据help文档,我们可以发现venn()函数中输入的文件,要么是list,要么是data.frame,具体?venn
venn(list(
  mutect=as.character(apply(mutect.mut,1,function(x) paste0(x[2:5],collapse = ':'))),
  varscan=as.character(apply(varscan.mut,1,function(x) paste0(x[2:5],collapse = ':'))),
  somaticsniper=as.character(apply(somaticsniper.mut,1,function(x) paste0(x[2:5],collapse = ':'))),
  muse=as.character(apply(muse.mut,1,function(x) paste0(x[2:5],collapse = ':')))
))+title('Venn')
####################关于这个数据集的讲解:#######################
#输入文件的格式为list,使用list()函数创建了一个list作为venn()的输入文件
#list()函数中,是四个数据集,每一个数据集都是as.character转化成的字符型的向量
#apply()函数将数据集的行的第2-5位置的数据,使用paste0链接起来,连接符是':'
#我们根据最后形成的字符型的向量,相当于是进行ID的匹配(ID相当于是索引),使用的venn函数其实内部进行交集和并集的计算
#并且将apply()的结果转化为字符串
#####这样简单的Venn图就做出来了,虽然不够美观,但是每个数据集之间的交集和并集全都表示出来了
![Rplot1.png](https://img.haomeiwen.com/i14088710/cf67ac78f4eb51e2.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

二、发表级的Venn图 VennDiagram包

rm(list = ls())
#二、发表级的Venn图 VennDiagram包
#首先要安装R包VennDiagram包 
#if(!require('VennDiagram')) install.packages('VennDiagram',ask=F,update=F)
#VennDiagram包需要额外的两个R包grid,使用BioCManager自行下载
#if(!require('grid')) BiocManager::install('grid',ask = F,update = F)
#加载包
library(VennDiagram)
library(grid)
data <- list(
  mutect=as.character(apply(mutect.mut,1,function(x) paste0(x[2:5],collapse = ':'))),
  varscan=as.character(apply(varscan.mut,1,function(x) paste0(x[2:5],collapse = ':'))),
  somaticsniper=as.character(apply(somaticsniper.mut,1,function(x) paste0(x[2:5],collapse = ':'))),
  muse=as.character(apply(muse.mut,1,function(x) paste0(x[2:5],collapse = ':')))
)
#使用VennDiagram包中的venn.diagram()函数进行绘图
?venn.diagram() #查看所有参数
ven <- venn.diagram(data,filename = NULL,fill=c('red','yellow','pink','green'))
grid.newpage()
grid.draw(ven)
#基本图已经绘制好,然后调整参数进行图片美化
###VennDiagram包中的参数很多,具体细节参数可以自己进行查看,更改以便实现自己的目的
Rplot1.png

三、发表级的Venn图 Vennerable包

rm(list = ls())
#首先要安装R包Vennerable
#install.packages("Vennerable", repos="http://R-Forge.R-project.org")
#Vennerable包需要额外的两个R包grid, RBGL,使用BioCManager自行下载
#if(!require('grid')) BiocManager::install('grid',ask = F,update = F)
#if(!require('RBGL')) BiocManager::install('RBGL',ask = F,update = F)
#加载R包
library(Vennerable)
library(grid)
data <- list(
  mutect=as.character(apply(mutect.mut,1,function(x) paste0(x[2:5],collapse = ':'))),
  varscan=as.character(apply(varscan.mut,1,function(x) paste0(x[2:5],collapse = ':'))),
  somaticsniper=as.character(apply(somaticsniper.mut,1,function(x) paste0(x[2:5],collapse = ':'))),
  muse=as.character(apply(muse.mut,1,function(x) paste0(x[2:5],collapse = ':')))
)
#使用Vennerable包的时候,需要转化为Venn对象,因为gplot包中也有venn函数,因此需要仔细写出Venn()来源于哪一个包
data1 <- Vennerable::Venn(data)
Weights(data1)#查看一下Venn图中的具体的交集和并集情况
#0000表示没有交集的外围地区,1000表示mutect,0100表示varscan......1111表示四个数据集共有的交集数据
#绘制Venn图
plot(data1,doWeight=F,type='ellipses') #doWeight参数表示使用权重表示数据集,type参数用不同的性状来表示数据集
#type 参数有ChowRuskey,squares,triangles,AWFE,circles,ellipses
#其中在数据集比较多的时候,建议换成ellipses椭圆进行展示。
#如图所示,Venn图的颜色都是默认参数,那么如何修改Venn图的颜色呢?
#首先要了解一下Vennerable包的一个函数compute.Venn()
?compute.Venn #计算Venn图中交集和并集情况
data2 <- compute.Venn(data1,doWeights=T,type='ellipses')
?VennThemes #创建列表,调整Venn图的画图参数
gpList=VennThemes(data2)
gpList #既然是list,就可以分层查看,逐层查看list里面的内容,gpList中包括了Face,FaceText,Set,SetText
gpList$FaceText
gpList$FaceText$`1111`
gpList$FaceText$`1111`$col
gpList[['FaceText']][['1111']][['col']]='white'
plot(data2,gp=gpList) #plot()函数中,加上gp参数可以将图像进行更改,从而实现图形的美化
Rplot2.png Rplot3.png Rplot4.png

写在最后,Venn图的绘制最好的输入数据格式是list,因为list的数据内容保罗万象,里面的数据长度可以是不同的。而数据框的数据长度是一致的,这样会造成数据长度不一致的情况下,会以空格进行填充。如果多组数据进行Venn图的绘制的画,可能匹配到空格项,从而导致了Venn图的统计错误。

上一篇下一篇

猜你喜欢

热点阅读