生信相关我爱编程

(转帖)-circos-circlize-2

2018-06-11  本文已影响23人  苏慕晨枫

原文地址:https://mp.weixin.qq.com/s/wiTOWfrscK_dfDxk2vEFig

Circos可以用来画基因组数据的环状图,也可以用来绘制其它数据的相关环状图,功能甚是强大,各种环状的叠加,很是美观下面我们学习一下:

基本参数:

•circos.genomicTrackPlotRegion:  创建轨道,添加图形

•circos.genomicPoints:低水平函数,添加点

•circos.genomicLines: 低水平函数,添加线

•circos.genomicRect:  低水平函数,添加矩形

•circos.genomicText: 低水平函数,添加文本

•circos.genomicLink:添加连线

1、数据

数据格式:数据框

数据框必须包含三列信息:第一列是因子变量(基因类别、染色体等),第二列和第三列是数值变量,表示第一列因子的起始和终止位置。

library(circlize)

set.seed(1)

#随机产生一个数据

bed<-generateRandomBed(nr = 10,nc = 1)

bed

当然,你还可以增加很多变量(上述数据只有一个变量value1),需要设定nc=”变量数目“

2、初始化布局

默认:我们借用人类基因组信息进行布局:

par(mar = c(1, 1, 1, 1))

circos.initializeWithIdeogram()

当然了,circos.initializeWithIdeogram有很多参数可以选择,你可以绘制其它物种的信息(species可以选择物种)。

circos.initializeWithIdeogram(species = "hg18")

circos.initializeWithIdeogram(species = "mm10")

一般作为缺省值,该函数绘制出所有染色体的信息当然你还可以自己调整绘制哪一条染色体。

circos.initializeWithIdeogram(species = 'hg19',chromosome.index = paste('chr',1:5,sep=""))

par(mar = c(1, 1, 1, 1))

par(mfrow=c(2,1))

#打乱顺序

circos.initializeWithIdeogram(species = 'hg18',sort.chr = F)

circos.initializeWithIdeogram(species = 'hg18',chromosome.index = c('chr1','chr2','chr3','chr4'))

注意:如果你不设定chromosome.index, 染色体顺序是可以打乱顺序的,也就是说可以人为排序。当你设定后chromosome.index,sort.chr是不起作用的,染色体位置信息取决于你的因子水平。

当然了,很重要的一点就是,轨道上的信息,我们可以通过参数plotType调整。

#plotType函数:可以设定仅绘制轴和标签

circos.initializeWithIdeogram(plotType = c("axis", "labels"))

#仅仅初始化布局(什么也看不到)

circos.initializeWithIdeogram(plotType = NULL)

上一节我们也谈到图形绘制起始角度,扇形之间的距离,轨道高度等参数,在这里我们演示一下。

circos.par("start.degree" = 90,gap.degree=c(rep(2,3),10),cell.padding=c(0,0,0,0))

circos.initializeWithIdeogram(chromosome.index = c('chr1','chr2','chr3','chr4'))我们也是可以自己定制化轨道:

#设定随机数种子

set.seed(2)

#圆形布局

par(mar=c(1,1,1,1))

#初始化

circos.initializeWithIdeogram(species = 'hg18',plotType = NULL)

#绘制轨道

circos.trackPlotRegion(ylim=c(0,1),track.height = 0.2,panel.fun = function(x,y){

#获取信息(x、y范围,分类变量),这一步是必须的!

chr=get.cell.meta.data('sector.index')

xlim=get.cell.meta.data('xlim')

ylim=get.cell.meta.data('ylim')

#在轨道上绘制矩形

  circos.rect(xleft = xlim[1],ybottom = ylim[1],xright = xlim[2],ytop = ylim[2]-0.5,col=rand_color(1))

#添加文本信息

 

circos.text(x=mean(xlim),y =ylim[2]-0.3,labels = chr,font=1,facing =

'bending.outside', niceFacing = T,cex=0.6)},bg.border = NA)

#重置命令

circos.clear()

我们也是可以自己构造数据框,绘制图形。

df = data.frame(

name = c("TP53", "TP63", "TP73"),

start = c(7565097, 189349205, 3569084),

end = c(7590856, 189615068, 3652765))

#下面三条命令绘制结果一样

circos.genomicInitialize(df)

circos.genomicInitialize(df, sector.names = c("tp53", "tp63", "tp73"))

circos.genomicInitialize(df, plotType=c('axis','labels'))

#载入数据

load(paste0(system.file(package = "circlize"), "/extdata/tp_family.RData"))

names(tp_family)

#外显子名字

names(tp_family[["TP53"]])

#位置信息

head(tp_family[['TP53']])[[1]]

#构造数据框

df<-data.frame(

gene=names(tp_family),

start=sapply(tp_family,function(x)min(unlist(x))),

end=sapply(tp_family,function(x)max(unlist(x))))

#初始化

circos.genomicInitialize(df)

#绘制轨道

circos.genomicTrackPlotRegion(ylim = c(0, 1),

bg.col = c("blue", "green", "grey"),

bg.border = NA, track.height = 0.05)

我们绘制出外显子在基因上的位置信息:

#初始化

circos.genomicInitialize(df)

#绘制轨道

circos.genomicTrackPlotRegion(ylim = c(0, 1), bg.col = c("blue", "green", "grey"),

bg.border=NA,track.height = 0.05)

n = max(sapply(tp_family, length))

#创建新的轨道

circos.genomicTrackPlotRegion(ylim = c(0.5, n + 0.5),

panel.fun = function(region, value, ...) {

#类别变量信息(有三个:TP53,TP63,TP73)

gn = get.cell.meta.data("sector.index")

#从列表中获取每个类别变量的信息

tr = tp_family[[gn]]

 #循环绘制线、矩形

for(i in seq_along(tr)) {

current_tr_start = min(tr[[i]]$start)

current_tr_end = max(tr[[i]]$end)

circos.lines(c(current_tr_start, current_tr_end),c(n - i, n - i), col = "#CCCCCC")

circos.genomicRect(tr[[i]], ytop = n - i + 0.4,  ybottom = n - i - 0.4, col = "orange", border = NA)  }

}, bg.border = NA, track.height = 0.3)

circos.clear()

3、构建作图区域(添加点、线、矩形等)

一般格式如下:

#单个变量

circos.genomicTrackPlotRegion(data,ylim=c(0,1),

panel.fun=function(region,value,...) {

circos.genomicPoints(region, value, ...)

})

#多个变量

circos.genomicTrackPlotRegion(data, numeric.column,

panel.fun=function(region,value,...) {

circos.genomicPoints(region, value, ...)

})

点:circos.genomicPointscircos.genomicPoints(region, value, ...)

circos.genomicPoints(region, value,numeric.column=c(1,2))

circos.genomicPoints(region, value, cex, pch)

circos.genomicPoints(region, value, sector.index, track.index)这里numeric.column也可以用列的名字代替

circos.genomicPoints=function(region,value,numeric.column=1,...) {

x=(region[[2]]+region[[1]])/2

y=value[[numeric.column]]

circos.points(x, y, ...)

}这里circos.points也可以表示出circos.genomicPoints。

线:circos.genomicLines circos.genomicLines(region, value, ...)

circos.genomicLines(region, value,numeric.column=c(1,2))

circos.genomicLines(region, value, lwd,lty="segment")

circos.genomicLines(region, value, area, baseline, border)

circos.genomicLines(region, value, sector.index, track.index)

Text:文本circos.genomicText(region, value, ...)

circos.genomicText(region, value, y, labels)

circos.genomicText(region, value, numeric.column, labels.column)

circos.genomicText(region, value, facing, niceFacing, adj)

circos.genomicText(region, value, sector.index, track.index)

Rectangle:矩形circos.genomicRect(region, value,ytop=1,ybottom=0)

circos.genomicRect(region, value,ytop.column=2,ybottom=0)

circos.genomicRect(region, value, col, border)

在这里介绍一个函数,非常好用,可以分割你的数据:colorRamp2

colorRamp2(breaks=c(-1,0,1),colors=c("green","black","red"))分割断点-1,0,1分别对应颜色green、black、red;此外-1到0对应green到black的渐变色,0到1对应black到red的渐变色。

注意:这篇文章整个放不下了,请到附文查看……

上一篇下一篇

猜你喜欢

热点阅读