生信学习笔记集

热图6:系列终章之“奇形怪状”的热图

2021-12-06  本文已影响0人  KS科研分享与服务

走到这里,也代表热图这个系列到最终篇了。最后我们说说一些奇形怪状的热图。其实小编也发现,生物学现在整的不太好的一个方面就是发论文大家太注重图了,反倒忽略了数据的价值。我是认为用合理的图将数据价值表现出来即可,稍加修饰,无需太过。

但是很多小伙伴总是看到别人文章新奇的图,比较感兴趣,所以这里也示范一下一些新奇的热图,仅限于小编自己见过的!其他的小伙伴们可以留言分享。

一、环状热图

顾名思义,环状热图就是圆形的热图,将长形的热图卷一下就可以了。它唯一的好处可能就是热图太长的时候节省空间!
用circlize函数画图(ggplot2也可以实现,这里我们不再展示,有兴趣可以去网上查查)
首先加载数据并处理:

setwd("D:/物信息学/环形热图")
A <- read.csv("行列注释.csv", header = T, row.names = 1)
A <- as.matrix(A) #将表达矩阵转化为matrix
for (i in 1:nrow(A)) A[i, ] <- scale(log(unlist(A[i, ] + 1), 2)) #对数据进行标准化处理
annotation_row = data.frame(Pathway = c(rep("Wnt",20), rep("Inflammatory",32),rep("HIF",34)))#对行进行注释,用于后续的热图分裂
row.names(annotation_row) <- rownames(A)
annotation_row <- as.matrix(annotation_row)#在circlize函数中,需要为matrix

加载需要的包:

library(circlize)
library(dendextend)

设置颜色,画图:

col_color = colorRamp2(c(-2, 0, 2), c("#003399", "white", "#cccc00"))#设置legend颜色,范围
circos.heatmap(A, col = col_color, 
               dend.side = "inside",#聚类放在环形内测
               rownames.side = "outside",#基因名放在环形外侧
               split = annotation_row,#用行注释分裂热图
               bg.border = "black")#背景边缘颜色
circos.clear()#画完图结束。一定要运行这个,不然后续画图会叠加
image.png

但是这样没有行名,也没有分组信息,也没有legend,需要额外添加。

circos.par(gap.after = c(2, 2,30))#让分裂的一个口大一点,可以添加行信息
circos.heatmap(A, col = col_color, 
               dend.side = "inside",
               rownames.side = "outside",
               split = annotation_row,
               bg.border = "black",
               show.sector.labels = T)
#以下代码用于显示分组,但是很复杂
circos.track(track.index = get.current.track.index(), panel.fun = function(x, y) {
  if(CELL_META$sector.numeric.index == 3) { # the last sector
    cn = colnames(A)
    n = length(cn)
    circos.text(rep(CELL_META$cell.xlim[2], n) + convert_x(1, "mm"), 
                1:n - 0.5, cn, 
                cex = 0.5, adj = c(0, 0.5), facing = "inside")
  }
}, bg.border = NA)
#添加legend
library(ComplexHeatmap)
lgd = Legend(title = "Scale", col_fun = col_color)
grid.draw(lgd)
image.png

分组行名还是需要手动调整。

二、三角热图

总是在某些文章中(可能高分文章作图比较有性格吧)出现不一样的热图,除了上述讲的环状,还有三角热图,可以理解为热图只显示斜对角一半。
利用ComplexHeatmap正常加载数据处理,画热图加一个函数和改变参数就可以实现。

setwd("D:/生物信息学/环形热图")
A <- read.csv("行列注释.csv", header = T, row.names = 1)
A <- as.matrix(A) #将表达矩阵转化为matrix
for (i in 1:nrow(A)) A[i, ] <- scale(log(unlist(A[i, ] + 1), 2)) #对数据进行标准化处理
Heatmap(A, rect_gp = gpar(type = "none"), column_dend_side = "bottom",
        cell_fun = function(j, i, x, y, w, h, fill) {
          if(as.numeric(x) <= 1 - as.numeric(y)) {
            grid.rect(x, y, w, h, gp = gpar(fill = fill, col = fill))
          }
        })
image.png

这个热图基因表达量的时候真的没有什么意义。不过这种热图我们应该熟悉,一般用在相关系数的表达上,下三角是热图,上三角是数字,不过不是用这个函数实现的。

我们不妨做一下相关性分析及其可视化,或许在这里不会做无用功。

数据还是表达量数据,不过需要原始数据,不在经过做热图标准化那一步。

加载需要的数据包,并计算相关性和P值:

library(ggcorrplot)
library(ggthemes)
#计算这几个样本的相关性
sample_cor <- round(cor(A),3)
#计算P值,看显著性
sample_P <- round(cor_pmat(A),3)

画图:

ggcorrplot(sample_cor,#计算的相关系数矩阵
           method = 'circle',#热图显示为圆圈
           hc.order = T,#聚类
           hc.method = "ward.D",#聚类方法
           outline.color = "white",
           ggtheme = theme_bw(),
           type = "upper",#显示上三角
           colors = c("#6D9EC1","white","#E46726"),#热图颜色
           lab = T,#热图上显示相关系数
           lab_size = 2.5)
image.png

为了让这个图更加有意义,我们只显示P≤0.05的相关,也就是显著的。

ggcorrplot(sample_cor,#计算的相关系数矩阵
           method = 'circle',#热图显示为圆圈
           hc.order = T,#聚类
           hc.method = "ward.D",#聚类方法
           outline.color = "white",
           ggtheme = theme_bw(),
           type = "upper",#显示上三角
           colors = c("#6D9EC1","white","#E46726"),#热图颜色
           lab = T,#热图上显示相关系数
           lab_size = 2.5,
           p.mat = sample_P,#相关
           insig = "pch")#不显著的显示为X或者空白
image.png

走到这里,我想热图系列已经很圆满很丰富了,我们更多的还是要关注数据的实际意义,以及在适当的时候用合适的热图尽可能的表现数据意义!

系列结束总是给人一种轻松,祝大家学习愉快!

请大家多多支持关注和分享,有更多精彩内容!
更多精彩内容可关注KS科研分享与服务科研学习交流于分享,生信学习笔记,科研经历和生活!

上一篇下一篇

猜你喜欢

热点阅读