NGS

Heatmap——热图那些事

2020-10-17  本文已影响0人  young5100

1.用gplots-heatmap.2画热图,

library(gplots)
library(RColorBrewer)
setwd("D:\\生信课题\\R语言画图\\R语言统计与分析")
#读取数据,txt文档为例,各种读取文档的方法请参考help
#处理数据,如果第一行为名称时,不要第一行,提取行名
datExp1 = datExp[, -1]
rownames(datExp1) = datExp[, 1]
#读取患者分组信息,设置分组颜色,橙色与蓝色
datTraits = read.table('samplegroup.txt',sep='\t',header=T)
color = factor(datTraits$group,labels=c('orange','blue'),levels = c("P","N"))
#数据转换为矩阵
datExp1 = as.matrix(datExp1)
#聚类热图
heatmap.2(datExp1,col = bluered(75),Colv = NA, 
          hclust=function(x) hclust(x,method = 'ward.D2'),
          distfun=function(x) dist(x,method='euclidean'),
          scale = "row",dendrogram = 'row',
          key = TRUE, symkey = FALSE, density.info = "none",
          trace = "none", cexRow = 0.5,
          ColSideColors = as.character(color),
          main = "Heatmap")

注脚:
scale标准化,根据每列或者行数据的均值标准化,主要是为了防止单个数据过大(过小),导致冷热色分布不明显的现象,可选row,column,none。
**key 是否需要图标以及图标大小,key=T或者F,keysize=1.5;
Colv=NA表示不对行聚类,Rowv=NA不对列聚类
dendrogram=‘column’or 'none'or'row' or"both"显示聚类树状图,
trace,是否需要基准线(均值,方差之类的),trace="both","row" 或者"column"
density.info指示图内的线, density.info='none'
cexCol=1,cexRow=1 设置xlab和ylab的字符大小
#col,优化颜色:redgreen或者greenred, 调整配色,括号内表示这个配色区间分成多少格区分度; breaks=seq自己设置颜色分度breaks=seq(-5, 5, 1))
** labels,labCol
调整每列的标记 labCol = NA,或者 labCol = c('Age', 'A', 'B', 'C'))
margins 调整画布边距; margins=c(5,5),
main='Heatmap'增加标题。

2、用pheatmap画图,参考卖萌哥的——用pheatmap画热图 - 简书

rm(list = ls())
#获取当前工作目录
getwd()
#设置工作目录
setwd("D:\\生信课题\\R语言画图\\R语言统计与分析\\梁荣朴给的练习数据")
#加载包
library(RColorBrewer)#**设置颜色用的,
#关于RColorBrewer请参考——[RColorBrewer与ggplot2 - 简书](https://www.jianshu.com/p/a8856757a0d2)**
library(pheatmap)
#设置配色方案,为RColorBrewer,具体颜色方案放置备注里
cc = colorRampPalette(rev(brewer.pal(n=8, name="Reds")))
#读取文档,txt为例,卖萌哥的以csv为例,转化为矩阵
dat = read.table('IL.txt',sep='\t',header=T)
colnam=dat[,1]#设置行名,以便后面设置行名标签,labels_row = colnam
dat1=dat[,-1]
IL=as.matrix(dat1)
#绘图
heatmap=pheatmap(IL,color = cc(100),
                main="IL",
                fontsize = 15,
                scale="row",
                border_color = NA,
                na_col = "grey",
                cluster_rows = T,cluster_cols = F,
                labels_row = colnam,
                show_rownames = T,show_colnames = T,
                treeheight_row = 30,treeheight_col = 30,
                cellheight = 15,cellwidth = 30,
                cutree_row=2,cutree_col=2,
                display_numbers = F,legend = T,
                filename = "IL-10-07.pdf")

注脚:
第一个参数是需要用pheatmap画图的数据
color: 设置颜色。精细程度按照括号内设置的数值来定
main: 标题名称
fontsize: 设置row的字体大小
scale: 设置归一化为正态分布,可选row,column,none。
border_color: 是否显示边框及边框的颜色,NA不显示,red显示红色。支持简单的颜色单词
na_col: 设置缺失值的颜色,支持简单颜色单词,一般设置为灰色就满好识别的。
cluster_rows&cluster_cols: 设置是否对行或者列进行聚类,按照实际需求设置。当缺失值较多的时候是无法进行聚类的。**一个解决办法是读取数据的时候不设置缺失值。
show_rownames&show_colnames: 是否显示行/列的名称
treeheight_row&treeheight_col: 当前面设置了聚类之后,两边会出现聚类的树,这个参数是设置树的高度的。
cellheight&cellwidth: 设置每个各自格的宽度和高度。
cutree_row&cutree_col: 是否根据聚类情况把树切开,可以设置切开的份数。
display_numbers: 设置是否显示每个单元格的值。
legend: 设置是否显示旁边的bar状图例。
filename: 设置输出文件的名字。可以设置的文件类型有:pdf,png,jpg,tiff,bmp。


3、在线工具

3.1、Expression Heat Map,操作参考在线绘制聚类热图(heatmapper) - 组学大讲堂问答社区

优点:1、支持多种的颜色配置;2、支持样品和基因的双聚类;
缺点:基因名称显示似乎不太行,还在尝试,数据上限:2,500 rows and 300 columns;

3.2、Morpheus

操作参考-没有,慢慢摸索就好,简单易上手,似乎没有数据上限?

3.3、Matrix2png,操作参考:一个在线绘制热图的工具 - 生信人(生物信息学)问答平台

似乎全英,看着好累

3.4、https://www.omicstudio.cn/tool/4联川生物-

这个工具看着也蛮好用的,操作参考也很详细,全中文参考:重磅推荐,超详细热图在线绘制教程资料! - 简书,不过我不想注册,就没尝试

上一篇下一篇

猜你喜欢

热点阅读