Heatmap——热图那些事

2020-10-17 本文已影响0人 young5100

1.用gplots-heatmap.2画热图，

library(gplots)
library(RColorBrewer)
setwd("D:\\生信课题\\R语言画图\\R语言统计与分析")
#读取数据，txt文档为例,各种读取文档的方法请参考help
#处理数据，如果第一行为名称时，不要第一行，提取行名
datExp1 = datExp[, -1]
rownames(datExp1) = datExp[, 1]
#读取患者分组信息,设置分组颜色，橙色与蓝色
datTraits = read.table('samplegroup.txt',sep='\t',header=T)
color = factor(datTraits$group,labels=c('orange','blue'),levels = c("P","N"))
#数据转换为矩阵
datExp1 = as.matrix(datExp1)
#聚类热图
heatmap.2(datExp1,col = bluered(75),Colv = NA, 
          hclust=function(x) hclust(x,method = 'ward.D2'),
          distfun=function(x) dist(x,method='euclidean'),
          scale = "row",dendrogram = 'row',
          key = TRUE, symkey = FALSE, density.info = "none",
          trace = "none", cexRow = 0.5,
          ColSideColors = as.character(color),
          main = "Heatmap")

注脚：
scale标准化，根据每列或者行数据的均值标准化,主要是为了防止单个数据过大（过小），导致冷热色分布不明显的现象，可选row,column,none。
**key 是否需要图标以及图标大小，key=T或者F,keysize=1.5；
Colv=NA表示不对行聚类,Rowv=NA不对列聚类
dendrogram=‘column’or 'none'or'row' or"both"显示聚类树状图,
trace,是否需要基准线（均值，方差之类的）,trace="both","row" 或者"column"
density.info指示图内的线, density.info='none'
cexCol=1,cexRow=1 设置xlab和ylab的字符大小
#col，优化颜色：redgreen或者greenred, 调整配色，括号内表示这个配色区间分成多少格区分度； breaks=seq自己设置颜色分度breaks=seq(-5, 5, 1))
** labels，labCol调整每列的标记 labCol = NA，或者 labCol = c('Age', 'A', 'B', 'C'))
margins 调整画布边距； margins=c(5,5)，
main='Heatmap'增加标题。

2、用pheatmap画图，参考卖萌哥的——用pheatmap画热图 - 简书

rm(list = ls())
#获取当前工作目录
getwd()
#设置工作目录
setwd("D:\\生信课题\\R语言画图\\R语言统计与分析\\梁荣朴给的练习数据")
#加载包
library(RColorBrewer)#**设置颜色用的，
#关于RColorBrewer请参考——[RColorBrewer与ggplot2 - 简书](https://www.jianshu.com/p/a8856757a0d2)**
library(pheatmap)
#设置配色方案，为RColorBrewer，具体颜色方案放置备注里
cc = colorRampPalette(rev(brewer.pal(n=8, name="Reds")))
#读取文档，txt为例，卖萌哥的以csv为例，转化为矩阵
dat = read.table('IL.txt',sep='\t',header=T)
colnam=dat[,1]#设置行名，以便后面设置行名标签，labels_row = colnam
dat1=dat[,-1]
IL=as.matrix(dat1)
#绘图
heatmap=pheatmap(IL,color = cc(100),
                main="IL",
                fontsize = 15,
                scale="row",
                border_color = NA,
                na_col = "grey",
                cluster_rows = T,cluster_cols = F,
                labels_row = colnam,
                show_rownames = T,show_colnames = T,
                treeheight_row = 30,treeheight_col = 30,
                cellheight = 15,cellwidth = 30,
                cutree_row=2,cutree_col=2,
                display_numbers = F,legend = T,
                filename = "IL-10-07.pdf")

注脚：
第一个参数是需要用pheatmap画图的数据
color: 设置颜色。精细程度按照括号内设置的数值来定
main: 标题名称
fontsize: 设置row的字体大小
scale: 设置归一化为正态分布，可选row,column,none。
border_color: 是否显示边框及边框的颜色，NA不显示,red显示红色。支持简单的颜色单词
na_col: 设置缺失值的颜色，支持简单颜色单词，一般设置为灰色就满好识别的。
cluster_rows&cluster_cols: 设置是否对行或者列进行聚类，按照实际需求设置。当缺失值较多的时候是无法进行聚类的。**一个解决办法是读取数据的时候不设置缺失值。
show_rownames&show_colnames: 是否显示行/列的名称
treeheight_row&treeheight_col: 当前面设置了聚类之后，两边会出现聚类的树，这个参数是设置树的高度的。
cellheight&cellwidth: 设置每个各自格的宽度和高度。
cutree_row&cutree_col: 是否根据聚类情况把树切开，可以设置切开的份数。
display_numbers: 设置是否显示每个单元格的值。
legend: 设置是否显示旁边的bar状图例。
filename: 设置输出文件的名字。可以设置的文件类型有：pdf，png，jpg，tiff，bmp。

3、在线工具

3.1、Expression Heat Map，操作参考在线绘制聚类热图（heatmapper） - 组学大讲堂问答社区

优点：1、支持多种的颜色配置；2、支持样品和基因的双聚类；
缺点：基因名称显示似乎不太行，还在尝试，数据上限：2,500 rows and 300 columns；

3.2、Morpheus，

操作参考-没有，慢慢摸索就好，简单易上手，似乎没有数据上限？

3.3、Matrix2png，操作参考：一个在线绘制热图的工具 - 生信人（生物信息学）问答平台，

似乎全英，看着好累

3.4、https://www.omicstudio.cn/tool/4 联川生物-

这个工具看着也蛮好用的，操作参考也很详细，全中文参考：重磅推荐，超详细热图在线绘制教程资料！ - 简书，不过我不想注册，就没尝试

Heatmap——热图那些事

1.用gplots-heatmap.2画热图，

2、用pheatmap画图，参考卖萌哥的——用pheatmap画热图 - 简书

3、在线工具

3.1、Expression Heat Map，操作参考在线绘制聚类热图（heatmapper） - 组学大讲堂问答社区

3.2、Morpheus，

3.3、Matrix2png，操作参考：一个在线绘制热图的工具 - 生信人（生物信息学）问答平台，

3.4、https://www.omicstudio.cn/tool/4 联川生物-

猜你喜欢

热点阅读

Heatmap——热图那些事

1.用gplots-heatmap.2画热图，

2、用pheatmap画图，参考卖萌哥的——用pheatmap画热图 - 简书

3、在线工具

3.1、Expression Heat Map，操作参考在线绘制聚类热图（heatmapper） - 组学大讲堂问答社区

3.2、Morpheus，

3.3、Matrix2png，操作参考：一个在线绘制热图的工具 - 生信人（生物信息学）问答平台，

3.4、https://www.omicstudio.cn/tool/4联川生物-

猜你喜欢

热点阅读

3.4、https://www.omicstudio.cn/tool/4 联川生物-