重磅推荐,超详细热图在线绘制教程资料!
OmicStudio-热图 | 在线,免费,即时出图,多功能,带数据处理,可下载PPT:
https://www.omicstudio.cn/tool/4
本教程将会讨论如下话题:
【需要什么样的输入文件?】
1.下载示例数据
2.输入文件格式
【如何处理热图数据?】
1.log计算
2.中心化
3.标准化
4.特别注意
【如何使用输入数据原始值做热图?】
【如何调整配色方案?】
1.经典搭配
2.深-浅-深
3.由深到浅
【如何做出黑白两色的热图?】
【如何处理聚类,并根据聚类结果调整数据以重新绘制?】
1.选择聚类的对象
2.聚类方法
【如何查看作图数据?】
1.在图上显示数字
2.下载绘图表格
【基因太多导致名字重叠,怎么办?】
1.取消显示基因名
2.增加图片高度
【如何对齐两张热图,以便拼接?】
【如何使图例数字范围对称?】
1.中心化
2.调整图例极值
3.区别
【如何仅对一个样本数据做热图?】
【如何恢复全局的默认值?】
【更多资料】
1.B站直播教程
3.更多超好用的在线生信云工具的详细教程资料
需要什么样的输入文件?
1.下载示例数据
默认显示的文件名是默认图片的输入数据,可以点击“示例文件下载”查看。上传的文件必须是xlsx格式,否则会报错。
2.输入文件格式
文件内容如图所示,必须有行名和列名,且不能重名。填写的名字直接作为图片上显示的名字,数据可以是经过处理可直接作图的,也可以是未经处理的;未经处理的数据可使用“绘图前数据处理”功能进行处理,参见【如何处理热图数据?】。
如何处理热图数据?
本工具提供三种数据处理方案:log计算,中心化和标准化。
1.log计算
可以在不改变所有数据线性关系的情况下使数据分布更紧凑,从而使颜色分布更均匀。由于log(0)无法计算,所以提供了步骤0,对所有数据加一个数,以使得计算能够进行,不同的加数会可能对绘图有不同的影响,需要调试使用。
2.中心化
对全部数据仅进行中心化处理可以使图例关于0对称:
3.标准化
相关意义可以上网搜索,在此不再赘述。仅对做热图而言,标准化可以使数据分布更紧凑。
特别注意
若按列进行处理,则同一列内数据的线性关系不受影响(即相对大小不发生改变),但是行与行之间的线性关系可能发生改变(破坏行间数据的相对大小关系);若按行进行处理,同理。因此,若要进行中心化和标准化处理,建议对象(全部,按行,按列)保持统一,如下为正确示范:
如何使用输入数据原始值做热图?
由于本工具默认会进行一定的数据处理,若输入文件已经经过数据处理,或者是使用“绘制表格下载”得到的文件进行二次作图,则需要清除预设的数据处理,方法如下:将1-3步骤的选项全部选择“不处理”即可。由于第0步是第1步log计算的预处理,若log计算选择“不处理”,在第0步并不会进行处理。
如何调整配色方案?
1.经典搭配
最常用的“深-浅-深”配色方案。如:“红黑绿”,“红白蓝”,“彩虹色”等。
2.深-浅-深
大值和小值颜色深,中间值颜色浅,适用于展现上下调情况。
3.由深到浅
如何做出黑白两色的热图?
如何处理聚类,并根据聚类结果调整数据以重新绘制?
1.选择聚类的对象
如下,取消对列的聚类,使样本排序方式依据输入文件中的顺序。
2.聚类方法
具体含义可上网搜索,后续会将相关释义添加到本工具的说明中。默认选项为推荐的选项。
如何查看作图数据?
1.在图上显示数字
2.下载绘图表格
如下所示,下载的表格中的数据与下载时图片中数据完全对应,包括行和列的名称顺序和经过前期数据处理后的数值。
推荐用法:下载此表,删除离群样本或基因,重新上传,选择不处理数据(参见【如何使用原始值做热图?】),即可得到符合预期的热图。
基因太多导致名字重叠,怎么办?
1. 取消显示基因名
一般而言,对大量基因做热图时,是为了展现数据的总体趋势,此时没有必要显示出所有基因名。
2. 增加图片高度
优势减小字号也不一定能让行名清晰显示,在保持字号不变的情况下,增加图片高度可以自动拉长图片,为行名留出足够的书写空间。
需要注意的是,当增大图片高度时,网页上呈现的作图区域并不会因此调整(网页上的绘图区域目前暂时是固定的,以后会更新优化),但是能控制下载的图片,所以这个调整效果需要下载后才能看到。
如何对齐两张热图,以便拼接?
可以控制方格高度相等,如下图所示,两个数据得到的输出图片,在缩放比相同的情况下,绘图区域是对齐的。
特别注意:调整方格高度可能会导致图片出界,需要同时调整图片高度。另外,需要注意的是,调整图片高度的效果并不会在网页上展示,需要查看下载的图片(下右图)。
如何使图例数字范围对称?
1.中心化
对全部数据仅进行中心化处理可以使图例关于0对称:
2.调整图例极值
如下原图,图例范围为[-3,2],有两种解决方案:
方案一:增大最小值。
如图,将图例最小值提高到-2,图上框出来的超出范围的格子被赋予图例最小值的颜色。即,超出最小值的数字颜色不再加深,统一变成图例最小值的颜色。
方案二:增加最大值。
如图,将图例最大值提高到3,此时没有数据超界,但是颜色分配发生了向下的移动,即,原来红色的区域,变成了橙黄色。
特别注意:图例极值一次只能调整一个,如上图,调整了最大值,就不能调整最小值(会自动隐藏),反之亦然。删除填入的值可取消隐藏,重新选择要调整的对象。
3.区别
中心化方法是调整了所有数据的值,使之落入一个对称的区间;调整极值的方法是把超出图例范围的数值重新赋予颜色。两者没有优劣之分,对于不同的情况,合适的就是最好的。
如何仅对一个样本数据做热图?
下表为示例数据:
上传该数据:若输入文件只有1列,或者所有列的数据都相同,会跳出如下提示框。同时会锁定如下操作:【绘图前数据处理】模块中的中心化和标准化只能“按列处理”或者“不处理”;【聚类】模块只能对“行”进行聚类或者不进行任何聚类。
另外,由于只有1列,自动将图片标题名设置为样本名(列名),同时不再显示列名:
如何恢复全局的默认值?
1.点击“恢复默认值”按键,左侧参数栏的所有参数会回复默认值(输入文件不会清空):
2. 点击浏览器的“刷新”按键,可以重启整个工具页面(输入文件会清空,同时报错等问题也会消失)
B站直播:https://www.bilibili.com/video/BV1XE411W7Hw
更多超好用的在线生信云工具的详细教程资料:http://qr03.cn/CF09Dg