生信

如何对时间节点样本进行趋势分析?

2020-08-24  本文已影响0人  OmicStudio
趋势分析结果展示


适用场景

示例数据

当样本为时间节点样本时(如上图,分别为0h,0.5h,3h,6h,12h五个时间节点样本的基因表达量),一般的差异分析比较分析就难以满足我们的数据挖掘需求,比如,若进行两两比较,得进行10次比较才能把所有时间点的数据都比较一遍,而且不方便整体性地观察变化趋势,比如某基因随着时间的变化一直上升/一直下降/先上升后下降/先下降后上升/......。这种趋势分析也称为“基因表达模式聚类分析”。

如下图,将五个时间点简化成五个点,给出了不同的变化趋势,有颜色的是分析得到的最显著的变化模式,按显著程度从大到小排列,相同颜色代表更相似的变化趋势:

以上,对所有有趋势的样本设置都有用:时间、浓度、患病程度等。


一分钟演示出图

网址:https://www.omicstudio.cn/tool/37

按图中箭头指示:

1. 点击“开始分析”,直接运行示例数据;

2. 运行完成后显示如图画面;

3.有两个下载选项可以下载数据:一个打包下载全部,一个下载当前呈现的图表。


STEM趋势分析:一分钟出图演示_腾讯视频

输入文件

第一列:SPOT ID,序号列;

第二列:基因名;

第三列至最后:按时间顺序排列您的表达量数据。

SPOT列可以没有,但是需要注意在网页上去掉勾选“含序号列”。

格式一:含序列号 格式二:不含序列号
STEM趋势分析:输入文件格式说明_腾讯视频

一键分析自己的数据

1. 上传文件

2. 确认输出结果中的图片格式和文件夹名称

3. 点击开始分析


如何看趋势分析的结果

1.关于表格

根据“Genes Assigned”的显著性对有颜色的聚类结果进行排序;

相同的Cluster编号对应相同的颜色,Cluster为-1的底色均为白色;

图排序顺序为:从左到右,从上到下。图中越靠前的Profile越值得研究。

2.关于图片

总图右上角的数字对应Profile的编号,可从下拉框中寻找到对应图片;

图片标题中的(0,1,2,1,0)代表该图所代表的的模型,对应图中的黑线(Profile)

图片标题中已经标注了p值,significant默认以0.05做阈值;

其他彩色线条代表与这个模型的相似度在70%以内的基因,鼠标悬浮可查看基因名;

右表与图片对应,给出了每个基因在此图中的模型数据;

Gene.Symbol列中“0(SPOT_数字)”类型的数据代表在您的输入文件中此基因名为空,故使用SPOT号代替。


如何调整参数分析

参数调整界面


数据处理(见如下官方说明):

Log normalize data:以前后时间点差异倍数的log2值作为分析数据,适合浮动范围跨数量级的数据;

Normalize data:以前后时间点的差值作为分析数据,适合浮动范围较小的数据;

No normalization/add 0:以上传的数据作为分析数据。

STEM官方说明

聚类方法

STEM和K-Means都是聚类算法,二者主要的不同是STEM是根据“变化跨度”总结所有可能的模型,

而K-Means是通过“聚类个数”预先人为定义要生成几个模型。

【变化跨度】指相邻两个时间点间的变化跨度,若为1,则后一个点相对于前一个点的状态有:1,0,-1;若为2,则为:2,1,0,-1,-2。也就是说,如果有三个时间点,要表达一直上升这种趋势,值为1时,三个点的状态只有一种:0,1,2;值为2时,三个点的状态有6种:0,1,2; 0,1,3; 0,1,4; 0,2,3; 0,2,4;0,3,4。其他状态以此类推。这个可根据您想研究的情况俩调整。


STEM趋势分析:结果解读_腾讯视频



结果下载


STEM趋势分析:打包下载+下载当前图片_腾讯视频

更多信息


STEM趋势分析:其他信息_腾讯视频

FAQ

趋势分析结果中的颜色是什么意思?

关于趋势分析结果中的颜色需要关注两个点:

1. 有颜色和没颜色:有颜色的是统计学意义上值得关注的趋势模型,推荐优先关注这些数据;

2. 颜色相同:代表这些模型相比于其他模型更为相似,可以归为一类来进行后续研究。

3. 颜色本身没有意义,比如不存在某种颜色更值得关注这种情况。

趋势分析结果中右上角的数字是什么意思?

是模型代号,用来对应找到另一张更具体的图形结果。这个数字与下拉框中的条目对应,可以查看到带基因的更详细的结果(见下图)。

 更多超好用的在线生信云工具的详细教程资料:http://qr03.cn/CF09Dg

上一篇 下一篇

猜你喜欢

热点阅读