如何对时间节点样本进行趋势分析?
适用场景
示例数据
当样本为时间节点样本时(如上图,分别为0h,0.5h,3h,6h,12h五个时间节点样本的基因表达量),一般的差异分析比较分析就难以满足我们的数据挖掘需求,比如,若进行两两比较,得进行10次比较才能把所有时间点的数据都比较一遍,而且不方便整体性地观察变化趋势,比如某基因随着时间的变化一直上升/一直下降/先上升后下降/先下降后上升/......。这种趋势分析也称为“基因表达模式聚类分析”。
如下图,将五个时间点简化成五个点,给出了不同的变化趋势,有颜色的是分析得到的最显著的变化模式,按显著程度从大到小排列,相同颜色代表更相似的变化趋势:
以上,对所有有趋势的样本设置都有用:时间、浓度、患病程度等。
一分钟演示出图
网址:https://www.omicstudio.cn/tool/37
按图中箭头指示:
1. 点击“开始分析”,直接运行示例数据;
2. 运行完成后显示如图画面;
3.有两个下载选项可以下载数据:一个打包下载全部,一个下载当前呈现的图表。
STEM趋势分析:一分钟出图演示_腾讯视频
输入文件
第一列:SPOT ID,序号列;
第二列:基因名;
第三列至最后:按时间顺序排列您的表达量数据。
SPOT列可以没有,但是需要注意在网页上去掉勾选“含序号列”。
格式一:含序列号 格式二:不含序列号STEM趋势分析:输入文件格式说明_腾讯视频
一键分析自己的数据
1. 上传文件
2. 确认输出结果中的图片格式和文件夹名称
3. 点击开始分析
如何看趋势分析的结果
1.关于表格
根据“Genes Assigned”的显著性对有颜色的聚类结果进行排序;
相同的Cluster编号对应相同的颜色,Cluster为-1的底色均为白色;
图排序顺序为:从左到右,从上到下。图中越靠前的Profile越值得研究。
2.关于图片
总图右上角的数字对应Profile的编号,可从下拉框中寻找到对应图片;
图片标题中的(0,1,2,1,0)代表该图所代表的的模型,对应图中的黑线(Profile);
图片标题中已经标注了p值,significant默认以0.05做阈值;
其他彩色线条代表与这个模型的相似度在70%以内的基因,鼠标悬浮可查看基因名;
右表与图片对应,给出了每个基因在此图中的模型数据;
Gene.Symbol列中“0(SPOT_数字)”类型的数据代表在您的输入文件中此基因名为空,故使用SPOT号代替。
如何调整参数分析
参数调整界面
数据处理(见如下官方说明):
Log normalize data:以前后时间点差异倍数的log2值作为分析数据,适合浮动范围跨数量级的数据;
Normalize data:以前后时间点的差值作为分析数据,适合浮动范围较小的数据;
No normalization/add 0:以上传的数据作为分析数据。
STEM官方说明聚类方法
STEM和K-Means都是聚类算法,二者主要的不同是STEM是根据“变化跨度”总结所有可能的模型,
而K-Means是通过“聚类个数”预先人为定义要生成几个模型。
【变化跨度】指相邻两个时间点间的变化跨度,若为1,则后一个点相对于前一个点的状态有:1,0,-1;若为2,则为:2,1,0,-1,-2。也就是说,如果有三个时间点,要表达一直上升这种趋势,值为1时,三个点的状态只有一种:0,1,2;值为2时,三个点的状态有6种:0,1,2; 0,1,3; 0,1,4; 0,2,3; 0,2,4;0,3,4。其他状态以此类推。这个可根据您想研究的情况俩调整。
STEM趋势分析:结果解读_腾讯视频
结果下载
STEM趋势分析:打包下载+下载当前图片_腾讯视频
更多信息
STEM趋势分析:其他信息_腾讯视频
FAQ
趋势分析结果中的颜色是什么意思?
关于趋势分析结果中的颜色需要关注两个点:
1. 有颜色和没颜色:有颜色的是统计学意义上值得关注的趋势模型,推荐优先关注这些数据;
2. 颜色相同:代表这些模型相比于其他模型更为相似,可以归为一类来进行后续研究。
3. 颜色本身没有意义,比如不存在某种颜色更值得关注这种情况。
趋势分析结果中右上角的数字是什么意思?
是模型代号,用来对应找到另一张更具体的图形结果。这个数字与下拉框中的条目对应,可以查看到带基因的更详细的结果(见下图)。
更多超好用的在线生信云工具的详细教程资料:http://qr03.cn/CF09Dg