生物节律之biocycle和cosinor分析--网页版(3)
前面介绍了好几个R包,有做振荡检测的Metacycle包,对周期限制的比较松,也有做cosinor分析的,限定周期为24小时。
下面解释几个网页版的工具
1.BIO_CYCLE PORTAL
2.cosinor.online
3.Cosinor_Analysis_of_Rhythms
1.BIO_CYCLE
输入文件必须是一个制表符分隔的文件(* .tsv),第一列为Gene ID,后跟每个时间点的测量值,允许重复。下面的链接中提供了示例文件格式。BIO_CYCLE可以处理可变数量的重复,不均匀的时间点和缺失的重复(只要每一行每个时间点至少有一个值)。
提交结果文件直接Run就好,完成后下载,下载的结果文件有三个,直接看24小时那个就好
results_24hr_period.tsv
结果依次为基因名,p值,校正q值,周期,相位,振幅
它还提供了AVG_REPS_PERIODICITY,这是对重复的平均周期的度量。该值来自于深度神经网络的输出,并对其进行均值评估。
它还给出了REPS_SCATTER,即重复的平均标准偏差除以信号的标准偏差。
如果只有一个复制,那么这个值总是0。
ps:现在网站好像有点问题,无法直接在网页上可视化
另外:网站也提供了本地化R包,下载下来解压即可用,比网页好的一点是可以自定义检测周期,不像网站只有8,12,24三个周期可以选择,缺点是非图形化界面
使用方法:
Rscript BioCycle.R -i <input_file>
-o <output_dir>
-s <start of range of periods to search for, default: 20>
-e <end of range of periods to search for, default: 28>
输入文件和前面一样,示例:
Rscript BioCycle.R -i 1.tsv -o .
结果也和前面差不多,不再赘述
ps:Rscript使用前需先将其所在目录添加到PATH环境变量中,在此不再赘述
2.cosinor.online
使用超级简单,网站说的很明白,用来评估单个基因非常好使,示例和使用说明见下图:
示例结果如下:
3.Cosinor_Analysis_of_Rhythms
该网站有些毛病,时不时会断开连接,但有时点的过快也会断开,真是神奇,毕竟是个人搭建的,现在可能已经不维护了
然后它可以对单个基因进行统计,也可以对单个基因不同分组做统计
使用方面,网站也说的很清楚了
结果有好几个部分:
第一部分:两个检验(一个是cosinor2::cosinor.poptests()的返回结果,一个是常规的t检验,该t检验没有检测方差齐性,默认为非齐性)
第一个表p列:两组基线,振幅,相位差异的p值
1st列:组别1的基线,振幅,相位均值
2nd列:组别2的基线,振幅,相位均值
第二个表:常规t检验结果,不再描述
第二部分:绘图部分及每组振荡性检测
上为图,下为统计数据,只要看一个就好,图中画图部分
吐槽:要我说,这部分应该放到前面,比较两组振荡曲线是否有差异,应该先测试每组是否振荡
第三部分:更详细的统计数据
第一个表为拟合的三条曲线值对应值,
猜测其实际上是对每个样本列都做了一次,因此每组产生了产生了三个值,但私以为没有现实上的统计意义
第二个表为三个样本列值合并起来后拟合所产生的置信区间表(有实际意义,提取自cosinor2::population.cosinor.lm()$conf.ints)
第三个图不太清楚
总结:
1.希望检测区间比较宽泛的,建议使用Metacycle
和Biocycle
R包(一个在cran上,一个在circadiomics上),但这两个都不能做组间差异检测,可以用来评估单组多基因,不喜欢R包的就使用网页版的BIO_CYCLE PORTAL
2.希望做cosinor分析,尤其是单组单基因的,建议使用cosinor.online和Cosinor_Analysis_of_Rhythms,毕竟是网页版的,点点就好,不喜欢网页的话也可以使用season::cosinor
(我评估过,和cosinor.online结果几乎一模一样)
3.希望做cosinor分析,但着重于单基因两组间比较的,建议使用Cosinor_Analysis_of_Rhythms,统计资料非常齐全,但其实结果和cosinor2包的结果差不多,不喜欢网页的话就用cosinor2
包
4.希望做cosinor分析,但着重于多基因两组间比较的,没有网页版的使用建议,建议使用cosinor
和cosinor2
包,然后自行提取和整理数据
ps:暂时就写这么多,回头想起什么再补,有问题敬请各位批评指正!