科研信息学代谢组学代谢组学

非靶向代谢组学数据校正软件之-SERRF

2019-03-12  本文已影响51人  Dayueban

@文章翻译自SERRF主页

SERRF是什么

SERRF的全名叫Systematical Error Removal using Random Forest

图一

SERRF是如何工作的

注:在SEFFR算法中,采用的是QC样本交叉验证相对标准偏差(或称为变异系数)的值来评估模型的性能

图二

SEFFR与其它校正方法有什么不同

图三

为什么选择随机森林

随机森林的算法,是由Breiman开发的,其实一种非参、非线性、不容易过拟合等优点,对离群值和噪音相对来说比较稳健以及可以快速训练。所以这些属性赋予了RF适用于对高纬非靶向代谢组学数据进行归一化。

SERRF性能如何

我们不能说某一个归一化方法是最好的,但是SERRF有下面的一些优点:

注:交叉验证是处理数据过拟合的常用方法

SERRF使用

本地下载到R语言

1 | 下载SERRFweb包

rm(list=ls())
library(devtools)
install_github("linliliaabbcc1024/SERRFweb")
library(SERRFweb)

2 | 使用

注:文件准备如下:

图四
# 文件转备好,直接输入下列命令
SERRF(input = "SERRF example dataset2.xlsx")

可以得到如下文件

图五

网页版使用

1 | 网址

点击这里SERRF网页版分析

2 | 使用方法如下

网页版使用

参考

[1] SERRF:Systematical Error Removal using Random Forest

上一篇 下一篇

猜你喜欢

热点阅读