代谢组学

statTarget-基于QC样本的代谢组学数据校正

2019-01-07  本文已影响129人  Dayueban

导读

质量控制是基于质谱组学数据获得可重复性和准确性结果的必要步骤。重复使用相同的QC样本在MS run order序列中对信号漂移的评估和校正越来越被接受,尤其有利于提高批次间实验数据的质量,statTarget是一个流线型的工具,它为基于质量控制的信号校正、多批实验的MS数据集成以及基于MS的组学数据的综合统计分析提供了图形化的用户界面。本文档旨在指导用户使用函数执行数据分析,如shiftCor、statAnalysis、statTargetGUI函数等。

Fig.1

概述

statTarget一个精简的可以提供图形用户界面,基于质QC样本进行信号校正,可以整合不同批次之间的代谢组学和蛋白质组学数据,并进行全面的统计分析。

statTarget是如何工作的

statTarget包括两方面内容

  1. 基于QC样本的随机森林校正(QC-based random forest correction, QC-RFSC);
  2. 基于QC样本的LOESS(locally weighted scatterplot smoothing)信号校正(QC-based LOESS signal correction, QCRLSC)

statTarget包的功能列表

statTargetGUI

因为该函数提供了一个交互式界面分析的功能statTargetGUI,所以先看下如何使用

## Examples Code for graphical user interface 

library(statTarget)

statTargetGUI()

#For mac PC,  the GUI function 'statTargetGUI()' need the XQuartz instead of X11 support. Download it from https://www.xquartz.org. R 3.3.0 and RGtk2 2.20.31 are recommended for RGtk2 installation.

工作界面如下图所示

Fig.2 statTargetGUI工作界面

信号校正

Fig.3 Meta文件格式

Profile file
就是组学数据的丰度表

Fig.4 Profile文件格式
## Examples Code

library(statTarget)

datpath <- system.file('extdata',package = 'statTarget')
samPeno <- paste(datpath,'MTBLS79_sampleList.csv', sep='/')
samFile <- paste(datpath,'MTBLS79.csv', sep='/')
shiftCor(samPeno,samFile, Frule = 0.8, MLmethod = "QCRFSC", QCspan = 0,imputeM = "KNN")

统计分析

Fig.6 Stat File数据格式
## Examples Code

#library(statTarget)

datpath <- system.file('extdata',package = 'statTarget')
file <- paste(datpath,'data_example.csv', sep='/')
statAnalysis(file,Frule = 0.8, normM = "NONE", imputeM = "KNN", glog = TRUE,scaling = "Pareto")

处理质谱数据

Fig.8 xcms处理后的数据
## Examples Code

library(statTarget)

datpath <- system.file('extdata',package = 'statTarget')
dataXcms <- paste(datpath,'xcmsOutput.tsv', sep='/')
#dataSkyline <- paste(datpath,'skylineDemo.csv', sep='/')
transX(dataXcms,'xcms')
#transX(dataSkyline,'skyline')

参考

[1] Luan H., Ji F., Chen Y., Cai Z. (2018) statTarget: A streamlined tool for signal drift correction and interpretations of quantitative mass spectrometry-based omics data. Analytica Chimica Acta. dio: https://doi.org/10.1016/j.aca.2018.08.002
[2] Luan H., Ji F., Chen Y., Cai Z. (2018) Quality control-based signal drift correction and interpretations of metabolomics/proteomics data using random forest regression. bioRxiv 253583; doi: https://doi.org/10.1101/253583
[3] KNN,k-临近算法
[4] statTarget官网

上一篇 下一篇

猜你喜欢

热点阅读