R package:MSnbase(二):将质谱数据由profi

2021-10-30  本文已影响0人  佳名

在profile 模式下产生的质谱数据,特定离子的信号通常分布在离子真实m/z值周围。这种信号的准确性依赖于仪器的分辨率和设置。profile模式数据可以处理成centroid数据,只保留一个单一的、有代表性的值,通常是数据点分布的局部最大值。某些算法,如LC-MS实验xcms包中用于色谱峰检测的centWave函数或蛋白质组学匹配MS2光谱和多肽的搜索引擎,要求数据为centroid模式。

可以使用MSconvert在将数据转化为centroid模式

MSConvert.jpg

但是MSconvert软件转换往往存在耗时特别长,转换不成功等问题。此外,也可以通过MSnbase包的pickPeaks函数实现转换,该方法对单个光谱(Spectrum实例)或整个实验(MSnExp实例)进行峰挑选,以创建中心光谱。
质谱的centroid 模式会使得检出来的二级质谱更多。

library(xcms)
library(magrittr)
library(ggplot2)

载入数据

raw_data <- readMSData("WMZHY-20201113-1.mzML",  mode = "onDisk",centroided = FALSE)

参数refineMz有"kNeighbors","descendPeak","none"(默认)3个选项。
kNeighbors通过加权平均计算最接近真实m/z;
descendPeak峰值区域通过从两侧确定的质心/峰值下降,直到测量信号再次增加来定义。在该定义区域内,强度至少为质心强度百分比的所有测量值用于计算精确的m/z。

转化为centroid模式

dda_data <- raw_data %>%
  pickPeaks(refineMz = "none") 

比较对一级谱图的影响

par(mar=c(6,3,6,3))
par(mfrow = c(1, 1))
plot(raw_data[[3737]],dda_data[[3737]])
MS.png

比较对二级谱图的影响

plot(raw_data[[3739]],dda_data[[3739]])
MS/MS.png

转化为centroid模式后,无论是一级质谱还是二级质谱,杂峰明显减少。转化后的数据可以用于后续分析,也可以保存。

writeMSData(dda_data, file = "dda_data.mzML")

如果不知道质谱数据是否为centroid模式可以通过featureData@data[["centroided"]]查看。
参考资料:
Bioconductor - MSnbase
MSnbase: centroiding of profile-mode MS data (bioconductor.org)
MSnbase: MS data processing, visualisation and quantification • MSnbase (lgatto.github.io)

上一篇 下一篇

猜你喜欢

热点阅读