【ProteoWizard MSConvert】质谱文件格式简介
2020-03-23 本文已影响0人
生物信息与育种
质谱格式
质谱文件格式多种多样,各仪器厂商产出的数据都有不同。虽然HUPO已经对质谱数据进行了标准化,但大家依然是我行我素,因为不得不用它们提供的软件,而不同的软件会要求不同的格式进行搜库(不过现在很多软件以及支持多种数据格式了,如MaxQuant)。各厂商对应的文件格式如下表:
image.png
好在ProteoWizard为我们提供了格式转换的工具MSConvert,它可以转换为以下数据格式:
- mzML 1.1
- mzML 1.0
- mzXML
- MGF
- MS2/CMS2/BMS2
- mzIdentML
其中mzXML和mzML就是标准数据格式。
格式转换
MSConvert的Linux版本并不友好,需要wine/docker来运行Proteowizard,但一般linux默认都是x64架构,而x64一直诟病于对Framework的支持。
1.Linux转换
Wine
msconvert –help
msconvert data.RAW –mzXML #默认mzML
msconvert *.RAW -o my_output_dir
msconvert data.RAW –zlib –filter “peakPicking true [1,2]” #用vendor方法对msLevels 1/2进行中心化过滤,并用zlib对结果数据进行压缩,此命令比较常用
更多命令可参考:msconvert
Docker
ProteoWizard提供了docker解决方案
# 下载docker镜像
docker pull chambm/pwiz-skyline-i-agree-to-the-vendor-licenses
##直接运行
docker run -it --rm -e WINEDEBUG=-all -v /home/xxx/rawfiles/:/data chambm/pwiz-skyline-i-agree-to-the-vendor-licenses wine msconvert /data/*.raw --filter "peakPicking true 1-"
## 交互式运行,通过bash进入
docker run -it --rm -e WINEDEBUG=-all -v /home/xxx/rawfiles/:/data chambm/pwiz-skyline-i-agree-to-the-vendor-licenses /bin/bash
转换过程会遇到一些错误,好像都有一些问题。
2.Windows转换
GUI界面版本操作起来更简单,但数据转移和运行速度实在是忍不了。
image.png
使用默认参数不过滤的话,转换的文件会非常大(比源文件增加数倍,因为它把一些无强度的峰也加进去了),速度也巨慢。一般Filters需要设置为Peak Picking,MS Levels设为1-2。
image.png
而且要注意,选择后记得按Add,否则还是没有加入peakPicking,并且要将peakPicking放在第一行(行可拖动)。
image.png
其他格式转换软件
- ThermoRawFileParser
- Proteome Discoverer
-
GNPS
不同软件转换的结果很可能不同。比如同一个数据,我用ThermoRawFileParser(默认参数),同事用Proteome Discoverer,得到MGF的谱图数竟然有4-5倍差异!后来用MSConvert转换和ThermoRawFileParser谱图一致,它俩的算法好像是一样的。哎,搞不懂,如果连原始数据质量都不能保证,还做个屁的数据分析。
Ref:
Employing ProteoWizard to Convert Raw Mass Spectrometry Data
msconvert使用介绍
在Linux环境运行msconvert转换格式
Use msconvert in Linux or Mac