Multi-omics Hammer软件之‘元素索引的批量查找’
本篇推文则主要介绍Multi-omics Hammer软件的另一个重磅功能:大文件的矩阵操作套件。使用这一套件可以进行各种文件格式转换,有效减少用户处理文件格式的时间和精力。
一 功能开发
其实这项功能的开发的初衷是因为高通量数据时常常会生成和调用大量的格式迥异的文件。虽然使用excel可以实现数据在各个格式间来回切换,但是这一过程常常特别的繁琐,并且易出错。因此,萌生了在Multi-omics Hammer软件提供一个套件来完成各种文件格式的转换。那么,该如何实现这一想法呢?在做数据分析时,我发现对于许多文件而言,仅仅通过类似矩阵的重建或拆分的形式即可实现文件的多格式快速整理。因此,本软件以矩阵为理念,以文件行与列的常用组合为基础,实现了不同文件格式间的转换。只是,文件格式千千万,哪能一个软件全实现。因此,后续功能的增添还需根据用户需求进行调整。
二 软件调用
开头第一步,也是最重要的一步。就是打开我们的Multi-omics Hammer软件(下载地址:https://github.com/wangjun258/Multi-omics-Hammer)。随后,在‘Dataprocess’菜单中点击‘Data process as matrix’选项,弹出对话框(如下所示)。
图1要使用本功能,需要首先了解一下该对话框包含哪些元素(图2)。
①Formatconversion method: 文件进行格式转换时调用的方法
②Input file:需要转换的文件
③Formatconversion command: 文件转换时的辅助命令
④Documentsfor retrieval: 用于检索的文件(如需要以此文件的内容作为种子查找对应的内容)
⑤Previewoutput results: 结果预览(如果用户不需要保存结果,通过此窗口即可实现结果好看)
⑥Output filelocation: 此窗口填入的内容为保存输出结果的文件的绝对路径
⑦CommandLaunch Options: 命令启动选项,用于启动功能和保存文件。其中7-1为文件是否保存的复选框,7-2为是否仅用窗口的数据进行运算的复选框,7-3为启动按钮,7-4为加载示例文件按钮
图2随后,用户即可将输入文件拖入到‘inputfile’文本框中,如图3所示。
图3将格式转换辅助命令的文件拖入到‘CMD lines’文本框中,如图4所示。
图4将索引文件拖入到‘index file’对话框中,并点击图5的方框9的按钮,启动索引查找。
图5之后,结果会展现在‘Result Preview’对话框中(图6)。如果用户想要保存数据,则将输出文件拖入到‘output files’对话框中,软件会自动识别所拖入文件的绝对路径,并展示出来。其中‘Result Preview’对话框中的数值对应各个元素在输入文件中的行数(以1起始)。
图6上面所用到的示例数据,我也在下面逐一列出,方便用户调用。
输入文件(inputfile):
格式转换辅助命令的文件(CMD lines):
注意,加载示例文件时会包含以note开头的行,这些行的作用是向用户介绍各个参数的含义
元素文件(index file):
输出文件(result file):
三 惯例小结
实际上,除了对给定内容在背景文件中的行索引进行查找外,本软件还提供了文件大小统计、分隔符替换、GO文件的格式转换等等(这部分内容会在后面结合相应的案例继续介绍)。另外,读者觉得还有什么功能需要实现,也可直接通过公众号留言。最后的最后,欢迎大家多用Multi-omicsHammer软件,多提宝贵建议。也欢迎大家多关注公众号(见个人介绍)。
软件下载地址:
https://github.com/wangjun258/Multi-omics-Hammer