诗翔的R语言学习之路Cook R生物信息学与算法

「r<-工具」在 Hiplot 中使用 Sigflow

2020-08-19  本文已影响0人  王诗翔

介绍

突变模式(印记)分析(mutational signature analysis)目前已经成为变异检测后一个重要分析流程,它能够揭示癌症组织样本受哪些内外界因素的影响以及其贡献大小。

Sigflow 是基于突变模式分析 R 包 sigminer 所构建的命令行流程软件,提供了几大突变模式分析流程,便于组学流程的对接与自动化分析。

在 Hiplot 平台上,目前 Sigflow 开放了 2 个核心的子命令 extractfit

使用

在 Hiplot 平台的进阶模块中,我们可以找到 Sigflow

image-20200809174040904

点击即可进行工具使用界面。

点击数据文件右侧的突变,可以载入示例输入文件。一般而言,我们推荐使用标准的 MAF 格式文件作为 SBS/DBS/INDEL 突变模式提取的输入(包含同样数据信息的 CSV/EXCEL 格式文件也支持);提取拷贝数突变模式的输入文件需要包含以下列:

image-20200809174204679

extract 命令

该命令推荐在突变记录多、样本多的情况下使用。

经过简化,extract 命令只需要设置 4 个参数:

设定好选项后点击「提交」运行程序。

image-20200809175702701

运行时间受到输入数据大小和最后两个选项的设定影响(10几分钟到数小时),请耐心等待程序结束。

任务完成后,在界面下方可以预览一些输出结果图表,推荐点击结果预览右下侧的下载按钮下载所有的结果图表📈。

image-20200810104231480

fit 命令

fit 命令只需要设定 extract 命令提及的前 2 个参数,不再赘述。

fit 命令使用的是动态规划算法寻找输入数据基于 COSMIC 参考突变模式的最佳线性组合,算法很快,一般数百个样本的处理过程可以在数分钟内完成。

image-20200809180522245

在 fit 的结果中,被 COSMIC 数据库标记为 artifact 的突变模式结果被去除了。

任务完成后,在界面下方可以预览一些输出结果图表,推荐点击结果预览右下侧的下载按钮下载所有的结果图表📈。

image-20200810104234573
上一篇下一篇

猜你喜欢

热点阅读