Maf文件中突变起始位点与终止位点的关系
2018-05-16 本文已影响7人
王诗翔
在TCGA下载的都是标准的Maf文件,但有时我们会需要使用某篇文章或者某些数据构建Maf文件,然后利用像Maftools
这样的工具进行分析和可视化突变。
如果你知道突变的起始位置,突变参考碱基序列,突变后的序列,我们可以用类似下面的代码来计算终止位点:
library(tidyverse)
input_maf %>%
mutate(End_Position = ifelse( Reference_Allele == '-',
Start_Position + 1,
ifelse(Tumor_Seq_Allele2 == '-',
Start_Position + nchar(Reference_Allele) - 1,
Start_Position)))
在参考位点或者突变位点中,-
用来表示缺失或插入。
该代码执行这样一个计算变换:
替换 End = Start
插入 End = Start + 1 # 不管插入了多少个
删除 End = Start + n(删除碱基数) - 1