生物信息学与算法生物信息杂谈生物信息

Maf文件中突变起始位点与终止位点的关系

2018-05-16  本文已影响7人  王诗翔

在TCGA下载的都是标准的Maf文件,但有时我们会需要使用某篇文章或者某些数据构建Maf文件,然后利用像Maftools这样的工具进行分析和可视化突变。

如果你知道突变的起始位置,突变参考碱基序列,突变后的序列,我们可以用类似下面的代码来计算终止位点:

library(tidyverse)
input_maf %>% 
    mutate(End_Position = ifelse( Reference_Allele == '-', 
                                  Start_Position + 1,
                                  ifelse(Tumor_Seq_Allele2 == '-', 
                                         Start_Position + nchar(Reference_Allele) - 1, 
                                         Start_Position)))

在参考位点或者突变位点中,-用来表示缺失或插入。

该代码执行这样一个计算变换:

替换 End = Start
插入 End = Start + 1 # 不管插入了多少个
删除 End = Start + n(删除碱基数) - 1
上一篇下一篇

猜你喜欢

热点阅读