突变与用药关联思路实现

2022-12-20  本文已影响0人  无话_

想将突变位点与用药联系起来,最简单的方法就是将每个突变精确到染色体上哪个位置哪个碱基改变。实际上多数SNV都可以通过Transvar转换(例如BRAF V500E 就可以转为hg19坐标下的chr7 140453136 A T)。如果能转换为这种格式,那么就可以填入vcf中,那么不管是作为热点突变去forece call出也好,拿snpshift annotate 做注释也好,都十分简单。
缺点则是这种做法十分依赖原始数据库积累,对于19号外显子缺失这种没有明确位置的信息位点很不友好。或者说19号外显子缺失,缺一个碱基是缺,缺两个碱基也是缺,能够一概而论用药吗?
Transvar的转换也不会考虑复杂情况。举一个Clinvar中的EGFR的L858R例子(如图), Transvar则只会转换出chr7 55259515 T G。本质上,EGFR这三个L858R是不同的,但是其造成的氨基酸变化又是相同的,那么用药又当如何呢?


image.png

如果坚持‘‘只有在已知数据库出现过的变异,才能关联用药’’的考虑,那么根据直接从cosmic,clinvar,civic下载的vcf一个点一个点地关联起来,总得来说,也不会太难。

如果是还是只考虑氨基酸变化,不论此位点有无前车之鉴。

显然就需要从几个层面考虑:
1.氨基酸变化;如:T>M 790
2.外显子变化;如:del 19
3.其他状态;CNV loss ,CNV gain ,Fusion
你以为这就结束了,不不不,还有其他乱七八糟的情况
比如:KRAS的G12C突变
是一个用药靶点,野生型(即完全不突变)也有药用,到了啥G12D,G12A,G13...等致癌突变,就开始耐药起来了。。。
再有一些MET 14号外显子跳跃突变
EGFR 20号外显子in-frame insertions又要排除 A763_Y764insFQEA
奇奇怪怪的太多。
就只说KRAS这个基因,要完全处理它,首先得把oncokb这个划分逻辑解析明白,并且这个逻辑估计只适用于这一个基因,属实是难搞。

说难搞,其实也并没有那么难,毕竟fda认证的oncokb也不过719个基因,124种药物。只是这些看起来混乱的突变划分,有些错杂的用药关联,实在缺乏数据的美感,让人没动力去做。

而且最重要的,oncokb商用要钱。。。。。。
贴一个PCGR的链接,这个项目相当的amazing啊。看得出来作者的思路是第二种,但是没有考虑一些奇奇怪怪的情况
Annotation resources • PCGR (sigven.github.io)

image.png
上一篇 下一篇

猜你喜欢

热点阅读