生信分析工具包基因组学做肿瘤

MSI+火山图

2021-02-05  本文已影响0人  小森的生统笔记

MSI学习笔记

MSI的检测方法和应用
  1. DNA检测和免疫组织化学法
  2. 使用MANTIS算法来计算各个样本的MSI得分(参考文献: Landscape of Microsatellite Instability Across 39 Cancer Types.)
    来源:100篇泛癌研究文献解读之微卫星不稳定性生信技能树

微卫星不稳定

  1. 重复序列在基因组中,有串联重复序列,有三种类型:卫星DNA、小卫星DNA、微卫星DNA,区别在于重复单位的长度。
  2. 微卫星DNA,重复单位仅2-5bp,一般为1-6个碱基重复。
  3. 为了防止MSI,就有了DNA错配修复(mismatch repair,MMR),它由一系列特异性修复DNA碱基错配的酶(由错配修复基因编码)组成,能够查出MSI并进行修复,保证复制的精确性。
  4. 出现错配修复缺陷(deficient mismatch repair,dMMR),DNA修复能力下降或缺失,个体自发突变率将明显增加。
  5. 最终,导致MSI不稳定性,造成细胞增殖分化异常和肿瘤的发生,比如Lynch(林奇)综合症,这是一种可遗传的大肠癌。
    参考:只为解析:微卫星不稳定---MSI
    msisensor计算msi2020-05-11-MSI算法-msisensor计算原理

方法介绍

基于一般统计模型的MSI检测方法
  1. 基于Indel的MSI检测方法
  2. MSIsensor(推荐使用)
  3. MANTIS
基于机器学习模型的MSI检测方法
  1. MSIseq
  2. MOSAIC
EDB-MSI新算法检测肿瘤MSI状态具有更高准确性

参考:【转载】【MSI学习笔记】

Figure Ya59

#设置x,y軸的最大最小位置
xmin <- -10
xmax <- 10
ymin <- 0
ymax <- 6

原文有用公式去做,但是公式有时候显示出来的不是足够差异表达的基因,有些是-logFC=0.4,画出来一些都是不咋显著的基因

> xmin <- (range(x$logFC)[1]- (range(x$logFC)[1]+ 10))
Error in range(x$logFC)[1] + 10 : non-numeric argument to binary operator
> class(x$logFC)
[1] "character"
> range(x$logFC)[1]
[1] "-0.000108058"
> range(x$logFC)[1]+10
Error in range(x$logFC)[1] + 10 : non-numeric argument to binary operator

必须要转化为数值形式
注意:必须提前在excel里面把缺失值全部除去,pvalue和logFC的缺失值都除去。

上一篇 下一篇

猜你喜欢

热点阅读