全基因组/外显子组测序分析肿瘤免疫微环境生物信息学与算法

ABSOLUTE评估肿瘤纯度

2018-08-18  本文已影响59人  生信修炼手册

欢迎关注"生信修炼手册"!

ABSOLUTE是评估肿瘤纯度的常用软件之一,它可以利用肿瘤样本的CNV和SNV等信息,对肿瘤纯度进行估计,该软件采用R语言进行编写。

软件官网如下

http://archive.broadinstitute.org/cancer/cga/absolute

首先需要到官网注册一个账号,登录之后才可以下载到源代码的压缩包。下载好之后,在R里面安装其依赖包和对应的源代码包就可以了,安装过程如下

install.packages("numDeriv")
install.packages("ABSOLUTE_1.0.6.tar.gz")

安装好之后,可以先测试一下。测试数据我是从以下链接下载的

http://software.broadinstitute.org/cancer/software/genepattern/modules/docs/absolute/2#exampledata

在这个网站上还推荐了各种参数的设置,可以参考运行代码如下

RunAbsolute(
 seg.dat.fn = "SNP6_blood_normal.seg.txt", 
 min.ploidy = 0.5, 
 max.ploidy = 8, 
 max.sigma.h = 0.2, 
 platform = "SNP_6.0", 
 copy_num_type = "total", 
 sigma.p = 0,
 results.dir = "test", 
 primary.disease = "BLCA", 
 sample.name = "cancer", 
 max.as.seg.count = 1500, 
 max.non.clonal = 1, 
 max.neg.genome = 0.005
)

sample.name指定样本名称;results.dir参数指定输出结果的目录,该目录包含以下文件

├── cancer.ABSOLUTE_plot.pdf
├── cancer.ABSOLUTE.RData
└── tmp

我们只需要看PDF文件就可以了。不提供肿瘤细胞体细胞突变数据时,该文件包含下面三种类型的图片

1. 肿瘤纯度和倍性的散点图

横坐标肿瘤倍性,纵坐标肿瘤纯度,每个点代表一个软件评估的结果。

2. 不同模型排序柱状图

SCNAs代表体细胞CNV数据,karyotype是根据预先筛选的TCGA肿瘤数据建立的模型,combined代表综合前面两种模型。ABSOLUTE会根据这三种模型分别对肿瘤纯度评估的结果进行排序。

3. 肿瘤纯度评估结果

上述截图只是其中一个结果的截图,ABSOLUTE一次会给出多个评估结果。这多个结果会按照综合模型的打分进行排序,通常情况下,直接看第一个结果就可以了。

由于肿瘤样本的复杂性,建议同时提供体细胞突变的数据,这样可以综合利用CNV和SNV的信息去评估肿瘤纯度,比单纯利用CNV数据效果更好。

扫描关注微信号,更多精彩内容等着你!

上一篇下一篇

猜你喜欢

热点阅读