maftools笔记
maftools的用途是:汇总,分析和可视化MAF文件
1简介
随着癌症基因组学的进步,突变注释格式(MAF)被广泛接受并用于存储检测到的体细胞变体。 癌症基因组图谱项目对30多种不同的癌症进行了测序,每种癌症类型的样本量超过200种。由体细胞变体组成的结果数据以突变注释格式的形式存储。 只要数据采用MAF格式,该软件包就可以从TCGA源或任何内部研究中有效地总结,分析,注释和可视化MAF文件。
2生成MAF文件
对于VCF文件或简单的表格文件,简单的选择是使用vcf2maf实用程序,它将注释VCF,确定转录的优先级,并生成MAF。
如果你使用ANNOVAR进行变体注释,maftools有一个方便的函数annovarToMaf,用于将表格的annovar输出转换为MAF。
3 MAF field requirements
MAF files contain many fields ranging from chromosome names to cosmic annotations. However most of the analysis in maftools uses following fields.
-
Mandatory fields: Hugo_Symbol, Chromosome, Start_Position, End_Position, Reference_Allele, Tumor_Seq_Allele2, Variant_Classification, Variant_Type and Tumor_Sample_Barcode.
-
Recommended optional fields: non MAF specific fields containing VAF (Variant Allele Frequecy) and amino acid change information.
Complete specification of MAF files can be found on NCI GDC documentation page.
This vignette demonstrates the usage and application of maftools on an example MAF file from TCGA LAML cohort 1.
4 Installation
if (!require("BiocManager"))
install.packages("BiocManager")
BiocManager::install("maftools")
image.png
参考文献:https://www.bioconductor.org/packages/devel/bioc/vignettes/maftools/inst/doc/maftools.html