maftools使用
2018-11-08 本文已影响340人
高邮在逃咸鸭蛋
maftools是对WGS和WES数据进行上游分析之后,进行somatic mutation分析的一个非常好用的包,用非常简短的几行代码即可出图。
1.安装
maftools是bioconductor的包,详细说明可见https://bioconductor.org/packages/release/bioc/html/maftools.html
source("[http://bioconductor.org/biocLite.R](http://bioconductor.org/biocLite.R)")
biocLite("maftools")
library(maftools)
2.把vcf合并并进行处理便于下一步进行转换
如果数据是直接从TCGA下载maf文件,那么可跳过这一步直接进行画图。但通常我们是对自己拿到的测序结果进行分析,所以格式转换是必不可少的一步。我在这里使用3个mm10的vcf文件进行转换。该步骤都是在linux下进行操作。
maf文件的内容包括:
Mandatory fields: Hugo_Symbol, Chromosome, Start_Position, End_Position, Reference_Allele, Tumor_Seq_Allele2, Variant_Classification, Variant_Type and Tumor_Sample_Barcode.
Recommended optional fields: non MAF specific fields containing VAF (Variant Allele Frequecy) and amino acid change information.
#将所有样本的.mm10_multianno文件合并成一个文件并在最后一列添加文件名前缀
#!/bin/sh
for i in *.mm10_multianno
do
cut -f '2-13' $i |sed '1d' | sed "s/$/\t${i%%.*}/" >> all_annovar
done
#提取出含有外显子的信息
grep -P "\texonic\t" all_annovar > all_annovar2
#加上列名
sed -i '1s/^/Chr\tStart\tEnd\tRef\tAlt\tFunc.refGene\tGene.refGene\tGeneDetail.refGene\tExonicFunc.refGene\tAAChange.refGene\tTumor_Sample_Barcode\n/' all_annovar2
转换后的文件应具有:
2018-11-08 19-52-09屏幕截图.png
3.在R语言中正式处理
#将文件转换为maf格式
var.annovar.maf = annovarToMaf(annovar = "all_annovar2", Center = 'NA', refBuild = 'mm10', tsbCol = 'Tumor_Sample_Barcode', table = 'refGene',sep = "\t")
write.table(x=var.annovar.maf,file="var_annovar_maf",quote= F,sep="\t",row.names=F)
var_maf = read.maf(maf ="var_annovar_maf")
#概览maf文件
plotmafSummary(maf = var_maf, rmOutlier = TRUE, addStat = 'median')
Rplot.png
#绘制瀑布图
oncoplot(maf = var_maf, top = 30, fontSize = 12 ,showTumorSampleBarcodes = F )
因为我的样本略少,此处画出的图太丑,就不贴了。贴一下官网的图
下载.png
#绘制箱线图
laml.titv = titv(maf = var_maf, plot = FALSE, useSyn = TRUE)
plotTiTv(res = laml.titv)
同丑同官网图
下载 (1).png
#分析相互关系图
somaticInteractions(maf = var_maf, top = 15, pvalue = c(0.05, 0.1))
来张自己的图
Rplot02.png
今日结束!maftools可以做的图还有很多,如有需要,可以仔细阅读说明书。