R语言maftools包画oncoplot(瀑布图)的一个简单小
2021-04-05 本文已影响0人
小明的数据分析笔记本
几天在一个讨论群里看见有人 问是 否可以有偿做TCGA中 某个肿瘤的突变基因瀑布图吗,瀑布图之前听过,但是自己没有画过。感觉有错过了一个可以赚外快的好机会,赶紧找资料来学习一下,争取下次可以抓住赚外快的好机会,哈哈哈哈。
搜索了一下,有现成的包可以做这个事情,链接 http://bioconductor.org/packages/devel/bioc/vignettes/maftools/inst/doc/oncoplots.html 一行代码就出图,这也太方便了吧!
![](https://img.haomeiwen.com/i6857799/1fc03fb93a1868ce.png)
看来画图不难,难点应该在于如何按照指定的格式准备数据。
首先把代码运行一下,看自己能不能得到结果图
之前没有用过这个包,第一次用需要先安装
BiocManager::install("maftools")
安装没有遇到问题
加载
library(maftools)
获得输入文件的路径
laml.maf = system.file('extdata',
'tcga_laml.maf.gz',
package = 'maftools')
laml.maf
laml.clin = system.file('extdata',
'tcga_laml_annot.tsv',
package = 'maftools')
laml.clin
![](https://img.haomeiwen.com/i6857799/a0f98e0521536902.png)
读入数据
laml = read.maf(maf = laml.maf,
clinicalData = laml.clin,
verbose = FALSE)
class(laml)
laml@
![](https://img.haomeiwen.com/i6857799/7b1090991359d06f.png)
读进来的数据有好多内容,暂时还搞不懂是啥
接下来是画图
oncoplot(maf = laml, draw_titv = TRUE)
![](https://img.haomeiwen.com/i6857799/23e816d337034aa3.png)
接下来看看输入数据的格式
临床数据是一个tsv文件,数据相对比较简单, (tsv文件就是文件内部的内容使用指标付分隔)
![](https://img.haomeiwen.com/i6857799/c14bc7f9f41a012a.png)
另外一个文件是 一个压缩文件 ,解压出来也是一个tsv格式的文件
![](https://img.haomeiwen.com/i6857799/78e1803b318fb76b.png)
那么如何把TCGA格式的数据整理成上面的格式呢?后面学到了再来记录吧!
TCGA和GEO数据库挖掘也该学起来了!
欢迎大家关注我的公众号
小明的数据分析笔记本
小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!