R语言做图bioinformaticsR plot

R语言maftools包画oncoplot(瀑布图)的一个简单小

2021-04-05  本文已影响0人  小明的数据分析笔记本

几天在一个讨论群里看见有人 问是 否可以有偿做TCGA中 某个肿瘤的突变基因瀑布图吗,瀑布图之前听过,但是自己没有画过。感觉有错过了一个可以赚外快的好机会,赶紧找资料来学习一下,争取下次可以抓住赚外快的好机会,哈哈哈哈。

搜索了一下,有现成的包可以做这个事情,链接 http://bioconductor.org/packages/devel/bioc/vignettes/maftools/inst/doc/oncoplots.html 一行代码就出图,这也太方便了吧!

image.png

看来画图不难,难点应该在于如何按照指定的格式准备数据。

首先把代码运行一下,看自己能不能得到结果图

之前没有用过这个包,第一次用需要先安装
BiocManager::install("maftools")

安装没有遇到问题

加载
library(maftools)
获得输入文件的路径
laml.maf = system.file('extdata', 
                       'tcga_laml.maf.gz', 
                       package = 'maftools')
laml.maf
laml.clin = system.file('extdata', 
                        'tcga_laml_annot.tsv',
                        package = 'maftools')
laml.clin
image.png
读入数据
laml = read.maf(maf = laml.maf,
                clinicalData = laml.clin,
                verbose = FALSE)
class(laml)
laml@
image.png

读进来的数据有好多内容,暂时还搞不懂是啥

接下来是画图
oncoplot(maf = laml, draw_titv = TRUE)
image.png
接下来看看输入数据的格式

临床数据是一个tsv文件,数据相对比较简单, (tsv文件就是文件内部的内容使用指标付分隔)

image.png

另外一个文件是 一个压缩文件 ,解压出来也是一个tsv格式的文件

image.png

那么如何把TCGA格式的数据整理成上面的格式呢?后面学到了再来记录吧!

TCGA和GEO数据库挖掘也该学起来了!

欢迎大家关注我的公众号
小明的数据分析笔记本

小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

上一篇下一篇

猜你喜欢

热点阅读