SMART App:鼠标点点就能完成发表级的DNA甲基化综合分析
今天跟大家分享的是2019年12月发表在Epigenetics & Chromatin(IF:4.185)杂志上的一篇文章The SMART App: an interactive web application for comprehensive DNA methylation analysis and visualization.本文是复旦大学附属中山医院胸外科卢春来教授(通讯作者)带领的团队发表的;李胤为该文的第一作者。在文章中作者对SMART App(一个只需要点一点就能完成DNA甲基化分析和可视化的网站应用程序) 分模块作了详细的介绍和举例说明~
The SMART App: an interactive web application for comprehensive DNA methylation analysis and visualization carcinoma
SMART APP:一个用于DNA甲基化分析和可视化的交互式web应用程序
一.研究背景
癌症基因组图谱(TCGA)数据的挖掘极大地促进了癌症基因组的研究,为癌症研究人员提供了前所未有的机遇。然而,现有的DNA甲基化分析web应用程序并不能充分满足实验生物学家的需要,通常还需要许多其他辅助工具。(为大家附上网址:http://www.bioinfo-zs.com/smartapp/;挂上梯子体验感更加哦)
B站:科研菌2020/公众号:科研菌 可播放二.分析流程
三.结果解读
1.Features
这款SMART(Shiny Methylation Analysis Resource Tool) App,为用户对不同癌症类型DNA甲基化的多维度分析带来便捷。
接下来作者也从SMART的几个模块来介绍这款SMART App的功能。下面我也会将各模块的功能小结在最前面,便于大家快速提炼。
图S1:小编在网站的截图:顶端可见不同的模块分区
2.Home(主页)
本模块功能:
供用户获取有关癌症类别的样本数目概览,以及所研究基因的所有相关CpG的染色体分布的可视化(circular plot)(图S2);
展示转录本,外显子,UTR, cd, CpG island、CpG shelves以及CpG shores等信息(segment plot)。
图S2:CpG的染色体分布的circular plot
然后详细的segment plot显示了转录本,外显子,UTR, cd, CpG island、CpG shelves以及CpG shores等信息(图1),帮助研究者识别潜在甲基化表达相关的CpGs。
segment plot下面的面板(图1)总结了这些探针的详细信息,用户可以任意选择其中一个来查看其泛癌甲基化概况,并识别异常甲基化位点以进行进一步分析。此外,用户还可以查看泛癌甲基化概况。用户也可以一次选择多个CpG来探究所选CpG甲基化的平均值或中位数。
图1.SMART App 展示的ERBB2基因的基因组信息
3.Differential CpGs
图S3:Differential CpGs模块
本模块功能:
甲基化CpGs差异分析(可作M值、beta值截断),
动态获取不同甲基化CpGs及其在染色体上的分布(全染色体、或选定单条染色体)
图2.差异CpGs
SMART App开发了甲基化CpGs差异分析的功能:允许用户对于一个给定的癌症类型自定义设置Cutoff value,来动态获取不同甲基化CpGs及其在染色体上的分布(图2)。
另外,SMART App 支持对beta值或M值的设定(btw,一般M值具有更好的统计特性,因此更适合用于甲基化数据的统计分析;而beta值更适合于显示数据)。
作者以TCGA-BLCA为例(设定delta |beta-valve|>0.25,以及p值< 0.01),展示了BLCA中甲基化差异CpGs的可视化(图2)。
首先是TCGA-BLCA中高低甲基化水平CpG的数量和染色体分布:TCGA-BLCA中有6007个高甲基化CpG,其中染色体1、19的高甲基化CpG数量最多,染色体Y上最少(图2a)。图2b则显示为低甲基化CpG的情况。
图2c:对所筛选的CpGs在全染色体上分布的可视化。
图2d:展示了筛选的CpG在1号染色体上的情况。
4.Methylation DIY
图S4:Methylation DIY模块
本模块功能:
为用户提供综合分析DNA甲基化的功能,而且可以结合其他组学数据和临床分期数据(可视化:箱线图)
图3.甲基化DIY示例
第一个面板为用户生成自定义box plot,用于比较给定癌症类型中正常和肿瘤样本之间的基因CpG。为了便于观察和解释,用户可以同时选择多个探针。
还可以结合TCGA的临床分期数据:
通过SMART App,可以很容易的发现TRIM58 (cg10983544)在肺鳞癌II期组中存在大量的高甲基化(图3b, p= 0.016)。
另外由于体细胞突变也会影响DNA甲基化。所以SMART App也提供了比较突变组和野生型组之间甲基化差异的功能。
以IDH1为例,IDH1突变可导致低级别胶质瘤(LGG)的高甲基化。选择IDH1后,box plot显示,突变组中cg07640666、cg17353896、cg24324379显著超甲基化(图3a, p< 0.05)。
CNV也会影响DNA甲基化,同样地,SMART App提供了研究CNV和DNA甲基化之间潜在联系的功能,结果以box plot作可视化。作者以肺鳞癌中TRIM58的CpG为例(图3)。
5.Correlation
图S5:Correlation模块
本模块功能:
DNA甲基化常与基因表达的相关性分析
基因or转录本水平
统计方法:Pearson、Spearman、Kendall
DNA甲基化常与基因表达相关。SMART App的Correlation功能可以对任意TCGA数据集进行基因表达与甲基化的相关分析,使用Pearson、Spearman、Kendall等方法作相关统计。UCSC Xena可供下载TCGA 198,619个转录本的表达数据。
而且可以选择在基因水平或者是转录本上进行相关性分析。可视化结果显示转录本和CpGs的基因组位置(图4和图5)。
图4.肺鳞癌中ZNF582表达与DNA甲基化(M值)的相关性研究
图5.基因或转录本表达与甲基化的相关性的分布图
6.Survival
图S6:Survival模块
本模块功能:生存、预后价值分析
单变量Cox回归分析、多变量Cox回归分析、KM生存曲线
SMART App允许用户选择自定义癌症类型,执行基于甲基化水平的总生存(OS)和无病生存(DFI)的生存分析。不仅如此,SMART App也提供了单变量和多变量Cox回归分析功能,便于用户作预后价值分析。
而在进行多变量Cox回归分析时,用户可以调整其中的因素,包括年龄、性别、种族和病理分期。然后选择感兴趣的癌症类型进行Cox回归分析。App将给出HR、95%CI、Z score和p值等信息。进一步可以使用SMART App来绘制生存曲线。高/低甲基化水平组的阈值也都可由用户根据需求调整。
7.与现有工具的比较
其他用于分析TCGA项目DNA甲基化的Web工具主要包括4个:methHC、Wanderer、MEXPRESS和MethSurv。详细的比较如表1所示。
表1.SMART APP与其他工具之间的功能比较
MethHC于2014年引入,允许用户识别最高/最低甲基化基因,进行分级聚类分析,探索肿瘤的甲基化谱并进行相关分析。然而,methHC最新的更新都已经是2014年了。
Wanderer是一个交互式网络应用程序,探索DNA甲基化和基因表达。它提供了一个单页界面,以探索DNA甲基化的区域框架。
MEXPRESS是一款用于DNA甲基化分析的数据可视化工具,于2015年首次推出。它后续进行了更新,添加了更多的数据并支持生成更漂亮的图形。
MethSurv是一个很有前景的应用,它主要关注DNA甲基化的临床影响。
虽然这些工具非常有价值,但与SMART APP相比起来也有一些短板:
这4个工具都不允许用户使用M值进行差异分析,而且也不允许用户选择癌症类型并可视化异常甲基化CpG的染色体分布。
此外,它们也不允许用户在转录水平上分析甲基化和表达之间的相关性。以及在绘制生存曲线时,不能提供可自定义的甲基化阈值选择。
看到这里我们可以发现,SMART App将多组学和临床数据与DNA甲基化相结合,为研究人员提供关键的交互以及自定义功能,包括CpG可视化、泛癌甲基化概况、差异甲基化分析、相关分析、生存分析等,为用户(尤其是没有编程背景的用户)从多维度分析不同癌症类型的DNA甲基化带来了极大的便利。可以说是业界DNA甲基化一站式分析、可视化的法宝了。
特别鸣谢
很开心可以邀请到李胤老师(发表该文第一作者)为我们这次介绍SMART APP作简要点评,非常感谢老师的支持和鼓励!!
李胤老师:TCGA甲基化数据量巨大,整合甲基化数据工作量巨大且耗费时间。为了促进甲基化研究的发展,在此基础上建立了SMART App,提供更加方便的分析模块,从而助力肿瘤数据挖掘。所有代码开源,用户不仅可以下载本地版打破网速问题,而且也是ShinyApp网页构建学习的好资源。
还是和往常一样,后台回复「4b」,即可获取今天小编为大家解读的文献。除此之外,“科研菌”团队已经录制好有关SMART APP的视频教程(鼠标点点就能完成甲基化分析哦!)。近期将免费与大伙分享!
▼▼是否遗漏了往期精彩生信解析没看呢?▼▼
汇总贴
生信思路
非肿瘤生信数据挖掘
m6A热点
肿瘤免疫微环境
5.Nat Commun: 肿瘤淋巴细胞浸润算法预测黑色素瘤生存
单细胞测序
4.Nat Med:一个病例带你了解单细胞测序如何指导临床治疗
特定基因表达谱预后
4. Genome Med一文带你学会胚系突变与泛癌预后思路
干湿结合
ceRNA
基因组
表观遗传
生信杂志
1. 被“灌水”的Aging(IF=5.515)还能不能投??
4. 即将突破5分的Frontiers in Oncology是灌水杂志吗?
5. 博士毕业神器3+分纯生信杂志:平均一审只要一个月,年刊量1000+
无需转发/分享の精品资源
2.无需转发!免费送你全套53本九版教材+习题集+八年制教材
6.无需转发!免费送你全套SCI写作句型及审稿邮件回复大全!
11.无需转发!免费送你2020年最新100+内分泌指南/临床解读
科研菌始终都在,陪你度过漫漫科研路
希望志同道合的小伙伴就像科研“菌”一样不断裂变,越来越多
▲ 长按二维码“识别”关注设置为星标
关注科研菌回复"1"即可获取"28G全网最全科研绘图素材"、"谷歌上网助手"(梯子)和"科研常用软件合集"、“肿瘤/消化内科指南”、"考研复试大礼包";回复2020,可获得2020年生信套路合集(无需转发/集赞);回复“单细胞文献”,可获得单细胞文献合集