生物信息学从零开始学生信分析工具包

SMART App:鼠标点点就能完成发表级的DNA甲基化综合分析

2020-04-26  本文已影响0人  科研菌

今天跟大家分享的是2019年12月发表在Epigenetics & Chromatin(IF:4.185)杂志上的一篇文章The SMART App: an interactive web application for comprehensive DNA methylation analysis and visualization.本文是复旦大学附属中山医院胸外科卢春来教授(通讯作者)带领的团队发表的;李胤为该文的第一作者。在文章中作者对SMART App(一个只需要点一点就能完成DNA甲基化分析和可视化的网站应用程序) 分模块作了详细的介绍和举例说明~

The SMART App: an interactive web application for comprehensive DNA methylation analysis and visualization carcinoma

SMART APP:一个用于DNA甲基化分析和可视化的交互式web应用程序

一.研究背景

癌症基因组图谱(TCGA)数据的挖掘极大地促进了癌症基因组的研究,为癌症研究人员提供了前所未有的机遇。然而,现有的DNA甲基化分析web应用程序并不能充分满足实验生物学家的需要,通常还需要许多其他辅助工具。(为大家附上网址:http://www.bioinfo-zs.com/smartapp/挂上梯子体验感更加哦

B站:科研菌2020/公众号:科研菌 可播放

二.分析流程

三.结果解读

1.Features

这款SMART(Shiny Methylation Analysis Resource Tool) App,为用户对不同癌症类型DNA甲基化的多维度分析带来便捷。

接下来作者也从SMART的几个模块来介绍这款SMART App的功能。下面我也会将各模块的功能小结在最前面,便于大家快速提炼。

图S1:小编在网站的截图:顶端可见不同的模块分区

2.Home(主页)

本模块功能:

供用户获取有关癌症类别的样本数目概览,以及所研究基因的所有相关CpG的染色体分布的可视化(circular plot)(图S2);

展示转录本,外显子,UTR, cd, CpG island、CpG shelves以及CpG shores等信息(segment plot)。

图S2:CpG的染色体分布的circular plot

然后详细的segment plot显示了转录本,外显子,UTR, cd, CpG island、CpG shelves以及CpG shores等信息(图1),帮助研究者识别潜在甲基化表达相关的CpGs。

segment plot下面的面板(图1)总结了这些探针的详细信息,用户可以任意选择其中一个来查看其泛癌甲基化概况,并识别异常甲基化位点以进行进一步分析。此外,用户还可以查看泛癌甲基化概况。用户也可以一次选择多个CpG来探究所选CpG甲基化的平均值或中位数。

图1.SMART App 展示的ERBB2基因的基因组信息

3.Differential CpGs

图S3:Differential CpGs模块

本模块功能:

甲基化CpGs差异分析(可作M值、beta值截断),

动态获取不同甲基化CpGs及其在染色体上的分布(全染色体、或选定单条染色体)

图2.差异CpGs

SMART App开发了甲基化CpGs差异分析的功能:允许用户对于一个给定的癌症类型自定义设置Cutoff value,来动态获取不同甲基化CpGs及其在染色体上的分布(图2)。

另外,SMART App 支持对beta值或M值的设定(btw,一般M值具有更好的统计特性,因此更适合用于甲基化数据的统计分析;而beta值更适合于显示数据)。

作者以TCGA-BLCA为例(设定delta |beta-valve|>0.25,以及p值< 0.01),展示了BLCA中甲基化差异CpGs的可视化(图2)。

首先是TCGA-BLCA中高低甲基化水平CpG的数量和染色体分布:TCGA-BLCA中有6007个高甲基化CpG,其中染色体1、19的高甲基化CpG数量最多,染色体Y上最少(图2a)。图2b则显示为低甲基化CpG的情况。

图2c:对所筛选的CpGs在全染色体上分布的可视化。

图2d:展示了筛选的CpG在1号染色体上的情况。

4.Methylation DIY

图S4:Methylation DIY模块

本模块功能:

为用户提供综合分析DNA甲基化的功能,而且可以结合其他组学数据和临床分期数据(可视化:箱线图)

图3.甲基化DIY示例

第一个面板为用户生成自定义box plot,用于比较给定癌症类型中正常和肿瘤样本之间的基因CpG。为了便于观察和解释,用户可以同时选择多个探针。

还可以结合TCGA的临床分期数据:

通过SMART App,可以很容易的发现TRIM58 (cg10983544)在肺鳞癌II期组中存在大量的高甲基化(图3b, p= 0.016)。

另外由于体细胞突变也会影响DNA甲基化。所以SMART App也提供了比较突变组和野生型组之间甲基化差异的功能。

以IDH1为例,IDH1突变可导致低级别胶质瘤(LGG)的高甲基化。选择IDH1后,box plot显示,突变组中cg07640666、cg17353896、cg24324379显著超甲基化(图3a, p< 0.05)。

CNV也会影响DNA甲基化,同样地,SMART App提供了研究CNV和DNA甲基化之间潜在联系的功能,结果以box plot作可视化。作者以肺鳞癌中TRIM58的CpG为例(图3)。

5.Correlation

图S5:Correlation模块

本模块功能:

DNA甲基化常与基因表达的相关性分析

基因or转录本水平

统计方法:Pearson、Spearman、Kendall

DNA甲基化常与基因表达相关。SMART App的Correlation功能可以对任意TCGA数据集进行基因表达与甲基化的相关分析,使用Pearson、Spearman、Kendall等方法作相关统计。UCSC Xena可供下载TCGA 198,619个转录本的表达数据。

而且可以选择在基因水平或者是转录本上进行相关性分析。可视化结果显示转录本和CpGs的基因组位置(图4和图5)。

图4.肺鳞癌中ZNF582表达与DNA甲基化(M值)的相关性研究

图5.基因或转录本表达与甲基化的相关性的分布图

6.Survival

图S6:Survival模块

本模块功能:生存、预后价值分析

单变量Cox回归分析、多变量Cox回归分析、KM生存曲线

SMART App允许用户选择自定义癌症类型,执行基于甲基化水平的总生存(OS)和无病生存(DFI)的生存分析。不仅如此,SMART App也提供了单变量和多变量Cox回归分析功能,便于用户作预后价值分析。

而在进行多变量Cox回归分析时,用户可以调整其中的因素,包括年龄、性别、种族和病理分期。然后选择感兴趣的癌症类型进行Cox回归分析。App将给出HR、95%CI、Z score和p值等信息。进一步可以使用SMART App来绘制生存曲线。高/低甲基化水平组的阈值也都可由用户根据需求调整。

7.与现有工具的比较

其他用于分析TCGA项目DNA甲基化的Web工具主要包括4个:methHC、Wanderer、MEXPRESS和MethSurv。详细的比较如表1所示。

表1.SMART APP与其他工具之间的功能比较

MethHC于2014年引入,允许用户识别最高/最低甲基化基因,进行分级聚类分析,探索肿瘤的甲基化谱并进行相关分析。然而,methHC最新的更新都已经是2014年了。

Wanderer是一个交互式网络应用程序,探索DNA甲基化和基因表达。它提供了一个单页界面,以探索DNA甲基化的区域框架。

MEXPRESS是一款用于DNA甲基化分析的数据可视化工具,于2015年首次推出。它后续进行了更新,添加了更多的数据并支持生成更漂亮的图形。

MethSurv是一个很有前景的应用,它主要关注DNA甲基化的临床影响。

虽然这些工具非常有价值,但与SMART APP相比起来也有一些短板:

这4个工具都不允许用户使用M值进行差异分析,而且也不允许用户选择癌症类型并可视化异常甲基化CpG的染色体分布。

此外,它们也不允许用户在转录水平上分析甲基化和表达之间的相关性。以及在绘制生存曲线时,不能提供可自定义的甲基化阈值选择。

看到这里我们可以发现,SMART App将多组学和临床数据与DNA甲基化相结合,为研究人员提供关键的交互以及自定义功能,包括CpG可视化、泛癌甲基化概况、差异甲基化分析、相关分析、生存分析等,为用户(尤其是没有编程背景的用户)从多维度分析不同癌症类型的DNA甲基化带来了极大的便利。可以说是业界DNA甲基化一站式分析、可视化的法宝了。

特别鸣谢

很开心可以邀请到李胤老师(发表该文第一作者)为我们这次介绍SMART APP作简要点评,非常感谢老师的支持和鼓励!!

李胤老师:TCGA甲基化数据量巨大,整合甲基化数据工作量巨大且耗费时间。为了促进甲基化研究的发展,在此基础上建立了SMART App,提供更加方便的分析模块,从而助力肿瘤数据挖掘。所有代码开源,用户不仅可以下载本地版打破网速问题,而且也是ShinyApp网页构建学习的好资源。

        还是和往常一样,后台回复「4b」,即可获取今天小编为大家解读的文献。除此之外,“科研菌”团队已经录制好有关SMART APP的视频教程(鼠标点点就能完成甲基化分析哦!)。近期将免费与大伙分享!

是否遗漏了往期精彩生信解析没看呢?

汇总贴

1. 2020年医学生信分析别人都在用哪些思路?

生信思路

1. 如何筛出一篇5分文章的核心基因

2. 筛出一个5分文章的核心基因后你可以这样做

3. 国自然前期研究基础不足?你可以这样补一些生信分析

4.非肿瘤生信分析:来不及解释了快上车

非肿瘤生信数据挖掘

1.非肿瘤纯生信:STAT1和结核感染的机制挖掘

m6A热点    

1.15+分的纯生信:胃癌m6A和肿瘤免疫微环境

2.易学版m6A:肾癌预后和机制分析

肿瘤免疫微环境

1. 5+易学套路: 基因突变+TMB+免疫浸润

2. 纯生信4+膀胱癌免疫微环境思路分享

3. 纯生信3+肾癌免疫微环境预后相关基因

4.围观:为什么别人的免疫浸润能发9+分?

5.Nat Commun: 肿瘤淋巴细胞浸润算法预测黑色素瘤生存

6.一看就会的3+典型免疫浸润表型

7.单基因结合免疫浸润的新思路

单细胞测序

1.在Aging上发表的胃癌单细胞测序做了什么?

2.仅3个单细胞测序样本纯分析也发6分!

3.Nat Commun:乳腺癌单细胞测序深度解析

4.Nat Med:一个病例带你了解单细胞测序如何指导临床治疗

特定基因表达谱预后

1. 9+纯生信泛癌预后标志物筛选

2.肾癌EMT基因预后标志物发5+分

3.纯生信自噬基因与乳腺癌预后也能发5分!

4. Genome Med一文带你学会胚系突变与泛癌预后思路

5. 易学3+分套路:单基因与胶质瘤免疫治疗预后

6.2020年的可变剪切有什么不一样?

7.JTO:日本非吸烟患者基因组综合分析

8.纯生信新套路:肺鳞癌TP53基因signature

9.5分+的单基因综合分析还几乎零代码

10.单基因分析新思路:联合ChIP-Seq

干湿结合

1. 干湿结合上6+高渗基因与透明细胞肾癌预后

2. 干湿结合的miRNA调控网络发7+也不难

3. lncRNA简配版干湿结合发5+分

4.肿瘤学套路如何逆袭JCSM10+顶刊

ceRNA

1.膀胱癌ceRNA的3+分思路

2.别人的膀胱癌ceRNA如何做出新花样?

3.三张图的miRNA简单分析如何发6分?

基因组

1.一文就懂子宫内膜癌的POLE突变如何发病理学顶刊

表观遗传

1.5+乳腺癌表观遗传深度剖析

生信杂志

1. 被“灌水”的Aging(IF=5.515)还能不能投??

2. 推荐一本生信友好并且最快1月接受的5+分杂志

3. 年刊量3000篇预计5+分的JCP

4. 即将突破5分的Frontiers in Oncology是灌水杂志吗?

5. 博士毕业神器3+分纯生信杂志:平均一审只要一个月,年刊量1000+

6.马上4分年刊量近2000的杂志:生信友好还不要版面费!

无需转发/分享の精品资源

1.2020年考研复试大礼包

2.无需转发!免费送你全套53本九版教材+习题集+八年制教材

3.无需转发!免费送你全套医学动画(中文字幕+英文播放)

4.无需转发!免费送你全套医学英语课程和教材!

5.无需转发!免费送你全套NEJM官方中译合集!

6.无需转发!免费送你全套SCI写作句型及审稿邮件回复大全!

7.无需转发!免费送你全套斯坦福大学医学公开课视频!

8.无需转发!免费送你Markdown教程

9.无需转发!免费送你全套肿瘤学图书!

10.无需转发!免费送你16G-PPT精美模板和制作教程

11.无需转发!免费送你2020年最新100+内分泌指南/临床解读

科研菌始终都在,陪你度过漫漫科研路

希望志同道合的小伙伴就像科研“菌”一样不断裂变,越来越多

▲ 长按二维码“识别”关注设置为星标

关注科研菌回复"1"即可获取"28G全网最全科研绘图素材"、"谷歌上网助手"(梯子)和"科研常用软件合集"、“肿瘤/消化内科指南”、"考研复试大礼包";回复2020,可获得2020年生信套路合集(无需转发/集赞);回复“单细胞文献”,可获得单细胞文献合集

上一篇下一篇

猜你喜欢

热点阅读