生信在线数据库转录组转录组高级分析

RNA 15. SCI 文章中的融合基因之 FusionGDB2

2022-03-17  本文已影响0人  桓峰基因

    基于 RNA 数据分析1-13期基本介绍完成,而基因融合同样也是转录组测序中能够获得的对于临床上非常有意义的数据,这期就看看融合基因该怎么分析,增添文章的内容。

一、 融合基因

    融合基因就是两个基因“融合”在一起。正常情况下,两个基因相隔很远互不干扰,但是由于病理的染色体重排,导致相隔很远甚至是不在同一条染色体的基因组合在一起。一般,融合基因是由染色体重排而产生的,包括染色体的易位,插入,颠倒,缺失。基因融合会产生基因融合转录本和嵌合蛋白产物,它们已被用作治疗的靶标。众所周知的例子是靶向BCR-ABL1基因融合的格列卫(Imantinib)和靶向 EML4-ALK基因融合的克唑替尼。作为基因组重排的结果的转录本融合是一类重要的体细胞改变,作为癌症起始事件和作为特定肿瘤的分子治疗靶标。

Figure 1. Fusion transcripts. Fusion transcripts are chimeric mRNAs encoded from the joined parts of two genes, and may occur as a result of genomic rearrangements.

    融合基因检测通过高通量 RNA-seq 测序,并结合CNV数据能够提高检测的准确性,RNA水平上融合基因表现为前后两个基因外显子之间的衔接,融合点相对固定。这一特征为精准设计探针或引物提供了先天优势。因此,根据融合基因序列特点,在RNA水平上检测融合基因比DNA水平更易实现。如下:

Figure 2. Detection of fusion transcripts.PRADA detects fusion transcripts through identification of discordant read pairs and junction spanning reads.

二、FusionGDB2 数据库

    RNA测序数据分析(PRADA)流程能够全面检测融合转录本, 并具有很高的置信度。基于对来自癌症基因组图谱(TCGA)的配对端RNA测序和DNA拷贝数数据的综合分析,肿瘤融合基因数据门户提供了许多肿瘤类型的真正融合列表。

FusionGDB2是FusionGDB的升级版,借助深度学习的方法来注释融合基因,并且增加了一下在线可视化的方法,势必提高效率,提高准确性。

https://www.tumorfusions.org/

    我们可以看到网站上给出来详细的35种癌种的检测结果,方便我们对癌种的全面认识。

三、实例解析

1 填写symbol或者entrez id

2 点击感兴趣融合基因

    得到34个Fusion genes,点击感兴趣的基因

主要出现六个方面结果

    表格详细给出了对应symbol,gene ID,位置,癌症评分等信息,并附上对应数据库超链接,非常方便。

4 蛋白质特征

 5 基因序列 包括氨基酸序列和核酸序列

6 PPI网络

 7 相关药物 

8 相关疾病

9 下载

下载页面有对应内容及数据库

    关于数据库这块就说这么多,后续可以看下融合基因都能做些什么分析,以及 SCI 文章中出现的分析方法!

关注公众号,每日更新,扫码进群交流不停歇,马上就出视频版,关注我,您最佳的选择!

References:

  • Kim P, Tan H, Liu J, et al. FusionGDB 2.0: fusion gene annotation updates aided by deep learning. Nucleic Acids Res. 2022;50(D1):D1221-D1230. 

  • Kim P, Zhou X. FusionGDB: fusion gene annotation DataBase. Nucleic Acids Res. 2019;47(D1).

  • Gao Q, Liang WW, Foltz SM, et al. Driver Fusions and Their Implications in the Development and Treatment of Human Cancers. Cell Rep. 2018;23(1):227-238.e3. 

  • 本文使用 文章同步助手 同步

    上一篇 下一篇

    猜你喜欢

    热点阅读