funny生物信息

可变剪接鉴定软件rMATS的结果文件内容说明

2020-12-19  本文已影响0人  纪伟讲测序

    是的,本篇不讲解软件的安装使用,因为网上的教程已经非常多了。

    但是有关rMATS的输出结果,网上的教程都很少提到,结果应该怎么看?各文件各列代表了什么信息?很多老师或同学们拿到结果后,非常抓狂,因为不清楚文件内容的含义,因为官网上也没有给出详细的结果说明。

    为此,我们在本篇对rMATS的结果内容项作了梳理,解决这个问题,给大家提供一个参考。

    rMATS评估可变剪接,使用注释文件中的外显子(exon)位置信息,并结合测序数据和基因组比对结果计算各外显子的表达状态,推断可能的外显子可变剪接状态。

首先来看可变剪接的5种模式。

    SE,外显子跳跃,指一个外显子从初始转录物上被剪切掉。

    A5SS,可变5’剪接,它们的3’端剪接位点一致但5’端剪接位点不同,产生不同长度的5’端外显子。

    A3SS,可变3’剪接,它们的5’端剪接位点一致但3’端剪接位点不同,产生不同长度的3’端外显子。

    MXE,可变剪接形成两种不同的转录本,两转录本之间相同的外显子称为constitutive exon, 不同的外显子称为inclusive exon,两个inclusive exon不能同时存在同一转录本。

    RI,内含子保留,在一些转录本中内含子不会被剪切掉,保留在最终的转录本中。

SE*

    以该名称开头的文件,记录了基因组中的SE剪接事件。

    文件中,前几列记录了可变剪接事件的位置信息。

    GeneID、geneSymbol,发生可变剪接的基因id和名称。

    chr、strand、exonStart_0base、exonEnd、upstreamES、upstreamEE、downstreamES、downstreamEE,记录了发生可变剪接的位置信息,包含所在染色体、正负链、剪接位点等。在SE模式下,upstreamexon和downstreamexon拼接在一起,skipped exon被剪切掉。

随后的几列,与该剪接事件的可信度有关。

    IJC_SAMPLE,记录了支持skipped exon被保留(外显子包含)的相关reads数,这意味着该外显子在剪接后将出现在最终加工的mRNA转录物中。

    SC_SAMPLE,记录了支持skipped exon被剪切(外显子跳跃)的相关reads数,这意味着该外显子在可变剪接过程中被切除,不出现在最终加工的mRNA转录物中。

    我们可知,如果该剪接事件比较可信,则理论上SC_SAMPLE中的数值应当更大,IJC_SAMPLE中的数值应当较小,否则,没有有效的证据支持可变剪接(skipped exon被剪切,外显子跳跃)的发生。

    如果存在多组,则分别以IJC_SAMPLE_1、IJC_SAMPLE_2等命名,以分别显示各组数据中,支持剪接事件的reads数量。

    如果每组中存在多个重复,则该列的数据中包含多个值,每个值对应一个样本,以逗号分隔。

    当然,除了reads支持数量,还要考虑外显子长度的问题,因为更长的转录本往往对应了更多的reads count值,还需要根据支持reads数量及外显子长度,对有效reads标准化。

    IncFormLen和SkipFormLen分别对应了外显子是否被剪切所产生转录本同工型的有效长度。IncFormLen,外显子包含同种型的有效长度;SkipFormLen,外显子跳跃同工型的有效长度。

    最后几列,即为综合考虑支持剪接事件的reads数量,以及外显子剪接后的长度,所得的统计指标。

    PValue,可变剪接事件的p值,p值越小约可信。

    FDR,校正后的p值,越小越可信,一般取FDR<0.05作为阈值。

    IncLevel,根据剪接事件所产生同工型的有效长度以及支持剪接事件的reads数量计算,结果反映了样本的最终mRNA转录本中平均包含各自外显子的频率的信息。与上述IJC_SAMPLE等类似,如果存在多组,则分别以IncLevel1、IncLevel2等命名。

    IncLevelDifference = IncLevel1 - IncLevel2,结果可反映不同样本组间,可变剪接事件的差异程度。

A5SS*和A3SS*

    以该名称开头的文件,记录了基因组中的A5SS、A3SS剪接事件。

    除了以下位置信息,A5SS、A3SS中有所不同。

    其它列的信息,两种文件中的结构与上述SE结果文件中的结构相同,各列信息所代表的含义大致一致,参考上述即可。

MXE*

    以该名称开头的文件,记录了基因组中的MXE剪接事件。

    结果文件中,关于MXE剪接事件所涉及的位置信息,如下所示。

    其它列的信息,两种文件中的结构与上述SE结果文件中的结构相同,各列信息所代表的含义大致一致,参考上述即可。

RI*

    以该名称开头的文件,记录了基因组中的RI剪接事件。

    结果文件中,关于RI剪接事件所涉及的位置信息,如下所示。

其它列的信息,两种文件中的结构与上述SE结果文件中的结构相同,各列信息所代表的含义大致一致,参考上述即可。

上一篇下一篇

猜你喜欢

热点阅读