可变剪切分析

rMATs的介绍及用法

2019-08-02  本文已影响0人  漱衣仁止

具体的介绍和使用方法及原理:使用rmats进行可变剪切的分析(摘自生信修炼手册

原理:我理解的原理是他利用了3-4个外显子,检测哪个是exon inclusion isoform,哪个是exon skipping isoform,定量一下剪切百分率(PSI),比较两个样本的PSI的差是不是大于自己设定的阈值(这一点不理解,是哪两个isoform之间的对比,为什么是两个样本里的,不应该是对应的exon inclusion isoform和exon skipping isoform之间的对比吗?)

软件用法示例:

1.数据下载:https://sourceforge.net/projects/rnaseq-mats/files/latest/download

gtf文件:Homo_sapiens.Ensembl.GRCh37.75.gtf

2.应该安装python2.7.x版本

3.基本用法:1)先判断用哪个版本的python解释程序

出现1114111说明用rMATS-turbo-Linux-UCS4

出现65535说明用rMATS-turbo-Linux-UCS2

用bam文件:python rMATS-turbo-xxx-UCSx/rmats.py --b1 b1.txt --b2 b2.txt -gtf gtf/Homo_sapiens.Ensembl.GRCh37.75.gtf -od bam_test -t paired --readLength 50 --cstat 0.0001 --libType fr-unstranded

特别注意:b1.txt和b2.txt保存的是每个样本比对参考基因组的bam文件的路径,每个里面可以包含多个bam文件示例如下

具体参数意义:

遇到的问题:结果输出文件只有表头,没有内容,不知道怎么解决

上一篇 下一篇

猜你喜欢

热点阅读