转录组数据分析linux选择性剪切

新的可变剪切分析软件:McSplicer

2020-08-17  本文已影响0人  茶与生信2021

转载自 微信公众号:茶与生信
依据RNA-seq数据进行可变剪切分析的新软件:McSplicer
下面对其使用步骤做一介绍:

(1) 需要准备的文件Files

GTF 文件:基因组自带的,或者是stringtie等软件生成的皆可

BAM文件:已排序,已建好索引(可以用samtools建索引)

(2) 操作步骤Steps

1‘ 运行exonRefine将外显子集精炼为不重叠的连续子外显子区域,

./bin/exonRefine  <annotation.gtf> --prefix OUTPUT_PREFIX

2’ 对上一步中生成的注释和输入的BAM文件运行SigCount

./bin/sigcount <alignments.bam> <annotation_refined.gtf> <outfile-prefix>

3' 运行McSplucer以获取剪切位点情况估计

python2 ./python_code/McSplicer.py \
        --gtf REFINED_GTF \
        --count_file SIGNATURE_COUNT_FILE \
        --out_dir OUTPUT_DIRECTORY\
        --bootstraps NUM_OF_BOOSTRAPS\
        --read_len READ_LENGTH\
        --prefix OUT_FILE_PREFIX

(3) 结果输出Outputs

输出的csv文件包含bootstrap step,剪接位点索引,基因链,染色体,剪接位点基因组位置和McSplicer剪接位点使用估计。

依赖Dependencies

McSplicer 在 python 2上运行(最好是python 2.7),另外需要:

软件背景Reference

文章目前发表在bioRxiv

题目为:McSplicer: a probabilistic model for estimating splice site usage from RNA-seq data

软件使用说明和下载地址:https://github.com/canzarlab/McSplicer

单位:德国慕尼黑大学

上一篇下一篇

猜你喜欢

热点阅读