新的可变剪切分析软件:McSplicer
2020-08-17 本文已影响0人
茶与生信2021
转载自 微信公众号:茶与生信
依据RNA-seq数据进行可变剪切分析的新软件:McSplicer
下面对其使用步骤做一介绍:
(1) 需要准备的文件Files
GTF 文件:基因组自带的,或者是stringtie等软件生成的皆可
BAM文件:已排序,已建好索引(可以用samtools建索引)
(2) 操作步骤Steps
1‘ 运行exonRefine将外显子集精炼为不重叠的连续子外显子区域,
./bin/exonRefine <annotation.gtf> --prefix OUTPUT_PREFIX
2’ 对上一步中生成的注释和输入的BAM文件运行SigCount
./bin/sigcount <alignments.bam> <annotation_refined.gtf> <outfile-prefix>
3' 运行McSplucer以获取剪切位点情况估计
python2 ./python_code/McSplicer.py \
--gtf REFINED_GTF \
--count_file SIGNATURE_COUNT_FILE \
--out_dir OUTPUT_DIRECTORY\
--bootstraps NUM_OF_BOOSTRAPS\
--read_len READ_LENGTH\
--prefix OUT_FILE_PREFIX
(3) 结果输出Outputs
输出的csv文件包含bootstrap step,剪接位点索引,基因链,染色体,剪接位点基因组位置和McSplicer剪接位点使用估计。
依赖Dependencies
McSplicer 在 python 2上运行(最好是python 2.7),另外需要:
- numpy>=1.13.1
- pandas>=0.20.3
软件背景Reference
文章目前发表在bioRxiv
题目为:McSplicer: a probabilistic model for estimating splice site usage from RNA-seq data
软件使用说明和下载地址:https://github.com/canzarlab/McSplicer
单位:德国慕尼黑大学