单细胞测序专题集合

RNA速率:软件下载与loom文件准备

2020-11-24  本文已影响0人  周小钊

参考链接:
https://github.com/velocyto-team/velocyto.R

http://velocyto.org/velocyto.py/index.html

http://pklab.med.harvard.edu/velocyto/notebooks/R/chromaffin2.nb.html

https://htmlpreview.github.io/?https://github.com/satijalab/seurat-wrappers/blob/master/docs/velocity.html

https://github.com/velocyto-team/velocyto.R/issues/16
本次数据还是使用王佳伟老师的拟南芥单细胞数据进行分析,这只是一次尝试,具体结果会怎样我也不清楚,共勉!!!

目录

RNA速率:软件下载与loom文件准备

RNA速率:数据读入

RNA速率:使用Seurat的结果做RNA velocity

velocyto下载

首先是下载velocyto生成loom文件

## 1. 创建python>3.6的环境
conda create -n velocyto python=3.6
## 2. 安装前置软件
conda install numpy scipy cython numba matplotlib scikit-learn h5py click
pip install pysam
## 3. 安装velocyto
pip install velocyto
## 4. 测试
velocyto --help
Usage: velocyto [OPTIONS] COMMAND [ARGS]...

Options:
  --version  Show the version and exit.
  --help     Show this message and exit.

Commands:
  run            Runs the velocity analysis outputting a loom file
  run10x         Runs the velocity analysis for a Chromium Sample
  run-dropest    Runs the velocity analysis on DropEst preprocessed data
  run-smartseq2  Runs the velocity analysis on SmartSeq2 data (independent bam file per cell)
  tools          helper tools for velocyto

repeat_masker.gtf生成

运行velocyto需要准备三个文件,单细胞数据分析的结果文件,基因组注释文件,重复序列注释文件,其中前两个在单细胞分析时就会得到,关键是这个repeat_masker.gtf

本人是做植物的,所以本次教程主要关注植物类repeat_masker.gtf的获得,人和小鼠的重复序列文件比较好得到,植物类首先可以看一下Phtozome数据库上想要研究的物种的注释文件夹下有没有reapeat.gtf,没有就要我们自己生成了

重复序列的注释文件我们一直没怎么关注过,对于做过基因组注释的童鞋来说,大家都忽略了一步,其实repeatmasker就可以生成重复序列的注释文件。

RepeatMasker -e ncbi -species arabidopsis -pa 40 -gff  TAIR10.fa

生成gff文件后,可以看到重复序列的点位以及属性,velocyto主要使用的就是位点

loom文件生成

接下来是生成loom文件,运行velocyto需要准备三个文件,基因组注释文件(gtf),repeat_masker.gtf(重复序列注释文件),cellranger的结果文件夹(以样本名WT_1为例,里面包含cell matrix和bam文件)

velocyto run10x -m TAIR10_masked.gtf WANG/ TAIR10.gtf

运行结束后会在WANG文件夹下生成velocyto文件夹,里面有velocyto.loom的文件,可以用于下一步的分析


转载请注明:周小钊的博客>>>RNA速率:软件下载与loom文件准备

上一篇下一篇

猜你喜欢

热点阅读