oligo探针设计

2020-08-16  本文已影响0人  Yanglook

Chorus2软件安装

conda 方法安装

  1. conda安装python3.x环境
conda info -e # 查看当前环境
conda create --name Chorus2 python=3.7 #创建环境
conda activate Chorus2 #激活环境
conda deactivate #退出当前环境
conda remove Chorus2 #删除环境
  1. 安装依赖包
    所有安装的包默认在public/.../envs/Chorus2/bin下
conda config --add channels conda-forge
conda config --add channels defaults
conda config --add channels r
conda config --add channels bioconda
conda install bwa
conda install jellyfish
conda install Cython
conda install primer3-py
conda install pyfasta
conda install numpy
conda install pyBigWig
conda install pandas
  1. 安装Chorus2
    软件位置:public/.../envs/Chorus2/bin
git clone https://github.com/zhangtaolab/Chorus2
../python3  /public/home/ztchen/anaconda3/envs/Chorus2/bin/Chorus2/Chorus2.py -h #检测Chorus2是否安装上

Chorus2挑选探针

  1. 准备基因组数据
    甜橙基因组
  2. 挑选探针
python3  ~/anaconda3/envs/Chorus2/bin/Chorus2/Chorus2.py  -j $jellyfish -b $bwa -g /public/home/ztchen/mlk/raw_data/DH_Valencia_NGS/csi.chromosome.masked.fa  -i /public/.../raw_data/DH_Valencia_NGS/csi.chromosome.masked.fa  -t 24 -l 50 --step 25 --homology 80 -s Select

参数说明:
上述用的绝对路径,方便以后理解,也可以用相对路径。
-g:基因组序列 fa格式
-i: 同-g一样
-t: 线程
-l: 探针长度
--step: 挑选探针步移长度为25
--homology: 若探针可比对到基因组两个或多个同源性大于80%的位置时,该探针将会被过滤掉
-s 用于保存输出结果的文件夹名
其中fa.bed为挑选出的探针,用于后面的分析

重复序列过滤

另一甜橙的基因组数据用于过滤

python3 ~/anaconda2/envs/Chorus2/bin/Chorus2/ChorusNGSfilter -g ~/mlk/raw_data/DH_Valencia_NGS/csi.chromosome.masked.fa  -i $Ridge_pineapple_1.paired.fastq.gz,$Ridge_pineapple_2.paired.fastq.gz  -z gz -t 24 -p $csi.chromosome.masked.fa.bed   

-g: 基因组,fa格式
-i: 基因组,双端测序
-p: 上步中挑选的探针
-t: 压缩格式
-o: 输出文件,默认为output.bed

python3 ~/anaconda3/envs/Chorus2/bin/Chorus2/ChorusNGSselect.py -i ~/mlk/oligo_design/filter_2/output.bed  -o  filtered_output.bed -d 50 -ss

参数说明
-d:保证了两个探针第一个碱基之间的距离至少为50nt;
-ss: 只保留正链,不考虑负链
-i:以上步的输出文件out.bed为输入
-o: 默认输入为filtered_output.bed

RepeatMasker再次过滤

软件安装

参考说明

  1. 切换环境
    为方便使用,可以安装在Chorus2环境下。
conda activate Chorus2
  1. 安装TRF和搜索引擎RMBlast
conda install TRF
conda install RMBlast
  1. 设置perl环境的路径
    不要用conda下的perl,容易出现报错。
vim ~/.bashrc
export PATH="/usr/bin/:$PATH"
source ~/.bashrc
  1. RepeatMasker软件下载与安装
wget http://www.repeatmasker.or/RepeatMasker-open-4-0-6.tar.gz #下载
tar xzvf RepeatMasker-open-4-0-6.tar.gz #解压
cd RepeatMasker
chmod -R 755 * 
./configure 

安装过程中,依次对perl、TRF和搜索引擎RMBlast进行路径设置,路径依次如下:

/usr/bin/ #perl路径
/public/home/.../anaconda3/envs/Chorus2/bin/trf #trf路径
/public/home/.../anaconda3/envs/Chorus2/bin/ #为搜索引擎的工作路径
  1. 下载Repbase数据库文件
    下载地址
    下载之前需要提前注册,但是注册后需要几天审核时间,因此可以从网上寻找资源。
    由于之前下载过该数据,因此直接解压并上传到Libraries中即可。
  1. 检测RepeatMasker是否安装成功
cd ~/anaconda3/envs/Chorus2/bin/RepeatMasker
./RepeatMasker -h
上一篇 下一篇

猜你喜欢

热点阅读