生物信息学基因组转录组

snpEFF的使用

2018-11-12  本文已影响3人  chaimol
  1. 教程地址
    下载snpEff地址
    解压unzip snpEff_latest_core.zip
    我的路径是/home/chaim/bsa/snpEff/
  2. 配置玉米zm437版本的数据库
    在路径/home/chaim/bsa/snpEff/snpEff/目录下创建文件夹data,
cd /home/chaim/bsa/snpEff/snpEff/
mkdir data
cd data
mkdir genomes
mkdir zm437

#在zm437目录存放基因组注释文件genes.gff,   蛋白库,protein.fa
#在genomes目录放置基因组参考序列 zm437.fa

注意上述的基因组注释文件是gff3格式。
修改snpEff.config的参数
添加如下内容

#maize genome,version zm437
 zm437.genome:maize

回到snpEFF目录,运行命令
java -jar snpEff.jar build -gff3 -v zm437

  1. 对vcf格式文件进行注释:
    bwa目录存放着GATK4处理之后的文件common_filtration.vcf
    /home/chaim/bsa/bwa目录执行下面命令
 java -Xmx128g -jar /home/chaim/bsa/snpEff/
snpEff/snpEff.jar zm437 common_filtration.vcf > common.eff

会输出三个文件,
snpEff_genes.txt
snpEff_summary.html
common.eff.vcf

  1. 如果想更改使用其他注释文件,
    删除/home/chaim/bsa/snpEff/snpEff//data/zm437/snpEffectPredictor.bin该文件删除即可。
    重新从步骤1开始即可。
上一篇下一篇

猜你喜欢

热点阅读