snpEFF的使用
2018-11-12 本文已影响3人
chaimol
-
教程地址
下载snpEff地址
解压unzip snpEff_latest_core.zip
我的路径是/home/chaim/bsa/snpEff/ - 配置玉米zm437版本的数据库
在路径/home/chaim/bsa/snpEff/snpEff/
目录下创建文件夹data
,
cd /home/chaim/bsa/snpEff/snpEff/
mkdir data
cd data
mkdir genomes
mkdir zm437
#在zm437目录存放基因组注释文件genes.gff, 蛋白库,protein.fa
#在genomes目录放置基因组参考序列 zm437.fa
注意上述的基因组注释文件是gff3格式。
修改snpEff.config的参数
添加如下内容
#maize genome,version zm437
zm437.genome:maize
回到snpEFF目录,运行命令
java -jar snpEff.jar build -gff3 -v zm437
- 对vcf格式文件进行注释:
bwa
目录存放着GATK4处理之后的文件common_filtration.vcf
在/home/chaim/bsa/bwa
目录执行下面命令
java -Xmx128g -jar /home/chaim/bsa/snpEff/
snpEff/snpEff.jar zm437 common_filtration.vcf > common.eff
会输出三个文件,
snpEff_genes.txt
snpEff_summary.html
common.eff.vcf
- 如果想更改使用其他注释文件,
删除/home/chaim/bsa/snpEff/snpEff//data/zm437/snpEffectPredictor.bin
该文件删除即可。
重新从步骤1开始即可。