重测序分析(6)CNV检测
2022-09-16 本文已影响0人
Bioinfor生信云
拷贝数变异(Copy Number Variation,CNV)是一种复杂的现象,一般是由基因组发生重排导致的,一般指长度为1 kb以上的基因组大片段的拷贝数增加或者减少。采用CNVnator 来检测全基因组中存在的CNV,其中bin_size设置为100,同时对CNVnator获得的结果进行筛选,将基因组中多拷贝区域去除,同时设置Read Depth值(将染色体正常区域的的Read Depth定义为1),保留RD值<=0.05或>=1.8的区域。
软件和数据准备
软件:CNVnator
数据:
基因组文件 genome.fasta
比对结果文件 S1.sort.rmdup.bam
step1 按染色体切分基因组(CNVnator的输入要求)
seqkit split -i ./genome.fa -O split
step2 提取比对结果
/home/software/cnvnator/CNVnator/cnvnator -genome genome.fa -root S1.root -tree S1.sort.rmdup.bam
step3 生成深度分布
/home/software/cnvnator/CNVnator/cnvnator -genome genome.fa -root S1.root -his 100 -d split
step4 进行统计计算
/home/software/cnvnator/CNVnator/cnvnator -root S1.root -stat 100
step5 检查bin size是否合适
/home/software/cnvnator/CNVnator/cnvnator -root S1.root -eval 100 > S1.eval.ratio
step6 RD信号分割
/home/software/cnvnator/CNVnator/cnvnator -root S1.root -partition 100
step7 进行CNV检测
/home/software/cnvnator/CNVnator/cnvnator -root S1.root -call 100 > S1.cnv
step8 转成vcf格式
/home/software/cnvnator/CNVnator/cnvnator2VCF.pl S1.cnv >S1.cnv.vcf