运行操作

2020-10-19  本文已影响0人  线断木偶人

gtx超算工作站运行命令

1、生成index(如果没有创建的话)

gtx index ref.fa

2、比对

#1 快速比对,生成vcf
gtx wgs -R '@RG\tID:输出文件名\tSM:输出文件名\tPL:ILLUMINA' -o 输出文件名.vcf /index/hg19/hg19.fa 原始数据.R1.fastq 原始数据.R2.fastq

#2 快速比对,生成gvcf
gtx wgs -R '@RG\tID:输出文件名\tSM:输出文件名\tPL:ILLUMINA' -o 输出文件名.g.vcf /index/hg19/hg19.fa 原始数据.R1.fastq 原始数据.R2.fastq -g

#3 精准比对,生成vcf文件
gtx wgs -R '@RG\tID:输出文件名\tSM:输出文件名\tPL:ILLUMINA' -o 输出文件名.vcf /index/hg19/hg19.fa 原始数据.R1.fastq 原始数据.R2.fastq --bwa

#4 精准比对,生成gvcf文件
gtx wgs -R '@RG\tID:输出文件名\tSM:输出文件名\tPL:ILLUMINA' -o 输出文件名.g.vcf /index/hg19/hg19.fa 原始数据.R1.fastq 原始数据.R2.fastq -g --bwa -L bed

3、Joint calling 分析:

  1. 对所有样本精准比对,生成g.vcf文件

gtx wgs -R '@RG\tID:输出文件名\tSM:输出文件名\tPL:ILLUMINA' -o 输出文件名.g.vcf /参考基因组文件路径/参考基因组文件夹/参考基因组.fa 原始数据.R1.fastq.gz 原始数据.R2.fastq.gz -g --bwa

  1. 对每个样本进行压缩和索引

bgzip /样本放置路径/样本放置文件夹/样本名1

(例:bgzip /home/gtx/jointcall/文件名1)

tabix -p vcf /样本放置路径/样本放置文件夹/样本名1

(例:tabix -p vcf /home/gtx/jointcall/文件名1)

bgzip /样本放置路径/样本放置文件夹/样本名2

(例:bgzip /home/gtx/jointcall/文件名2)

tabix -p vcf /样本放置路径/样本放置文件夹/样本名2

(例:tabix -p vcf /home/gtx/jointcall/文件名2)

bgzip /样本放置路径/样本放置文件夹/样本名3

(例:bgzip /home/gtx/jointcall/文件名3)

tabix -p vcf /样本放置路径/样本放置文件夹/样本名3

(例:tabix -p vcf /home/gtx/jointcall/文件名3)

... ...

gtx gi -V /样本放置路径/样本放置文件夹/样本名1 -V /样本放置路径/样本放置文件夹/样本名2 -V /样本放置路径/样本放置文件夹/样本名3 -G /样本放置路径/样本放置文件夹/db

(例:gtx gi -V /home/gtx/jointcall/文件名1 -V /home/gtx/jointcall/文件名2 -V /home/gtx/jointcall/文件名3 -G /home/gtx/jointcall/db)

gtx joint -R /参考基因组路径/参考基因组文件夹/参考基因组.fa -V gendb:///样本放置路径/样本放置文件夹/db -O 输出文件名(jointcall_gtx_pig.vcf)

(例:gtx joint -R /home/gtx/jointcall/ref/参考基因组.fa -V gendb:///home/gtx/jointcall/db -O jointcall_gtx_pig.vcf)

上一篇下一篇

猜你喜欢

热点阅读