利用QTL-seq软件进行BSA定位分析
最近逛Github,发现一个新出的BSA自动化流程,就叫QTL-seq,看起来还蛮简单方便的,所以搞了一下试试。
BSA原理就不多说了,在实际操作中,高、低池子至少得两个,然后就是可以选择测还是不测亲本。这套流程是需要亲本测序数据的,还有一些流程是不需要的,例如DeepBSA、QTLseqr等,所以根据自己试验经费来定就好。个人觉得测一下亲本多不了几个钱,可以测了,还可以搞搞重测序分析嘛。
安装挺简单的,我就喜欢用conda,这个流程又支持conda,所以,上吧
conda install -c bioconda qtlseq
完事就安装完毕了,这个流程里面包含了BWA、samtools、BCFtools、Snpeff、Trimmomatic等软件,还有一些python依赖库用于绘图什么的,反正都可以用上面那个命令安装完。
使用命令很简单,就一行
qtlseq
usage: qtlseq -r <FASTA> -p <BAM|FASTQ> -b1 <BAM|FASTQ>
-b2 <BAM|FASTQ> -n1 <INT> -n2 <INT> -o <OUT_DIR>
[-F <INT>] [-T] [-e <DATABASE>] [--species <NAME>]
这玩意需要准备的数据有几个,第一部分是两个亲本的测序数据,使用的是参数-p输入 两个亲本就输入两次-p
-p P1_1.fq,P1_2.fq
-p P2_1.fq,P2_2.fq
第二部分是两个池的数据,
-b1 bulk1_1.fq,bulk1_2.fq,
-b2 bulk2_1.fq,bulk2_1.fq,
测序数据准备完了,剩下就是一些细节参数,比如每个池子里面的样本数
-b1 int
-b2 int
能用的线程数
-t cpus
这软件有个特殊的功能,似乎是有人搞了些验证过的snp,用于过滤,目前支持Arabidopsis, Cucumber, Maize, Rapeseed,Rice, Tobacco, Tomato, Wheat, and Yeast等物种,可以增加snp的准确性吧。
qtlseq -r reference.fasta \
-p parent.1.fastq,parent.2.fastq \
-b1 bulk_1.1.fastq,bulk_1.2.fastq \
-b2 bulk_2.1.fastq,bulk_2.2.fastq \
-n1 20 \
-n2 20 \
-t 48 \
-o example_dir
然后个人试用的话,感觉还是太慢了,测序数据清理用的Trimmomatic慢出天际,比对走的是bwa流程,其实讲究加速的话,可以先用fastp-----bwa-mem2-------sambamba流程先建立好所有的去重的bam文件,然后再把bam文件进行输入,速度快得多,所以我个人更喜欢如下这样:
qtlseq -r reference.fasta \
-p parent_1.bam \
-p parent_2.bam \
-b1 bulk_1.bam \
-b2 bulk_2.bam \
-n1 20 \
-n2 20 \
-t 48 \
-o example_dir
最后输出的文件夹里面包含了各种中间内容:
├── 10_ref
│ ├── reference.fasta
│ ├── reference.fasta.amb
│ ├── reference.fasta.ann
│ ├── reference.fasta.bwt
│ ├── reference.fasta.fai
│ ├── reference.fasta.pac
│ └── reference.fasta.sa
├── 20_bam
│ ├── bulk1.filt.bam
│ ├── bulk1.filt.bam.bai
│ ├── bulk2.filt.bam
│ ├── bulk2.filt.bam.bai
│ ├── parent.filt.bam
│ └── parent.filt.bam.bai
├── 30_vcf
│ ├── qtlseq.vcf.gz
│ └── qtlseq.vcf.gz.tbi
├── 40_qtlseq
│ ├── bulk1_SNPindex.png
│ ├── bulk2_SNPindex.png
│ ├── delta_SNPindex.png
│ ├── sliding_window.tsv
│ ├── sliding_window.p95.tsv
│ ├── sliding_window.p99.tsv
│ ├── np_index.tsv
│ ├── snp_index.p95.tsv
│ └── snp_index.p99.tsv
└── log
├── bcftools.log
├── bgzip.log
├── bwa.log
├── samtools.log
└── tabix.log
还有图,看起来还不错。