利用QTL-seq软件进行BSA定位分析

2023-11-14  本文已影响0人  挖泥种地

       最近逛Github,发现一个新出的BSA自动化流程,就叫QTL-seq,看起来还蛮简单方便的,所以搞了一下试试。

       BSA原理就不多说了,在实际操作中,高、低池子至少得两个,然后就是可以选择测还是不测亲本。这套流程是需要亲本测序数据的,还有一些流程是不需要的,例如DeepBSA、QTLseqr等,所以根据自己试验经费来定就好。个人觉得测一下亲本多不了几个钱,可以测了,还可以搞搞重测序分析嘛。

        安装挺简单的,我就喜欢用conda,这个流程又支持conda,所以,上吧

           conda install -c bioconda qtlseq

        完事就安装完毕了,这个流程里面包含了BWA、samtools、BCFtools、Snpeff、Trimmomatic等软件,还有一些python依赖库用于绘图什么的,反正都可以用上面那个命令安装完。

        使用命令很简单,就一行

qtlseq 

usage: qtlseq -r <FASTA> -p <BAM|FASTQ> -b1 <BAM|FASTQ>

              -b2 <BAM|FASTQ> -n1 <INT> -n2 <INT> -o <OUT_DIR>

              [-F <INT>] [-T] [-e <DATABASE>] [--species <NAME>]

        这玩意需要准备的数据有几个,第一部分是两个亲本的测序数据,使用的是参数-p输入 两个亲本就输入两次-p

-p P1_1.fq,P1_2.fq

-p P2_1.fq,P2_2.fq

        第二部分是两个池的数据,

 -b1 bulk1_1.fq,bulk1_2.fq,

 -b2 bulk2_1.fq,bulk2_1.fq,

      测序数据准备完了,剩下就是一些细节参数,比如每个池子里面的样本数

-b1 int

-b2 int

    能用的线程数

-t cpus

      这软件有个特殊的功能,似乎是有人搞了些验证过的snp,用于过滤,目前支持Arabidopsis, Cucumber, Maize, Rapeseed,Rice, Tobacco, Tomato, Wheat, and Yeast等物种,可以增加snp的准确性吧。

qtlseq -r reference.fasta \

      -p parent.1.fastq,parent.2.fastq \

      -b1 bulk_1.1.fastq,bulk_1.2.fastq \

      -b2 bulk_2.1.fastq,bulk_2.2.fastq \

      -n1 20 \

      -n2 20 \

      -t 48 \

      -o example_dir

    然后个人试用的话,感觉还是太慢了,测序数据清理用的Trimmomatic慢出天际,比对走的是bwa流程,其实讲究加速的话,可以先用fastp-----bwa-mem2-------sambamba流程先建立好所有的去重的bam文件,然后再把bam文件进行输入,速度快得多,所以我个人更喜欢如下这样:

qtlseq -r reference.fasta \

      -p parent_1.bam \

      -p parent_2.bam \

      -b1 bulk_1.bam \

     -b2 bulk_2.bam \

       -n1  20  \

      -n2 20 \

       -t 48 \

      -o example_dir

最后输出的文件夹里面包含了各种中间内容:

├── 10_ref

│  ├── reference.fasta

│  ├── reference.fasta.amb

│  ├── reference.fasta.ann

│  ├── reference.fasta.bwt

│  ├── reference.fasta.fai

│  ├── reference.fasta.pac

│  └── reference.fasta.sa

├── 20_bam

│  ├── bulk1.filt.bam

│  ├── bulk1.filt.bam.bai

│  ├── bulk2.filt.bam

│  ├── bulk2.filt.bam.bai

│  ├── parent.filt.bam

│  └── parent.filt.bam.bai

├── 30_vcf

│  ├── qtlseq.vcf.gz

│  └── qtlseq.vcf.gz.tbi

├── 40_qtlseq

│  ├── bulk1_SNPindex.png

│  ├── bulk2_SNPindex.png

│  ├── delta_SNPindex.png

│  ├── sliding_window.tsv

│  ├── sliding_window.p95.tsv

│  ├── sliding_window.p99.tsv

│  ├── np_index.tsv

│  ├── snp_index.p95.tsv

│  └── snp_index.p99.tsv

└── log

  ├── bcftools.log

  ├── bgzip.log

  ├── bwa.log

  ├── samtools.log

  └── tabix.log

还有图,看起来还不错。

上一篇下一篇

猜你喜欢

热点阅读