生信笔记

HLA分型工具--OptiType

2022-02-15  本文已影响0人  11的雾

OptiType只能分型HLA-A, HLA-B, HLA-C三种类型

文章2014年发表:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4441069/

截止2022年2月看到github上的版本:2020年9月更新到了v1.3.5

image.png

安装:

mkdir OptiType
cd OptiType
tar -zxvf OptiType-1.3.5.tar.gz
image.png

可以分析dna数据(WES,WGS),也可以分析RNA数据(RNAseq),用--dna和--rna参数区分。

输入为:fastq格式:

作者建议三步走:

1,使用razers3 比对原始数据(fastq/gz)到hla reference上(注意dna和rna的不同,reference放在data目录下),得到一个fished bam

>razers3 -i 95 -m 1 -dr 0 -o fished_1.bam /path/to/OptiType/data/hla_reference_dna.fasta sample_1.fastq

2,再用samtools bam2fq 将bam转换为fastq格式

>samtools bam2fq fished_1.bam > sample_1_fished.fastq

3,再用optitype

>python /path/to/OptiTypePipeline.py -i sample_fished_1.fastq [sample_fished_2.fastq]
                    (--rna | --dna) [--beta BETA] [--enumerate N]
                    [-c CONFIG] [--verbose] --outdir /path/to/out_dir/

还要提前修改 config.ini文件哦。

测试: DNA data (paired end):

python OptiTypePipeline.py -i ./test/exome/NA11995_SRR766010_1_fished.fastq ./test/exome/NA11995_SRR766010_2_fished.fastq --dna -v -o ./test/exome/

测试:RNA data()

python OptiTypePipeline.py -i ./test/rna/CRC_81_N_1_fished.fastq ./test/rna/CRC_81_N_2_fished.fastq --rna -v -o ./test/rna/

真实数据测试:PE

razers3 -i 95 -m 1 -dr 0 -o fished_1.bam /software/OptiType-1.3.5/data/hla_reference_dna.fasta 2022112_L1_1.fq.gz
razers3 -i 95 -m 1 -dr 0 -o fished_2.bam /software/OptiType-1.3.5/data/hla_reference_dna.fasta 2022112_L1_2.fq.gz

samtools bam2fq fished_1.bam > sample_1_fished.fastq
samtools bam2fq fished_2.bam > sample_2_fished.fastq

python3 /cygene/software/biosoftware/OptiType/OptiType-1.3.5/OptiTypePipeline.py -i sample_1_fished.fastq sample_2_fished.fastq --dna -v -o ./

image.png

结果:一个tsv文件,和一个pdf文件如下

image.png image.png
上一篇下一篇

猜你喜欢

热点阅读