HLA分型工具--OptiType
2022-02-15 本文已影响0人
11的雾
OptiType只能分型HLA-A, HLA-B, HLA-C三种类型
文章2014年发表:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4441069/
截止2022年2月看到github上的版本:2020年9月更新到了v1.3.5
image.png安装:
mkdir OptiType
cd OptiType
tar -zxvf OptiType-1.3.5.tar.gz
image.png
可以分析dna数据(WES,WGS),也可以分析RNA数据(RNAseq),用--dna和--rna参数区分。
输入为:fastq格式:
作者建议三步走:
1,使用razers3 比对原始数据(fastq/gz)到hla reference上(注意dna和rna的不同,reference放在data目录下),得到一个fished bam
>razers3 -i 95 -m 1 -dr 0 -o fished_1.bam /path/to/OptiType/data/hla_reference_dna.fasta sample_1.fastq
2,再用samtools bam2fq 将bam转换为fastq格式
>samtools bam2fq fished_1.bam > sample_1_fished.fastq
3,再用optitype
>python /path/to/OptiTypePipeline.py -i sample_fished_1.fastq [sample_fished_2.fastq]
(--rna | --dna) [--beta BETA] [--enumerate N]
[-c CONFIG] [--verbose] --outdir /path/to/out_dir/
还要提前修改 config.ini文件哦。
测试: DNA data (paired end):
python OptiTypePipeline.py -i ./test/exome/NA11995_SRR766010_1_fished.fastq ./test/exome/NA11995_SRR766010_2_fished.fastq --dna -v -o ./test/exome/
测试:RNA data()
python OptiTypePipeline.py -i ./test/rna/CRC_81_N_1_fished.fastq ./test/rna/CRC_81_N_2_fished.fastq --rna -v -o ./test/rna/
真实数据测试:PE
razers3 -i 95 -m 1 -dr 0 -o fished_1.bam /software/OptiType-1.3.5/data/hla_reference_dna.fasta 2022112_L1_1.fq.gz
razers3 -i 95 -m 1 -dr 0 -o fished_2.bam /software/OptiType-1.3.5/data/hla_reference_dna.fasta 2022112_L1_2.fq.gz
samtools bam2fq fished_1.bam > sample_1_fished.fastq
samtools bam2fq fished_2.bam > sample_2_fished.fastq
python3 /cygene/software/biosoftware/OptiType/OptiType-1.3.5/OptiTypePipeline.py -i sample_1_fished.fastq sample_2_fished.fastq --dna -v -o ./
image.png