基因组组装组装

hifiasm组装

2022-06-29  本文已影响0人  木夕月

参考hifiasm网页代码: https://github.com/chhylp123/hifiasm
ssh 进入一个登录节点
从subreads 里提取hifi数据 利用ccs软件

ccs m64033_210412_083226.subreads.bam m64033_210412_083226.ccs.bam
ccs m64083_210501_064735.subreads.bam m64083_210501_064735.ccs.bam

数据压缩、合并

gzip m64033_210412_083226.ccs.fastq m64083_210501_064735.ccs.fastq
cat  m64033_210412_083226.ccs.fastq.gz  m64083_210501_064735.ccs.fastq.gz > GX.HiFi.fq.gz

运行hifiasm

hifiasm -o test -t32 -f0 GX.HiFi.fq.gz 2 > test.log

-o:定义输出文件的文件名前缀, -t:线程数

get primary contigs in FASTA
提取数据

awk '/^S/{print ">"$2;print $3}'  GX.HiFi.fq.gz > test.p_ctg.fa  

下载fasta文件 test.p_ctg.fa 与基因组文件比对

homozygous genomes
Assemble inbred/homozygous genomes (-l0 disables duplication purging)
hifiasm -o CHM13.asm -t32 -l0 CHM13-HiFi.fa.gz 2> CHM13.asm.log

一般用:f0参数
基因型是杂合的时候参数:l0

minimap比对

参考:[GitHub - lh3/minimap2: A versatile pairwise aligner for genomic and sload/v2.24/minimap2-2.24_x64-linux.tar.bz2 | tar -jxvf -
./minimap2-2.24_x64-linux/minimap2
方法1
(1):index

minimap2 -d ref.mmi R64.fna         

-d FILE: dump index to FILE []
生成索引文件ref.mmi
(2)alignment

nohup minimap2 -a ref.mmi ~/WGS/SY14/pacbio/fastq1/SRR6823435.fastq.gz > alignment1.sam 

在minimap2命令行中用索引文件替换引用序列文件
方法2

nohup minimap2 -ax map-pb R64.fna ~/WGS/SY14/pacbio/fastq1/SRR6823435.fastq.gz > alignment2.sam 

参数设置:
-a: output in the SAM format (PAF by default)
-x STR: preset (always applied before other options; see minimap2.1 for details) []
- map-pb/map-ont - PacBio CLR/Nanopore vs reference mapping
- map-hifi - PacBio HiFi reads vs reference mapping

上一篇 下一篇

猜你喜欢

热点阅读