Hifiasm参数的详细解释

2024-05-09  本文已影响0人  peacezhang

Hifiasm Parameter Reference

概要

仅使用 HiFi reads进行组装

hifiasm -o [prefix] -t [nThreads] [options] input1.fq [input2.fq [...]]

#-o [prefix]: 指定输出文件的前缀。hifiasm会根据这个前缀生成几个输出文件,包括最终的组装结果、日志文件等。
#-t [nThreads]: 指定用于组装过程的线程数。增加线程数可以加快计算速度,但请注意不要超过你的硬件资源限制。

#[options]: hifiasm提供了一系列的选项来调整组装参数,例如:
#-s: 是否使用单分子序列。
#-p: 是否使用PacBio CLR序列。
#-P: 是否使用PacBio CCS序列。
#-S: 是否使用Nanopore序列。
#-L: 设置长序列的最小重叠长度。
#-k: 设置k-mer大小。
#input1.fq [input2.fq [...]]: 一个或多个输入文件,可以是FASTQ格式的测序读取文件。对于双端测序数据,需要提供正向和反向序列的文件。

三重组分分选(先用yak)

yak count -o paternal.yak -b37 [-t nThreads] [-k kmerLen] paternal.fq.gz
yak count -o maternal.yak -b37 [-t nThreads] [-k kmerLen] maternal.fq.gz
hifiasm [-o prefix] [-t nThreads] [options] -1 paternal.yak -2 maternal.yak child.hifi.fq.gz

#yak count 是一个用于快速估算基因组大小和杂合度的程序。它基于k-mer计数,可以帮助确定基因组中可能的重复区域和结构变异。
#-b37: 指定参考基因组的版本,这里 b37 指的是Human Genome Build 37。
#-k [kmerLen]: 可选参数,用于指定k-mer的长度。
#这里,paternal.fq.gz 和 maternal.fq.gz 是压缩的测序数据文件,分别对应父本和母本的样本。

Hi-C集成组件

hifiasm -o [prefix] -t [nThreads] --h1 [hic_r1.fq.gz,...] --h2 [hic_r2.fq.gz,...] [options] HiFi.read.fq.gz

获取选项的详细说明

hifiasm -h
#or
man ./hifiasm.1

常规选项

错误方案

组装选项

Trio-binning选项

有关重复选项

Hi-C组装选项

上一篇 下一篇

猜你喜欢

热点阅读