2022-06-08 seqkit的一些常见使用

2022-06-07  本文已影响0人  dashan1928

转自:https://www.51xxziyuan.com/54/3865.html

1.大文件拆分 

 -l, --by-length string   split sequences into chunks of >=N bases, supports K/M/G suffix

 -p, --by-part int        按照拆分出来的数量,比如:拆分成两个子文件2。-s, --by-size int        按照序列数量拆分

 -f, --force              强制覆盖文件

 -h, --help               查看帮助文件

 -O, --out-dir string     输出文件夹 (default value is $infile.split)

 -1, --read1 string       (gzipped) 双端序列第一个

 -2, --read2 string       (gzipped) 双端序列第二个

同时支持fa和fq文件。单端和双端序列拆分实例

-f强制覆盖结果,适合重复计算时使用

seqkit split2 xx.fa.gz -s 10000 -f

双端序列拆分(重点),p指定拆分数量,-O指定输出目录,-f覆盖结果,默认为压缩

seqkit split2 -1 xx.fq1.gz -2 xx.fq2.gz -p 2 -O out -f

上一篇下一篇

猜你喜欢

热点阅读