2022-06-08 seqkit的一些常见使用
2022-06-07 本文已影响0人
dashan1928
转自:https://www.51xxziyuan.com/54/3865.html
1.大文件拆分
-l, --by-length string split sequences into chunks of >=N bases, supports K/M/G suffix
-p, --by-part int 按照拆分出来的数量,比如:拆分成两个子文件2。-s, --by-size int 按照序列数量拆分
-f, --force 强制覆盖文件
-h, --help 查看帮助文件
-O, --out-dir string 输出文件夹 (default value is $infile.split)
-1, --read1 string (gzipped) 双端序列第一个
-2, --read2 string (gzipped) 双端序列第二个
同时支持fa和fq文件。单端和双端序列拆分实例
-f强制覆盖结果,适合重复计算时使用
seqkit split2 xx.fa.gz -s 10000 -f
双端序列拆分(重点),p指定拆分数量,-O指定输出目录,-f覆盖结果,默认为压缩
seqkit split2 -1 xx.fq1.gz -2 xx.fq2.gz -p 2 -O out -f