生信笔记生信

【小工具】按比例截取fastq数据量

2019-05-17  本文已影响0人  11的雾

生信需求:

你有fastq文件,想按照5%,10%,20%,40%,60%,80%,截取fastq的数据量。

特点与功能:

1,随机截取,不是按照原始fastq中的顺序截取。
2,支持PE,和SE reads,
3,仅支持fastq格式。
4,目前仅支持固定比例。(5%,10%,20%,40%,60%,80%)。

用法:

usage: downsampling.py [-h] [-r1 READ1] [-r2 READ2] [-p PREFIX]

This is description

optional arguments:
  -h, --help            show this help message and exit
  -r1 READ1, --rd1 READ1
                        input read1 file
  -r2 READ2, --rd2 READ2
                        input read2 file
  -p PREFIX, --prefix PREFIX
                        prefix

举例 -p为输出文件的前缀。

python downsampling.py -r1  16E1L1_R1.fastq.gz -r2 16E1L1_R2.fastq.gz  -p 16E1L1

得到如下结果,输出结果的命名为:前缀+ 固定的后缀(xxpct_Rx.fq.gz)。


image.png
上一篇下一篇

猜你喜欢

热点阅读