智能合并测序数据fastq的脚本
2022-05-12 本文已影响0人
11的雾
介绍:
这是一个可以自动合并数据的简易脚本
应用场景:
有一批数据有三十几个样本,测序公司返回数据时由于数据量不达标,需要加测一次,部分样本数据量还是不够, 又加测一次才够,总共三次数据,需要根据样本名称合并成一个fq.gz。这么多数据要一个一个对应太麻烦了.
那么如果经常发生这种情况,建议换一家测序公司。
脚本使用注意事项:
批次之间的文件如何区分:
通常是根据lane号区分的,比如:
- XXX_L3_1.fq.gz(第一批测序回来的)
- XXX_L2_1.fq.gz(第二批测序回来的)
再有就是两批数据完全相同的名称:
- XXX_L3_1.fq.gz(第一批测序回来的)
- XXX_L3_1.fq.gz(第一批测序回来的)
这两种都支持!
脚本的使用:
只需要放入需要合并的数据的所有路径,有多少批数据路径就放多少批数据路径:
python3 DataMerge.py /path/to/data1 /path/to/data2 /path/to/data3
已更新:
- 支持相对路径
- 结果不会替换原来的文件,而是生成新的文件夹:
- 会检查每个路径的fastq数量,并根据fastq名称一一对应.
- 支持10x数据的-1,-2,-3,-4的数据:
- 所有的数据一个都不漏,该合并的合并,不需要合并的就链接地址过来.
待更新:
SE的数据没有验证过,
举例:
python3 DataMerge.py ../20220331_HG5GLDSX3_Result/Rawdata ../20220404_HFVV3DSX3_Result/Rawdata
点赞+评论获取脚本