人体菌群研究

python: 指定行数切割文本

2022-03-04  本文已影响0人  胡童远

一个1089行的文件需要被每100行拆到一个新的文件,最后剩下的放到最后一个文件。即,批量指定行数切割文件。后面就可以多线程的处理这些文件了。

1 待处理文件

2 python script
代码思路:

#!/usr/bin/env python3
import re, os, sys

size = 100  # 多少行一个文件
inpath = "3324path.list"  # 需要拆分的文件,3324行

with open(inpath) as infile:
    infile = infile.readlines()
    nrow = len(infile)
    start = 0
    end = size
    for i in range(nrow//size): 
        #print(''.join(infile[start:end]))
        batch_name = "batch_" + str(i+1) + ".path" 
        with open(batch_name, 'w') as o:
            o.write(''.join(infile[start:end]))
        start = start + size
        end = end + size
    os.system("tail -n " + str(nrow%size) + " " + inpath + " > batch_left.path")

3 使用script

运行程序

python3 ../script/cut_file.py

结果

上一篇 下一篇

猜你喜欢

热点阅读