python 字节流按长度截取

2020-06-07 本文已影响0人生活就是爱

一、业务需求

谈到python对bytes类型数据的处理，常用的struct模块，网上资料甚多，这里不做赘述
用struct处理的前提是：接收方和发送方提前定义好不同变量的类型、长度、位置，然后双方安装柜子进行打包和拆包

这里有一个业务场景：双方指定单次业务长度是128，发送方因为操作实物，一次性发过来n个数据包
接收方接受到的长度就是n*128，如果还是安装之前指定的规则进行struck.unpack就会出错
现在需要对数据包进行拆分，而且是根据长度来进行拆分

安装长度拆分字符串，正则是最快的

import re

data = "hello world"
ret = re.findall(r".{2}", data)
print("ret:", ret)

就可以得到想要的结果

ret: ['he', 'll', 'o ', 'wo', 'rl']

如果data是字节流bytes的话，直接使用会报错

TypeError: can't use a string pattern on a bytes-like object

需要做一些小小的改造

import re

data = b"\xfe\xff\xff\xff\x00\x00\x00\x00"
ret = re.findall(b".{2}", data) #就是这里需要做小小的改造，看仔细哦
print("ret:", ret)

后续补充:
上面的正则表达式，通过 .来匹配任意字符是不完善的：无法匹配回车符\n
以上代码需要改造

import re

data = b"\xfe\xff\xff\xff\x00\x00\x00\x00"
ret = re.findall(b"[\s\S]{2}", data) #就是这里需要做小小的改造，看仔细哦
print("ret:", ret)

后面找到一个字符串切片的方式也不错

obj = b"\xfe\xff\xff\xff\x00\x00\x00\x00"
sec = 2
[obj[i:i+sec] for i in range(0,len(obj),sec)]

返回的结果也很理想

[b'\xfe\xff', b'\xff\xff', b'\x00\x00', b'\x00\x00']