python 字节流 按长度截取

2020-06-07  本文已影响0人  生活就是爱

一、业务需求

谈到python对bytes类型数据的处理,常用的struct模块,网上资料甚多,这里不做赘述
用struct处理的前提是:接收方和发送方提前定义好不同变量的类型、长度、位置,然后双方安装柜子进行打包和拆包

这里有一个业务场景:双方指定单次业务长度是128,发送方因为操作实物,一次性发过来n个数据包
接收方接受到的长度就是n*128,如果还是安装之前指定的规则进行struck.unpack就会出错
现在需要对数据包进行拆分,而且是根据长度来进行拆分

二、按照长度拆分字节流bytes:正则表达式

安装长度拆分字符串,正则是最快的

import re

data = "hello world"
ret = re.findall(r".{2}", data)
print("ret:", ret)

就可以得到想要的结果

ret: ['he', 'll', 'o ', 'wo', 'rl']

如果data是字节流bytes的话,直接使用会报错

TypeError: can't use a string pattern on a bytes-like object

需要做一些小小的改造

import re

data = b"\xfe\xff\xff\xff\x00\x00\x00\x00"
ret = re.findall(b".{2}", data) #就是这里需要做小小的改造,看仔细哦
print("ret:", ret)

后续补充:
上面的正则表达式,通过 .来匹配任意字符是不完善的:无法匹配回车符\n
以上代码需要改造

import re

data = b"\xfe\xff\xff\xff\x00\x00\x00\x00"
ret = re.findall(b"[\s\S]{2}", data) #就是这里需要做小小的改造,看仔细哦
print("ret:", ret)

三、按照长度拆分字节流bytes:字符串切片

后面找到一个字符串切片的方式也不错

obj = b"\xfe\xff\xff\xff\x00\x00\x00\x00"
sec = 2
[obj[i:i+sec] for i in range(0,len(obj),sec)]

返回的结果也很理想

[b'\xfe\xff', b'\xff\xff', b'\x00\x00', b'\x00\x00']

参考资料:
细究Python struct 模块
python 按照固定长度分割字符串的方法小结
如何对python的bytes类型数据split分割切片
python按照固定长度分割字符串
python - 正则表达式判断 - 正则表达式匹配单词
Python一行代码实现按指定长度分段切割字符串或列表
正则表达式匹配任意字符(包括换行符)的写法

上一篇 下一篇

猜你喜欢

热点阅读