21.1-习题base64解码
2019-10-07 本文已影响0人
BeautifulSoulpy
Base64编码
Base64编码 是一种基于 64 个可打印字符来表示二进制数据的方法。目前 Base64 已经成为网络上常见的传输 8 位二进制字节代码的编码方式之一。
它的编码过程如下:
man编码将待转换的字符串每三个字节分为一组,每个字节占 8 个二进制位,那么共有 24 个二进制位。
将第(1)步得到的每 24 个二进制位分为每 6 个一组,则每 3 个字节可分为 4 组。
在每组前面添加两个 0 ,每组由 6 个二进制位变为 8 个二进制位,总共 32 个二进制位,即四个字节。
若原字节序列数据长度不是3的倍数时且剩下1个输入数据,则在编码结果后加2个=;若剩下2个输入数据,则在编码结果后加1个=。根据 Base64编码对照表(见下表)获得对应的值。
大多数编码都是由字符串转化成二进制的过程,而 Base64 的编码则是从二进制转换为字符串。与常规恰恰相反,Base64 编码主要用在传输、存储、表示二进制领域,不能算得上加密,只是无法直接看到明文。也可以通过打乱Base64 编码来进行加密。中文有多种编码(比如:utf-8、gb2312、gbk等),不同编码对应Base64编码结果都不一样。
alphabet = b"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"
def base64decode(src:bytes):
ret = bytearray()
length = len(s)
step = 4 # 对齐
for offset in range(0,length,step):
tmp = 0x00
block = s[offset:offset+step]
# 反查表,
for i,c in enumerate(reversed(block)):
index = alphabet.find(c)
if index == -1:
#continue # 找不到说明是=,就是0,不用移位相加了
tmp += index << i*6
ret.extend(tmp.to_bytes(3, 'big'))
return bytes(ret.rstrip(b'\x00')) # 把最右边的\x00去掉