Python全栈工程师

21.1-习题base64解码

2019-10-07  本文已影响0人  BeautifulSoulpy

Base64编码

Base64编码 是一种基于 64 个可打印字符来表示二进制数据的方法。目前 Base64 已经成为网络上常见的传输 8 位二进制字节代码的编码方式之一。

它的编码过程如下:

将待转换的字符串每三个字节分为一组,每个字节占 8 个二进制位,那么共有 24 个二进制位。

将第(1)步得到的每 24 个二进制位分为每 6 个一组,则每 3 个字节可分为 4 组。

在每组前面添加两个 0 ,每组由 6 个二进制位变为 8 个二进制位,总共 32 个二进制位,即四个字节。
若原字节序列数据长度不是3的倍数时且剩下1个输入数据,则在编码结果后加2个=;若剩下2个输入数据,则在编码结果后加1个=。

根据 Base64编码对照表(见下表)获得对应的值。

man编码

大多数编码都是由字符串转化成二进制的过程,而 Base64 的编码则是从二进制转换为字符串。与常规恰恰相反,Base64 编码主要用在传输、存储、表示二进制领域,不能算得上加密,只是无法直接看到明文。也可以通过打乱Base64 编码来进行加密。中文有多种编码(比如:utf-8、gb2312、gbk等),不同编码对应Base64编码结果都不一样。

alphabet = b"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"
def base64decode(src:bytes):
    ret = bytearray()
    length = len(s)
    step = 4 # 对齐
    for offset in range(0,length,step):
        tmp = 0x00
        block = s[offset:offset+step]
# 反查表,
        for i,c in enumerate(reversed(block)):
            index = alphabet.find(c)
            if index == -1:
                #continue # 找不到说明是=,就是0,不用移位相加了
                tmp += index << i*6
                ret.extend(tmp.to_bytes(3, 'big'))
    return bytes(ret.rstrip(b'\x00')) # 把最右边的\x00去掉
上一篇下一篇

猜你喜欢

热点阅读