BASE64
BASE64 是一种编码方式,通常用于把二进制数据编码为可写的字符形式的数据。这是一种可逆的编码方式。编码后的数据是一个字符串,其中包含的字符为:A-Z、a-z、0-9、+、/ ,共 64 个字符:26 + 26 + 10 + 1 + 1 = 64,所以称为 Base64 编码【注:其实是 65 个字符,“=” 是填充字符】。
标准编码方法
64 个字符需要 6 位来表示,表示成数值为 0~63。
这样,长度为 3 个字节的数据经过 Base64 编码后就变为 4 个字节。
例:字符串“Xue”经过 Base64 编码后变为“WHVl”。
长度为 3 个字节的数据位数是 8x3=24,可以精确地分成 6x4。
如果数据的字节数不是 3 的倍数,则其位数就不是 6 的倍数,那么需要就不能精确地划分成 6 位的块。,
此时,需在原数据后面添加 1 个或 2 个零值字节,使其字节数是 3 的倍数。
然后,在编码后的字符串后面添加 1 个或 2 个等号“=”,表示所添加的零值字节数。
例:字符串 “Xu” 经过 Base64 编码后变为 “WHU=”。
字符串 “X” 经过 Base64 编码后变为 “WA==”。
应用:
需要明文保存二进制数据时,可以将不可打印的二进制数据经过 Base64 编码转成可打印的字符串。
Mozilla Thunderbird 和 Evolution 用 Base64 来保密电子邮件密码
Base64 也会经常用作一个简单的“加密”来保护某些数据,而真正的加密通常都比较繁琐。
垃圾讯息传播者用 Base64 来避过反垃圾邮件工具,因为那些工具通常都不会翻译 Base64 的讯息。
在 LDIF 档案,Base64 用作编码字串。
测试程序:
import sun.misc.BASE64Encoder;
public class Base64Test {
public static void main(String[] args) {
BASE64Encoder encoder = new BASE64Encoder();
String s = "Xue";
String encoded = encoder.encode(s.getBytes());
System.out.println("Xue -> " + encoded);
s = "Xu";
encoded = encoder.encode(s.getBytes());
System.out.println("Xu -> " + encoded);
s = "X";
encoded = encoder.encode(s.getBytes());
System.out.println("X -> " + encoded);
}
}
输出:
Xue -> WHVl
Xu -> WHU=
X -> WA==
这是一种可逆的编码方式,从编码的方式即可逆推出解码的方式。
URL 安全编码
Base64 转码时会生成 “+”,“/”,“=” 这些会被 URL 进行转码或者在 URL 中有特殊用途的特殊字符,导致 URL 解析出错或者收发两方面数据不一致。解决方案是,在发送前将 “+”,“/”,“=” 替换成 URL 不会转码的字符,接收到数据后,先将这些字符替换回去,再进行解码。通用做法是:
将 “+” 替换为 “_“,解码时再替换回去
将 ”/“ 替换为 ”-“,解码时再替换回去
将尾部 ”=“ 删除,解码时再根据数据长度自动补齐尾部的 “=”=