Android编码解码及其原理
本文摘抄至:chendong_ 的博客
前言
本文用到ASCII表,Base64对照表请自行百度。
概念:编码解码就是使用特定的算法,将数据进行处理,形成数据的另外一种表现形式,编码后的数据可以使用解码算法还原出原始数据。
Base64简介
Base64算法可以将任意的字节数组数据通过算法生成只有(英文大小写,数字,+,/)共64种字符的字符串数据;相当于将任意内容转换为可见字符串表示。
也就是将不可见的数据转换为ASCII码数据,便于在Json和Xml中传递。
Base64Api
flag常量
字符串Base64编码过程
字符串String str = "0Aa";首先,原先每个字符是2个字节16bit,对于英文来说前8个bit是0,也就是只有8个bit,现在是3个字符,3*8=24个bit需要显示。
转换
现在拼凑成是这样的二进制串( 001100 000100 000101 100001),将其转化为Base64可以显示的模式,需要每次取6位作为一个Base64字符,前两位补0
二进制数组编码过程
这个例子已经很清晰的解释了Base64的编码过程,网上有人自己实现了Base64编码的类,Android源码也不难,这是编码字符串看起来还是比较清晰的,我们也可以更本质一点
byte[] bs = new byte[]{1,10,20};这是一个byte数组,复习一下,1个byte是8个bit,可以表示的范围 0-127之间,我们在调用Base64的函数时,本质也是在操作字节数组,同样的原理
Hex编码简介
Hex就是16进制,本质上是将字节数组转化为16进制,然后用字符串的形式表现出来,我们知道16进制的取值范围就是在0-f之间,这样就可以将无法显示的字节数组数据显示出来。
原理方面比起Base64就简单很多了,一个8bit的数据,也就是(xxxx xxxx),每4个bit可以转化为一个16进制表示,也就是8个bit会转化为(00-ff)之间的16进制数字。
Hex编码原理分析
简单说一下,&运算,两者都为1结果才是1,b>>4&0xf取出高四位,b&0x0f取出低四位,举个例子:
1、字节是 b = 1010 1111
2、b>>4 b = 00001010
3、b>>4&0x0f 也就是 00001010&00001111 —-> 1010高四位取出来了,取得低四位原理一样。后面的操作就是根据数据的大小转换一下格式,因为拿到的数据是十进制的那么范围会在0-15之间,需要转换为16进制的0-f.
Hex解码原理分析
相当于编码的逆运算,根据字符串每次取两位,转换成int,在进行移位将其拼成一个字节,怎么拼的?v = ((ih&0x0f)<<4)|(il&0x0f);
这一句,假设我们获得的字符串最后转化结果是10和5,也就是1010,0101。10<<4,结果是10100000,然后10100000 | 0101,|运算只要有1则为1,结果是10100101就完成了拼接工作。
总结
Base64和Hex是比较常见的编码方式,对比一下,Base64每3个字节转化为4个字节,每个字节浪费2bit,Hex编码,每个字节转化为两个字节,每个字节浪费4bit,所以说Base64更加节省空间,而且用起来简单得多。