深入理解JAVA虚拟机学习笔记12——class类文件结构概述
对于前面的学习,笔者认为属于第一阶段,一直都在说虚拟机内存分配和垃圾收集的问题,由于这些都是开发的过程中看不见又不常用得,不那么容易理解。
从这一篇开始,我们迎来了第二阶段,这一阶段的知识,将会和我们的代码紧密联系起来。
每一个学习JAVA的人,相信都听过一个诱人的口号“Write once, run anywhere”,JAVA是怎么实现的,简单来说,在不同的平台上有不同的虚拟机,虚拟机会将生成的字节码文件(Class类文件)进行解释,在不同的平台上得到不同的指令,但是不论在什么平台上,最终执行的结果是一样的。这个情境有没有种似曾相识的感觉?是不是有点像接口和实现类,class文件像一个更高层次的接口(不要受JAVA接口概念的限制),定义了各种的操作方法,虚拟机中对这些方法进行实现。
而且,使用虚拟机还有一个好处,那就是,只要按照虚拟机规范生成的Class字节码文件,就能够被虚拟机解释执行。
因此,借助于Java虚拟机,又涌现了一批优秀的语言,如Groovy,Ruby,Scala等。
Class文件是一组以8位字节为基础单位的二进制流,这些字节码是按顺序紧凑排列的,并且没有任何符号的,那就要求文件内容必须严格按照规则排列!这就是一个用16进制编码工具打开的class文件,大家先简单看一下。
其中,文件的内容就是按照下表的类型,依次排列的(图片来自《深入理解JAVA虚拟机第二版》)。
类型中,u4、u2分别代表四个字节和两个字节;以“_info”结尾,代表由多个无符号数或其它表构成的复合数据类型。具体的排列规则,我们后续再深入分析。
今天本来其实看了很多,但是写着写着发现,其实这里面涵盖了很多基础的内容,为了让朋友们更好的理解,将计算机理论中的一些概念再复习一下。
区分一下容易混淆的两个概念,字节和字符。
在对比之前,还要提到另一个概念:位,即bit,前一段让玩家们欲生欲死的比特币,就是这个比特,这是计算机信息存储的最小的一个单位,只有0和1两种状态。
那么,这两种状态计算机又是怎么识别的呢?我只能说数字电路中高电压代表1,低电压代表0,再多的笔者也真的记不住了……
言归正传,开始对比。
字节:这是一个基本数据类型byte,每个字节中包含8个位,即1byte=8bit。通俗的说,如果一个位存在两种可能,那么我们就不难推测出一个字节可以表示2的8次幂,即256种可能。代表数字的话,就可以代表-127到128。
多说一嘴,在计算机世界里,这个负数是怎么实现的呢?用符号肯定不行啊,‘-’作为字符,自己就占一个字节啊!这不得不说前辈们的智慧,8个bit中,如果第一位为1,那么计算机会就会认为这是一个负数,负数在计算机当中是以补码形式存在的,将符号位去掉,末尾补1,就得到了对应的负数值。
字符:即基本数据类型里面的char,可以用来存储一个文字符号,比如‘a’,‘1’,‘三’,‘¥’等等,这些都是字符。其中英文字母,数字和符号占一个字节;汉字GBK占2个字节,UTF-8编码占3个字节(还有其它的编码,不尽相同,真的烦!)。按照JAVA的规定,采用的UNICODE编码,所有字符占两个字节,即1char
= 2 byte,不够的需要用0补齐(说实话,笔者对这里总是将信将疑,正好学到了class文件,接下来一定要测试一下)。
这里再顺带提一个关于StringBuffer的小细节(真的啰嗦),不知道朋友们有没有注意到,当我们new一个StringBuffer的时候,默认存储了16个char。神不神奇?
求关注,喜欢文章或想一起学习的朋友可以关注我,给我点赞,我将会持续更新,有什么疑问或文中有不当之处请给我留言,真诚地希望能与大家一起交流探讨,学习进步。