【Android】java虚拟机、dalvik虚拟机和Art虚拟
1 概论
1.1 JVM概念
JVM是Java Virtual Machine的简称,本质上就是一个软件,是计算机硬件的一层软件抽象,在这之上才能够运行Java程序,JAVA在编译后会生成类似于汇编语言的JVM字节码,与C语言编译后产生的汇编语言不同的是,C编译成的汇编语言会直接在硬件上跑,但JAVA编译后生成的字节码是在JVM上跑,需要由JVM把字节码翻译成机器指令,才能使JAVA程序跑起来。
JVM运行在操作系统上,屏蔽了底层实现的差异,从而有了JAVA吹嘘的平台独立性和Write Once Run Anywhere。根据JVM规范实现的具体虚拟机有几十种,主流的JVM包括Hotspot、Jikes RVM等,都是用C/C++和汇编编写的,每个JRE编译的时候针对每个平台编译,因此下载JRE(JVM、Java核心类库和支持文件)的时候是分平台的,JVM的作用是把平台无关的.class里面的字节码翻译成平台相关的机器码,来实现跨平台。
1.2 DVM概念
DVM是Dalvik Virtual Machine的缩写,是Android4.4及以前使用的虚拟机,所有android程序都运行在android系统进程里,每个进程对应着一个Dalvik虚拟机实例。JVM和DVM都提供了对象生命周期管理,堆栈管理,线程管理,安全和异常管理及垃圾回收等重要功能,各自拥有一套完整的指令系统。
APK在打包的过程中会先将java等源码通过javac编译成.class文件,然后通过android的dx工具将.class文件转换成Dalvik虚拟机能够执行的.dex文件。Dalvik虚拟机在应用程序启动时,会将.dex文件转换成快速运行的机器码进行执行。
1.3 ART概念
在android5.0及后续版本中,Google采用了ART正式取代了以往的Dalvik虚拟机,ART虚拟机会将.dex文件转化为可直接运行的.oat文件。
1.3.1 JIT
JIT是Just In Time缩写,称为及时编译技术。以JVM为例,javac将源程序编译成java字节码,JVM通过逐条解释将字节码翻译成对应的机器指令,逐条读入,逐条解释翻译,执行速度必然比c/c++编译后的可执行二进制字节码程序慢,为了提高执行速度,就引入了JIT技术,JIT会在运行时分析应用程序代码,识别哪些方法可以归类为热方法,这些方法会被JIT编译器编译成对应的汇编代码,然后存储到代码缓存中,以后调用这些方法时就不用解释执行了,可以直接使用代码缓存中已编译好的汇编代码,这能显著提升应用程序的执行效率。Dalvik虚拟机在android2..2中增加了JIT。
1.3.2 AOT
AOT指的是预编译技术,其全称为Ahead Of Time。AOT就是在我们安装APK时就将dex文件直接处理成可直接供ART虚拟机使用的机器码。
1.4 APK的执行流程
引用一张Google的图来看一下Android对apk的执行流程(图片从上往下阅读):
图1.1 apk执行过程
Java文件通过javac编译成.class文件,然后通过SDK中的dx工具将.class文件转换成Dalvik虚拟机能够执行的.dex文件,然后与Native code(JNI)和资源文件一起打包成apk,apk安装到手机后解压出.dex文件,Dalvik虚拟机会通过dexopt工具将.dex文件优化,形成Odex文件,ART则会将.dex文件通过dex2oat工具编译得到一个ELF文件,这是一个可执行文件。
2 虚拟机特性对比
2.1 JVM与DVM对比
-
Java虚拟机运行的是java字节码,Dalvik虚拟机运行的是Dalvik字节码
java程序经过编译,生成java字节码保存在.class文件中,JVM通过解码.class文件中的内容来运行程序。而DVM运行的是Dalvik字节码,所有的Dalvik字节码都是由Java字节码转换而来,并打包到.dex(Dalvik Executable)可执行文件中,DVM通过解释.dex文件来执行这些字节码。
-
Dalvik可执行文件体积更小
android SDK中有个dx工具,该工具负责将Java字节码转换为Dalvik字节码,dx工具对Java类文件重新排列,将所有Java类文件中的常量池分解,消除其中冗余信息,重新组合形成一个常量池,所有的类文件共享同一个常量池,使得相同的字符串、常量在DEX文件中只出现一次,从而减少了文件的体积。 -
JVM基于栈,DVM基于寄存器
关于栈式虚拟机:
- 代码必须使用这些指令来移动变量(即push和pop)
- 代码尺寸小和解码效率会更高些
- 堆栈虚拟机指令有隐含的操作数。
关于寄存器式虚拟机:
- 使用堆栈来分配激活记录器
- 基于寄存器代码免去了使用push和pop命令的麻烦,减少了每个函数的指令总数。
- 代码尺寸和解码效率不如基于栈虚拟机,因为它包含操作数,所以指令大于基于堆栈的指令。但是基于寄存器产生更少的代码,所以总的代码数不会增加。
- 寄存器虚拟机必须从操作指令中解码操作数,需要额外的解码操作。
因而,笼统说可以有以下结论:
- 要追求尽量实现简单:选择基于栈
- 传输代码的大小尽量小:选择基于栈
- 纯解释执行的解释器的速度:选择基于寄存器
- 带有JIT编译器的执行引擎的速度:随便,两者一样;对简易JIT编译器而言基于栈的指令集可能反而更便于生成更快的代码,而对比较优化的JIT编译器而言输入是基于栈还是基于寄存器都无所谓,经过parse之后就变得完全一样了。
2.2 DVM与ART对比
-
ART采用AOT技术替代了JIT
ART在应用程序安装时,就已经将所有的字节码编译成机器码,运行的时候直接运行的是机器码。而Dalvik则是在应用程序运行时,实时地将字节码编译成机器码。因此,ART与Dalvik相比,省去了运行时将字节码编译成机器码的过程,极大地提升了应用程序的运行效率。
虽然运行效率得到提升,但同时带来了其它缺点:
- 安装时需要将字节码转换成机器码,因此ART需要更大的存储空间
- 安装时需要更多的时间
-
提高了垃圾回收效率
Dalvik虚拟机在GC时,会挂起虚拟机内部的所有线程,然后GC查找所有可回收的对象进行回收,回收后恢复所有挂起的线程。GC与应用程序的运行并不是并发执行的,如果GC频繁或者GC时间过长都会导致应用程序运行卡顿。
ART对GC做了一定的改善,Dalvik的GC操作与应用程序是同步执行的(非并发),而ART则将原来的非并发过程改成部分并发,缩短了GC时间,提升了垃圾回收效率。 -
提高了内存使用率、减少了内存碎片化
Dalvik虚拟机垃圾回收采用了Mark and Sweep算法,即“标记-清除”算法,这种算法先对需要回收的内存区域进行标记,然后再统一清除,它是一种比较高效的算法,但是带来的弊端是会造成可用内存块的不连续,碎片化严重。虚拟机多次gc之后,本来连续的内存区域变得千疮百孔,以后为对象分配内存寻址会越来越难。
而ART在内存分配上做了优化,比如它开辟了一块名为Large Object Space的内存区域,专门用来存放大对象,同时还引入了一个名为moving collector的技术,专门用来将gc后不连续的物理内存块对齐,解决了Dalvik上内存碎片化严重的问题。
参考文章
https://blog.csdn.net/qq_27688259/article/details/82252855
https://www.jianshu.com/p/5c00dd2bece6
https://www.jianshu.com/p/1f779586efdc
https://blog.csdn.net/k1457047898/article/details/53471951