性能优化那些事（3）

2022-04-22 本文已影响0人 ThoughtWorks

在讨论完性能优化的方面和策略之后，这次我们的文章更偏向技术层面，来分享下如何开发一个自己的性能分析工具（基于JVM）。

『新』知识

考虑到咱们大多数还是开发业务为主，所以Java里面一些『鲜为人知』的API可能很多人都不知道，这里就简单介绍一番，如果想深究的，就自己谷歌一下吧。

JVMTI（JVM Tool Interface）是 Java 虚拟机所提供的 native 编程接口，即底层的相关调试接口调用，我们熟知的Java调试其实也是基于它。
Instrumentation，虽然Java提供了JVMTI，但是对应的agent需要用C/C++开发，对Java开发者而言并不是非常友好。因此在Java SE 5的新特性中加入了Instrumentation机制。有了Instrumentation，开发者可以构建一个基于Java编写的Agent来监控或者操作JVM了，比如替换或者修改某些类的定义等。

[图片上传失败...(image-cb712e-1650620049744)]

有了上面两个知识，其实我们就可以开发一个简单的Agent了，Instrumentation可以理解为JVM层面的AOP（Aspect Oriented Programming），通过应用启动时挂载Agent，我们可以对每一个class字节码进行查看和修改。

ASM ASM是一种通用Java字节码操作和分析框架，它可以用于修改现有的class文件或动态生成class文件，结合Instrumentation我们可以做到挂载Agent的时候，对字节码进行修改，加上我们需要的性能监控手段。ASM的学习是有难度的，需要对字节码有所了解，但由于其性能优秀，被各种工具作为修改字节码的首选，比如大家熟悉的Cglib。
Javassist 依旧是一个字节码的修改工具，但对初学者更加友好，不需要过多了解字节码层面，可以书写Java语法片段对已有class字节进行修改，缺点是过于模板化，难以优化，并且功能有限。我们做性能分析工具，本身是要尽可能减少插入字节码对现有代码的影响，并且注入的速度也要尽可能快，所以一般都会选择ASM作为首选项。

好了，介绍完Instrumentation和ASM，我们是不是就可以满足制作性能分析工具的前提条件了呢？你看我们通过Instrumentation进行JVM层面的AOP，再通过ASM对JAVA的字节码进行修改，就可以着手完成性能分析最重要的埋点环节了。

看起来没有错，但是谁也不希望我们增强修改过的代码一直存在内存中，分析一次就对环境造成不可逆的破坏吧。Instrumentation可以通过addTransformer添加字节码转换器，也可以将字节码恢复原样（只需要removeTransformer再retransformClasses就可以恢复了），但javaAgent毕竟是个单独的jar包，它也会有一些依赖，将其加载进来必然会引发新的Class加载甚至是Class的冲突。那么新的问题就出来了，javaAgent如何不对现有的类有影响呢？

ClassLoader 类加载器，我们可以采用一个新的类加载器，专门加载javaAgent里面的类库，这样就可以解决agent的类引发冲突的问题，在旧版本JDK中我们很难对ClassLoader做卸载，并且类的卸载是很麻烦的事情，限制很多，好在我们现在多数用的都是jdk1.8，只要遵循类卸载的规则，对ClassLoader进行清理还是很轻松的。

额外的类加载器实现了业务代码和Agent代码类的隔离，使它们可以安全引用包，并且可以对Agent的类进行卸载，但这样同时引入了一个新的问题。类是隔离的，我在对业务代码进行增强时，如何向agent代码传递信息？增强的代码一定是被加载在AppClassLoader里，如何与AgentClassLoader进行通讯呢？

BootStrapClassLoader 启动类加载器，该ClassLoader是JVM在启动时创建的，理解这一部分知识，就一定要理解ClassLoader的双亲委派机制。我们可以创建一个非常简单的Spy类和一个SpyHandler接口，Spy类定义好一些静态方法用于代码增强时调用，而SpyHandler则是定义一些用于通讯传参的接口。我们将这两个类打成jar包，并通过Instrumentation的appendToBootstrapClassLoaderSearch接口，在agent加载时引入BootStrapClassLoader类中，这样我们在各个ClassLoader中都能访问Spy类和SpyHandler接口了。

通过上面的介绍，我们现在可以动手做一个自己的APM工具了，通过Instrumentation+ASM，我们可以实现Class文件的修改增强，甚至可以修改JDK自带的类比如String，通过自定义的ClassLoader我们可以隔离Agent的类和业务的类，通过打入BootStrap的Spy，我们可以实现跨ClassLoader之间的通讯。

万事俱备，我们现在可以开始动手实现一个自己的APM工具了吧！

打住，其实上面这些功能不需要自己一一实现，我们不需要重复制造轮子，来自阿里开源项目JVM-SANDBOX此时华丽登场。这个项目屏蔽了ASM难以使用的缺点，也简化了Instrumentation打桩过程，并且实现了ClassLoader的隔离，也有了BootStrapClassLoader中的Spy类，我们在此框架的基础上进行开发更为简单。

[图片上传失败...(image-7a4a0f-1650620049744)]
原图链接：https://github.com/alibaba/jvm-sandbox/wiki/img/jvm-sandbox-classloader.png

集『大』成

我们拥有了JVM-SANDBOX这一利器，似乎节约了我们很多的时间，我们现在终于可以着手性能分析了。

那么怎么进行性能分析呢？

Zipkin，开源的链路追踪。
Jaeger，开源的链路追踪支持Zipkin协议，个人感觉更为好用。

我们可以引入Zipkin或者Jaeger作为收集者和UI展现，根据自己的喜好选择一个好用的开源工具。通过sandbox提供的功能,我们可以很方便编写埋点代码，将我们的链路追踪工具集成到Agent里面，最终实现无侵入的定制化链路追踪。

通过集成ZipkinClient或者JaegerClient我们可以进行埋点收集，我们似乎把一些功能以搭积木的方式组装起来，解决了一个颇为复杂的实现，这就是开源的魅力所在。其实在实际的过程中我们还遇到了一些困难，比如如何追踪异步调用，如何追踪跨线程的调用，如何处理线程池，如何处理ForkJoin？

其中最为复杂的是如何处理那些跨线程的派发，我们如何将链路的上下文在多个线程中传递。JDK的InheritableThreadLocal类可以完成父线程到子线程的值传递。但对于使用线程池等会池化复用线程的执行组件的情况，线程由线程池创建好，并且线程是池化起来反复使用的；这时父子线程关系的ThreadLocal值传递已经没有意义，应用需要的实际上是把 任务提交给线程池时的ThreadLocal值传递到任务执行时。

说起来可能不好理解，总得来说无论是ThreadLocal还是InheritableThreadLocal都无法处理线程池或者ForkJoin带来的线程复用的副作用，即无法有效准确安全的传递链路的上下文，不信大家可以试一试。

那么怎么解决这个问题呢？没错,就是修改JDK源码，让线程池在进行调度的时候具有安全准确传递上下文信息的能力，比如对Runnable和Callable接口进行增强处理，让其可以携带线程的上下文。如果要对JDK的代码进行增强，我们需要非常熟悉线程调度、线程池、Forkjoin的源码，还需要小心处理值的传递确保安全，听起来就很危险，也很困难。不用担心我们不是第一次遇到这种问题的人，我们再次搬来了阿里的开源产品TTL，这个库解决的就是上面描述的问题。

但是找到开源产品也并不一定能解决所有的问题，transmittable-thread-local虽然能够解决线程复用时传值的问题，但是它的实现对JDK代码进行了『过分』的修改，以至于Instrumentation不能进行动态增强，它需要在启动时未加载到ClassLoader的时候对JDK的源码进行增强，并不能对已加载的JDK源码进行动态增强，也就是说这种增强只能发生在一开始，不能发生在中间时间，且不可卸载。

这是因为Instrumentation的redefineClasses这个方法存在限制：重定义不得添加、移除、重命名字段或方法；不得更改方法签名、继承关系（不然那些商业的热重载技术怎么赚钱。。）。而TTL的增强违反了这个原则，我们需要对其修改，并集成到Agent中。这个改造比较无趣也不好解说，可以直接看改造后的JVM-SANDBOX，我们为了后续使用方便，将TTL库直接用BootStrapClassLoader加载了进去。

开源

最终开源的性能分析工具可以在这里找到：https://github.com/tmtbe/PVisualization，配合改造后的JVM-SANDBOX，可以实现360度无死角的性能链路追踪分析，开发埋点也非常便捷，也无需考虑任何线程池的问题。有兴趣的小伙伴可以试着使用一下，如有项目需要可以直接找我支持。

[图片上传失败...(image-7b5fbd-1650620049744)]
原图链接：https://github.com/tmtbe/PVisualization/raw/master/source/img.png

文/Thoughtworks张锦程
原文链接：https://insights.thoughtworks.cn/performance-turning-practice-3/

性能优化那些事（3）

『新』知识

集『大』成

开源

猜你喜欢

热点阅读