问题分析:Kafka Connect 引入了Fastjson后,
前言
最近在学习Kafka Connect,写了个连接器的demo。在demo提交了几个版本之后,突然发现Kafka Connect Rest API 无法正常响应了,明明有正在运行的连接器,查询status,居然返回{}
问题分析
对 Rest API 进行debug后,确认是有数据的,但是数据返回不到客户端,很奇怪。因为我记得之前是好用的,所以我回滚了代码版本,逐一排查之后发现当引入Fastjson 依赖之后,会导致Connect Rest API 不可用
如果懒一点的话,到这里就已经结束了,直接删除Fastjson依赖,使用其他Json包。但是我很好奇,在我的理解里,Fastjson 这种库就是个工具包,如果我们程序没有主动调用的时候,是不会对我们产生任何影响的。
百度谷歌一通之后,一筹莫展之际,点开了Fastjson的源码包,在这里发现了Fastjson为JAXRS提供的SPI扩展
1JAXRS:Java API for RESTful Web Services,JavaEE提供的Web服务接口。Jersey 实现了JAXRS,而Kafka Connect 引用了Jersey 。
SPI:Service Provider Interface ,是JDK内置的一种服务提供发现机制,可以参考我之前的博客 Java SPI 实战
打开javax.ws.rs.ext.MessageBodyWriter
文件,可以看到提供的实现类是com.alibaba.fastjson.support.jaxrs.FastJsonProvider
,定位到FastJsonProvider
下writeTo
方法,该方法会把object写入到OutputStream中,看起来很靠谱,debug试一下
果然,说明Fastjson果然参与了Rest API的响应。为什么使用Fastjson就响应不了数据呢,看了下源码,这里要求被序列化的Bean必须标记Fastjson相关的注解,而实际的Bean使用的是Jackson的注解,所以Fastjson无法序列化数据。
接下来可以根据调用栈和全局搜索找一下,看看FastJsonProvider是在什么时机加载的,能否干掉他。
调用栈并没有找到什么有用的信息,通过全局搜索MessageBodyWriter
找到了FastJsonProvider的加载位置,MessageBodyFactory::initialize
上图字面意思理解,使用 injectionManager
(注入管理器),找到MessageBodyWriter
的可用实现
这里的 customMbws
size = 2,分别是FastJson和Jackson的实现。但是FastJson在前,而每次需要做JSON序列化的时候,会遍历writers
,如果找到支持application/json
的MessageBodyWriter则直接返回,所以每次使用的都是FastJson的实现。
至此已经明白了,为什么Fastjson 会影响Kafka Connect了,接下来就是想办法解决了
这个时候还是没有找到Fastjson是在哪加载的,在Fastjson的 wiki 中找到了些灵感,发现Fastjson 在Jersey 中并不是通过SPI的方式进行的扩展,而是通过FastJsonAutoDiscoverable
,向Jersey 的 context中注册FastJsonProvider
最后,我们在java 进程启动时指定参数 -Dfastjson.auto.discoverable=false
,禁用 FastJsonProvider
参考
https://github.com/alibaba/fastjson/wiki/Integrate-Fastjson-in-JAXRS