java将html实体字符转换成正常字符
2022-10-10 本文已影响0人
10676
函数
StringEscapeUtils.unescapeHtml();
今天最羡慕。word转成html后编码格式是这样的:
<p style="text-indent:21.0pt;">接车后发现该车不好启动,启动时间较长,着车后发动机轻微抖动,外出试车发现车子明显加速无力。与客户沟通得知,该车在其他修理厂检查过,并先后更换过高压油泵和发动机控制单元,没有解决问题。

中文全部被编码成了"来电"这种格式,后来在网上找了一会才知道这种字符被称为html entity character(实体字符)。java中好像是没有现成方法来解码的,找了半天才在一个国外网站上发现了一个一样的问题,方法就是通过apache commons包中的以下方法对字符串进行解码。
然后我就用这个方法将他转换成正常的字符串了
