基于jdom的xml cdata内容解析
2018-05-14 本文已影响175人
帅气小伙
大家好,我是帅气小伙,今天为大家分享的是一次技术支持过程中的经验。
有以下一段xml数据
<?xml version="1.0" encoding="utf-16" standalone="no" ?>
<root>
<row>
<awareness><![CDATA[]]></awareness>
<temperature><![CDATA[]]></temperature>
<pluse><![CDATA[111]]></pluse>
<breathe><![CDATA[]]></breathe>
<blood_pressure><![CDATA[2222]]></blood_pressure>
<SPO2><![CDATA[]]></SPO2>
<breath_method><![CDATA[<P></P>]]></breath_method>
<breath_quantity><![CDATA[]]></breath_quantity>
<health><![CDATA[]]></health>
<cut><![CDATA[]]></cut>
<input_name><![CDATA[粥]]></input_name>
<input_quantity countid="inputquantity" display="总入量" unit="ml"><![CDATA[300]]></input_quantity>
<output_name><![CDATA[]]></output_name>
<output_quantity countid="outquantity" display="总出量" unit="ml"><![CDATA[]]></output_quantity>
<output_color><![CDATA[]]></output_color>
<nurse_path><![CDATA[]]></nurse_path>
<skin><![CDATA[]]></skin>
<sleep><![CDATA[]]></sleep>
<extend_title_1><![CDATA[]]></extend_title_1>
<extend_title_2><![CDATA[]]></extend_title_2>
<signature><![CDATA[]]></signature>
<id><![]]></id>
<template_id><![CDATA[504]]></template_id>
<catalog_id><![CDATA[34]]></catalog_id>
<emr_type><![CDATA[20]]></emr_type>
<type><![CDATA[0]]></type>
<time><![CDATA[2012-02-08 08:00]]></time>
<creator_id><![CDATA[76151]]></creator_id>
<creator_name><![CDATA[小红]]></creator_name>
<modifier_id_list><![CDATA[76151]]></modifier_id_list>
<modifier_name_list><![CDATA[小明]]></modifier_name_list>
<modify_time_list><![CDATA[2012-02-08 10:52:32]]></modify_time_list>
<create_time><![CDATA[2012-02-08 10:52:32]]></create_time>
<input_quantity><![CDATA[]]></input_quantity>
<output_quantity><![CDATA[]]></output_quantity>
<input_xml_data><![CDATA[<?xml version="1.0" encoding="UTF-16" standalone="no" ?><root/>]]></input_xml_data>
<output_xml_data><![CDATA[<?xml version="1.0" encoding="UTF-16" standalone="no" ?><root/>]]></output_xml_data>
<age>39岁</age>
<bed>02</bed>
<dept>消化内科病房</dept>
<intime>2011-03-01</intime>
<name>小曹</name>
<sex>女</sex>
<patient_id>0000001010</patient_id>
<event_no>371283001212</event_no>
<dept_id>1010120</dept_id>
<dept_name>消化内科病房</dept_name>
<ip>192.168.3.2</ip>
<cp_name>jzh-pc</cp_name>
<sys_name>pda系统</sys_name>
</row>
</root>
其中CDATA 这些比较特殊,是为了防止标签值中有特殊字符而导致破坏xml规范的特殊语法。
在这里我推荐大家用 jdom,因为我试了很多种xml解析的类库,基本上都不行。只用jdom满足。
maven
<!-- https://mvnrepository.com/artifact/org.jdom/jdom -->
<dependency>
<groupId>org.jdom</groupId>
<artifactId>jdom</artifactId>
<version>1.1.3</version>
</dependency>
xml 转 map,基本上转了map之后,后面的格式都可以解决了。
/**
* 含cdata的xml转map
* @param xml
* @return
*/
public static Map<String,Object> xml2Map(String xml){
Map<String,Object> tree = new LinkedHashMap<>();
try {
SAXBuilder builder = new SAXBuilder();
Document document = builder.build(new StringReader(xml));
Element root = document.getRootElement();// 获得根节点
//xml 都会有根节点,如果根节点有多个子节点,那么它必定是一个数组,否则它是一个对象,因此先初始化一个map
tree.put(root.getName(), new LinkedHashMap<>());
//递归遍历节点下的各元素
parseNode(root,tree);
} catch (JDOMException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
return tree;
}
private static void parseNode (Element root ,Map<String,Object> map){
final String rootName = root.getName();//根节点名称
//遍历根节点下的子节点
for(Object object : root.getChildren()){
if(object instanceof Element){
Element element = (Element)object;
Object rootObj = map.get(rootName);
//先判断这个父节点是否为数组,再判断子节点是否也是数组,如果是那么递归遍历
if(rootObj instanceof ArrayList){
if(element.getChildren().size()>0){
LinkedHashMap linkedHashMap = new LinkedHashMap();
linkedHashMap.put(element.getName(),new LinkedHashMap<>());
((List)rootObj).add(linkedHashMap);
parseNode(element,(LinkedHashMap)linkedHashMap);
}
}else{
//如果父节点不是数组,子节点是也是一个对象,如果它有多个节点,必定是属性节点
if(element.getChildren().size()>0){
((LinkedHashMap)rootObj).put(element.getName(),new ArrayList<>());
}else{
((LinkedHashMap)rootObj).put(element.getName(),element.getValue());
}
parseNode(element,(LinkedHashMap)rootObj);
}
}
}
}
这个递归很饶,不知道有没有更好的实现,目前是实现了我的需求的。但是对于xml的 attribute 解析是实现不了的。