基于jdom的xml cdata内容解析

2018-05-14 本文已影响175人帅气小伙

大家好，我是帅气小伙，今天为大家分享的是一次技术支持过程中的经验。
有以下一段xml数据

<?xml version="1.0" encoding="utf-16" standalone="no" ?>
<root>
    <row>
        <awareness><![CDATA[]]></awareness>
        <temperature><![CDATA[]]></temperature>
        <pluse><![CDATA[111]]></pluse>
        <breathe><![CDATA[]]></breathe>
        <blood_pressure><![CDATA[2222]]></blood_pressure>
        <SPO2><![CDATA[]]></SPO2>
        <breath_method><![CDATA[<P></P>]]></breath_method>
        <breath_quantity><![CDATA[]]></breath_quantity>
        <health><![CDATA[]]></health>
        <cut><![CDATA[]]></cut>
        <input_name><![CDATA[粥]]></input_name>
        <input_quantity countid="inputquantity" display="总入量" unit="ml"><![CDATA[300]]></input_quantity>
        <output_name><![CDATA[]]></output_name>
        <output_quantity countid="outquantity" display="总出量" unit="ml"><![CDATA[]]></output_quantity>
        <output_color><![CDATA[]]></output_color>
        <nurse_path><![CDATA[]]></nurse_path>
        <skin><![CDATA[]]></skin>
        <sleep><![CDATA[]]></sleep>
        <extend_title_1><![CDATA[]]></extend_title_1>
        <extend_title_2><![CDATA[]]></extend_title_2>
        <signature><![CDATA[]]></signature>
        <id><![]]></id>
        <template_id><![CDATA[504]]></template_id>
        <catalog_id><![CDATA[34]]></catalog_id>
        <emr_type><![CDATA[20]]></emr_type>
        <type><![CDATA[0]]></type>
        <time><![CDATA[2012-02-08 08:00]]></time>
        <creator_id><![CDATA[76151]]></creator_id>
        <creator_name><![CDATA[小红]]></creator_name>
        <modifier_id_list><![CDATA[76151]]></modifier_id_list>
        <modifier_name_list><![CDATA[小明]]></modifier_name_list>
        <modify_time_list><![CDATA[2012-02-08 10:52:32]]></modify_time_list>
        <create_time><![CDATA[2012-02-08 10:52:32]]></create_time>
        <input_quantity><![CDATA[]]></input_quantity>
        <output_quantity><![CDATA[]]></output_quantity>
        <input_xml_data><![CDATA[<?xml version="1.0" encoding="UTF-16" standalone="no" ?><root/>]]></input_xml_data>
        <output_xml_data><![CDATA[<?xml version="1.0" encoding="UTF-16" standalone="no" ?><root/>]]></output_xml_data>
        <age>39岁</age>
        <bed>02</bed>
        <dept>消化内科病房</dept>
        <intime>2011-03-01</intime>
        <name>小曹</name>
        <sex>女</sex>
        <patient_id>0000001010</patient_id>
        <event_no>371283001212</event_no>
        <dept_id>1010120</dept_id>
        <dept_name>消化内科病房</dept_name>
        <ip>192.168.3.2</ip>
        <cp_name>jzh-pc</cp_name>
        <sys_name>pda系统</sys_name>
    </row>
</root>

其中CDATA 这些比较特殊，是为了防止标签值中有特殊字符而导致破坏xml规范的特殊语法。
在这里我推荐大家用 jdom，因为我试了很多种xml解析的类库，基本上都不行。只用jdom满足。

maven

      <!-- https://mvnrepository.com/artifact/org.jdom/jdom -->
        <dependency>
            <groupId>org.jdom</groupId>
            <artifactId>jdom</artifactId>
            <version>1.1.3</version>
        </dependency>

xml 转 map，基本上转了map之后，后面的格式都可以解决了。

    /**
     * 含cdata的xml转map
     * @param xml
     * @return
     */
    public static Map<String,Object> xml2Map(String xml){
        Map<String,Object> tree = new LinkedHashMap<>();
        try {
            SAXBuilder builder = new SAXBuilder();
            Document document = builder.build(new StringReader(xml));
            Element root = document.getRootElement();// 获得根节点
            //xml 都会有根节点，如果根节点有多个子节点，那么它必定是一个数组，否则它是一个对象，因此先初始化一个map
            tree.put(root.getName(), new LinkedHashMap<>());
            //递归遍历节点下的各元素
            parseNode(root,tree);
        } catch (JDOMException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
        return tree;
    }

    private static void  parseNode (Element root ,Map<String,Object> map){
        final String rootName = root.getName();//根节点名称
        //遍历根节点下的子节点
        for(Object object : root.getChildren()){
            if(object instanceof Element){
                Element element = (Element)object;
                Object rootObj = map.get(rootName);
                //先判断这个父节点是否为数组，再判断子节点是否也是数组，如果是那么递归遍历
                if(rootObj instanceof ArrayList){
                    if(element.getChildren().size()>0){
                        LinkedHashMap linkedHashMap = new LinkedHashMap();
                        linkedHashMap.put(element.getName(),new LinkedHashMap<>());
                        ((List)rootObj).add(linkedHashMap);
                        parseNode(element,(LinkedHashMap)linkedHashMap);
                    }
                }else{
                    //如果父节点不是数组，子节点是也是一个对象，如果它有多个节点，必定是属性节点
                    if(element.getChildren().size()>0){
                        ((LinkedHashMap)rootObj).put(element.getName(),new ArrayList<>());

                    }else{
                        ((LinkedHashMap)rootObj).put(element.getName(),element.getValue());
                    }
                    parseNode(element,(LinkedHashMap)rootObj);
                }
            }
        }
    }

这个递归很饶，不知道有没有更好的实现，目前是实现了我的需求的。但是对于xml的 attribute 解析是实现不了的。

基于jdom的xml cdata内容解析

猜你喜欢

热点阅读