2018-04-29—XML解析(PULL解析)
大家好,还记得我们上次就说的解析XML的三种方式吗?上一次我们说了SAX的解析方法,是有点繁琐,今天我们来讲一下PULL方法来解析XML。
PULL方法其实跟SAX方法很像,但是也有不一样的地方,先来讲完代码,然后再比较一下两者的异同。
PULL解析
1.创建PULL解析器,在这里我们有两种方法创建解析器,第一种是跟我们上次创建SAX解析器一样,先创建解析器工厂,然后通过工厂创建解析器,

第二种我们直接用Xml类的静态方法创建:

2.再创建完工厂之后,我们要设置一下数据的编码格式

第一个参数是我们数据的输入流,第二个参数是我们设置的编码格式,我们设置为utf-8格式。
3.然后就开始我们正式的解析过程了:
首先这是我们今天要解析的xml数据:

看着很恶心是吧哈哈!!
在这之前我们先来看一下PULLParser中比较常用的几个方法:

获取事件类型主要对应我们获取到标签还是结束标签,开始文档还是结束文档等。
next()对应上面的方法,获取到下一个事件类型
后面的四个方法应该解释的很清楚,就不多说了。
1)获取事件类型。

我们首先先获取事件类型,而且我们最开始获取到的肯定是START_DOCUMENT事件类型。
2判断事件并执行对应逻辑

我们先写出来总体逻辑框架,我们把整个过程写到一个大循环中,只要事件类型不是END_DOC,就一直走下去。
在里面我们只需要进行两个事情:获取标签和结束标签
最后不要忘记让事件类型移向下一位(next方法)。
3)代码编写
我们需要的数据类型如下:


首先我们通过getName方法得到标签名,如果标签名为class,就新建一个classBean对象,然后通过解析器的getAttributeValue方法,给属性赋值,这里只有一个叫做id的属性。然后把classBean中list添加数据。
如果标签名为student,那只需要new一个studentBean对象就好,因为他没有标签。
如果是name,iid和sex,就分别调用nextText方法,因为他们是内容的标签。
到这里我们就发现了,我们PULL方法无论是外标签还是内容的标签,统统是写到一起的。只是具体的执行逻辑不一样,但是执行逻辑也是我们实现的。

现在我们进入结束标签的事件,还是先获取标签名,这里不用多说,只是把他们对应的数据添加到对应的list中就好。
到这里我们的PULL解析就全部完成了,我们通过日志来看一下效果:


数据也没有问题。下面我们来对比一下SAX和PULL两个方法:
SAX和PULL方法对比
我们还记得SAX方式解析xml吧,他的解析逻辑几乎全都是写到了defaultHandler类的子类方法中,我们需要重写他的5个方法,分别是开始文档,开始标签,结束标签,结束文档,数据读取。也就是说我们执行到不同的事件时,他会跳转到不同的方法中,然后我们在对应方法中实现对应的逻辑,最终完成XML解析。
而今天这个PULL方法不太一样:首先我们没有用到什么类去解析;其次所有的事件逻辑都是我们自己写的,我们只是用一个while循环,在里面进行判断事件类型,对应类型的操作。
而他们的相同点是:都是驱动型解析。从头到尾依次解析,按顺序扫面直到结束。
但是相比之下我们还是发现PULL解析比SAX解析更方便,更轻巧哈哈,所以一般情况下我们多数用到PULL解析。(当然SAX也是要会的)。