程序员编程地带

Xpath

2018-11-08  本文已影响3人  MA木易YA

XPath用于 XML 文档中对元素和属性进行遍历。小编主要用于在爬虫代码中进行节点选择,下面主要给大家总结一下最常用的一些用法。

常用路径表达式

image.png

举例

div  div节点的所有子节点
/div  从根目录开始定位,这里是根目录下第一级的div标签
//div  精准定位到div,忽略前面的所有节点
.  选取当前节点
..  选取当前节点的父节点
div[@class="container"]

函数

  1. not 不包含

tbody下不包含class属性的tr节点

//tbody/tr[not(@class)]
  1. text() 文本,包含特定文字,精准匹配

包含“任务类型”的li标签

//li[text()='任务类型:']
  1. contains 使用contains函数可指定仅包含部分的信息

包含有文字“任务类”的及节点

//li[contains(text(),'任务类')]

后续还有诸如starte-with等等,但我用的也不多,这些就是比较普遍的一些操作了,如果想了解更多,可以去参考一下教程

上一篇 下一篇

猜你喜欢

热点阅读