网页解析库XPath(九)
2019-07-15 本文已影响0人
梦捷者
一、XPath的简介
- XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。相比于BeautifulSoup,Xpath在提取数据时会更有效率。
- lxml的安装
pip install lxml
二、XPath的语法
- XPath 使用路径表达式在 XML/HTML 文档中选取节点。
- 下面列出了最有用的路径表达式:
1、谓语
- 谓语被嵌在方括号中。在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果。
2、选取未知节点
XPath通配符可用来选取未知节点。