关于 scrapy 基础操作

2017-09-26  本文已影响10人  Vissioon
表达式 描述
node 选取此节点的所有子节点
/ 从根节点选取
// 从匹配选择的当前节点选择文档中的节点,而不考虑他们的位置
. 选取当前节点
.. 选择当前节点的父节点
@ 选取属性

谓语

表达式 描述
/node/td[1] 选取 node 下面的第一个 td 元素
/node/td[last()] 选取 node 下面的最后一个 td 元素
/node/td[last()-1] 选取 node 下面的倒数第二个 td 元素
/node/td[position()<3] 选取 node 下面的前两个 td 元素
//node[@attr] 选取所有拥有名为 attr 的属性的 node 元素
//node[@attr='value'] 选取所有拥有名为 attr 且值为 value 的属性的 node 元素
/node/td[size>10] 选取 node 下面所有 size 属性值大于10的 td 元素
/node/td[size>10]/span 选取 node 下面所有 size 属性值大于10的 td 元素下面的 span 元素

未知节点

表达式 描述
* 匹配任何元素节点
@* 匹配任何属性节点
node() 匹配任何类型节点
上一篇下一篇

猜你喜欢

热点阅读