如何用xpath提取不在标签内的文本

2018-06-30  本文已影响42人  sexy_cyber

场景,豆瓣电影频道,国产电视剧详情页中


提取这个部分的数据,比如集数:后面的66 html结构
response.xpath(u'//span[./text()="出版社:"]/following::text()[1]')

如果text() 中有空格, 提醒, 你可能还需要这么写

response.xpath(u'//span[contains(./text(), "出版社:")]/following::text()[1]')

或者全匹配:

response.xpath(u'//span[.//text()[normalize-space(.)="出版社:"]]/following::text()[1]')
上一篇 下一篇

猜你喜欢

热点阅读