数据爬取之Xpath

2018-08-08  本文已影响0人  月下独酌123

XML

XML指可扩展标记语言(EXtensible Markup Language)

XML和HTTP的区别

区别.jpg

Xpath

Xpath(XML Path Language)是一门在XML文档中查找信息的语言,可用来在XML文档中对元素和属性进行遍历

Xpath的使用

1、安装lxml
pip install lxml
lxml 是一个HTML/XML的解析器,主要的功能是如何解析和提取HTML/XML数据
2、使用

from lxml import etree

html = etree.HTML(text)
content = html.xpath('xpath表达式')
上一篇 下一篇

猜你喜欢

热点阅读