程序员大数据 爬虫Python AI Sql前端

XML 和 HTML、lxml

2019-03-03  本文已影响8人  叫我老村长

XML 和 HTML 的区别

数据格式 描述 设计目标
XML Extensible Markup Language (可扩展标记语言) 被设计为传输和存储数据,其焦点是数据的内容。
HTML HyperText Markup Language (超文本标记语言) 显示数据以及如何更好显示数据。
HTML DOM Document Object Model for HTML (文档对象模型) 通过 HTML DOM,可以访问所有的 HTML 元素,连同它们所包含的文本和属性。可以对其中的内容进行修改和删除,同时也可以创建新的元素。

使用 lxml 的 etree 库

from lxml import etree

html = etree.HTML(html) ----> 使用xpath

上一篇 下一篇

猜你喜欢

热点阅读