XML 和 HTML、lxml
2019-03-03 本文已影响8人
叫我老村长
XML 和 HTML 的区别
数据格式 描述 设计目标
XML Extensible Markup Language (可扩展标记语言) 被设计为传输和存储数据,其焦点是数据的内容。
HTML HyperText Markup Language (超文本标记语言) 显示数据以及如何更好显示数据。
HTML DOM Document Object Model for HTML (文档对象模型) 通过 HTML DOM,可以访问所有的 HTML 元素,连同它们所包含的文本和属性。可以对其中的内容进行修改和删除,同时也可以创建新的元素。
使用 lxml 的 etree 库
from lxml import etree
html = etree.HTML(html) ----> 使用xpath