beautifulsoup、xpath、pyquery总结
2018-10-06 本文已影响6人
juriau
1、beautifulsoup
初始化
from bs4 import BeautifulSoup
soup = BeautifulSoup(html, 'html.parser')
用于结构简单清晰的网页,下面两个都适用于复杂的网页
2、xpath
初始化
from lxml import etree
html = etree.HTML(text)
基础规则
image.pngresult = html.xpath('/')
3、pyquery
初始化
from pyquery import PyQuery as pq
doc = pq(html)
css选择器
doc.find(selector)