xpath
2019-04-24 本文已影响0人
江湖有爱
表达式 | 描述 |
---|---|
nodename | 选取此节点的所有子节点。 |
/ | 从根节点选取。 |
// | 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。 |
. | 选取当前节点。 |
.. | 选取当前节点的父节点。 |
@ | 选取属性。 |
#!/usr/bin/env python
# _*_ coding: utf-8 _*_
# xpath
#导入模块
import requests,re,time
from lxml import etree
url = 'http://www.guanggoo.com/'
html = requests.get(url)
html.encoding = 'utf-8'#指定编码格式
div = etree.HTML(html.text)#解析HTML
imgs = div.xpath('//h3[@class="title"]/a/text()')#用xpath查找对象(返回是列表格式)
# print(imgs)
for i in imgs:
# i = i.replace('\n', '')#去掉换行
# i = i.replace('/', '')#去掉/
# i = i.strip()#去掉空格
print(i)