xpath

2019-04-24  本文已影响0人  江湖有爱
表达式 描述
nodename 选取此节点的所有子节点。
/ 从根节点选取。
// 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
. 选取当前节点。
.. 选取当前节点的父节点。
@ 选取属性。
#!/usr/bin/env python
# _*_ coding: utf-8 _*_
# xpath

#导入模块
import requests,re,time
from lxml import etree

url = 'http://www.guanggoo.com/'
html = requests.get(url)
html.encoding = 'utf-8'#指定编码格式

div = etree.HTML(html.text)#解析HTML
imgs =  div.xpath('//h3[@class="title"]/a/text()')#用xpath查找对象(返回是列表格式)
# print(imgs)
for i in imgs:
#     i = i.replace('\n', '')#去掉换行
#     i = i.replace('/', '')#去掉/
#     i = i.strip()#去掉空格
    print(i)

上一篇 下一篇

猜你喜欢

热点阅读