成长励志想法

网络爬虫(十四)selenium简介

2019-06-18  本文已影响0人  zhangxiaohao
selenium介绍

Selenium是一个基于浏览器自动化的一个模块,能直接运行在浏览器中,就像真正的用户在线操作一样。

selenium的使用流程

环境安装:pip install selenium

下载浏览器的驱动程序

由于需要使用selenium,需要为本机配置对应浏览器的驱动,如chome浏览器,要安装chromedriver,chromedriver版本要与chrome版对应:
下载驱动路径:chromedriver.storage.googleapis.com/index.html

代码编写说明

实例化一个浏览器对象
from selenium impor webdiver
bro=webdriver.chrome(executable_path='./chromedriver')
编写基于浏览器自动化的行为动作
发起请求:get(url)
bro.get('http://125.356.84:81/xxk/')
获取网页源码数据
page_text=bro.page_source
标签定位:
from lxml import etree
tree=etree.HTML(page_text)
li_list=tree.xpath('\ul[@id="gzlist"]/li')
for li in li_list:
name=li.xpath('.\dl@title')[0]
print(name)
from time import sleep
sleep(5)
bro.quit()//关闭浏览器

标签交互可用:send_keys('xxx')

上一篇 下一篇

猜你喜欢

热点阅读