Python + Selenium(一)常用控制方法
Selenium 体系中用来操作浏览器的 API 就是 WebDriver,WebDriver 针对多种语言都实现了一套 API,支持多种编程语言。
Selenium 通常用来做自动化测试,或者编写网络爬虫。
通常我们说的 Selenium 自动化操作,指的就是 WebDriver 中提供的控制方法。一般我们讲 Selenium 多半都是在谈 WebDriver。
Webdirver 中提供了对浏览器、网页元素、鼠标键盘等操作方法:
- 浏览器操作: 打开和关闭浏览器、改变浏览器分辨率,切换窗口,模拟刷新等
- 页面元素定位: WebDriver 中提供了 Id、Name、Link text、Css、Xpath 等定位方式,用于查找需要操作的网页元素
-
页面元素操作: 找到元素都,就可以对元素进行操作。比如点击
click
、输入send_keys
、清空文本clear
、获取文本text
、获取属性get_attribute
等 - 其他方法: 页面等待、frame 切换、调用JS、模拟鼠标键盘等
启动浏览器
对于 WebDriver 的控制方法,先从对浏览器的基本控制说起。要操作网页元素,首先需要启动浏览器,下面的代码就实现启动浏览器,并打开百度首页:
# 引入webdriver
from selenium import webdriver
# 启动 chrome 浏览器
driver = webdriver.Chrome(executable_path='driver/chromedriver.exe')
# 打开百度首页
driver.get("https://www.baidu.com")
executable_path:
Python + Selenium环境搭建 中提到了浏览器驱动的部署,一般我们都放在环境变量中,方便使用。
如果你不想放环境变量,可以通过此参数指定驱动 (如:chromedriver.exe) 的绝对路径或相对路径。
浏览器控制
控制浏览器大小
通过 WebDriver 打开浏览器一般默认都是窗口状态(非全屏),这可能会导致某些网页显示不全,无法定位和操作某些页面元素。
可以通过 WebDriver 控制浏览器的大小:
driver.maximize_window() # 浏览器最大化
driver.set_window_size(480, 800) # 设置浏览器480,800为像素大小
driver.minimize_window() # 浏览器最小化
一般,用 maximize_window() 方法最大化即可。
后退、前进
在使用浏览器的过程中,为了方便在浏览过的网页之间切换,WebDriver 也提供了对应的 back() 和 forword() 方法来模拟后退和前进按钮。
driver.back() # 后退到上一个页面
driver.forward() # 前进到下一个页面
如无特殊需要,不建议使用这两个方法。
浏览器刷新
有时候需要手动刷新(F5)页面,例如页面上有些统计字段,当数据发生改变时,并不会及时变化,需要刷新页面后才会变化。此时可以使用模拟浏览器刷新的方法 refresh()。
driver.refresh() # 浏览器刷新,与F5同理
退出
WebDriver 提供了两种退出方式:close() 和 quit(),close() 方法只关闭当前窗口,quit() 则完全退出(删除 session,并关闭浏览器驱动)。
driver.close() # 关闭当前窗口,不会关闭浏览器驱动
driver.quit() # 退出所有窗口并关闭浏览器驱动
关于 close() 与 quit():
close() 仅关闭当前窗口,不会关闭浏览器驱动。
某些浏览器默认情况下,只有一个窗口时,关闭窗口的时候也会自动关闭浏览器。这会造成一个错觉,觉得 close() 也把浏览器关闭了。
对 WebDriver 来说,你并没有关闭浏览器,你只是关闭了一个窗口而已,所以浏览器驱动还处于开启状态,Python 的进程也并未停止。
quit() 会关闭浏览器,删除 session,清理运行过程。
所以,当你想退出时,使用 quit() 而不是 close()。