大数据 爬虫Python AI Sql

Python3+selenium+driver操作测试

2020-01-20  本文已影响0人  不存在的一角

前言

因为要用到Selenium的暴力操作某盘,便写一篇记录一下

Selenium

Selenium 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。

Selenium 是一套完整的web应用程序测试系统,包含了测试的录制(selenium IDE),编写及运行(Selenium Remote Control)和测试的并行处理(Selenium Grid)。

Selenium的核心Selenium Core基于JsUnit,完全由JavaScript编写,因此可以用于任何支持JavaScript的浏览器上。Selenium可以模拟真实浏览器,自动化测试工具,支持多种浏览器,爬虫中主要用来解决JavaScript渲染问题。

PhantomJS

PhantomJS是一个基于webkit的javaScript API。它使用QtWebKit作为它核心浏览器的功能,使用webkit来编译解释执行javaScript代码。任何你可以基于在webkit浏览器做的事情,它都能做到。它不仅是个隐性的浏览器,提供了诸如css选择器、支持wen标准、DOM操作、json、HTML5等,同时也提供了处理文件I/O的操作,从而使你可以向操作系统读写文件等。phantomJS的用处可谓非常广泛诸如网络监测、网页截屏、无需浏览器的wen测试、页面访问自动化等。

下载地址

安装

安装selenium

pip install selenium

安装低指定版本selenium

pip install selenium==2.48.0

安装phantomJS

下载后,解压到任意一个目录中,右击我的电脑->属性->高级系统设置->环境变量->编辑系统变量中的path,把plantomJS.exe添加到环境变量中即可

安装Chromedriver

chromedriver的版本一定要与Chrome的版本一致,不然就不起作用
有两个下载地址:
1、http://chromedriver.storage.googleapis.com/index.html
2、https://npm.taobao.org/mirrors/chromedriver/

首先需要查看你的Chrome版本,在浏览器中输入chrome://version/

下载对应版本号的压缩包,如79.0.3945.130则对应可以下载

79.0.3945.16
79.0.3945.36

没有64位的就下个32位的

解压压缩包,找到chromedriver.exe复制到chrome的安装目录C:\Program Files (x86)\Google\Chrome\Application(复制chromedriver.exe文件的路径并加入到电脑的环境变量中去)

我目前的情况是将chromedriver.exe文件拖到Python的Scripts目录下,同时chromedriver.exe也在C:\Program Files (x86)\Google\Chrome\Application但是没有把这个路径放在环境变量,然后可以运行

完成后在cmd下输入chromedriver验证是否安装成功

Starting ChromeDriver 79.0.3945.36 (3582db32b33893869b8c1339e8f4d9ed1816f143-refs/branch-heads/3945@{#614}) on port 9515
Only local connections are allowed.
Please protect ports used by ChromeDriver and related test frameworks to prevent access by malicious code.

使用

Selenium基本使用看这里 https://www.jianshu.com/p/3aa45532e179

phantomJS使用

browser = webdriver.PhantomJS()

使用时如果出现下面的报错信息

UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox instead
  warnings.warn('Selenium support for PhantomJS has been deprecated, please use headless '

意思是selenium已经放弃PhantomJS了,建议使用火狐或者谷歌无界面浏览器

解决方案,降低selenium版本

pip install selenium==2.48.0

Chromedriver使用

可以看看Python3+Selenium 配置Chrome选项

正常模式

driver = webdriver.Chrome()
driver.get('http://www.baidu.com/')
print (driver.page_source)

chromedriver无界面模式

chrome_options = webdriver.ChromeOptions()
# 无头浏览器选项
chrome_options.add_argument('--headless')
# 谷歌文档提到需要加上这个属性来规避bug
chrome_options.add_argument('--disable-gpu')
browser = webdriver.Chrome(chrome_options=chrome_options)
browser.get('http://www.baidu.com/')
print(browser.page_source)

from selenium.webdriver.chrome.options import Options

chrome_options = Options()
# 无头浏览器选项
chrome_options.add_argument('--headless')
# 谷歌文档提到需要加上这个属性来规避bug
chrome_options.add_argument('--disable-gpu')
browser = webdriver.Chrome(chrome_options=chrome_options)
browser.get('http://www.baidu.com/')
print(browser.page_source)

栗子

根据id找到对应的节点并输入密码

url = 'xxx'
pwd = 'xxx'
browser = webdriver.Chrome()
browser.get(url)
browser.find_element_by_id("xxx").send_keys(pwd)

键盘回车

from selenium.webdriver.common.keys import Keys

browser.find_element_by_id("xxx").send_keys(Keys.ENTER)

获取包含多个class名称的tag对象时,如:
class="g-button g-button-blue",(中间有空格),建议使用

browser.find_element_by_css_selector(".g-button.g-button-blue")

或者

browser.find_element_by_css_selector("[class='g-button g-button-blue']")

模拟点击

browser.find_element_by_id("xxx").click()
上一篇 下一篇

猜你喜欢

热点阅读