python实现自动控制浏览器，自动化脚本神器selenium

2018-11-16 本文已影响0人 48e0a32026ae

其实了解运维方面的人员可能并不陌生，有时候测试一些东西写好脚本让其进行自动执行，那么像自动控制浏览器，控制命令台什么都是我比较喜欢收集的模块

这里介绍的控制浏览器的模块，我们不深究，介绍点基础操作，后期结合爬虫项目和大家分享一下

「selenium」模块正如上文所说，更多的使用在运维的方面，但是这不妨碍其中的一些功能来做一些我们需要的功能。比如我做一个百度自动查询。

前两天突然介绍个利用爬虫项目做的有道词典的小项目，使得没有爬虫基础的朋友很不适应，其实当时就在想，何不直接控制浏览器将让其自动查询我传入的词语，也就是在这一目的下，完成了这个

首先介绍一些我用的selenium的安装方式以及利用方法，

1、

我们要知道，python是没办法控制浏览器的，这中间还是需要bridge（桥）具体原因这里面涉及的知识又很多，有兴趣的可以百度。我在「阅读原文」会给大家附一个Chrome浏览器的bridge，当然你也可以“selenium python bridge”的关键字自己根据型号下载，这东西不大，下载后即可用。

2、

方法一：

设置环境变量，这就是我不喜欢Windows的原因了，当然这是指的是用Anaconda的用户，要把其路径配置到环境变量的path路径中。然后把这个driver放到Anaconda的python解释器同一个文件夹中。

方法二：

你和我一样是pycharm的忠实用户，那么你在安装python3的时候已经默认配置环境变量了，这个我在安装python篇也已经经过了，那么只要把driver丢到python解释器文件夹就行了。

3、

介绍方法（这里只介绍几个常用的方法）：

get：

通过url访问某个网站

find_element_by_id；

find_elements_by_xpath

等方法可以查找元素

page_source

获取当前网页的html信息

current_url

获取当前URL

值得注意的是find_element_by_id，需要我们去了解页面的id，拿百度来说，F12键，定位百度输入框：

定位百度搜索框：

代码实现：

1from selenium import webdriver

2import time

3# from selenium.webdriver.chrome import webdriver

4key = input('输入要查询的信息：')

5driver = webdriver.Chrome()

7driver.get('https://www.baidu.com')

9driver.find_element_by_id('kw').send_keys(key)

11driver.find_element_by_id('su').click()

13time.sleep(5)

15driver.quit()

16driver.close()

实现起来就那几秒，没想到要写这么长时间。

python实现自动控制浏览器，自动化脚本神器selenium

猜你喜欢

热点阅读