使用selenium 的笔记总结

2021-03-06 本文已影响0人 My熊猫眼

第一次使用seleninum ，现学现用，所以做笔记还是很有必要的：

A. 利用xpath定位元素的注意点：

表达式语法举例：

driver.find_element_by_xpath("//div[@class='class_name']")

a. 其中 '//' 表示从匹配的节点开始找，也就是相对路径，这也是用的最多的一种情况.
b. [@class='class_name'] 表示元素的属性值，在这里表示元素的class 属性的值为 class_name. 如果是多个属性进行限制，那么可以追加多个 [@attribute_name='attribute_value']来限制，从而保证可以匹配到相应的元素
c. 支持多层路径，上面路径基础上可以追加,比如： "//div[@class='class_name']/button[@type='submit']" , 如果是查找节点元素，那么后面用类似： "//div[@class='class_name']/.." 的格式，这种情况在实际使用中会常遇到.
d. input, button 等元素不支持class 属性，这个原因不清楚，但是使用的时候加上class 属性就找不到元素. div等元素支持class 属性，如果通过特定属性找不到，尝试更改属性的值来进行查找
e. 如果是使用xpath, 并通过使用text 属性来进行元素查找，那么表达式格式如下：

 find_element_by_xpath('//*[contains(text(),"string_to_locate")]' )

其中中括号里面就是元素的限定条件，符号 * 表示所有元素，和上面其他限定条件类似；text() 就是元素的text 属性值，contains() 是一个函数，判断字符串的包含关系.
f. 如果找到的是多个元素，那么可以通过类似数组元素的方式进行访问特定元素.

B. IE中点击无效的问题，以及input 输入框接受数据不正确的问题.

在ie 浏览器中，经常性的会出现click 无效, 此时可以借助js 的方式进行click 点击操作：

driver.execute_script("arguments[0].click(); ",btn_element)

其中的arguments[0] 表示取后面参数列表中的第一个参数的值. 后面的btn_element 就是具有click()方法的元素.
而向input之类的输入框传递数据的时候，在IE中经常出现输入框获取到的数据和发送的数据不一致的情况，这个可以通过改用js的方式进行发送，也可以通过清空输入框数据，重新进行发送，直到收到的数据正确为止, 而清空input 类输入框数据的方式是： driver.find_element_by_xpath().clear(), 也就是调用元素的clear() 方法就清空其数据了.

C. 等待响应以及窗口关闭，切换等.

等待响应可以调用 WebDriverWait(driver,30,0.5).until(lambda driver: driver.find_element_by_id("input4") ) 这种方式来实现 (也可以用WebDriverWait().until_not() )，当然了，等待的条件也可以是新窗口的弹出或者释窗口标题发生改变等. 比如如下条件都可以用来等待响应：

"Google"  in  driver.title 
driver.window_handles      
driver.current_window_handle

多窗口切换就直接找到对应窗口的handle (driver.window_handles 会返回所有的窗口handle, 找到需要的就行)，然后用 driver.switch_to(NEW_HANDLE) 就可以进行窗口切换了.
如果要关闭窗口，那么首先要确保目标窗口是激活的，也就是要先切换到目标窗口，然后调用 driver.close() 方法就可以实现了. 通常窗口关闭后就无法继续进行元素定位了，这时候要再次进行窗口切换，切换到目标窗口后，才可以进行元素定位.

D. 处理同一个wait请求的不同响应结果

比较典型的例子是“发送搜索请求”，在发送请求后，进入WebDriverWait ，进行等待响应，这个时候响应的结果可能是“没有匹配的搜索结果”，或者是 “有匹配的搜索结果”. 这时候等待面临的结果就是两种，这种情况如何用WebDriverWait 来实现呢？
在使用WebDriverWait的时候，等待条件一般用lambda 函数，所以可以在lambda函数的调用上做文章，网上有一个写法类似如下： WebDriverWait(driver,30,0.5).until(lambda driver:driver.find_element_by_id("input4") or driver.find_element_by_xpath("//*[contains(text(),"No results")]"))
这个方法咋一看没有问题，实际上并不能实现需求，根本原因是：lambda 匿名函数在执行遇到异常的时候就直接返回了，在这种情况下第二个条件根本没有机会获得执行,要解决这个问题，那么可以在lambda函数中调用一个自定义的外部函数，这个自定义的函数在多个等待条件都不满足时候再返回异常. 这样就可以解决了，下面是一个参考例子 (当第一个元素没有找到的时候，尝试返回第二个元素，如果依然没有找到，那么就返回 find_element_by_xpath 本身的异常，WebDriverWait 会处理这个异常，然后重新等待直到元素被返回或者发生timeout异常)：

def wait_multi_element(driver,para1, para2):  #para1 and para2 is the xpath of the elements. 
   try:
      return driver.find_element_by_xpath(para1)
   except:
      try:
         return driver.find_element_by_xpath(para2)
      except:
         raise

实际上，除了以上的解决方式，可以参考WebDriverWait的实现方式，写自己的 wait 类，然后解决这个问题.

E. 在页面加载过程中，依然可以定位到刷新前的元素，如何进行规避？

还是用“搜索”来举例：
假设当前的搜索没有匹配的结果，而此结果对应的元素 ele .
然后输入新的搜索条件并开始搜索，在新的搜索结果没有出现的时候，如果我们就开始查找出现的元素，那么很可能定位到了前一次的 ele 元素，而这并不是我们想要的结果，因为新的搜索结果并没有返回，是否有匹配其实是不清楚的.
为了解决这个问题，可以把前一次ele元素保存到列表，然后拿当前查找到的元素和之前的ele进行比对，如果是同一个，那么表示当前搜索没有返回结果, 从而避免把上一次的结果作为这一轮搜索的结果来使用.

F. 对剪切板的访问

在windows环境下，可以使用win32clipboard 配合win32con 模块，实现对剪切板的: "写，读，清空" 等.
需要注意的是：
如果需要先清空剪切板，然后又通过第三方程序向剪切板中写入了数据，此时再想要获取剪切板的内容，那么需要用如下的顺序：

import win32con
import win32clipboard as cp
cp.OpenClipboard() 
cp.SetClipboardData(win32con.CF_UNICODETEXT,"")    #清空剪切板内容
cp.CloseClipboard()    #必须首先关闭
......       #第三方程序向剪切板写入数据 
cp.OpenClipboard()    #打开剪切板
clip_data=cp.GetClipboardData()     #获取剪切板的数据
cp.CloseClipboard()

如果前面"清空"之后，没有关闭剪切板而在后面直接调用GetClipboardData方法，那么获取到的内容为空，所以必须要重新打开剪切板，才可以获取到剪切板的数据.