Linux运维进阶-Python,Docker,Shell

使用selenium 的笔记总结

2021-03-06  本文已影响0人  My熊猫眼

第一次使用seleninum ,现学现用,所以做笔记还是很有必要的:

A. 利用xpath定位元素的注意点:

表达式语法举例:

driver.find_element_by_xpath("//div[@class='class_name']")   

a. 其中 '//' 表示从匹配的节点开始找,也就是相对路径,这也是用的最多的一种情况.
b. [@class='class_name'] 表示元素的属性值,在这里表示元素的class 属性的值为 class_name. 如果是多个属性进行限制,那么可以追加多个 [@attribute_name='attribute_value']来限制,从而保证可以匹配到相应的元素
c. 支持多层路径,上面路径基础上可以追加,比如: "//div[@class='class_name']/button[@type='submit']" , 如果是查找 节点元素,那么后面用类似: "//div[@class='class_name']/.." 的格式,这种情况在实际使用中会常遇到.
d. input, button 等元素不支持class 属性,这个原因不清楚,但是使用的时候加上class 属性就找不到元素. div等元素支持class 属性,如果通过特定属性找不到,尝试更改属性的值来进行查找
e. 如果是使用xpath, 并通过使用text 属性来进行元素查找,那么表达式格式如下:

 find_element_by_xpath('//*[contains(text(),"string_to_locate")]' )

其中中括号 里面就是元素的限定条件,符号 * 表示所有元素,和上面其他限定条件类似;text() 就是元素的text 属性值,contains() 是一个函数,判断字符串的包含关系.
f. 如果找到的是多个元素,那么可以通过类似数组元素的方式进行访问特定元素.

B. IE中点击无效的问题,以及input 输入框接受数据不正确的问题.

在ie 浏览器中,经常性的会出现click 无效, 此时可以借助js 的方式进行click 点击操作:

driver.execute_script("arguments[0].click(); ",btn_element) 

其中的arguments[0] 表示取后面参数列表中的第一个参数的值. 后面的btn_element 就是具有click()方法的元素.
而向input之类的输入框传递数据的时候,在IE中经常出现输入框获取到的数据和发送的数据不一致的情况,这个可以通过改用js的方式进行发送,也可以 通过清空 输入框数据,重新进行发送,直到收到的数据正确为止, 而清空input 类输入框数据的方式是: driver.find_element_by_xpath().clear(), 也就是调用元素的clear() 方法就清空其数据了.

C. 等待响应以及窗口关闭,切换等.

等待响应可以调用 WebDriverWait(driver,30,0.5).until(lambda driver: driver.find_element_by_id("input4") ) 这种方式来实现 (也可以用WebDriverWait().until_not() ),当然了,等待的条件也可以是新窗口的弹出或者释窗口标题发生改变等. 比如如下条件都可以用来等待响应:

"Google"  in  driver.title 
driver.window_handles      
driver.current_window_handle  

多窗口切换就直接找到对应窗口的handle (driver.window_handles 会返回所有的窗口handle, 找到需要的就行),然后用 driver.switch_to(NEW_HANDLE) 就可以进行窗口切换了.
如果要关闭窗口,那么首先要确保目标窗口是激活的,也就是要先切换到目标窗口,然后调用 driver.close() 方法就可以实现了. 通常窗口关闭后就无法继续进行元素定位了,这时候要再次进行窗口切换,切换到目标窗口后,才可以进行元素定位.

D. 处理同一个wait请求的不同响应结果

比较典型的例子是“发送搜索请求”,在发送请求后,进入WebDriverWait ,进行等待响应,这个时候响应的结果可能是“没有匹配的搜索结果”,或者是 “有匹配的搜索结果”. 这时候等待面临的结果就是两种,这种情况如何用WebDriverWait 来实现呢?
在使用WebDriverWait的时候,等待条件一般用lambda 函数,所以可以在lambda函数的调用上做文章,网上有一个写法类似如下: WebDriverWait(driver,30,0.5).until(lambda driver:driver.find_element_by_id("input4") or driver.find_element_by_xpath("//*[contains(text(),"No results")]"))
这个方法咋一看没有问题,实际上并不能实现需求,根本原因是:lambda 匿名函数在执行遇到异常的时候就直接返回了,在这种情况下第二个条件根本没有机会获得执行,要解决这个问题,那么可以在lambda函数中调用一个自定义的外部函数,这个自定义的函数在多个等待条件都不满足时候再返回异常. 这样就可以解决了,下面是一个参考例子 (当第一个元素没有找到的时候,尝试返回第二个元素,如果依然没有找到,那么就返回 find_element_by_xpath 本身的异常,WebDriverWait 会处理这个异常,然后重新等待直到元素被返回或者发生timeout异常):

def wait_multi_element(driver,para1, para2):  #para1 and para2 is the xpath of the elements. 
   try:
      return driver.find_element_by_xpath(para1)
   except:
      try:
         return driver.find_element_by_xpath(para2)
      except:
         raise  

实际上,除了以上的解决方式,可以参考WebDriverWait的实现方式,写自己的 wait 类,然后解决这个问题.

E. 在页面加载过程中,依然可以定位到刷新前的元素,如何进行规避?

还是用“搜索”来举例:
假设当前的搜索没有匹配的结果,而此结果对应的元素 ele .
然后输入新的搜索条件并开始搜索,在新的搜索结果没有出现的时候,如果我们就开始查找出现的元素,那么很可能定位到了前一次的 ele 元素,而这并不是我们想要的结果,因为新的搜索结果并没有返回,是否有匹配其实是不清楚的.
为了解决这个问题,可以把前一次ele元素保存到列表,然后拿当前查找到的 元素和之前的ele进行比对,如果是同一个,那么表示当前搜索没有返回结果, 从而避免把上一次的结果作为这一轮搜索的结果来使用.

F. 对剪切板的访问

在windows环境下,可以使用win32clipboard 配合win32con 模块,实现对剪切板的: "写,读,清空" 等.
需要注意的是:
如果需要先清空剪切板,然后又通过第三方程序向剪切板中写入了数据,此时再想要获取剪切板的内容,那么需要用如下的顺序:

import win32con
import win32clipboard as cp
cp.OpenClipboard() 
cp.SetClipboardData(win32con.CF_UNICODETEXT,"")    #清空剪切板内容
cp.CloseClipboard()    #必须首先关闭
......       #第三方程序向剪切板写入数据 
cp.OpenClipboard()    #打开剪切板
clip_data=cp.GetClipboardData()     #获取剪切板的数据
cp.CloseClipboard() 

如果前面"清空"之后,没有关闭剪切板而在后面直接调用GetClipboardData方法,那么获取到的内容为空,所以必须要重新打开剪切板,才可以获取到 剪切板的数据.

本文原创,转载请注明出处

上一篇下一篇

猜你喜欢

热点阅读