selenium基础知识-3-异常问题汇总
2020-04-19 本文已影响0人
沈宥
1、封装一个函数,判断当前元素是否存在
from selenium.common.exceptions import NoSuchElementException
def isElementExist(xpath_value,driver):
"""
用来判断元素标签是否存在,
"""
try:
element = driver.find_element_by_xpath(xpath_value)
# 原文是except NoSuchElementException, e:
except NoSuchElementException as e:
# 发生了NoSuchElementException异常,说明页面中未找到该元素,返回False
return False
else:
# 没有发生异常,表示在页面中找到了该元素,返回True
return True
2、通过xpath获取href链接
image正常情况下,直接通过如下方式获取即可
href_temp = browser.find_element_by_xpath('//*[@id="1"]/h3/a/@href')
但事实上,上述方法selenium会报错,正确的应该为:
href_answer = browser.find_element_by_xpath('//*[@id="1"]/h3/a')
href_link = href_answer.get_attribute('href')
3、新开Tab并在多个Tab中切换
# 通过执行js来新开一个窗口
new_tab_js = 'window.open("'+ href_link + '");'
browser.execute_script(new_tab_js)
# 输出当前窗口句柄(搜索结果页)
baidu_handle = browser.current_window_handle
# 获取当前窗口句柄集合
handles = browser.window_handles
# 获取结果详情页窗口
result_handle = None
for handle in handles:
if handle != baidu_handle:
result_handle = handle
# 输出当前窗口句柄
browser.switch_to.window(result_handle)
#在详情页中找结果
get_result_detail(browser)
# 关闭当前窗口
browser.close()
4、获取span标签中的文本
answer_number = browser.find_element_by_xpath('//*[@id="qb-content"]/div[2]/span[2]').get_attribute('innerHTML')
5、通过find_element_by_class_name
获取元素失败
class.png
根据Inspect获取到class_name,当去抓取时报错无该元素:
best_answer = browser.find_element_by_class_name('best-text mb-10')
这是因为使用CSS选择器的时候不允许使用空格,需要将class_name中的空格替换成英文的点“.”
best_answer = browser.find_element_by_class_name('best-text.mb-10')
6、通过find_element()
方法获取元素
获取元素除了指定获取方式的方法,还有更灵活的方法
element = driver.find_element(by=by, value=value)
定位方式 | By |
---|---|
id | By.ID |
name | By.NAME |
class_name | By.CLASS_NAME |
tag_name | By.TAG_NAME |
link_text | By.LINK_TEXT |
partial_link_text | By.PARTIAL_LINK_TEXT |
css_selector | By.CSS_SELECTOR |
xpath | By.XPATH |