python3+selenium 自动发布微博
2018-12-21 本文已影响0人
鼻子两个孔
编程环境
- 编程语言:python3 + selenium库
- IDE:jupyter notebook
- 浏览器:chrome 70.0
- 系统:macOS
安装selenium库
pip install selenium
实现方法
由于selenium打开的chrome是原始设置的,所以访问微博首页时一定会弹出来是否提示消息的弹窗,导致不能定位到输入框。
1545383065836.jpg
此处有两种解决方案
方案一
直接访问http://weibo.com/login.php,不会弹出
from selenium import webdriver
import time
driver = webdriver.Chrome()
url='http://weibo.com/login.php'
driver.get(url)# get打开微博主页
time.sleep(10) # 页面加载完全
方案二
配置chrome的选项,禁止弹出
from selenium import webdriver
import time
chrome_options = webdriver.ChromeOptions()
# 把允许提示这个弹窗关闭
prefs = {"profile.default_content_setting_values.notifications": 2}
chrome_options.add_experimental_option("prefs", prefs)
driver = webdriver.Chrome(options=chrome_options)
url='http://weibo.com/'
driver.get(url)# get打开微博主页
time.sleep(10) # 页面加载完全
登录账号
- 如果有独立的id、class、tag等,可以直接定位
-
也可以直接用xpath定位,浏览器可以直接复制出来xpath,不过这种一般都是div[3]/div[5]这样一层一层下来,如果页面有一点变动就会出错,所以我一般会往上级找,找到能通过属性定位到唯一一级的。
查找xpath.jpg
例如浏览器找出来的登录按钮xpath是:
//*[@id="pl_login_form"]/div/div[3]/div[6]/a
可以把自己写的xpath放进浏览器的搜索框验证能否唯一定位
//div[@node-type="normal_form"]//div[@class="info_list login_btn"]/a
具体登录部分代码如下
input_account=driver.find_element_by_id('loginname') # 找到用户名输入框
input_psw=driver.find_element_by_css_selector('input[type="password"]') # 找到密码输入框
# 输入用户名和密码
input_account.send_keys('username')
input_psw.send_keys('password')
# 找到登录按钮
bt_logoin=driver.find_element_by_xpath('//div[@node-type="normal_form"]//div[@class="info_list login_btn"]/a') # 找到登录按钮
bt_logoin.click() # 点击登录
# 等待页面加载完毕
time.sleep(10)
发布纯文字微博
weibo_content = driver.find_element_by_xpath('//div[@class="input"]/textarea[@class="W_input"]')
weibo_content.send_keys("这是一个测试微博!")
bt_push = driver.find_element_by_xpath('//div[@class="func"]/a')
bt_push.click() # 点击发布
time.sleep(5)
driver.close() # 关闭浏览器
发布带图片微博
- 如果是input标签,使用send_keys把路径传上去即可,不过微博不满足这个条件(windows系统的文件夹地址要用"\"链接)
- 如果不是input标签,可以借助sendKeys这个第三方库,可是这个库只有windows平台可以用
小结
- 如果需要在linux系统里面实现自动发微博,还是使用微博的接口比较好,但是得先去申请一个开发者账号,获得App Key和App Secret。不过试了一天,最后一直说没有权限发微博。。。所以还是用selenium了
- xpath是最方便的定位方式
- chrome的options有很多东西,官方文档在这里https://sites.google.com/a/chromium.org/chromedriver/capabilities