(番外篇)Python操纵网盘客户端批量离线下载小电影

2017-08-08  本文已影响1166人  Seeker_zz

上回(Python实现电影排行榜自动网盘下载(4)Cookies免登录+抓包下载)说到,一段时间内能进行多少次离线下载还是受限于验证码的输入。
在此有两个解决方案,

这篇文章记录了我第二种方法的实验过程,最后测试了几个磁力链接的添加速度,大概是这样的:

演示

速度大概是每分钟10个,如果再慢的话从速度上可能第一种方案会是比较好的选择。

Pywinauto

先看看简介吧。pywinauto is a set of python modules to automate the Microsoft Windows GUI. At it’s simplest it allows you to send mouse and keyboard actions to windows dialogs and controls.
嗯,是个Windows的自动化操作工具。
帮助文档
要点一个按钮,首先要知道怎么找这个按钮吧?在这里他的一个示例是关于记事本的,学习了一下,大概是通过窗口类名标题来找的元件,说到这里就要用到Spy++(或者Spy++Lite)

百度网盘的示例

就这么拖一下就找出来了。
嘿嘿,初次用这个Pywinauto感觉还挺厉害的,然而我把他用到网盘上的时候…我就蒙蔽了- -,这个离线下载的按钮在Spy++Lite中找不到,换了其他各种找元件的工具都查不出来,Pywinauto输出这个主窗口包含的元件也不管用。网上查了一下这是为什么,可能是这个按钮他丫的就不是个标准的按钮!那该怎么办呢?

关于按钮的折腾

这一段着实是瞎折腾,最初的想法并没有成功,最终选择了鼠标模拟,发上来给大家参考参考吧,大家有指正或者好的改进方法快来告诉我呀~(所以大概这段可以跳过了?(划掉)
网上看到别的一个方案——窗口收到了什么消息,就模拟什么消息;收到了鼠标按下按键这个消息,就模拟这个消息。
于是又在Spy++里面瞎折腾,先打开百度云主窗口,然后在Spy++里面记录它收到的消息,找到了这么一条

找到了按下离线下载之后的窗口的句柄 就是这个消息用到了我们需要的句柄
离线下载这个按钮的功能就是激活这个新建的窗口,那我们拿到这个句柄(相当于窗口的身份)来激活,不就不用管这个按钮了吗?然而这个句柄是如何产生的呢?它到底是在按下按钮的一瞬间产生的,还是在按下之前就存的有呢?在Spy++中从按下鼠标之后截获到的消息并没有返回这个句柄,呵呵,我就天真地暂定它是之前就存的有吧。就算你存的有,那又该怎么找呢?嘿嘿,我想到了CheatEngine来搜索。 新建离线下载窗口的句柄

哇,这不是有规律嘛!第4位每次+1!
然而马上我又被打脸了…开个别的窗口再来开它,嗯……(手动再见)


好吧…我屈服了…就按照按键脚本来写吧…

后台鼠标消息

好了,现在开始试着写按键脚本…大致想法就是获得主窗口的句柄,用坐标的方式获得按钮的位置,然后模拟点击。这里可能用按键精灵的抓抓会比较方便。

拖动到窗口内“离线下载”按钮上 在按键精灵中测试 主窗口句柄为133248

在这里需要注意按键精灵抓出来的句柄是10进制的。
测试成功啦,看来可以用这个方法,那就一通写出来吧。

发送文本

这里问题就是离线下载的地址填不进去!它就这么默默地看着你,一动不动!


按键精灵不行,试试Pywinauto?

移植到Python

……别试了,Pywinauto发送文本也不行。它们用的应该都是WIN API,所以应该换个思路了。在这里我的想法是模拟人操作,把地址Ctrl+C一下,然后到文本框Ctrl+V一下。在这里虽然Pywinauto有Ctrl+V,但却没有Ctrl+C(卧槽这是什么操作啊啊啊)还是用win api吧。注意这个SetClipboardData提到了一句,

必须用NULL结束字符串。使用此格式为ANSI文本。

所以我们在地址后面加上一句

.encode('ansi')

否则粘贴过去就是这样的


此外文本框还有一个坑,像上面那样查询链接失败的话地址就留在那里了,所以应该是Ctrl+A Ctrl+V。而文本框发送Ctrl+A Ctrl+V有的时候会Ctrl莫名奇妙失效,多出来一个a,粘贴过去是amagnet,所以在这里干脆都按照存在文字的情况处理,发送A Ctrl+A Ctrl+V
下一个窗口。

成功晋级!

虽然可以按照偏移点击的方法解决,但同时我发现可以通过Tab Tab Enter的方式完成下载,或许以后遇见坐标偏移量是变化的时候可以尝试这种方法?
依次用鼠标点击指定坐标的方式到了最后一个窗口了,关掉这个窗口,就是脚本的一个循环啦。

关掉这个窗口

总结

一开始我并不知道Pywinauto有后台鼠标消息,于是写了一个用winapi模拟点击的版本,也放上来吧。

from pywinauto import application
import win32api
import win32gui
import win32con
import win32ui
main_handle=win32ui.FindWindow('BaseGui','欢迎使用百度网盘').GetSafeHwnd()
client_pos=(516,118)
tmp = win32api.MAKELONG(client_pos[0], client_pos[1])
win32gui.SendMessage(main_handle, win32con.WM_ACTIVATE, win32con.WA_ACTIVE, 0)
win32api.SendMessage(main_handle, win32con.WM_LBUTTONDOWN, win32con.MK_LBUTTON, tmp)
win32api.SendMessage(main_handle, win32con.WM_LBUTTONUP, win32con.MK_LBUTTON, tmp)

这次实验还是有很多问题,包括Python实现电影排行榜自动网盘下载(3)Selenium离线下载同样出现的欲速则不达,所以最终代码中加入了wait_until;还有下载一定次数之后查询磁力链接没反应,重启客户端可解决;以及各种查询失败、离线下载错误……总之,应对错误的逻辑还有待改进,在这里只是简单的设定为add_task出现问题之后直接重启客户端,即查询不了下载信息就重启。还有其他情况没有处理,包括下载进度为0%,这种任务多了会提醒离线下载任务过多,需要手动清理,如果违规资源较多,可能导致重启频繁,影响速度。代码的话可能需要根据实际运行情况修改超时时间。由于速度过快经常容易查不到句柄啥的,就都用try except括起来了,感觉好丑却很无奈,献丑啦:

import pywinauto
import time
import win32clipboard as w
import win32con
from pywinauto.timings import *
from pywinauto.application import Application
class baidudisk:

    def boot(self):
        path=r'C:\Users\Administrator\AppData\Roaming\Baidu\BaiduNetdisk\BaiduNetdisk.exe'
        #Python3 中Application要加()
        self.baiduapp=Application().start(path)
        try:
            #规定时间内等待程序启动
            wait_until(10,0.25,self.getmainui,True)
        except Exception as e:
            print('Get Main Window ')
            print(e)

    def kill(self):
        self.baiduapp.kill()
    def download(self,url):
        #剪切板函数要求数据类型为ANSI
        self.url=url.encode('ansi')
        try:
            wait_until(1,0.25,self.click_newtask,True)
        except Exception as e:
            print('Download button ')
            print(e)
        try:
            wait_until(1,0.25,self.query_newtask,True)
        except Exception as e:
            print('Query')
            print(e)
        try:
            wait_until(4,0.25,self.add_newtask,True)
        except Exception as e:
            print('Add task')
            print(e)
            print('Rebooting...')
            self.baiduapp.kill()
            self.boot()
        try:
            wait_until(3,0.25,self.close_state,True)
        except Exception as e:
            print('State Window')
            print(e)

    def click_newtask(self):
        try:
            self.main_ui.click(coords=(516,118))
            return (True)
        except Exception as e:
            print(e)
            return (False)

    def query_newtask(self):
        try:
                newtask_handle=pywinauto.findwindows.find_window(class_name="BaseGui",title= "新建离线下载任务窗口")
                newtask_ui=pywinauto.controls.hwndwrapper.DialogWrapper(newtask_handle)
                url_ui=newtask_ui.descendants()[0]
                # url_ui.set_keyboard_focus()
                w.OpenClipboard()
                w.EmptyClipboard()
                w.SetClipboardData(win32con.CF_TEXT, self.url)
                w.CloseClipboard()
                url_ui.send_keystrokes('a^a^v')
                # print(url_ui.element_info)
                # print(url_ui.get_properties())
                #添加磁力链接后下载
                newtask_ui.click(coords=(470,255))
                return (True)
        except Exception as e:
            print(e)
            return (False)


    def add_newtask(self):
        try:
            download_handle=pywinauto.findwindows.find_window(class_name="BaseGui",title= '新建离线BT任务')
            download_ui=pywinauto.controls.hwndwrapper.DialogWrapper(download_handle)
            download_ui.click(coords=(400,470))
            #可能出现离线下载错误时该窗口不会正常关闭的情况 所以使用try
            try:
                download_ui.close()
            except:
                pass
            return (True)
            
        except Exception as e:
            print(e)
            return (False)

    def close_state(self):
        try:
            state_handle=pywinauto.findwindows.find_window(class_name="BaseGui",title= '离线下载任务列表')
            state_ui=pywinauto.controls.hwndwrapper.DialogWrapper(state_handle)
            state_ui.close()
            return (True)
        except Exception as e:
            print(e)
            return (False)

    def getmainui(self):
        try:
            #返回窗口句柄
            self.baidudisk_handle=pywinauto.findwindows.find_window(class_name='BaseGui',title='欢迎使用百度网盘')
            #根据窗口句柄查询对话框
            self.main_ui=pywinauto.controls.hwndwrapper.DialogWrapper(self.baidudisk_handle)
            return (True)
        except Exception as e:
            print(e)
            return (False)






if __name__=='__main__':
    bdtest=baidudisk()
    bdtest.boot()
    #正常与违规的链接均进行测试
    magnets=[
        'magnet:?xt=urn:btih:583bed331c32889897f69b114191c44732bb7aa2',
        'magnet:?xt=urn:btih:FD351CACF9692E1833388B3B5A568C6A115E4672&xl=546661540&dn=[%E6%A5%9A%E9%97%A8%E7%9A%84%E4%B8%96%E7%95%8C].rmvb',
        'magnet:?xt=urn:btih:F77F5133B209D29126812CFAC9B0FE2508DC52A9&xl=584113510&dn=%E9%9C%B8%E7%8E%8B%E5%88%AB%E5%A7%AC.rmvb',
        'magnet:?xt=urn:btih:E2A87A1922139C5C44965B77F5EC21F1442C97A4&xl=1073579448&dn=#_IBW118',
        'magnet:?xt=urn:btih:CC2711AE1A5CCB8CB5FB3E6F900F404BD4792517&xl=1367609104&dn=%E9%98%BF%E7%94%98%E6%AD%A3%E4%BC%A0.[1024%E5%88%86%E8%BE%A8%E7%8E%87].rmvb'
    ]
    for i in range(20):
        bdtest.download(magnets[i%5])

关于如何批量获取磁力链接地址可参阅往期系列文章:
Python实现电影排行榜自动网盘下载(4)Cookies免登录+抓包下载
Python实现电影排行榜自动网盘下载(3)Selenium离线下载
Python实现电影排行榜自动网盘下载(2)Scrapy深入 “打包员”“快递员”
Python实现电影排行榜自动网盘下载(1)Scrapy爬虫框架
Python实现电影排行榜自动网盘下载(0)简介
网易云音乐评论抓取实验(1)接口获取

上一篇下一篇

猜你喜欢

热点阅读