OUTLOOK高效办公

如何批量下载微信公众号的文章?

2021-01-26  本文已影响0人  沛文沛语

以下几个场景你是否遇到过呢?
1:创作者:很多在公众号创作的朋友,时间长了都会遇到文章莫名其妙被河蟹的情况。还有一阵子一阵子抽风似的封号,导致你历史上创作的内容全部丢失,你需要有一个高效的备份方法,怎么办?
2:读者:你关注某一个优质公众号很久了,有很多你喜欢读的文章,你用了微信收藏起来了,但是你想搜索的时候,只记得其中几个关键词,等你搜索到了,发现公众号的内容打不开或者被作者删除掉了,怎么办?
3:研究者:你想研究一下某个公众号的行文风格,需要获取历史数据,需要把该作者的历史文章全部下载下来,怎么办?

好久没有写过教程类文章了,沛哥今天就来给大家分享一个最近get到的好用的工具,帮大家解决上面的问题。
之前为了备份新浪博客的文章,沛哥找朋友用python搞了一个爬虫,很快搞定。但是微信属于移动端的产品,依托于微信,传统的爬虫不适用于微信,而且这个定制化的爬虫对于大多数人来说操作起来也不够方便友好。
通过搜索试用,沛哥找到了一个好用的工具:


微信公众号文章搜索导出助手V1.5.8.zip

下载安装

有点讨厌的是,这个工具会被杀毒工具拦截,于是乎,我找了个不常用的电脑来做这件事。虽然官方说工具没事,还是小心点为妙。如果你没有多余的电脑,可以搞一个虚拟机隔离开。操作很简单,在此不表,到官网查看即可。
https://www.juyimv.cn/

官网

如何下载指定公众号的历史文章

所谓指定公众号,好比说【井英俱乐部】,只有发表在这个公众号的文章。但是注意一下,有几个数据可能会误导大家。你在微信关注一个公众号的时候,微信会提示你有XX个朋友也关注了这个公众号,这个公众号有多少篇【原创】文章,注意是原创哦!
由于历史的原因,早期的公众号没有打赏,原创这些功能。所以你实际搜索出来的文章数量会比显示的文章数量要多。
以下的教程,我就不重新搞一遍了,直接引用官方的说明文档。

第一步:打开公众号

打开微信电脑版并登录,还没有下载微信的点我下载,登录微信后,打开需要采集的公众号,这里以公众号【井英俱乐部】为例,打开公众号后先点击进入公众号,然后再点击右上角的三个点点

image.png

第二步:进入历史消息界面

打开如上图界面后,点击右上角的三个点点,再点击下图所示界面的查看历史消息


号内采集」自动抓取cookie和公众号主页图文教程

如果上图点击历史消息界面提示 “请在微信客户端打开链接” ,打开PC端微信设置—通用设置,将使用系统默认浏览器打开网页取消勾选即可

「号内采集」自动抓取cookie和公众号主页图文教程 「号内采集」自动抓取cookie和公众号主页图文教程

第三步:开始抓取文章

然后我们在软件的号内采集界面,点击开始采集按钮(点击后360等安全软件可能会有拦截提示,请务必点击允许,第一次使用可能也会提示安装证书,务必也点击允许)

等待按钮名称变为监听中,再刷新公众号历史消息界面

注意是刷新公众号历史消息界面,如下面第二张图片,其他任何界面都不行


「号内采集」自动抓取cookie和公众号主页图文教程 「号内采集」自动抓取cookie和公众号主页图文教程

第四步:进入文章抓取

刷新后软件就会自动采集历史文章啦,加载间隔建议设置10秒,等待采集完成就可以导出文章或者浏览,如果刷新后没有自动采集历史文章,请查看这篇文章解决:「号内采集 」自动抓取参数报错:监听获取cookie超时或刷新历史消息界面无反应

采集结束

动图福利教程


批量抓取微信公众号历史文章.gif 批量下载微信公众号历史文章 动图教程.gif

再找一个新的公众号从头完整的演示一遍。


硅谷王川微信历史文章采集 动图教程.gif

特别注意:

  1. 是等按钮名称变为监听中,再刷新历史界面;
  2. 是刷新历史消息界面,不是刷新文章内容页面,千万不能弄错了;
  3. 采集过程中不需要再去刷新历史消息界面,只需要刷新一次即可;

导出为PDF,WORD,HTML

以上是完成了内容抓取的工作,接下来要做的就是把这些数据以本地可读的方式备份起来。常用的有3种格式,PDF,WORD和HTML。
我选择HTML来备份,因为我还需要把这些抓取后的数据批量导入到印象笔记里面,而HTML是最友好的格式,导入之后直接可读,而且还可以全文检索。
操作方法如下,同样摘录自官网教程。

  1. 第一步,打开微信文章下载工具,切换到搜索面板;
  2. 第二步,点击导入链接,把我们需要下载的微信文章链接复制过了粘贴到软件上,点击导入
  3. 第三步:在列表任意文章右击,下载即可。可以选择下载Word、pdf和html格式。然后等着下载完成即可,非常方便


    选中后导出文章

关于印象笔记如何批量导入文件,请参考
印象笔记如何批量导入文件

导入后的效果

模糊搜索

如果你想监控一下某一个关键词在所有微信公众号中出现的相关文章,可以选用模糊搜索方式,你只需要在做下角切换为文章搜索即可。其他操作同上。
这种方式有点类似舆情监控吧,你可以看看其他人对某个公司或者某个事件的看法。

王川 公众号历史文章导入印象笔记动图教程.gif
上一篇下一篇

猜你喜欢

热点阅读