利用Python网络爬虫抓取微信好友的签名及其可视化展示
前几天给大家分享了如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化,利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例,以及利用Python网络爬虫抓取微信好友的所在省位和城市分布及其可视化,感兴趣的小伙伴可以点击进去看看详情,内容方面不是很难,即使你是小白,也可以通过代码进行实现抓取。今天,小编继续给大家分享如何利用Python网络爬虫抓取微信好友的签名及其可视化展示,具体的教程如下所示。
1、代码实现还是基于itchat库,关于这个神奇的库,在之前的文章中有提及, 再次不多赘述。下图的代码的功能是实现签名的抓取和数据提取。之后将抓取到的数据写入到本地文件中去。

2、程序运行完成之后,得到了一个文本文件,内容如下图所示。

第一行中最开始的那条签名是小编自己的,博学,审问,慎思,明辨,笃行。之后的签名是根据微信通讯录上的名片列序来进行呈现的。如果好友有微信签名的话,都会抓取下来,如果没有签名的话,则忽略。
3、随机的验证一下微信好友的签名,再此以小编对象的微信签名为例,她的签名是“得之安然、失之坦然、处之泰然、顺其自然、争其必然!”,之后在TXT文件中进行搜索,可以看到其签名确实是存在里边的,如下图所示。

4、接下来就要对这个文件文件进行词云可视化呈现了。继续写代码,如下图所示。

代码的关键部分是需要底图和字体,底图小编用的是路飞,注意要使用白色底图的图片,不然词云可视化的时候效果不佳。

字体的话需要自己提前去下载,对于可视化呈现也可以参考这篇文章:如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化。
5、运行程序之后,仍然需要进行扫码授权,程序运行如下图所示。

红色代码部分,上一篇文章已经详细讲解过了,再次不多赘述了。
6、之后我们可以看到漂亮的词云图就展示在我们面前了,如下图所示。

根据词云的可视化效果来看,关键词:人生、努力、时间、我们、哈哈哈……等词语,出现的频率较高。可以感受得到小编的微信好友的签名基本上都突显出积极乐观,珍惜时间,努力奋斗的特征。
劝君吸取金缕衣,劝君惜取少年时。花开堪折直须折,莫待无花空折枝。祝福大家周末愉快,人生苦短,我用Python~~