Python数据可视化之Wordcloud
文章起始,先跟大家说声抱歉。因为距离我上一篇帖子turtle库更新已经将近过去了一个月,相信粉丝们已经等不及了,还有很多氢粉在后台跟我留言说“在很早之前就想接触wordcloud这个库,但是万事开头难,难就难在连库都安装不上”,所以小编今天在正式介绍wordcloud之前,先教大家怎么安装它。
一、word cloud库的安装
小编电脑的安装环境是anaconda(版本4.4.10),其中库也是在spyder 下的ipython中安装的,安装方法呢,一共有两种,下面小编就为大家逐一介绍下。
1.1 启动命令行,输入:pip install wordcloud 即可
但是在首次安装时,无论是python还是ipython都会报错,报错的原因呢,不尽相同,有的是因为pip版本的问题有的是由于别的依赖换句话就是文件缺失。说了这么多,给大家上张图吧。
1.1如果是出现上面的原因,就按照上面的提示照做就行了。链接如下:
Visual Studio Build Tools 2017 workload and component IDs - Visual Studio | Microsoft Docs
(值得提醒的就是大家一定要下载与之对应的版本)
1.2到python社区中下载安装包进行安装
这种方法呢,可以说是通解,即对所有的第三方库安装都适用。地址如下:
Python Extension Packages for Windows - Christoph Gohlke
下载wordcloud安装包然后解压(需要注意的是一定要下载与之对应的版本)。
1.2查看自己python版本的方法为在命令行下输入:python (就可以看到对应的版本号了)
下载完毕后,我们需要找到下载文件的地址,然后在此处打开命令行,输入:
pip install wordcloud-1.41······(也就是你所下载文件的文件名)
1.3检查wordcloud安装是否成功
我们可以在命令行窗口输入:pip list (查看你所安装的所有的第三方库是否存在word cloud)
也可以在idle中直接调用 import wordcloud 检验是否会报错。
二、word cloud 库介绍
wordcloud库,可以说是python非常优秀的词云展示第三方库。词云以词语为基本单位更加直观和艺术的展示文本,下面给大家看一个示例:
2.1接下来,介绍下wordcloud的基本使用。wordcloud把词云当作一个对象,它可以将文本中词语出现的频率作为一个参数绘制词云,而词云的大小、颜色、形状等都是可以设定的。
2.2在wordcloud作为对象时,大家要注意字母的大小写。
总的来说,生成一个漂亮的词云文件三步就可以完成。即:1、配置对象参数 2、加载词云文本 3、输出词云文件 (如果不加说明默认的图片大小为400 * 200)
wordcloud的常规方法如下:
2.3 2.4运行结果如下:
2.5wordcloud做词频统计分为以下几个步骤:
1 、分隔:以空格分隔单词 2、统计 :单词出现的次数并过滤 3、字体:根据统计搭配相应的字号 4 、布局
常用的参数列表如下:
2.6学了这么多,接下来,让我们做一个wordcloud的示例吧!小编做的是一个《小王子》某章的词云统计,有兴趣的同学可以尝试着自己敲下代码,代码也不算是多。
2.7运行结果如下:
2.8下次呢,小编将会为大家介绍open.cv的强大功能,或者有时间的话就更新一篇关于python整个计算生态的文章。
(本文原创,如需引用请标明出处)