wordcloud生成词云

2020-08-02  本文已影响0人  升不上三段的大鱼

先放个结果图:


阴阳师某微博评论

需要用的库:

from wordcloud import WordCloud
import jieba
import matplotlib.pyplot as plt

首先我们要准备一段文字,比如爬到的微博评论


阴阳师某条微博下面的评论

使用jieba库将文字内容进行切分

text = " ".join(jieba.cut(text))

得到


切分之后的文本

然后使用wordcloud生成词云。
在生成中文词云的时候,需要指定一个字体,否则会输出一堆方块。
选择任意一个需要的字体,放在当前文件目录下,我用的是simhei.ttf,然后执行代码:

wordcloud = WordCloud(background_color="white",font_path="simhei.ttf",
            max_font_size=100,max_words=300,width=1000,height=800).generate(text)

plt.figure(figsize=((10, 8)))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")

就可以得到词云了


参考:
python爬虫爬取微博评论案例详解
# Python爬虫实例学习篇——5、【超详细记录】从爬取微博评论数据(免登陆)到生成词云

上一篇 下一篇

猜你喜欢

热点阅读