【python】实验-十行代码生成词云
十行代码生成词云
http://python.jobbole.com/87496/?repeat=w3tc
准备工作,导入库
pip install wordcloud pip install jieba
代码 就十行
import matplotlib.pyplot as plt from wordcloud import WordCloud import jieba text_from_file_with_apath = open('/Users/hecom/23tips.txt').read() wordlist_after_jieba = jieba.cut(text_from_file_with_apath, cut_all = True) wl_space_split = " ".join(wordlist_after_jieba) my_wordcloud = WordCloud().generate(wl_space_split) plt.imshow(my_wordcloud) plt.axis("off") plt.show()
这10行代码:
1~3 行分别导入了画图的库,词云生成库和jieba的分词库;
4 行是读取本地的文件,代码中使用的文本是本公众号中的《老曹眼中研发管理二三事》。
5~6 行使用jieba进行分词,并对分词的结果以空格隔开;
7行对分词后的文本生成词云;
8~10行用pyplot展示词云图。
问题解决
arial.ttf 不行啊。 修改为 simhei.ttf 测试 一下。
问题解决
问题1 ,pip安装包下载慢,怎么办?用手机4G热点啊!
问题2,安装pip包出错,提示缺少Microsoft Visual C++ 9.0,那就下载一个84M的包,就搞定啦。
Windows7下pip安装包报错:Microsoft Visual C++ 9.0 is required Unable to find vcvarsall.bat
http://blog.csdn.net/testcs_dn/article/details/51570031
Microsoft Visual C++ Compiler for Python 2.7
http://www.microsoft.com/en-us/download/confirmation.aspx?id=44266
pip install wordcloud
第二个词云(python词云 wordcloud 入门)
实验地址是:
http://m.blog.csdn.net/article/details?id=50789226
问题没有解决,(提供的代码缺少模块,但其他所有程序均可以运行!)
ImportError: No module named scipy.misc
from os import path
from scipy.misc import imread
import matplotlib.pyplot as plt