小实验3:十行代码写词云
第一行
import matplotlib.pyplot as plt
导入matplotlib.pyplot库并命名为plt 这样后面写包名只需要写plt,可以改成其他
如import matplotlib.pyplot as a
a.show()
matplotlib是python的一个绘图的库,可以绘制各种矩阵图形,会显示一个绘图的界面,就像pygame会显示一个游戏界面。里面包含pylab和pyplot等子库。
第二行from wordcloud import WordCloud
第三行import jieba
jieba为结巴分词库
支持三种分词模式:
a,精确模式,试图将句子最精确地切开,适合文本分析;
b,全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;
c,搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
第四行 text_from_file_with_apath = open('文件路径/文件名.拓展名').read()
读取文件中的内容
第五行wordlist_after_jieba = jieba.cut(text_from_file_with_apath, cut_all = True)
jieba.cut
方法接受两个输入参数: 1) 第一个参数为需要分词的字符串 2)cut_all
参数用来控制是否采用全模式
第六行 wl_space_split = " ".join(wordlist_after_jieba)
文字中间以空格为分界隔开,变成一个list
因为jieba分词后的结果是一个string,各个词中间用空格隔开
第七行my_wordcloud = WordCloud().generate(wl_space_split)
把list构成词云
第八行 plt.imshow(my_wordcloud)
绘制热度图,大概是 显示不同的颜色
第九行 plt.axis("off”)
坐标轴的最值,无,这句话可以不写
plt.axis([xmin, xmax, ymin, ymax])
第十行 plt.show()
显示图片
pyplot库尝试
import matplotlib.pyplot as plt
plt.plot([1,2,3,4])
默认绘制y轴,x轴默认从0开始,为0,1,2,3...
plt.ylabel('some numbers',fontsize=16)
y轴的标题以及更改大小
plt.xlabel('some numbers')
x轴的标题
plt.show()
显示图片
plt.close()
close the current figure
plt.plot([1,2,3,4], [1,4,9,16])
分别为x轴,y轴的坐标
更改字体
FONT_PATH = os.environ.get("FONT_PATH", os.path.join(os.path.dirname(file), "字体.ttf"))