Python学习笔记Python学习笔记生活不易 我用python

Python3.5+PyQt5词频统计(一)

2016-10-11  本文已影响291人  Pantheon

一、需求分析


统计给定英文文档中单词出现的频率,要求速度快、准确率高,有良好的交互界面,初期实现简单的分词、统计功能,不考虑词形变换等复杂情况,中期要实现相对简单的词形还原任务,后期实现复杂的词形变换还原(需要较强的自然语言处理能力,暂不考虑)

二、环境搭建


| 所需环境 | 推荐工具 |
| ------------- |:-------------:| -----:|
|Python编程工具|PyCharm 2016.2|
|Python版本|Python 3.5|
|PyQt版本|PyQt5 |
|界面设计| QtDesigner|
|打包程序| pyinstaller|

三、测试案例


使用1M、20M、100M的txt文档,1M、100M的doc文档,50M的docx文档,一个小型的数字文档测试对数字分词的准确率

第一次次测试文档 第二次测试文档
上一篇下一篇

猜你喜欢

热点阅读