获取一篇文章中出现最多的单词

2019-10-10  本文已影响0人  冬月廿拾

代码片段来源:https://github.com/Show-Me-the-Code/python/tree/master/A1014280203/4

精彩代码片段

    for word in complete_text.lower().split():
        records[word] = records.get(word, 0) + 1

题目

任一个英文的纯文本文件,统计其中的单词出现的个数。

原思路:
  • 将文件中的转义符\n,\t替换成空格
  • 将文件内容以空格切成数组然后转为元组(去重) tuple_a
  • 再定义一个数组list_a 内容=文件内容以空格切隔
  • 建一个二维数组list_b,保存单词与对应的数量
  • 在一个white中(终止条件lista长度=0)用for遍历tuple_a,用for判断在list_a中是否存在,如果存在:在list_b中新增/修改 数组(单词,出现的次数),并使用下标将list_a对应的单词删除,跳出循环
问题点:

最后一步使用两个for稍微麻烦,二维数组list_b不好排序

新代码的精彩点:代码精简,且易于理解
#complete_text为文章内容('t 、're之类的缩写已转换)
#records为字典
    for word in complete_text.lower().split():
        records[word] = records.get(word, 0) + 1
上一篇 下一篇

猜你喜欢

热点阅读