Python 练习册 0004、0006题 (统计文本)

2017-04-21  本文已影响41人  海上牧云l

第 0004 题:任一个英文的纯文本文件,统计其中的单词出现的个数
第 0006 题:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。

这里把最重要的词当作出现频率最高的词来查找

答案

from collections import Counter

# 统计某一单词出现次数
with open('find.txt', 'r') as f:
    word_list = f.read().split(' ')
    word = input('输入要查找到的单词:')
    num = Counter(word_list).get(word)
    if not num:
        num = 0
    print('{}: {}'.format(word, num))


# 统计日记文本中最重要的词
with open('find.txt') as f:
    word_list = f.read().split(' ')
    top_word = Counter(word_list).most_common(1)[0]

    print('此文本中频率最高的词是:{}'.format(list(top_word)[0]))
上一篇 下一篇

猜你喜欢

热点阅读