Python 练习册 6-找出重要的单词

2017-08-09  本文已影响18人  双核孤城

题目取自Yixiaohan的python练习册

题目

你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词

代码

"""
 你有一个目录,放了你一个月的日记,都是txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。
"""
from collections import Counter

import os


def get_diary_path():
    list = []
    dir_path = './diary'
    for path in os.listdir(dir_path):
        list.append(dir_path + '/' + path)
    return list


def get_common_word(paths):
    common_words = []
    for path in paths:
        words = []
        with open(path, 'r') as f:  # 打开文件
            for line in f:
                line = line.strip('\n')  # 去掉每行后面的换行符
                if line != '':  # 去掉空行
                    split = str(line).split(' ')
                    words.extend(split)
        common_word = Counter(words).most_common(1)  # 获取此篇中出现频率最高的一个词汇
        common_words.append(common_word)
    return common_words


if __name__ == '__main__':
    paths = get_diary_path()
    words = get_common_word(paths)
    print(words)
上一篇下一篇

猜你喜欢

热点阅读