数据蛙数据分析每周作业

出现频率最高的字母

2018-12-16  本文已影响4人  已经不在简书了

题目:

头号通缉字母 The most wanted letter

给你一段文本,其中包含不同的英文字母和标点符号。
你要找到其中那个出现 最多字母,返回的字母必须是 小写形式
注意不要管标点符号、数字和空格,只要字母!

如果你找到 两个或两个以上出现频率相同的字母, 那么返回字母表中靠前的那个。 例如“one”包含“o”、“n”、“e”每个字母一次,因此我们选择“e”。


代码实现:

# coding: utf-8
def wanted(text):
    target_letter = ''
    target_count = 0
    for i in range(len(text)):
        count = text.count(text[i])
        if not text[i].isalpha() or target_letter == text[i]:
            # 避免重复判断
            continue
        if count == target_count:
            # 比较字母表顺序
            orders = [text[i], target_letter]
            orders.sort()
            target_letter = orders[0]
        elif count > target_count:
            target_count = count
            target_letter = text[i]
    return [target_letter, target_count]

res = wanted('abbc,,c,,,ccffffddddd')

print (res)

运行结果:

['d', 5]

这类算法可被用于密码破解。

上一篇 下一篇

猜你喜欢

热点阅读