[雪峰磁针石博客]python3快速入门教程8错误和异常2实战
2018-06-28 本文已影响6人
oychw
正则表达式及拼音排序
有某群的某段聊天记录
现在要求输出排序的qq名,结果类似如下:
#!python
[..., '本草隐士', 'jerryyu', '可怜的樱桃树', '叻风云', '欧阳-深圳白芒', ...]
需求来源:有个想批量邀请某些qq群的活跃用户到自己的群。又不想铺天盖地去看聊天记录。
参考资料:python文本处理库
参考代码:
#!python
#!/usr/bin/python3
# -*- coding: utf-8 -*-
# Author: xurongzhong@126.com wechat:pythontesting qq:37391319
# 技术支持 钉钉群:21745728(可以加钉钉pythontesting邀请加入)
# qq群:144081101 591302926 567351477
# CreateDate: 2018-6-1
import re
from pypinyin import lazy_pinyin
name = r'test.txt'
text = open(name,encoding='utf-8').read()
#print(text)
results = re.findall(r'(:\d+)\s(.*?)\(\d+', text)
names = set()
for item in results:
names.add(item[1])
keys = list(names)
keys = sorted(keys)
def compare(char):
try:
result = lazy_pinyin(char)[0][0]
except Exception as e:
result = char
return result
keys.sort(key=compare)
print(keys)
执行示例:
1,把qq群的聊天记录导出为txt格式,重命名为test.txt
2, 执行:
#!python
$ python3 qq.py
['Sally', '^^O^^', 'aa催乳师', 'bling', '本草隐士', '纯中药治疗阳痿早泄', '长夜无荒', '东方~慈航', '干金草', '广东-曾超庆', '红梅* 渝', 'jerryyu', '可怜的樱桃树', '叻风云', '欧阳-深圳白芒', '勝昔堂~元亨', '蜀中~眉豆。', '陕西渭南逸清阁*无为', '吴宁……任', '系统消息', '于立伟', '倚窗望岳', '烟霞霭霭', '燕子', '张强', '滋味', '✾买个罐头 吃西餐', '【大侠】好好', '【大侠】面向大海~纯中药治烫伤', '【宗师】吴宁……任', '【宗师】红梅* 渝', '【少侠】焚琴煮鹤', '【少侠】笨笨', '【掌门】溆浦☞山野人家']
可爱的python测试开发库 请在github上点赞,谢谢!
python中文库文档汇总
[雪峰磁针石博客]python3标准库-中文版
[雪峰磁针石博客]python3快速入门教程
接口自动化性能测试线上培训大纲
python测试开发自动化测试数据分析人工智能自学每周一练
更多内容请关注 雪峰磁针石:简书
-
技术支持qq群: 144081101(后期会录制视频存在该群群文件) 591302926 567351477 钉钉免费群:21745728
-
道家技术-手相手诊看相中医等钉钉群21734177 qq群:391441566 184175668 338228106 看手相、面相、舌相、抽签、体质识别。服务费50元每人次起。请联系钉钉或者微信pythontesting