python 比较短文本相似性(difflib、fuzzywuz

2018-10-16  本文已影响0人  逍遥_yjz

1 模糊字符串匹配字符串

from fuzzywuzzy import fuzz
from fuzzywuzzy import process
import difflib
s1 = "你们公司在哪里"
s2 = "你家的公司地址在哪里" # 71
s2 = "我不需要亲"   # 0
print(fuzz.ratio(s1, s2))  # 0,71

a = u'价格怎么样'
b = u'怎么卖的'
print(difflib.SequenceMatcher(None, a, b).ratio())

输出:

67
0.4444444444444444

https://github.com/seatgeek/fuzzywuzzy
参考资料:
python fuzzywuzzy模块 模糊字符串匹配详细用法
difflib

上一篇下一篇

猜你喜欢

热点阅读