python 比较短文本相似性(difflib、fuzzywuz
2018-10-16 本文已影响0人
逍遥_yjz
1 模糊字符串匹配字符串
from fuzzywuzzy import fuzz
from fuzzywuzzy import process
import difflib
s1 = "你们公司在哪里"
s2 = "你家的公司地址在哪里" # 71
s2 = "我不需要亲" # 0
print(fuzz.ratio(s1, s2)) # 0,71
a = u'价格怎么样'
b = u'怎么卖的'
print(difflib.SequenceMatcher(None, a, b).ratio())
输出:
67
0.4444444444444444
https://github.com/seatgeek/fuzzywuzzy
参考资料:
python fuzzywuzzy模块 模糊字符串匹配详细用法
difflib