几种相似度的对比

2018-11-14  本文已影响0人  Aerio_不要坐井观天

如何结合业务选取一个合适的相似度计算方式?

考虑对item的表征特点,并将item进行细分,定义一些具有代表性的item,尽量考虑全面些,然后人工定义出他们之间的相似关系。之后结合各种相似度的计算,筛选出符合期望的那种相似度,若最后有多个选择,选出解释性强,计算量小的那一种,如果是所有的都被样例item排除,则按照业务重要性,去掉比较不重要的那组样例,继续筛选。

1,余弦相似度

2,皮尔逊相关系数

3,修正的余弦相似度

4,杰卡相似度

5,欧式距离

上一篇 下一篇

猜你喜欢

热点阅读