如何选择计算相似的算法 2017-09-28 本文已影响0人 编程回忆录 通常计算相似度的算法有3种: 纳尔逊相关系数 欧氏距离或者曼哈顿距离 余弦相似度 我们可以根据数据的特性做成如下选择: 如果数据受分数贬值(grade-inflation,即不同用户使用不同的评级范围)的影响,则使用皮尔逊相关系数。 如果数据稠密(几乎所有属性都没有零值)且属性值大小十分重要,那么使用诸如欧氏距离或者曼哈顿距离。 如果数据稀疏,考虑使用余弦相似度。