为什么用余弦相似度,而不是欧式距离?

2018-12-09  本文已影响0人  小歪与大白兔
一、为什么用余弦相似度,而不是欧式距离?

余弦相似度:取值范围[-1,1]
余弦距离=1-余弦相似度:取值范围[0,2]

二、余弦距离是否是一个严格定义的距离?

首先我们要知道距离的定义是什么:满足三条距离公理(正定性、对称性、三角不等式)。
(1)正定性:书中给的证明是证明余弦距离≥0,不太确定正定性是不是这个含义。
dist(A,B) = 1- cosθ = \frac{||A||_2||B||_2-AB}{||A||_2||B||_2}
因为||A||_2||B||_2-AB≥0,所以dist(A,B)≥0恒成立,满足正定性。
(2)对称性:
dist(A,B) = \frac{||A||_2||B||_2-AB}{||A||_2||B||_2} = \frac{||B||_2||A||_2-BA}{||B||_2||A||_2} =dist(B,A)
满足对称性。
(3)三角不等式:
余弦距离不满足三角不等式,下面给出反例:A=(1,0) B = (1,1) C = (0,1)
dist(A,B) = dist(B,C) =1- \frac{\sqrt{2}}{2}
dist(B,C) = 1
从而有
dist(A,B)+dist(B,C) = 2- \sqrt{2} ≤ 1=dist(A,C)
不满足三角不等式。
整理自:《百面机器学习》

上一篇 下一篇

猜你喜欢

热点阅读