余弦相似度

2019-08-27  本文已影响0人  wzNote

1 余弦相似度

余弦相似度是通过测量两个向量之间夹角的余弦值来度量它们之间的相似度的,该结果与向量的长度无关,仅仅与向量的指向有关。

二维空间中,两个向量的点积为:
\vec a \cdot \vec b = ||\vec a||||\vec b||\cos \theta
给定两个n维向量,A和B,其余弦相似度为:
\cos \theta = \frac{A \cdot B}{||A||||B||}=\frac{\sum_{i=1}^{n}{A_i} \times {B_i}}{\sqrt{\sum_{i=1}^{n}(A_i)^2} \times \sqrt{\sum_{i=1}^{n}(B_i)^2}}

2 余弦距离

余弦距离 = 1 - 余弦相似度
余弦相似度的取值范围是[-1,1],余弦距离的取值范围是[0,2]
余弦距离不是严格意义上定义的距离,但是他可以有效的体现特征向量在方向上的相对差异

上一篇下一篇

猜你喜欢

热点阅读