距离度量

2017-04-23  本文已影响0人  ic_bbc

距离定义

Paste_Image.png
Paste_Image.png
Paste_Image.png

曼哈顿距离可以用来衡量一个十字路口开车到另外一个十字路口的距离;就像在曼哈顿开车一样,这也是曼哈顿距离的由来。


Paste_Image.png
Paste_Image.png
Paste_Image.png Paste_Image.png

马氏距离:


Paste_Image.png Paste_Image.png

马氏距离可以消除相关系的干扰,同时也消除了量纲的影响,量纲可以理解为一种线性变换。


Paste_Image.png
Paste_Image.png

夹角余弦通常用来衡量两个向量直接的相似性,值域为[-1,1]


Paste_Image.png

相似度和系数是两个互斥的量,此消彼长,所有可以用1-相似性来表示距离


Paste_Image.png Paste_Image.png Paste_Image.png

目前接触到的相关性基本可以理解为线性相关,这样相关系数高只能表示线性相关性高,而相关性低是独立性高,也就是正态性。


DTW 距离:

Paste_Image.png

信息熵

Paste_Image.png

总结

Paste_Image.png

补充知识点

1. 协方差矩阵

均值:描述的是样本集合的中间点
方差、标准差:描述的是样本集合的各个样本点到均值的平均距离,描述的是样本的离散程度。
协方差:度量两个随机变量相互关系,协方差定义如下:


Paste_Image.png

方差是一种特殊的协方差:

Paste_Image.png

协方差矩阵:是多个随机变量两两之间协方差的集合,形式如下:

Paste_Image.png
上一篇下一篇

猜你喜欢

热点阅读