距离度量
2017-04-23 本文已影响0人
ic_bbc
距离定义
Paste_Image.pngPaste_Image.png
Paste_Image.png
曼哈顿距离可以用来衡量一个十字路口开车到另外一个十字路口的距离;就像在曼哈顿开车一样,这也是曼哈顿距离的由来。
Paste_Image.png
Paste_Image.png
Paste_Image.png Paste_Image.png
马氏距离:
Paste_Image.png Paste_Image.png
马氏距离可以消除相关系的干扰,同时也消除了量纲的影响,量纲可以理解为一种线性变换。
Paste_Image.png
Paste_Image.png
夹角余弦通常用来衡量两个向量直接的相似性,值域为[-1,1]
Paste_Image.png
相似度和系数是两个互斥的量,此消彼长,所有可以用1-相似性来表示距离
Paste_Image.png Paste_Image.png Paste_Image.png
目前接触到的相关性基本可以理解为线性相关,这样相关系数高只能表示线性相关性高,而相关性低是独立性高,也就是正态性。
DTW 距离:
Paste_Image.png信息熵
Paste_Image.png总结
Paste_Image.png补充知识点
1. 协方差矩阵
均值:描述的是样本集合的中间点
方差、标准差:描述的是样本集合的各个样本点到均值的平均距离,描述的是样本的离散程度。
协方差:度量两个随机变量相互关系,协方差定义如下:
Paste_Image.png
方差是一种特殊的协方差:
Paste_Image.png协方差矩阵:是多个随机变量两两之间协方差的集合,形式如下:
Paste_Image.png