性能度量

2019-04-09  本文已影响0人  dreampai

在无监督学习(unsupervised learning)中,训练样本的标记信息是未知的。

无监督学习的目标:通过对无标记训练样本的学习来揭露数据的内在性质以及规律。

聚类过程仅仅能自动形成簇结构,簇所对应的概念语义需要由使用者来提供。

聚类的作用:

希望同一簇的样本尽可能彼此相似,不同簇的样本之间尽可能不同。即:簇内相似度 intra-cluster similarity 高,且簇间相似度 inter-cluster similarity 低.

聚类的性能度量分两类:

外部指标

image.png

Jaccard系数

image.png

FM指数

image.png

Rand指数

image.png

ARI指数

image.png

内部指标

image.png

DB指数

image.png

Dunn指数

image.png

距离度量

image.png
image.png
上一篇下一篇

猜你喜欢

热点阅读