5 聚类 - 性能度量

2019-01-18  本文已影响0人  shanshan302

外部指标 (要求数据集有标签)

image.png

内部指标 (针对无标签数据)

image.png

相对指标

轮廓系数描述的是 样本是否被正确分类的评分


image.png

轮廓系数可以用于确定k值


image.png image.png

评判分类效果


image.png

轮廓系数的缺点: 如双环形数据集,单连接和DBSCAN可以完美分割,但是得分却很低,因而轮廓系数更适合用于紧凑的数据聚类


image.png

聚类算法评价指标

上一篇 下一篇

猜你喜欢

热点阅读