机器学习

K均值聚类方法原理

2018-03-27  本文已影响7人  灵妍

对于这类算法,两个关键点是如何找类型数,以及如何找确定初始点。
找类型数我们是通过类型数对于组件距离加和的曲线变化率,来确定的。初始点为了避免初始陷阱,我们是通过一种算法。
K均值的步骤如下:
1、确定类型数
2、随机抽取K个点(可以不是数据点)
3、依据欧式距离判断所属类别(中心点连线画出中位线)
4、找出没类的中心点,重新定义类别,如果有数据点重定了类型,就继续第四步,如果所有数据对于新的中心点都划分正确就结束。
最后,我们可以通过画出类型数与组间距离的二维图来确定合适的类型数。
其实,K均值说白了就是将数据的特征分布可视化,通过欧式距离解决人眼无法区分的类别分类,将特征相近的分为一类。

1、K平均聚类法原理
用数字语言代替直觉.PNG 结束.PNG 刷新类别.PNG 继续划分.PNG 重新划分.PNG 找到新的中心点.PNG 垂直平分线确定分类.PNG 选择随机初始点.PNG 确定K.PNG K-Means步骤.PNG K-Means是什么.PNG
2、K-Means随机初始化陷阱
updatedforsolving.PNG imeffectatclassify.PNG wrongrandompoint.PNG problempoint.PNG correctrandompoint.PNG
3、K-Means选择类的个数
theelbowmethod(速率).PNG functionWCSSwithnumberofcluster.PNG WCSSattwo.PNG WCSSatone.PNG WCSSatthree.PNG withinclustersquaredsum.PNG bestatintuitive.PNG
上一篇下一篇

猜你喜欢

热点阅读