随记1:2

2018-09-05  本文已影响0人  梦已归零7


K-Means

1.随机选取k个质心点

2.计算各个点到质心的距离

3.将点的类划分为离他最近的质心,形成K个cluster

4.根据分好类的cluster,在每一个cluster内重新计算质心(平均每个点的值)

5.重复2~4知道满足迭代次数或者误差小于指定的值。

K-Medoids

1.随机选取K个质心的值

2.计算各个点到质心的距离

3.将点的类划分为离他最近的质心,形成K个cluster

4.根据分好类的cluster,在每个cluster内重新计算质心:(将中心点限制在当前的cluster所包含的的据点的集合中,也就是我们将从当前cluster中选取这样一个点——它到其他所有(当前cluster中的)点的距离之和最小)

            4.1 计算cluster内所有样本点到其中一个样本点的曼哈顿距离和绝对误差

            4.2  选出使cluster绝对误差最小的样本点作为质心点

5.重复迭代2~4步直到满足迭代次数或者误差小于指定的值

区别:k-means的质心是各个样本点的平均,可能是样本点中不存在的点。

           k-medoids的质心一定是某个样本点的值。

k-means 和 k-medoids 之间的差异就类似于一个数据样本的均值 (mean) 和中位数 (median) 之间的差异:前者的取值范围可以是连续空间中的任意值,而后者只能在给样本给定的那些点里面选。

 2018.9.5

上一篇 下一篇

猜你喜欢

热点阅读