随记1：2

2018-09-05 本文已影响0人梦已归零7

K-Means

1.随机选取k个质心点

2.计算各个点到质心的距离

3.将点的类划分为离他最近的质心，形成K个cluster

4.根据分好类的cluster，在每一个cluster内重新计算质心（平均每个点的值）

5.重复2~4知道满足迭代次数或者误差小于指定的值。

1.随机选取K个质心的值

2.计算各个点到质心的距离

3.将点的类划分为离他最近的质心，形成K个cluster

4.根据分好类的cluster，在每个cluster内重新计算质心：（将中心点限制在当前的cluster所包含的的据点的集合中，也就是我们将从当前cluster中选取这样一个点——它到其他所有（当前cluster中的）点的距离之和最小）

4.1 计算cluster内所有样本点到其中一个样本点的曼哈顿距离和绝对误差

4.2 选出使cluster绝对误差最小的样本点作为质心点

5.重复迭代2~4步直到满足迭代次数或者误差小于指定的值

区别：k-means的质心是各个样本点的平均，可能是样本点中不存在的点。

k-medoids的质心一定是某个样本点的值。

k-means 和 k-medoids 之间的差异就类似于一个数据样本的均值 (mean) 和中位数 (median) 之间的差异：前者的取值范围可以是连续空间中的任意值，而后者只能在给样本给定的那些点里面选。

2018.9.5