新年快乐呀

2020-01-25 本文已影响0人 _aLIEz

祝大家新年快乐，身体健康，事业有成！
新的一年要继续学习呀

K均值算法（K-means）聚类
关键词：K个种子，均值
聚类的概念：一种无监督的学习，事先不知道类别，自动将相似的对象归到同一个簇中

K-Means步骤总结
1、从数据中选择k个对象作为初始聚类中心;
2、计算每个聚类对象到聚类中心的距离来划分；
3、再次计算每个聚类中心
4、计算标准测度函数，直到达到最大迭代次数，则停止，否则，继续操作。
5、确定最优的聚类中心

from sklearn.cluster import KMeans
  
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
from sklearn.datasets import make_blobs
  
#生成样本点
X_train,y_train = make_blobs(n_samples=300,centers=4,cluster_std=  0.6, random_state = 9)

# 建立模型
kmeans = KMeans(n_clusters=4)
kmeans.fit(X_train)
y_ = kmeans.predict(X_train)

#画图
plt.figure(figsize = (12,8))
centers = kmeans.cluster_centers_
plt.scatter(X_train[:,0],X_train[:,1],c = y_)
plt.scatter(centers[:,0],centers[:,1],c = 'r',s = 100,alpha = 0.4)

新年快乐呀

猜你喜欢

热点阅读