【R语言 第2篇】K-means聚类分析流程

2016-08-01  本文已影响3941人  晟文刀

聚类算法是没用因变量的。
聚类算法有层次聚类、基于划分的聚类、两步聚类法、基于密度的聚类。

聚类方法的逻辑

客户细分是将全体客户划分为多个分组并刻画特征的过程,使得组内客户高度相似,组间客户差异明显。
基本逻辑:
步骤1:从N个观测和K各属性数据开始;
步骤2:计算N各观测两者之间的距离;
步骤3:将相离最近的观测聚为一类,距离远的分为不同类。最终达到组间的距离最大化,组间的距离最大化。

特别注意:

聚类分析前要对数据进行标准化(scale),然后做主成分分析(降维)。

K-means聚类示例

  • 得知当前文件位置
    getwd()

下篇将补上“主成分分析和因子分析”的实际操作。

上一篇下一篇

猜你喜欢

热点阅读