R语言-聚类分析
2020-06-06 本文已影响0人
科研小徐
聚类分析
把分类对象按照一定规则分成若干类,这些类是根据数据的特征决定的。在同一类中的对象趋向于彼此相似,而在不同类中对象趋向于不同。
聚类分析的步骤:
1.定义每个观测值为一类。
2.计算每类和其他各类的距离
3.把距离最短的两类合并成一类这样类数就减少一个
4.重复2、3指导包含所有观测值的类合并成单个的类为止
a=read.table("BMI.txt",header=T,sep="\t",row.names=1)
View(a)
#因子为负数为删除某一行某一列
data=a[,-3]
View(data)
#计算样本间距离dist(数据框,method=“距离”)默认为欧氏距离
d=dist(data)
d
sqrt(sum((data[1,]-data[2,])^2))
#聚类hclust(计算距离矩阵的数据框,method="聚类方法")默认为complete全联动
h=hclust(d)
h
#画出聚类结果的图
plot(h)
#结果分类。rect.hclust(聚类结果,k=数值) K=数值,为分几类
rect.hclust(h,k=2)
#剪出两类
cutree(h,k=2)
#也可以通过高度剪出下面的分类
cutree(h,h=20)
计算结果
画出的聚类图
rect.hclust分类后
剪类结果,告诉每个人属于哪类标号