机器学习10-信念贝叶斯分类器
2022-06-30 本文已影响0人
只是甲
一. 信念贝叶斯概述


二. 聚类


你可以把每一个变量都进行标记,有多少个不同的值,就有多少的维度,在空间内如果距离更近,则他们可以认为是同类,可以通过聚类算法标记出来。
2.1 聚类的应用场景:寻找优质客户

2.2 聚类应用场景:推荐系统

2.3 聚类应用场景:社区发现

2.4 聚类应用场景:生物进化树

2.5 聚类应用场景:孤立点的特殊意义

2.6 R的dist函数

2.7 数据中心化与标准化转换

三.层次聚类法

3.1 类与类之间距离计算的方法
- 最短距离法
- 最长距离法
- 中间距离法
- 类平均法
- 重心法
- 离差平方和法
R中的hclust()函数:

3.2 类的个数的确定

四. 动态聚类: K-means方法
K-means 比较容易搬到Hadoop 的MR上

4.1 R中的kmeans()函数

4.2 K-means算法优缺点

K均值对于球形的簇效果比较好,如果是下图所示的平面的,效果就不太理想

五. 基于有代表性的点的技术: K中心聚类法

K中心法的实现:PAM

六. 基于密度的方法: DBSCAN



若干概念

七. CLARA(大数据处理)

