关于无监督、聚类和主题模型

2020-02-11  本文已影响0人  Silv_Kim

Some references

1 吴恩达ML

Clustering

image.png

K-Means (usually two steps in each inner loop)

image.png

First step: Cluster assignments steps
Next: move cluster centroid to where close to the average of other dots

image.png
Optimization objective
image.png
distortion function

Random Initialization

随机选点
容易陷入局部最优 所以要多次kmeans
K值较小时random可以更好的最小化畸变函数而比较好地聚类
Choosing the number of K
更多的时候是自己设置,there isnt always a good answer elbow并不常用
image.png

2. 北理工ML

主题模型

发展历程
image.png
MK矩阵:每个词w 在 m行文档K列主题 的分布矩阵
image.png
吉布斯采样

3. 周志华ML

聚类

Prototype-based clustering

K-means


上一篇 下一篇

猜你喜欢

热点阅读