2021-02-02

2021-02-02  本文已影响0人  枯木嫩芽

1、完成采用3C训练集商品级问法的模型训练与知识库更新。

2、基于商品类目属性数据(来自勇哥)进行聚类划分品类,具体实施与数据如下:

1)总共的cid数为395条,属性特征数为1062个(特征非常稀疏,有些特征只有一两个cid才有)

2)对以上395条数据进行kmeans聚类,K值备选集合如下:

Ks = [50, 60, 70, 80, 90, 100, 120, 150, 160, 170, 180]

最终在70个类上Calinski-Harabasz系数最大,聚类效果较好。

上一篇 下一篇

猜你喜欢

热点阅读