2021-02-02
2021-02-02 本文已影响0人
枯木嫩芽
1、完成采用3C训练集商品级问法的模型训练与知识库更新。
2、基于商品类目属性数据(来自勇哥)进行聚类划分品类,具体实施与数据如下:
1)总共的cid数为395条,属性特征数为1062个(特征非常稀疏,有些特征只有一两个cid才有)
2)对以上395条数据进行kmeans聚类,K值备选集合如下:
Ks = [50, 60, 70, 80, 90, 100, 120, 150, 160, 170, 180]
最终在70个类上Calinski-Harabasz系数最大,聚类效果较好。