一、word2vec

2023-03-27  本文已影响0人  lizg

是什么

word2vec是继NNLM模型之后,为了专门训练词向量而产生的神经网络语言模型。

为什么

NNLM模型主要使预测词的概率最大,由此产生的参数矩阵是附带产生,而word2vec主要训练参数矩阵(即词向量),并不要求预测词的概率最大,前者主要目的是预测词,后者目的是参数矩阵。

怎么做

gensim的word2vec模型
code:


image.png image.png

优点

词向量大小降低,可以自定义
可以表示词之间的关联度

缺点

一词不多义

上一篇下一篇

猜你喜欢

热点阅读