一、word2vec
2023-03-27 本文已影响0人
lizg
是什么
word2vec是继NNLM模型之后,为了专门训练词向量而产生的神经网络语言模型。
为什么
NNLM模型主要使预测词的概率最大,由此产生的参数矩阵是附带产生,而word2vec主要训练参数矩阵(即词向量),并不要求预测词的概率最大,前者主要目的是预测词,后者目的是参数矩阵。
怎么做
gensim的word2vec模型
code:
image.png image.png
优点
词向量大小降低,可以自定义
可以表示词之间的关联度
缺点
一词不多义