python库

gensim 词向量工具

2017-12-07  本文已影响17人  梁新彦

web
使用python版的wrod2vec工具gensim来训练词向量。词向量维数设置为100,训练出来的词向量词典大小为38053.gensim训练词向量的代码特别简单:

model = gensim.models.Word2Vec(sentences, size=100, 
        window=5, min_count=3, sg=1,  max_vocab_size=vocabulary_size)
model.wv.save_word2vec_format(wrod2vec,
                 "word2vec/vocabulary",binary=False)
上一篇下一篇

猜你喜欢

热点阅读