gensim word2vec 训练外部语料
2017-06-14 本文已影响501人
freedomzll
随笔1、打开Anoconda自带的Spyder,这是一个可以交互的调试工具
2、训练外部文本语料集:
model = Word2Vec(LineSentence('E:\\spyder\\text8'), size=400, window=5, min_count=5)
图13、保存模型:
model.save('E:\\spyder\\text8.model')
4、保存成TXT文本:
model.wv.save_word2vec_format(r'e:\spyder\text8Vec.txt', binary=False)
5、等到使用的时候再将训练好的模型加载进来(模型的读取):
model = Word2Vec.load('E:\\spyder\\text8.model')
6、训练好的语料模型加载进来后就可以进行预测了:
model.most_similar("girl")
model["girl"]
model.similarity("girl","woman")