Word2vec bin文件转txt文件

2018-12-24  本文已影响0人  codefisher

深度学习模型训练时,常常需要下载pretrained embedding,而embedding保存的格式常有.bin和txt。

将.bin文件转为.txt文件。

dependencies:python gensim

from gensim.models.keyedvectors import KeyedVectors

model = KeyedVectors.load_word2vec_format('file.bin', binary=True)
model.save_word2vec_format('file.txt', binary=False)

将txt格式转为gensim格式:

word_vectors=KeyedVectors.load_word2vec_format('/path/to/fasttext/embeddings.txt', binary=False)
word_vectors.save('/path/to/converted') 
上一篇下一篇

猜你喜欢

热点阅读