possible work 2019-07-15 本文已影响0人 writ 1、清洗数据,主要是格式抓换,编码转换。 2、文本分类,主要用fasttext。 3、关键词抽取,主要靠词库。 4、相似度排序,用word2vec。 5、上线,写完接口,然后发布soap服务。