【自然语言处理】
2018-07-20 本文已影响0人
安琪拉的小迷妹
一.如何学习词嵌入矩阵
主要是word embeding矩阵,通过训练来得到,能表示词语之间的相似度。
w2v,skip gram:用附近的一个词做x训练
负采样:解决skip gram算法中,softmax层复杂度高(遍历所有词库中的词)的问题,将多分类转化为2分类,复杂度由o(n)变成了o(k),其中n为词库中词语数,k为负采样的个数+1.
glove:用一个Xij来表示两个词语之间的相似度,构造一个平方损失函数,来对参数e和seita进行学习。最后seita取,e和seita的平均值








二.例子
