N-gram模型和神经语言模型

2018-09-04  本文已影响0人  wenjian12

概率模型


N-gram 语言模型

可靠性与可区别性

OOV 问题

平滑处理 TODO

神经概率语言模型 (NPLM)

N-gram 神经语言模型

A Neural Probabilistic Language Model (Bengio, et al., 2003)

  1. 其中 c(w) 表示 w 的词向量
  2. 不同的神经语言模型中 context(w) 可能不同,比如 Word2Vec 中的 CBOW 模型

N-gram 神经语言模型的网络结构

原文的模型还考虑了投影层与输出层有有边相连的情形,因而会多一个权重矩阵,但本质上是一致的:

image.png
image.png

模型参数的规模与运算量

        - W: h * m(n-1) 的矩阵
        - p: h * 1      的矩阵
        - U: N * h    的矩阵
        - q: N * 1    的矩阵 

相比 N-gram 模型,NPLM 的优势

上一篇 下一篇

猜你喜欢

热点阅读