NGram prune

2019-01-07  本文已影响5人  期望最大化

Reference

https://blog.csdn.net/xmdxcsj/article/details/50321613
https://arxiv.org/pdf/cs/0006025.pdf

前置问题:

理解重点

示例如下,如果删除NGram 中的3gram:我 爱 你 ,那么整个模型概率发生变化的有:
p(你|我 爱)
bo(我 爱 w),所有以我 爱为历史词的NGram其backoff值都发生了变化。
bo(我 爱),我 爱backoff值也发生了变化。

裁剪流程

  1. 给定一个ppl相对变化的门限threshold
  2. 计算删除单独一条ngram,模型困惑度的相对变化
  3. 挑选出那些低于门限值的ngram,删除,然后重新计算回退权重。
上一篇下一篇

猜你喜欢

热点阅读