NER

关于HMM和CRF

2020-04-11  本文已影响0人  全村希望gone

前言

看了一下午HMM和CRF,还是没太理解里面的知识,大概有以下认知:

HMM到CRF的过程

HMM和朴素贝叶斯关系密切,下图展示了如何从朴素贝叶斯到HMM[1]。
朴素贝叶斯是以贝叶斯定理为基础并且假设特征之间相互独立的方法(所谓的特征就是输入向量x中的各个元素)。由假设①,可以得到公式②,因为③,所以要改进朴素贝叶斯让其适用于序列预测,在④和⑤的情况下,可以得到公式⑥。


④的序列元素之间的独立性假设使得模型不符合实际,所以引入转移概率——前一时刻的状态转移到当前状态的概率。由假设⑦可得公式⑧ 但是⑦中的假设也并不合理,因为观察序列由多个相互作用的特征等决定,又引出条件随机场(这里跳过了最大熵HMM,详见[2])。条件随机场中有很常见的线性条件随机场,如果特征函数仅仅依靠当前单词的标签和它前面的单词的标签对标注序列进行评判,这样建立的CRF也叫作线性链CRF(By restricting our features to depend on only the current and previous labels, rather than arbitrary labels throughout the sentence, I’m actually building the special case of a linear-chain CRF.[4])。我平时用到的都是线性CRF。

公式

总结

结尾

花了两天下午看HMM和CRF,虽然还是云里雾里,但是还算有一丢丢收获,之后就要看HMM和CRF如何训练和预测的了,把其中的算法和公式都搞清楚。

参考资料

[1] 条件随机场(CRF)和隐马尔科夫模型(HMM)最大区别在哪里?CRF的全局最优体现在哪里:尔总的马甲的回答
[2] HMM ,MHMM,CRF 优缺点与区别
[3] 如何用简单易懂的例子解释条件随机场(CRF)模型?它和HMM有什么区别?:工程师milter的回答
[4] Introduction to Conditional Random Fields

上一篇下一篇

猜你喜欢

热点阅读