书房就是我的全世界数据科学家每天写500字

什么是条件随机场 CRF: Conditional Random

2018-12-09  本文已影响5人  不会停的蜗牛

Conditional Random Fields 条件随机场,是一种判别模型,可以用于预测序列数据,通过使用过去的上下文信息,使模型达到更好的预测效果。

定义:

CRF 是一个无向图模型,它的节点可以分为两个不相交的集合 观测集 X,输出集 Y,然后可以对 P(Y|X)进行建模。


判别模型 vs 生成模型:

判别模型:由数据直接学习决策函数 Y=f(X) 或者条件概率分布 P(Y|X),作为预测值。例如 k近邻,感知级,决策树,支持向量机等。

生成模型:先由数据学习联合概率密度分布 P(X,Y),然后求出条件概率分布 P(Y|X),作为预测值。例如朴素贝叶斯,隐马尔科夫模型等。


CRF 的应用:

CRF 可以对序列数据建模,所以在 NLP 领域有很多应用。例如 :

Parts-of-Speech tagging,这个任务依赖之前的单词,通过使用 feature functions ,可以用 CRF 来判别哪些单词对应哪个 POS。

Named Entity recognition,CRF 可用于预测多变量相互依赖的序列。

还可用于图片的 parts-recognition,基因预测等任务.


HMM 和 CRF 看起来很像:

它们的区别是:


学习资料:
https://en.wikipedia.org/wiki/Conditional_random_field
https://medium.com/ml2vec/overview-of-conditional-random-fields-68a2a20fa541
https://blog.csdn.net/zouxy09/article/details/8195017

上一篇下一篇

猜你喜欢

热点阅读