(20)监督学习-标注问题-条件随机场
· 条件随机场(CRF)是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔科夫随机场。属于判别模型,其学习方法通常为极大似然估计。是无向图模型的一种。
那么什么是马尔科夫随机场呢。
设有联合概率分布P(Y),由无向图模型G=(V,E)表示,节点V表示随机变量,边e表示随机变量之间的依赖关系。如果联合概率分布P(Y)满足成对、局部或全局马尔可夫性,就称此联合概率分布为概率无向图模型或马尔科夫随机场。
成对马尔可夫性:给定所有其他变量,两个非邻接变量条件独立。
局部马尔可夫性:给定某变量的邻接变量,则该变量条件独立于其他变量。
局部马尔科夫性全局马尔可夫性:给定两个变量子集的分离集,则这两个变量子集条件独立。
全局马尔科夫性成对的、局部的、全局的马尔可夫性等价。
概率无向图模型的联合概率分布P(Y)可写作图中所有最大团C上的势函数的乘积形式(将概率无向图的联合概率分布表示为其最大团的随机变量的函数的乘积的形式,称为概率无向图的因子分解)。,其中,Z表示规范化因子,使得P(Y)的值在(0,1)之间。;势函数要求是严格正的,通常定义为指数函数。势函数。
无向图G中任何两个节点均有边连接节点子集称为团。若C是无向图G的一个团,并且不能再加进任何一个G的结点使其成为一个更大的团,则称此C为最大团。也就是极大团就是不能被其他团所包含的一个团。如图
无向图团:
{X2,X4},{X1,X2},{X3,X5},{x1,x3},{x2,x5},
{X2,X6},{X5,X6},{X2,X5,X6}
最大团:
{X2,X4},{X1,X2},{X3,X5},{x1,x3},{X2,X5,X6}