机器学习-概率图模型初探

2019-02-26  本文已影响8人  neo_ng

outline

数学基础

贝叶斯公式:

联概 = 条概*边概
条件概率 = 联合概率/边缘概率


贝叶斯公式.png

概率图模型(Probabilistic graphical model,PGM)是一类由图来表示变量相关关系的概率模型

在概率模型中,利用已知变量推测未知变量的分布称为"推断"
联概--> 条概

生成式模型直接对联合分布进行建模
判别式模型则对条件分布进行建模

概率图模型.png
从马尔可夫性说起
马尔可夫性.png

隐马尔科夫模型(Hidden Markov Model,HMM)

HMM的结构

HMM是结构最简单的动态贝叶斯网。

如下图所示为HMM的结构,HMM的变量可分为两组:

如上图所示,在任意时刻,x的取值仅依赖于y(x<--y,x由y确定);
下一刻的状态仅由当前状态决定,不依赖于以往的任何状态,由y(t-1)确定y(t),与其它状态无关
基于这种依赖关系的联合概率分布如下:


HMM-公式.png
确定一个HMM的三组参数

当确定这三组参数,可按如下过程产生观测变量x:


image.png
HMM模型有三个基本问题:
image.png
概率计算问题

条件随机场(Conditional Random Field,CRF)

CRF是一种判别式无向图模型
CRF的目标是构建条件概率模型P(y|x)


image.png

在现实应用中,最常用的是如下图的链式结构,“链式条件随机场”


image.png

与HMM相同,CRF也有类似的三个基本问题

主题模型(topic model)概述

topic model是一族生成式有向图模型。
主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出文字间的语义主题。
主题就是一个概念、一个方面。它表现为一系列相关的词语。主题就是词汇表上词语的条件概率分布 。与主题关系越密切的词语,它的条件概率越大,反之则越小。

image.png

主题模型训练推理的方法:

主题模型的优点:

<机器学习>第14章概率图模型-周志华
隐马尔科夫模型HMM的前向算法和后向算法

上一篇 下一篇

猜你喜欢

热点阅读