2.1.3 隐马尔科夫HMM

摘要

本篇文章笔记总结来自网络和书本,引用部分都有来源,内容主要介绍隐马尔科夫HMM相关实际应用搞得入门例子,很简单,但是能说明隐马尔科夫HMM的原理相关。

文章同步于: 我的gitbook

HMM(隐马尔可夫模型)

隐马尔可夫模型是一种统计模型,用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。

是在被建模的系统被认为是一个马尔可夫过程与未观测到的(隐藏的)的状态的统计马尔可夫模型。

本文简述的是离散情况下的隐马尔可夫模型.

一、贝叶斯公式

定义:假设以硬币的例子,从5角和1元的一堆硬币中,随意取出一枚硬币,然后然我们猜这枚硬币是5角还是1元。假设允许我们称这枚硬币的重量x(单位:g),(但是不允许我们直接看硬币,一般1元是比5角重的)。现在应考察在一直这枚硬币的重量x的情况下硬币属于各类(5角还是一元)的概率,分别记P(ω1x)P(\omega_{1}|x),(知重量为x时,是5角的概率),P(ω2x)P(\omega_{2}|x), (知重量为x时,是一元的概率),这种概率成为后验概率(我们需要求的)。这时的决策为:如果P(ω1x)>P(ω2x)P(\omega_{1}|x)>P(\omega_{2}|x),则xϵω1x \epsilon \omega_{1}; 反之,则xϵω2x \epsilon \omega_{2}

  • 最终我们要的就是这个决策。

概率论中的贝叶斯公式:

P(ωix)=p(x,ωi)p(ωi)=pωiP(ωi)p(x),i=1,2P(\omega_{i}|x)=\frac{p(x,\omega_{i})}{p(\omega_{i})}=\frac{p|\omega_{i}P(\omega_{i})}{p(x)} ,i=1,2

分布

表示

xϵ{ω1,ω2}x \epsilon \left \{ \omega_{1},\omega_{2} \right \}

类条件概率:

p(xωi)p(x\mid \omega_{i})

表示得到硬币结果是ωi\omega_{i}条件下,得到x的概率密度

后验概率:

P(ωix)P(\omega_{i}\mid x)

在重量为x,的条件下,得到是哪种硬币(5/1)的概率

先验概率:

P(ωi)P(\omega_{i})

根据之前的经验,得到5角和1元各自取得的概率

硬币重量概率密度函数:

p(x)p(x)

硬币重量的概率密度函数

联合概率密度:

p(x,ωi)p(x,\omega_{i})

在重量不同条件下,每种情况对应的取得不同硬币结果的联合概率

P(QiO)=P(O,Qi)P(O)=P(OQi)P(Q)P(O)P(Q_{i}|O)=\frac{P(O,Q_{i})}{P(O)}=\frac{P(O|Q_{i})P(Q)}{P(O)}
P(QiO)=P(O,Qi)P(O)=P(OQi)P(Q)P(O)P(Q_{i}|O)=\frac{P(O,Q_{i})}{P(O)}=\frac{P(O|Q_{i})P(Q)}{P(O)}

P(QiO)P(Q_{i}|O) ,后验概率,P(O,Qi)P(O,Q_{i}) ,表示O与Q的联合概率密度;P(O)表示两类所有的概率密度; P(Q{i})是先验概率;$$P(O|Q{i})$$是第i类状态随机序列的类条件概率密度

贝叶斯决策:在类条件概率密度和鲜艳概率已知(或可估计)的情况下,通过贝叶斯公式比较样本属于两类的后验概率,将类别决策为后验概率大的一类,这样做的目的是为了使总体错误率最小。

一条隐藏的马尔可夫链生成的 状态随机序列 (State sequence, 图中的白色节点) Q=(q1,q2,.....,qT)Q=(q_{1},q_{2},.....,q_{T})不可观测的,并记所有可能状态的集合为S=S1,S2,.....,SNS={S_{1},S_{2},.....,S_{N}};由它们产生一个可观测的观测随机序列(observation sequence,图示的深色节点)O=(o1,o2,......,oT)O=(o_{1},o_{2},......,o_{T}), 并记所有可能观测的集合为V=v1,v2,......,vMV={v_{1},v_{2},......,v_{M}}

序列的值可以看作是随时刻产生的,每个时刻对应着序列的一个值。所以HMM是个双重随机过程(doubly embedded stochastic process),一个是状态转移,另一个是由状态释放出观测值。在序列标注(Sequence labelling)任务中,模型就是需要对状态序列进行标注。

Last updated