HMM隐马尔科夫模型

  1. 写在前面

隐马尔科夫模型,简称HMM(Hidden Markov Model),是一种基于几率的统计分析模型,用来描述一个系统隐性状态的转移和隐性状态的表现几率。 算法

本文适用于对HMM感兴趣的入门读者,为了让文章更加通俗易懂,我会多阐述数学思想,尽量撇开公式,撇开推导。 spa

  1. 从掷骰子提及

假设我手里有三个不一样的骰子: 3d

a) 第一个骰子是咱们日常见的骰子(称这个骰子为D6),6个面,每一个面(1,2,3,4,5,6)出现的几率是1/6. blog

b) 第二个骰子是个四面体(称这个骰子为D4),每一个面(1,2,3,4)出现的几率是1/4. 数学

c)第三个骰子有八个面(称这个骰子为D8),每一个面(1,2,3,4,5,6,7,8)出现的几率是1/8. it

如今开始掷骰子: io

挑骰子:从三个骰子里挑一个(挑到每个骰子的几率都是1/3) 入门

③ 掷骰子:将获得一个数字(1,2,3,4,5,6,7,8中的一个) bfc

不停的重复上述过程,咱们会获得一串数字,例如咱们可能获得这么一串数字(掷骰子10次): transition

咱们称这串数字叫作可见状态链。

在隐马尔科夫模型中,不只仅有这么一串可见状态链,还有一串隐含状态链。在这个例子里,这串隐含状态链就是你用的骰子的序列。好比,隐含状态链有多是:

通常来讲,HMM中说到的马尔科夫链实际上是指隐含状态链,由于隐含状态(骰子)之间存在转换几率(transition probability)。

在这个例子里,D6的下一个状态是D4,D6,D8的几率都是1/3。D4的下一个状态是D4,D6D,D8的几率都是1/3,D8的下一个状态是D4,D6,D8的转换几率也是1/3.咱们其实能够随意设定转换几率的,好比咱们能够这样定义:D6后面不能接D4,D6后面是D6的几率是0.9,是D8的几率是0.1。这样就是一个新的HMM。

一样的,尽管可见状态直接没有转换几率,可是隐含状态和可见状态之间有一个几率叫作输出几率(emission probability)。就咱们的例子来讲,六面骰子(D6)产生1的输出几率是1/6;产生2,3,4,5,6的几率也都是1/6。咱们一样能够对输出几率进行其余的定义。好比,我有一个被赌场动过手脚的六面骰子,掷出来是1的几率更大,是1/2,掷出2,3,4,5,6的几率是1/10.

其实对于HMM来讲,若是提早知道全部隐含状态之间的转换几率和全部隐含状态到全部可见状态的输出几率,作模拟是至关容易的。但在实际运用中,每每会缺失一部分信息:有时候你知道骰子有几种,每种骰子是什么,可是不知道掷出来的骰子序列;有时候你知道骰子序列,剩下的什么都不知道。如何应用算法去估计这些缺失的信息,就成了一个颇有研究价值的问题。这些算法我会在下面详细讲。

和HMM模型相关的算法主要分为三类,分别解决三种问题:

知道骰子有几种(隐含状态数量),每种骰子是什么(转换几率),根据掷骰子掷出来的结果(可见状态链),我想知道每次掷出来的都是哪一种骰子(隐含状态链)。这个问题,在语音识别领域,叫作解码问题。这个问题其实有两种解法,会给出两个不一样的答案。每一个答案都对,只不过这些答案的意义不同。第一种解法求最大似然状态路径,说通俗点,就是我求一串骰子序列,这串骰子序列产生观测结果的几率最大。第二种解法,就不是求骰子序列了,而是求每次掷出的骰子分别是某种骰子的几率。好比说我看到结果后,我能够球的第一次掷骰子是D4的几率是0.5,D6的几率是0.3,D8的几率是0.2.第一种解法我会在下面说到,可是第二种解法就不写在这里了。

 

仍是知道骰子有几种(隐含状态数量),每种骰子是什么(转换几率),根据掷骰子掷出的结果(可见状态链),我想知道掷出这个结果的几率。看似这个问题意义不大,由于你掷出来的结果不少时候都对应了一个比较大的几率。问这个问题的目的,实际上是检测观察到的结果和已知的模型是否吻合。若是不少次结果都对应了比较小的几率,那么就说明咱们已知的模型颇有多是错的,有人偷偷把咱们的骰子给换了。

 

知道骰子有几种(隐含状态数量),不知道每种骰子是什么(转换几率),观测到不少次掷骰子的结果(可见状态链),我想反推出每种骰子是什么(转换几率)。这个问题很重要,由于这是最多见的状况。不少时候咱们只有可见结果,不知道HMM模型里的参数,咱们须要从可见结果估计出这些参数,这是建模的一个必要步骤。

 

  1. 一个简答问题

其实这个问题使用价值不高。因为对下面较难的问题有帮助,因此在这里先提一下。

知道骰子有几种,每种筛子是什么,每次掷的都是什么骰子,给出一串数字序列,

求产生这个序列的几率。

解法无非就是几率相乘:

破解骰子序列

这里我说的是第一种解法,解最大似然路径问题。

举例来讲,我知道我有三个骰子,六面骰,四面骰,八面骰。我也知道我掷了十次的结果(1,6,3,5,2,7,3,5,2,4),我不知道每次用了哪一种骰子,我想知道最有可能的骰子序列。

其实最简单而暴力的方法就是穷举全部可能的骰子序列,而后依照第零个问题的解法把每一个序列对应的几率算出来。而后咱们从里面把对应的最大几率的序列挑出来就好了。若是马尔科夫链不长,固然可行,若是马尔科夫链长的话,穷举的数量太大,就很难完成了。

另外一种颇有名的算法叫作Viterbi algorithm,要理解这个算法,咱们先看几个简单的例子。

首先,若是咱们只掷一次骰子:

看到结果为1,对应的最大几率骰子序列就是D4,由于D4产生1的几率是1/4,高于1/6和1/8。

把这个状况拓展,咱们掷两次骰子:

结果为1,6.这时问题变得复杂起来,咱们要计算三个值,分别是第二个骰子是D6,D4,D8的最大几率,显然要取得最大几率,第一个骰子必须是D4。这时,第二个骰子取到D6的最大几率是

一样的,咱们能够计算第二个骰子是D4或D8时的最大几率。咱们发现,第二个骰子取到D6的几率最大。而使这个几率最大时,第一个筛子为D4。因此最大几率骰子序列就是D4D6。

继续拓展,咱们掷三次骰子:

一样,咱们计算第三个骰子分别是D6,D4,D8的最大几率。咱们再次发现,要取到最大几率,第二个骰子必须为D6。这时,第三个骰子取到D4的最大几率是

同上,咱们能够计算第三个骰子是D6或D8时的最大几率。咱们发现,第三个骰子取到D4的几率最大。而使这个几率最大时,第二个骰子为D6,第一个骰子为D4。因此最大几率骰子序列就是D4 D6 D4。

写到这里,你们应该看出点规律了,这其实就是几率DP问题(Dynamic Programming with Probability)。既然掷骰子一二三次能够算,掷多少次均可以以此类推。咱们发现,咱们要求最大几率骰子序列时要作这么几件事情:

首先,无论序列多长,要从序列长度为1算起,算序列长度为1时取到每一个骰子的最大几率。

而后,逐渐增长长度,每增长一次长度,从新算一遍在这个长度下最后一个位置取到每一个骰子的最大几率。由于上一个长度下的取到每一个骰子的最大几率都算过了,从新计算的话其实不难。当咱们算到最后一位时,就知道最后一位是哪一个骰子的几率最大了。

最后,咱们把对应这个最大几率的序列从后往前推出来

谁动了个人骰子

好比说你怀疑本身的六面骰被赌场动过手脚了,有可能被换成另外一种六面骰,这种六面骰掷出来是1的几率更大,是1/2,掷出来是2,3,4,5,6的几率是1/10.你怎么办?答案很简单,算一算正常的三个骰子掷出一段序列的几率,再算一算不正常的六面骰和另外两个正常骰子掷出这段序列的几率。若是前者比后者小,你就要当心了。

好比说掷骰子的结果是:

要算出正常的三个骰子掷出这个结果的几率,其实就是将全部可能状况的几率进行加和计算。一样的,简单而暴力的方法就是把穷举全部的骰子序列,仍是计算每一个骰子序列对应的几率,可是这回,咱们不挑最大值了,而是把全部算出来的几率相加,获得的总几率就是咱们要求的结果。这个方法依然不能应用于太长的骰子序列(马尔科夫链)。

咱们会应用和前一个问题相似的解法,只不过前一个问题关心的是几率最大值,这个问题关心的是几率之和。解决这个问题的算法叫作前向算法(forward algorithm)。

首先,若是咱们只掷一次骰子:

看到结果为1,产生这个结果的总几率能够按照以下计算,总几率是0.18:

把这个状况拓展,咱们掷两次骰子:

看到结果为1,6.产生这个结果的总几率能够按照以下计算,总几率为0.05:

一样的,咱们一步一步的算,有多长算多长,再长的马尔可夫链总能算出来的。用一样的方法,也能够算出不正常的六面骰和另外两个正常骰子掷出这段序列的几率,而后咱们比较一下这两个几率大小,就能知道你的骰子是否是被人换了。

 

原文连接:https://www.zhihu.com/question/20962240

相关文章
相关标签/搜索