基于隐马尔可夫模型的人脸识别算法解析

更新时间：2025-10-15 理论教育 版权反馈

【摘要】：近年来，基于隐马尔可夫模型的方法成为人脸识别领域较为主要的研究内容。基于隐马尔可夫模型的人脸识别方法可在一定程度上提升人脸识别准确率。隐马尔可夫过程由可观测的观察序列和不可观测的状态过程构成。3）HMM模型的训练实际上，隐马尔可夫模型是一个包含五个状态的左右型人脸模型。

隐马尔可夫模型（hidden Markov model，HMM）是用来描述一个含有隐性未知参数，即状态的马尔可夫过程。其难点是从已观察的数据中确定该过程的隐含参数，然后利用这些参数来做进一步的分析与挖掘。对于任意一张人脸图像而言，其像素值处于可观测状态，而其隐含状态不能根据像素值观察而得到，因此需要一个随机过程去描述隐含的状态，即隐马尔可夫模型［57］。

近年来，基于隐马尔可夫模型的方法成为人脸识别领域较为主要的研究内容。基于隐马尔可夫模型的人脸识别方法可在一定程度上提升人脸识别准确率。

1.隐马尔可夫模型

隐马尔可夫模型是由两个相互关联的随机过程构成。其中一个是由内在的有限个状态的马尔可夫链来描述状态可能的变化，另一个随机过程描述观察值和所对应的状态之间的统计学关系。因为在状态转移过程中，观察者看到的只是与每一状态相关联的随机函数的输出值，观察不到具体的马尔可夫链的状态，故称之为隐马尔可夫模型。

1）隐马尔可夫模型的基本参数

隐马尔可夫模型的本质是一种用参数表示、用于描述随机过程统计特性的概率模型。隐马尔可夫过程由可观测的观察序列和不可观测的状态过程构成。隐马尔可夫模型可以表示为

其中，N为状态集合S=｛S1，S2，…，SN｝中的隐马尔可夫模型的状态数，假定t时刻的状态为qt，qt∈S，1＜t＜T，T为观察序列的长度；M为观察集合V=｛V1，V2，…，VN｝中状态所对应的观察数目；A为状态转移概率分布或转移矩阵，A=｛aij｝，aij=p（qt=Sj|qt-1=Si），1＜i＜N，1＜j＜N；B为观察概率矩阵或称之为发射矩阵，B=｛bij｝，bij=p（Ot=Vk|St=qj）；Π为初始状态概率分布矢量，Π=｛πi｝，πi=p（qi=Si），1＜i＜N。

2）参数计算和模型的建立

HMM模型建立之后，有三个基本的问题需要解决，即①给定观察序列O=o1，o2，…，or，以及模型参数λ=（N，M，A，B，Π），评估给定模型产生观察序列的概率p（O|λ）的问题；②给定观察序列O=o1，o2，…，or，以及模型参数λ=（N，M，A，B，Π），为了更好地解释观察序列O=o1，o2，…，or，如何选择一个最佳序列Q=q1，q2，…，qT的问题；③如何调整模型参数λ=（N，M，A，B，Π），使得p（O|λ）达到最大的问题。

在以上三个问题解决以后，就可以得到参数最优的模型，用于实际人脸识别。其中，第一个问题是对给定模型产生观察序列的概率进行估计，即评价模型与观察序列的匹配程度，给定一个未知人脸，计算哪个人脸模型经过状态转移生成该人脸模型的概率最大，将该未知人脸分到哪一类人脸当中。第二个是计算给定模型参数和观察序列后，生成哪种状态转移序列的可能性最大，通常需要制订一个优化准则，当满足优化准则条件后就可以认定该状态转移序列的可能性最大。第三个是对模型参数的优化问题，给定一组观察值序列后，需要不断调整优化参数λ，使得观察值出现的概率最大。

基于HMM的人脸识别就是要根据一组相同人的不同人脸图像，通过学习，给每一个人脸建立一个与之相对应的模型，这实际上是一个参数估计问题。

问题①的评估问题，采用前向后向算法来解决。

定义前向变量αt（i）为

定义后向变量βt（i）为

前向算法步骤：

a.初始化αt（i）

b.递推

pagenumber_ebook=214,pagenumber_book=205

c.结束

pagenumber_ebook=214,pagenumber_book=205

后向算法步骤：

a.初始化βt（i）

b.递推

pagenumber_ebook=215,pagenumber_book=206

定义

表示沿着一条单路径计算前i个观察值在时刻t结束于Si状态时的最高值。那么可以推出关系式：

再用一个二维阵列｛ψt（j），t=1，2，…，T，j=1，2，…，N｝来跟踪记载δt（j）在推导过程中的最佳路径。

解决问题②的算法步骤：

a.初始化

pagenumber_ebook=215,pagenumber_book=206

b.递推

pagenumber_ebook=215,pagenumber_book=206

c.结束

pagenumber_ebook=215,pagenumber_book=206

d.路径回溯（最佳状态链的确定）

算法的结果不仅给观察序列O确定了一个最佳状态链，而且可以同时求出模型λ产生观察序列O的概率p（O|λ）。由此得到的最佳状态链也确定了观察序列和各个状态之间最可能的对应关系，这种对应关系也称为对观察序列进行了分割。

如何调整模型参数λ=（N，M，A，B，Π），使p（O|λ）最大，这就是对模型参数的优化问题。受模型的训练样本个数和训练次数的限制，观察序列的长度往往也受到限制，因此不可能得到最优的参数估计值，而只能用一种估计最大化的算法来获得局部最优解。

定义1：γt（i）为给定HMM模型和观察序列在t时刻处于状态Si的概率，则