理论教育 隐马尔可夫模型在识别问题中的应用

隐马尔可夫模型在识别问题中的应用

时间:2023-06-15 理论教育 版权反馈
【摘要】:马尔可夫模型是表示序列可能出现的一种方法。在识别问题中,输入的是观察序列,而观察序列是由信号处理抽取得到的特征。自20世纪80年代以来,HMM已成功地用于语音识别、行为识别、文字识别和移动通信核心技术“多用户的检测”。隐马尔可夫模型建立了单词特征及一个特征出现在另一个特征之后的概率模型,可用于状态不直接可见的识别问题。

隐马尔可夫模型在识别问题中的应用

声源被简化为特征集合后,下一个任务是识别这些特征所代表的单词,本节重点关注单个单词的识别。识别系统的输入是特征序列,而单词对应于字母序。如果要分析一个大的单词库,就要识别某种字母序列比其他字母序列更有可能发生的模式。例如:字母y跟在ph后面出现的概率要大于跟在t后面出现的概率。马尔可夫模型是表示序列可能出现的一种方法。图5-5是马尔可夫模型的一个例子。模型中有4个状态,分别标记为1~4。边代表从一个状态到另一个状态的转移,每条边上有一个权值,表示状态转移的概率。下面的值是观察权值,每个状态可以发出它下面列出的符号之一,权值是概率,显示发出每个符号的相对频率。一个符号可以被多个状态发出。在图5-5中,状态4不会再转向其他状态,被认为是终止状态。对于任何状态,只能顺着箭头的方向进行状态转移,而从一个状态发出的所有箭头上的概率之和为1。状态可以代表组成单词的字母,这里只讨论通常的状态。

图5-5中的模型可以看作一个序列生成器。例如,若从状态1开始,在状态4结束,下面是可能生成的一些序列:

图5-5 一个隐马尔口可夫模型

任何序列生成的概率都可以计算出来,生成某个序列的概率就是生成该序列路径上的所有概率之积。

例如,对于序列“1 2 3 3 4”,路径集合为:

概率为:

某些序列比其他序列生成的可能性更高。马尔可夫模型的关键假设是下一个状态只取决于当前状态。(www.daowen.com)

在识别问题中,输入的是观察序列,而观察序列是由信号处理抽取得到的特征。不同的单词有不同的转移状态和概率,识别器的任务是确定哪一个单词模型是最可能的。因此,需要一种实现抽取路径的方法。

隐马尔可夫模型(Hidden Markov Model,HMM)是一种统计分析模型,创立于20世纪70年代。HMM的状态不能直接观察到,但能通过观测向量序列观察到。自20世纪80年代以来,HMM已成功地用于语音识别、行为识别、文字识别和移动通信核心技术“多用户的检测”。隐马尔可夫模型建立了单词特征及一个特征出现在另一个特征之后的概率模型,可用于状态不直接可见的识别问题。

习题

(1)什么是自然语言理解?自然语言理解过程有哪些层次?各层次的功能如何?

(2)什么是词法分析?

(3)什么是句法分析?其主要任务是什么?

(4)给定文法如下:

给出对句子the boy hits the doy进行分析的句法分析树。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈