说话者的识别是承认说话者的两种方式之一,另一种是说话者的验证。具体而言,说话者的识别是一项从男性或女性的话语样本中识别未知说话者的工作。这项工作可能相当困难(Dallasarra et al.2010;Hollien 2002),主要是因为:(1)频道或系统失真(电话带通、噪声、中断等),(2)说话者状态不佳(压力、伪装、恐惧、健康问题、情绪)和(3)个体不配合。另一方面,讲话者的验证涉及:(1)想要被认可的实验参与者,(2)只使用高质量的设备,(3)复杂的处理技术和(4)取得足够的讲话者话语参考样本。验证讲话者用于(1)允许某人进入安全区域,(2)通过电话开户存款或(3)识别宇宙飞船上或其他远程位置的人员。由于验证说话者不似识别说话者那样面临艰巨的挑战,如果可以建立有效的识别程序,那么验证方面的问题即可迎刃而解。(Hollien and Harnsberger 2010)
然而,已有充分的证据表明,通过话语识别个体是可能的。这个论断是基于一种假设,即说话者特定的特征源自个体的骨骼、生理机能和与运动控制相关的一些特性(Abbs,Gracco 1984),以及他们所使用的习惯性言语模式,加上社会、经济、地理和教育等因素。发育成熟水平、生理或身体状态、性别和智力高低对习性的培养也有一定影响(Hollien 2002)。显然,综合来看,在所有这些因素的影响之下,一个相当独特的言语和话语特征的集群得以形成。(Hecker 1971;Tsai and Wang 2006)相应地,这些集群也提供了一种可能性,即虽然一个个体的言语属性可能没有足够的强度和特性以区分其他说话者,但是一组结构化的特征能促使识别成功。(Hollien 2002;Hollien and Harnsberger 2010)这个概念是许多识别说话者方法的基础。其被分为耳识、听觉-感知和机器三个部分。(www.daowen.com)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。