如上所述,当许多开发人员构建一个过程时,他们只是将它投入使用,然后再试图找出它是如何工作以及为什么不工作。这种类型的方法对于验证系统没有什么作用,或者就此而言,其(需要)提供目标问题的负责任的解决方案。相反,有必要通过实验室实验和实地实验(图6-10)来确定该方法的合理性。
图6-15
多年来,对半自动语音识别进行评估的过程我们可以做出如下总结(见图6-15):首先,将未知话语者的样本建立为指示对象(U1),然后将其与第二个不同的话语样本(U2)进行比较,该分析应导致匹配,因为已知U1和U2是相同的说话者。然后,添加已知的声音(K)和对比者,并继续分析。当是同一个话语者时,未知者也应该与指示对象匹配。此外,没有一个对比者应该与指示对象相匹配,因为它们是不同话语者的声音。该过程允许进行K指示比较,即匹配或不匹配(U=K或U≠K)。接下来,整个过程会被重复,但是对于U,K和所有F,仍然有不同的样本。但是请注意,它们都被以相同的顺序保存。然后组合这三个求和以用于同种类型的更多的鲁棒性分析。(www.daowen.com)
表6-1 20世纪90年代所进行的半自动语言次别实验的结果
几个半自动语音识别实验的结果可以在表6-1中找到。第一个(1988年)涉及大量受试者的高保真样本。没有一个个体向量可以确保100%的正确识别。该项目的第二部分(未显示出)旨在测试在话语者不是未知的情况下,半自动语音识别系统能够消除已知说话者这一命题。这样做的正确率为98.6%。第二组实验(1993年)涉及单独对高保真、噪声和电话通带进行复制。在这里,向量的升级导致所有的条件都得到了显著改善。接下来,1993年实验提供了正确的识别,其矢量在所有条件下都明显更高,正确的识别水平在所有循环总和中达到了100%。最后,更新的现场研究(2009年)进一步支撑了基于机器的话语者识别是可行的这一提议,那些基于自然话语特征的向量是最有力的证明。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。