理论教育 法律语言学:话语增强与噪声处理的关系

法律语言学:话语增强与噪声处理的关系

时间:2023-10-15 理论教育 版权反馈
【摘要】:但当滤波和其他简单的补救方式对失真的话语样本无效时,它们非常有用。这些图还可以被用于获得关于信号的大量定量信息,因此有助于识别话语、词或短语。这个图是长元音/a/的电子音谱可以用来减少噪声并增强话语可懂度的频率滤波技术有几种。高达350Hz的频率的掩蔽效应可以掩蔽话语,而在3000Hz以上的频率通常只是令人心烦。当处理增强有噪声记录的话语的问题时,应该了解这些关系。

法律语言学:话语增强与噪声处理的关系

正如之前提到的,存储语篇的可懂度可以通过许多技术来提高。(Blain 1980;Dean 1980;Hollien 1990,1992;Hollien and Fitzgerald 1977)这些技术包括带宽压缩、跨声道相关、平均最小二乘法分析、全极点模型、群延迟函数、线性自适应滤波、变速记录器、倒谱技术、解卷积等。(Such as Bloch et al.1977;Lee 1998;Lim and Oppenheim 1979;Wan 1998)虽然这些技术大多数需要被改变以适合话语任务,但是如果语音学家能够将特定软件或处理过程与话语失真的具体情况相匹配,也是可以的。但当滤波和其他简单的补救方式对失真的话语样本无效时,它们非常有用。本节中会介绍一些更加实用和简单的方法,这些技术不会被详细评论。

增强话语的第一步是通过制作高质量的数字拷贝来保护原始记录。在原稿上工作并不可取,因为重复播放可能导致信号劣化或其他损坏。事实上,不意外擦除过度记录或以其他方式损坏它的任何部分都是特别重要的。重要证据因此被破坏或损害所会产生的问题是不难想象的。

第二步是在尝试处理录音之前,审查员应多次试听。在这个过程中,审查员可以建立一个日志,掌握良好的关于录音内容的工作知识,并了解录音干扰和话语失真的各种信息。在这个过程中,审查员可以发现各种问题,并考虑采用相应的修补技术。一种有用的分析方法是将问题区域数字化,使用应用软件将信号内的关系“可视化”(例如,谱和波形)。图6-2和图6-3即为这种类型的图示。我们在图6-2中可以看到,噪音很少,几乎没有;图6-3中的“瀑布”形的音谱所代表的是元音的特征(也几乎没有噪声)。这些图还可以被用于获得关于信号的大量定量信息,因此有助于识别话语、词或短语。

图6-2 一个能量频率(或一个瞬间)的波谱图。它提供关于每个频率和区域的能量值的信息。确实,将F0的峰值与每一个它的谐波成分相联系,便可以形成一个频谱包络

图6-3 一个瀑布型电子音谱。图中频率根据时间划分,能量水平由其峰值的高度来表示。这个图是长元音/a/的电子音谱

可以用来减少噪声并增强话语可懂度的频率滤波技术有几种。图6-4展示了关于滤波的一些基本概念,我们可以通过这个图较好地理解它们。它们现在几乎都是用数码软件完成的。因此,大多数与旧的模拟系统相关不足之处不再是问题。但是这些概念在这种形式下更容易理解。具体来说,图片能够提供关于各种类型的滤波对信号影响的信息,特别是一系列程式化和简化的低通、高通、带通和陷波滤波器的频率响应,并显示出不同的倾斜率。每个曲线都和所描述的一个或多个滤波技术相联系。例如:如果光谱分析显示噪声源以一个特定频率或者一定的频率波动范围内产生了一个相对较窄的高能量带,那么就可以使用以该频率为中心的陷波滤波器(模式E)来降低它的衰减影响。在其他条件相同的情况下,通带350Hz~3500Hz(模式C)可以形成合理的质量话语(用于解码目的)。(www.daowen.com)

另外一种我们必须了解的关系是声学能量模式是如何影响人类听觉的。我们知道,较低频率的能量将掩蔽其附近的能量和较高频率的能量,但是较高频率的能量不能很好地将较低频率能量掩蔽。图6-5是这些关系的简化图。可以看出,500Hz的正弦波将其附近的频率和较高的频率都遮掩了。窄带噪声的掩蔽效应也集中在500Hz附近——这是与法律模型更相关的情况——应以相似的方式操作。当考虑话语的通带(大致350Hz~3500Hz)时,我们可以最好地理解这些影响的意义。高达350Hz的频率的掩蔽效应可以掩蔽话语,而在3000Hz以上的频率通常只是令人心烦。当处理增强有噪声记录的话语的问题时,应该了解这些关系。

图6-4 滤波模式。这个图片显示了低通(A),高通(B),带通(C)和陷波滤波器(E)的过滤能力。同时,该图显示了不同的倾斜率,低度(上C),中度(A,B)和高度倾斜(C的左侧及E)。图中C模式和D模式显示了非数字型的回弹

最重要的过滤器类型是数码的,它们有两种形式:硬件和软件。硬件类型是自包含的,通常仅限于过滤功能,而软件程序需要使用计算机,这样,它可以执行许多其他的任务。基本上讲,这种类型的滤波器每秒都会将设定的次数(例如20k)的信号数字化确定在预定限制之上、之下和之间的频率中的能量(特别是稳态),去除这些值,并且存储剩余的或将其转换回某种模拟形式。虽然实际过程比较复杂,但用这些方法处理问题非常有效,且灵活性较高。

图6-5 声音遮掩。该图显示了一些声音如何遮掩其他声音。两个(遮掩音)的频率都将近500赫兹。可以看出低频音更可能遮掩高频音,但是高频音却较低可能遮掩低频音

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈