声学是研究声音的,与声波的产生、传播和接收有关,声音是通过空气分子延续声源的振动来传播的。将传感器接入声学系统,传感器可以将能量从一种形式转化为另外一种形式,它可以作为声音的产生和接收装置,比如话筒将声能转变为电能,扬声器则将这一过程逆变过来,将电能转换为声能。
声音是通过空气传播的一种连续的波,叫声波。声音的强弱体现在声波压力的大小上,音调的高低体现在声音的频率上。声音用电表示时,声音信号在时间和幅度上都是连续的模拟信号。
1.声波
声波是声音的传播形式,是一种机械波,由物体(声源)振动产生,声波传播的空间称为声场。在气体和液体介质中传播时是一种纵波,但在固体介质中传播时可能混有横波。人耳对声音的感觉有一定频率范围,大约每秒钟振动20~20000次,即频率范围是20~20000 Hz,如果物体振动频率低于20 Hz或高于20000 Hz人耳就听不到了,高于20000 Hz的频率称为超声波,而低于20 Hz的频率称为次声波。所以,不是所有物体的振动所发出的声音人们都能听到的。比如地震会产生多种复杂的波动,其中包括声波,但是由于它的频率太低(1 Hz),人耳无法听到,极强的次声波甚至可以对人体产生致命的伤害。另外要能听到声音也必须有传播声音的介质。图5-1为声波曲线图,其中周期为曲线上任一点再次出现所需要的时间间隔,音频波峰到波谷间的幅度阈称为振幅。
图5-1 声波曲线
2.声音频率特性
在一秒内声音由高(压力强)到低(压力低)再到高(压力强),这个循环出现的次数称为频率。
在人耳的音域范围(20~20000 Hz)内,所谓的低频一般指的是200 Hz以下,50 Hz以下可以称为极低频,要想还原极低频,一般的放音系统很难实现,需要比较昂贵的播出设备才可以实现真实的还原。但是大部分耳机的频响范围却都能低于50 Hz,甚或是很廉价的产品,但是耳机只能让信号作用于人耳的鼓膜,不能对人体其他部分产生对极低频的作用,因此使用耳机还原极低频是不完全的。在乐器中,低音鼓、大鼓、低音吉他、电贝司等主要频率在200 Hz以下,人声有时鼻音较重时也属于低频范围。
对于中频频段的划分,业内有很多种方式,有300~3000 Hz(人说话的声音信号频率),有200~6000 Hz,也有人认为20~10000 Hz都算中频。这里不去深究中频的划分定义,只是想告诉大家一个大致的范围。中频的范围是自然音乐最集中、最重要的频域,也是人耳最灵敏的范围,中频负责了声音的明亮度、透彻度、清晰度,如果录音时中频部分受损则会在很大程度上影响整体声音的质量。
一般认为6000~20000 Hz属于高频范围。在这个范围内,基本反映的都是乐器的泛音,泛音是在基础音上发出的微弱声音,以基音为标准,泛音是由分成等分的部分(如1/2、1/3、1/4)振动而产生的,乐器和自然界里所有的音都有泛音。泛音使得乐器声音听上去真实,电子合成器之所以能模拟出各种乐器的声音,就是靠模拟其高频泛音列。乐器中三角铁、铃、镲、长笛、短笛、铜管乐器的高频泛音,就属于高频范围。
3.频率范围
一般用声音信号的频率范围来衡量声音质量,频率范围又叫“频域”或“频带”,不同种类的声源其频带也不同。声源的频带越宽,表现力越好,层次越丰富。
●电话质量:200~3400 Hz。
●调幅广播质量:50~7000 Hz。
●调频广播质量:20~15000 Hz。
●标准CD质量:10~22050 Hz。
●标准DVD质量:0~24000 Hz。
●蓝光DVD质量:0~48000 Hz。
4.声音三要素
声音的三要素指的是音调、音强(响度)和音色(音品)3个主观属性。
(1)音调
声音频率的高低称为音调,表示人的听觉分辨一个声音的调子高低的程度,主要由声音的频率所决定,同时也与声音强度有关。对一定强度的纯音,音调随频率的升降而升降;对一定频率的纯音、低频纯音的音调随声强增加而下降,高频纯音的音调却随强度增加而上升。(www.daowen.com)
(2)音强
音强是指声音信号中主音调的强弱程度,是判别乐音的基础,又称为响度。音的强弱是由发音时发音体振动幅度(简称振幅)的大小决定的,两者成正比关系,振幅越大则音越“强”,反之则越“弱”。声音的强度是一个客观的物理量,其常用单位为“分贝(db)”。
(3)音色
音色是指声音的感觉特性,不同的发声体由于材料、结构不同,发出声音的音色也就不同,人们可以通过音色去辨认不同发声体的材料和结构。即使在同一音高和同一声音强度的情况下,也能区分出不同乐器或人发出的声音,同样的音量和音调上不同的音色与同样色度和亮度配上不同的色相的感觉一样。
5.单声
单声最初的概念是指用一个传声器拾取声音,经由处理系统后,用一个扬声器放音的单通道音频。现在也指把来自不同方位的音频信号混合后统一由单独一轨音频把它记录下来,再由一只音箱进行重放。
自从1877年,美国发明家托马斯·爱迪生发明了滚桶式留声机开始,就进入了单声的录音时代。尽管在人们生活中感受到的是全方位的声音世界,但由于当时受技术条件的制约,人们记录和播放音频的方式仍然以单声为主,这种情况延续到20世纪中期。
与立体声相比,单声没有宽度感,临场感与深度感都比较差。
6.双声道立体声
最传统的双声道立体声是在放音时在听众前方左右两边各放置一只扬声器,它们分别重放两个不同位置、不同声压、不同音色的具有时间差的音源信号。当信号进入人耳后会让听众感受到各声源的位置、强度和比例关系,从而获取立体感效果。与单声相比,双声道立体声具有宽度感,提升了临场感和深度感、层次感。
立体声与单声的最主要区别在于两只音箱所播放的信号是否相同,如果是两只音箱播放的音频信号完全相同,那么只能算是双声道,而不能称其为立体声。
7.多声道立体声
尽管双声道立体声的层次感和临场感效果要好于单声道,但是它只能再现一个二维平面的声音空间感,整个声场的感觉是平面化的,并不能让听众有置身其中的现场感。因为在现实中,声音的传播不可能是一个维度的,一定是上下左右各个方向的,是多维度的,是一个全息立体的概念。研究表明要还原这种全方位的声场环境,至少需要5个声道,5.1声道数的确定,是综合各方面指标对声道优化处理后的结果。多声道立体声比双声道立体声增强了纵深感、包围感、现场感,是现在最流行的音频播放手段。较新的数字多声道立体声技术有DOLBY AC-3、DOLBY Pro Logic、THX、SRS、DTS等。如图5-2所示为目前比较流行的几种数字多声道立体声技术图标。
图5-2 数字多声道立体声技术图标
8.数字音频采样
把模拟音频信号转换为数字音频信号的过程称为声音的数字化,数字化的过程是对音频信号通过采样、量化和编码来实现的。
把模拟音频变成数字音频时,需要每隔一个时间间隔在模拟声音波形上取一个幅度值,这一过程称为采样,也是A/D(模/数)转换的过程。采样频率是指音频信号采样时每秒的数字快照数量,这个速度决定了一个音频文件的频率范围(频响宽度)。采样频率越低,音频的波形形状越容易被扭曲,背离原始音频;采样频率越高,音频的波形形状越接近原始模拟音频波形。目前比较常见的采样频率有11025 Hz(AM调幅广播)、22050 Hz(FM调频广播)、44100 Hz(CD)、48000 Hz(DVD)、96000 Hz(蓝光DVD)。
9.数字音频量化
所谓量化就是把经过采样得到的某一幅度范围内的电压用一个数字来表示,量化的过程实际上也是一个离散化的过程,是选择分辨率的过程,这个分辨率也称为量化精度、位深度、量化比特数,它决定了数字音频的动态范围。较高的量化精度可以提供较宽泛的动态范围和较高的信噪比和保真度。通常情况下,标准的语音(电话)编码采用8 bit(位),即可有28=256个量化级;音频CD通常编码采用16 bit(位),其对应有216=65536个量化级;音频DVD采用24 bit(位),其对应有224=16777216个量化级;而32 bit,则对应4294967296个量化级。
10.数字化编码
由于计算机内数据的存储采用的是二进制,为此必须将声音数据写成计算机的数据格式,这一过程称之为编码。目前音频的编码方式有很多种,PCM(Pulse Code Modulation)就是一种最常见的编码方法,它将模拟信号的强度依照相等的间距分成若干段,然后将它们转换成数字信号。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。