理论教育 声音的数字化:频率、振幅、数据量和格式

声音的数字化:频率、振幅、数据量和格式

更新时间:2025-01-02 理论教育 版权反馈
【摘要】:声音的数字化声音的主要物理特征包括频率和振幅。声音通过采集、量化、编码,最终将音频数据量转换成二进制码组。音频数据量=采样时间×采样频率×量化位数×声道数/8例如,计算5 min双声道,16位量化位数,25.5kHz采样频率声音的数据量为:音频数据量=/8=30600000B=29 MB声音的格式存储声音信息的文件格式有多种,常用的有WAV、MP3、VOC等。MIDI声音产生的办法有多种,常用的有FM合成法和波表合成法。

(1)声音的数字化

声音的主要物理特征包括频率和振幅。声音用电表示时,声音信号是在时间和幅度上都连续的模拟信号。而计算机系统只能存储和处理离散的数字信号。将连续的模拟信号变成离散的数字信号就是数字化。数字化的基本技术是脉冲编码调剂(PCM),主要包括采样、量化和编码3个基本过程。

声音通过采集、量化、编码,最终将音频数据量转换成二进制码组。最终产生的音频数据量的计算公式如下。

音频数据量(B)=采样时间(s)×采样频率(Hz)

×量化位数(b)×声道数/8

例如,计算5 min双声道,16位量化位数,25.5kHz采样频率声音的数据量为:音频数据量=(5×60×25500×16×2)/8=30600000B=29 MB

(2)声音的格式

存储声音信息的文件格式有多种,常用的有WAV、MP3、VOC等。(www.daowen.com)

WAV是微软采用的波形声音文件存储格式,WAV文件的后缀名为“.wav”,是最早的数字音频格式。WAV格式的数据量庞大,为了解决这个问题,比较常见的办法是进行数据压缩或采用音乐合成的办法。

MPEG是指采用MPEG(.mp1/.mp2/.mp3)音频压缩标准进行压缩的文件,是一种有损压缩。根据压缩质量和编码复杂程度的不同可分为3层(MPEG-1Audio Player1/2/3),分别对应MP1、MP2、MP3这3种音频文件。其中,MP3文件具有压缩比高、音质接近CD、制作简单便于交换等优点,是目前使用最多的音频格式,其音质稍差于WAV文件。

RealAudio文件是由Real NetWork公司推出的一种网络音频文件格式,采用了“音频流”的技术。目前,RealAudio文件格式主要有3种:RA、RM、RMX。

乐器数字接口(MIDI)文件规定了乐器、计算机、音乐合成器以及其他电子设备之间交换音乐信息的一组标准规定。MIDI声音产生的办法有多种,常用的有FM合成法和波表合成法。MIDI文件的扩展名为“.mid”、“.rmi”等。

VOC文件是声霸卡使用的音频文件格式,以“.voc”作为文件的拓展名。

其他音频文件格式还有:AU文件(扩展名为“.au”)、AIF文件(扩展名为“.aif”)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈