声音的数字化：频率、振幅、数据量和格式

更新时间：2026-01-13 理论教育 版权反馈

【摘要】：声音的数字化声音的主要物理特征包括频率和振幅。声音通过采集、量化、编码，最终将音频数据量转换成二进制码组。音频数据量=采样时间×采样频率×量化位数×声道数/8例如，计算5 min双声道，16位量化位数，25.5kHz采样频率声音的数据量为：音频数据量=/8=30600000B=29 MB声音的格式存储声音信息的文件格式有多种，常用的有WAV、MP3、VOC等。MIDI声音产生的办法有多种，常用的有FM合成法和波表合成法。

（1）声音的数字化

声音的主要物理特征包括频率和振幅。声音用电表示时，声音信号是在时间和幅度上都连续的模拟信号。而计算机系统只能存储和处理离散的数字信号。将连续的模拟信号变成离散的数字信号就是数字化。数字化的基本技术是脉冲编码调剂（PCM），主要包括采样、量化和编码3个基本过程。

声音通过采集、量化、编码，最终将音频数据量转换成二进制码组。最终产生的音频数据量的计算公式如下。

音频数据量（B）=采样时间（s）×采样频率（Hz）

×量化位数（b）×声道数/8

例如，计算5 min双声道，16位量化位数，25.5kHz采样频率声音的数据量为：音频数据量=（5×60×25500×16×2）/8=30600000B=29 MB

（2）声音的格式

存储声音信息的文件格式有多种，常用的有WAV、MP3、VOC等。(https://www.daowen.com)

WAV是微软采用的波形声音文件存储格式，WAV文件的后缀名为“.wav”，是最早的数字音频格式。WAV格式的数据量庞大，为了解决这个问题，比较常见的办法是进行数据压缩或采用音乐合成的办法。

MPEG是指采用MPEG（.mp1/.mp2/.mp3）音频压缩标准进行压缩的文件，是一种有损压缩。根据压缩质量和编码复杂程度的不同可分为3层（MPEG-1Audio Player1/2/3），分别对应MP1、MP2、MP3这3种音频文件。其中，MP3文件具有压缩比高、音质接近CD、制作简单便于交换等优点，是目前使用最多的音频格式，其音质稍差于WAV文件。

RealAudio文件是由Real NetWork公司推出的一种网络音频文件格式，采用了“音频流”的技术。目前，RealAudio文件格式主要有3种：RA、RM、RMX。

乐器数字接口（MIDI）文件规定了乐器、计算机、音乐合成器以及其他电子设备之间交换音乐信息的一组标准规定。MIDI声音产生的办法有多种，常用的有FM合成法和波表合成法。MIDI文件的扩展名为“.mid”、“.rmi”等。

VOC文件是声霸卡使用的音频文件格式，以“.voc”作为文件的拓展名。

其他音频文件格式还有：AU文件（扩展名为“.au”）、AIF文件（扩展名为“.aif”）。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

声音的数字化：频率、振幅、数据量和格式

随机振幅、频率和相位信号的检测方法

声音世界：频率、分贝和波的重要属性

物体振动产生声音 ，声音的音调和频率

衰减振动频率与周期影响小，振幅明显衰减

小人国居民的声音和格列佛的声音

如何处理声波信号：从振幅和频率到特征提取及傅

周期因子、振幅和相位的关系

如何检测随机振幅和相位信号？

相关推荐

物体振动产生声音，声音的音调和频率