理论教育 MPEG-4视频编码标准解析

MPEG-4视频编码标准解析

时间:2023-06-21 理论教育 版权反馈
【摘要】:与MPEG-1和MPEG-2标准所用的视频源格式不同,MPEG-4编码器的视频输入将不再只是矩形区域,也可以是任意形状的VOP图像区域,且该区域的形状和位置可以随帧变化。MPEG-4中的视频对象是用户可以访问和操纵的实体。在MPEG-4中,矩形帧被认为是VOP的一个特例,这时编码系统不用处理形状信息,退化为类似于H.261、MPEG-1/2的传统编码系统,同时也实现了与现有标准的兼容。如图5-9所示,其中,图5-9a表示支持MPEG-1和MPEG-2的通用的MPEG-4编码器,图5-9b表示MPEG-4的甚低数码率视频核心编码器。

MPEG-4视频编码标准解析

MPEG-1/2最主要的目标是通过数据压缩技术,实现数字音/视频数据的有效存储和传送。它们所处理的是音频及基于“矩形帧”的视频信息,而其交互功能也仅局限于音频及矩形帧层次上,用户得到的是制作人员事先编排好的场景,只能对音/视频序列进行简单的回放。MPEG-4标准超越了MPEG-1/2的目标,以音视对象(Audio Visual Object,AVO)的形式对音视(Audio Visual,AV)场景进行描述。这些AVO在空间及时间上有一定的关联,经过分析,可对AV场景进行分层描述。因此,MPEG-4提供了一种崭新的交互方式——基于内容的交互,允许用户根据系统能力和信道带宽进行分级解码,同每一个AV对象进行交互并可进行操纵。根据制作者设计的具体自由度,用户不仅可以改变场景的视角,还可以改变场景中对象的位置、大小和形状,或置换甚至清除该对象。MPEG-4集成了不同性质的对象,例如自然视频对象,计算机生成的图形、图像、文字,以及自然/合成音频对象等。

为了实现基于内容(Content-based)的交互功能,MPEG-4引入了视频对象(Video Ob-ject,VO)和视频对象面(Video Object Plane,VOP)的概念。假定输入视频序列的每一帧都被分割成若干任意形状的图像区域,每个这样的区域可能包含感兴趣的特定图像或视频内容。我们称这些区域为视频对象面(VOP)。与MPEG-1和MPEG-2标准所用的视频源格式不同,MPEG-4编码器的视频输入将不再只是矩形区域,也可以是任意形状的VOP图像区域,且该区域的形状和位置可以随帧变化。属于场景中同一对象的连续VOP序列称为视频对象(VO)。一个视频对象是一个使用一种或多种工具的视频元素,例如矩形帧序列、任意形状区域序列、一幅静止图像等。视频序列是一个或多个视频对象的集合。MPEG-4中的视频对象(VO)是用户可以访问(例如定位和浏览)和操纵(例如剪切和粘贴)的实体。视频对象是持续任意长时间的、任意形状的视频场景的区域。视频对象可以是视频场景中的人物或具体的景物,例如,如图5-9所示的新闻节目中的主持人的头肩像(没有背景图像),即自然视频对象;也可以是计算机产生的二维、三维图形,即合成视频对象;还可以是矩形帧。一个视频序列可能包含多个可分离的背景对象和前景对象。按对象的形状划分,视频对象可分为矩形的视频对象和任意形状的视频对象。分离出的视频对象可单独进行处理,视频对象可用不同的视频质量和时间分辨率来编码,以反映它们在场景中的“重要”程度。简单对象可使用针对矩形视频序列工具的子集来编码;复杂对象可使用针对任意形状对象的工具进行编码。

978-7-111-34368-4-Chapter05-14.jpg

图5-9 通用MPEG-4编码器和MPEG-4 VLBV核心编码器

a)通用MPEG-4编码器 b)MPEG-4 VLBV核心编码器

每个VO由三类信息来描述:运动信息、形状信息和纹理信息。VOP具有任意形状,因此要求编码方案能够处理形状和透明(Transparency)信息,这同现有只能处理矩形帧序列的视频编码标准形成了鲜明的对照。在MPEG-4中,矩形帧被认为是VOP的一个特例,这时编码系统不用处理形状信息,退化为类似于H.261、MPEG-1/2的传统编码系统,同时也实现了与现有标准的兼容。如图5-9所示,其中,图5-9a表示支持MPEG-1和MPEG-2的通用的MPEG-4编码器,图5-9b表示MPEG-4的甚低数码率视频(Very Low Bitrate Video,VLBV)核心编码器。(www.daowen.com)

MPEG-4的VLBV核心编码器为数码率在5~64kbit/s范围内的视频操作与应用提供算法与工具,支持较低的空间分辨率(低于352×288像素)和较低的帧频(低于15Hz)。VLBV核心编码器支持的专用功能包括:

1)实时多媒体应用。支持矩形帧序列的有效编码,具有高编码效率、高精度、高容错度、低延时等特点。

2)多媒体数据库应用。支持多媒体数据库的存储、随机存取,以及快进/快退等功能与操作。

通用的MPEG-4编码器同样支持上述功能,其数码率范围为64kbit/s~10Mbit/s,与VLBV核心采用相同或相似的算法,但它支持更高的空间与时间分辨率,允许传送和存储适用于演播室的高质量视频信号,其输入可以是ITU-R BT.601的标准信号,典型应用为数字电视广播与交互式检索。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈