大家知道,模拟电视图像的信号带宽至少需要4.2MHz,复合视频信号(带扫描和同步控制的视频信号)的带宽至少为6MHz。采用8bit量化的数字视频信号的带宽更大。表7-2是各类数字视频信号的带宽(码率)。
表7-2 各类数字视频信号的码率
传送一幅清晰度不算高的每秒30帧、CIF格式(288×352≈10万像素)未被压缩的数字图像信号,需要36.5Mbit/s的码率。传送清晰度更低的QCIF格式(144×176≈2.5万像素)未被压缩的数字视频信号需要9.1Mbit/s的码率。如果再加上多路复用,那么需要网络的传输带宽更大。因此,必须对数字视频信号进行有效压缩,才能实现在网络上传输视频信号。视频会议系统要实施的是高压缩比、低码流、高清晰度的视频压缩编码技术。
1.视频信号压缩原理
彩色电视每秒传送25帧或30帧图像。实际上每帧画面的主体图形只有少许差异,背景的差异更少。如果把一串连续图像对应位置的亮度信号和色度信号进行比较和差值统计,结果发现只有不到10%的像素点的亮度变化会超过2%,色度只有不到1%的变化。说明帧间图像存在冗余信息的空间。运用帧间压缩技术可实现压缩图像信息的数据率。
在同一帧画面上某个像素的亮度和色度信息与其相邻像素的亮度和色度信息存在着极强的相关性(连贯性),这种帧内图像信息的相关性便产生帧内图像的冗余信息,也是压缩图像信息数据率的重要依据。
还有一种是图形结构中的冗余信息。例如方格状图案的像素存在着明显的分布模式,根据这种有规律的分布模式,通过运算可生成图像,而不必占用视频信息数据。
视觉冗余信息:人眼对量化误差的敏感度随着亮度的增加而降低,以及人眼对亮度感觉的敏感度高于对色度的感觉。根据人眼的这两种视觉特性,把敏感和不敏感的部分分开来编码,可以压缩数字视频信号的带宽。
1993年成立的ITU-T国际电信联盟标准化部和ISO国际标准化组织的MPEG活动图像专家组分别发布了H.261、H.263、H.264系列和MPEG1、MPEG2、MPEG4两种不同系列、不同性能和不同用途的视频压缩编解码标准。它们的压缩依据都是允许有一定的图像失真而并不妨碍图像实际应用的效果。采用的压缩方法都是压缩帧间图像、帧内图像的冗余信息和视觉冗余信息等。H.261、H.263和H.264用于视频会议系统。MPEG1、MPEG2和MPEG4主要用于电视和娱乐音/视频节目的存储(光碟)和播放。
(1)压缩方法。
1)频带压缩技术。利用眼睛的视觉特性,对像素的亮度Y值以全分辨率取样,对像素的色差值CR和CB以减半分辨率取样。这样可降低图像信号的数据率(带宽)。即YUV分量信号的比值为4∶2∶2或4∶1∶1。
2)帧间运动预测压缩编码技术。图7-9是根据图像的内容进行画面分类传送,即I、P、B画面分类传送。
第一类是I画面(Intracode Picture),它是基础画面,是图像背景和运动主体的详情,用较多的数据率传送,例如152kbit/s帧。
图7-9 三类画面的排序一列
第二类是P画面(Predictive Code Picture),又称预测画面,它是与I画面相隔一小段时间后,运动主体在同一背景上已有明显变化的预测画面。它是以I画面为基准,不传送背景画面信息,只传送运动主体变化的差值,因此可少用一些数据传送,例如80kbit/s帧。
第三类是B画面,它是I画面与P画面之间前后双向预测的过渡画面(Bidirectional Predictive Code Picture),反映I、P画面间运动主体的微小变化情况。它既要参考I画面的内容,又要参考P画面的内容,所以称为双向预测画面。通常以每帧16~23kbit/s数据率传送。
(2)帧间压缩和帧内压缩技术。
1)帧间差值有损压缩技术。把每帧图像分成16×16(或8×8)相同大小的子块(又称宏块),并对相邻帧图像对应区域的子块分别进行比较得出差值,用这个比较差值进行编码,而不是对实际数值进行编码。丢弃差值很小、对图像质量影响不大的一些信息,因此称为有损帧间压缩编码。
2)帧内压缩技术。在同一画面中存在着相当多的冗余信息,如一幅人像画面,面部与头顶部位的线条清晰度要求是不相同的,尤其是眼睛和嘴唇部分,不仅线条复杂,表情丰富,还是观众目光集中的地方,必须使用更多的比特率传送;侧面和头顶部位,轮廓变化少,灰度层次差别不大,可少用一些比特率处理。这种在同一画面中(同一时域内)的不同空间部位进行数据压缩,采用的是DCT(Discrete Cosine Transform)离散余弦变换法。
2.标准化图像格式CIF(Common Intermediate Format)
世界上现有三种彩色电视制式;即NTSC制、SECAM制和PAL制,为实现不同彩色电视制式之间的视频通信,国际上制定了三种电视制式的中间格式:即标准化图像格式CIF(Common Intermediate Format)。它解决了视频会议系统在国际互通互联时产生的矛盾。在编码时,将PAL、NTSC或SECAM等各种制式的数字电视信号转换为CIF格式,解码时再将CIF格式转换为相应的PAL、NTSC或SECAM等格式。
表7-3是5种CIF图像分辨率格式和H.261压缩编码需要的数据传输带宽。
表7-3 CIF标准化图像格式图像分辨率标准
3.H.261压缩编码标准
H.261是ITU-T的前身CCITT第15研究小组于1990年12月发布的视频图像压缩编码标准。常称为p×64kbit/s标准(p=1~30)。p=1或2时,支持QCIF格式、帧频较低的可视电话传输。p≥6时,支持CIF格式、帧频较高的视频会议系统的数据传输。
H.261是一种采用帧间预测减少时域冗余和帧内DCT变换,减少空域冗余的混合编码方法。具有压缩比高(最高压缩比可达50∶1)、算法复杂度低等优点。
4.H.263压缩编码标准(www.daowen.com)
在H.261的基础上,1996年ITU-T推出了H.263视频压缩编码标准,1998年ITU-T又推出了进一步提高编码性能的H.263+及H.263++等视频编码标准。H.263比H.261能够提供更好的图像质量、更低的码率和支持SubQCIF、QCIF、CIF、4CIF和16CIF五种图像分辨率格式。
H.263从以下三方面着手压缩数字视频的数据量:
1)充分利用人眼对亮度信号比色度信号更敏感的视觉特性,消除视觉冗余。
对每个像素的数据量由原来的24bit(YUV各占8bit)降低为12bit(Y占8bit、U和V各占4bit),从而使数据量减少50%。
2)在帧内(同一画面)的不同空间部位根据图像轮廓变化的大小和灰度层次的差别大小,用改进的DCT离散余弦变换技术进行数据压缩,有效地消除画面内相邻宏块数据的强相关性。因此H.263输出的数据率一般是非恒定的。即快速运动物体的数据率高于慢速运动物体的数据率。
3)利用帧间运动估计和高级预测技术,对运动矢量的差值进行编码,充分消除帧图像之间的强相关性,获得较高的压缩比。H.263++的压缩可达到120倍以上,在保证可以接受的图像质量基础上,获得极低的数据率。
5.H.264高效压缩编码标准
H.261、H263、H263+、H263++是ITU-T国际电信联盟为视频会议通信系统开发的、适合网络传输的数字视频压缩标准。在此同时,ISO/IEC国际标准化组织在1988年成立的MPEG运动图像专家组为广播电视和光碟系统也开发了MPEG1(用于VCD光碟)、MPEG2(用于DVD光碟)和多媒体传送、存储和检索的MPEG4数字视/音频压缩标准。H.26x和MPEGx两大视频压缩编码系统虽然压缩编码原理类似,但是由于两者算法不同,解码方法不同,性能指标也不相同,因此互不兼容。
21世纪初,这两个国际组织联合开发了兼容通信、广播和流媒等各种应用的H.264高效压缩编码标准。因此H.264又称MPEG4—AVC或MPEG4(Part10)。
H.264采用压缩数字视频冗余信息的原理类似前面所述,由于它要用于通信系统,因此要求通信系统的端到端的延迟应小于200ms,视频会议设备编/解码器端到端的延迟不大于300ms。
H.264比MPEG2可节省60%的带宽资源,在传输带宽为2.5Mbit/s的条件下,其图像质量可达到MPEG2压缩编码(DVD)的质量,见表7-4。
表7-4 H.264(MPEG4AVC)与MPEG2性能对比
表7-5是MPEG2、MPEG4、H.263和H.264四种视频压缩编码标准节省码流的比较。
表7-5 H.26x与MPEGx两种视频压缩编码标准码流节省率的比较
表7-5表明:H.264不仅比H.263节省49%的码率,比MPEG2节省64%的码率,比MPEG4节省39%的码率,而且对网络传输具有更好的支持功能。它引入了面向IP包的编码机制,有利于网络中的分组传输,支持网络中视频的流媒体传输,能适用于不同网络中的视频传输,网络亲和性好,从而获得平稳的图像质量。
H.264具有较强的抗误码特性,可适应丢包率高、干扰严重的无线信道中的视频传输。H.264的应用目标广泛,可满足各种不同速率、不同场合的视频应用。
6.高清视频会议图像分辨率标准
H.264压缩编解码的图像清晰度标准采用广电领域中常用的HDTV(High Definition TV)高清晰度电视标准(简称高清),即720p(1280×720)、1080i(1920×1080)、1080p(1920×1080)。其中p表示progressive逐行扫描;i表示interlaced隔行扫描。逐行扫描减少了大屏幕上的锯齿画面,并使画面动作变得更为流畅。
现已被世界广泛接受的HDTV高清图像显示格式为720p、1080i和1080p三种。HDTV高清电视规定必须至少具备720电视线、逐行扫描(720p),或1080电视线、隔行扫描(1080i)。大家熟悉的DVD标准为480电视线、逐行扫描(480p),不属于高清数字电视标准。
因此,480p是HDTV高清电视发展起步阶段的“准高清”标准;720p是高清电视标准中的最低要求,1080p才是HDTV发展的最终目标。任何低于720p清晰度的视频会议系统都不能称高清视频会议系统。
目前我国还经常引用的高清视频会议和视频监控系统的图像清晰度标准是日本数字电视的D类显示格式,其中D1和D2为SD(Standard Definition)标清格式,D3、D4、D5为HD(High Defini- tion)高清格式:
D1:480i,屏幕宽、高比为4∶3或16∶9,分辨率为860×480/60Hz,与NTSC制式的模拟电视清晰度相同,行频为15.25kHz,相当于DVD光盘的图像清晰度。
D2:480p,屏幕宽、高比为16∶9,分辨率为860×480/60Hz,与逐行扫描的DVD规格相同,行频为31.5kHz,相当于DVD光盘图像的清晰度标准。
D3:720p,屏幕宽、高比为16∶9,分辨率为1280×720/60Hz,行频为45kHz。
D4:1080i,屏幕宽、高比为16∶9,分辨率为1920×1080/60Hz,行频为33.75Hz。
D5:1080p,屏幕宽、高比为16∶9,分辨率为1920×1080/60Hz,行频为67.5Hz。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。