全面解析视频压缩技术和MPEG降噪技术

发布时间:2010-11-14 阅读量:1128 来源: 我爱方案网 作者:

理论上,数字电视(DTV)画面品质优于传统的模拟电视,没有鬼影、雪花、颤动和色彩失真等等问题。而且,模拟电视信号正如可以论证的那样,最大的缺陷就是画面斑点甚多,且因为对高频信号响应不足而导致画面不够细腻,简单地说,就是带宽不够。图像越细致,分辨率就越高,所需要的带宽就越大。 
    
  很久以前,美国官方就把可用频谱中的每6MHz带宽分配给美国广播公司的每一个频道以提供模拟电视信号,这种对视频带宽的限制及其对应的显示标准(NTSC色彩空间),就决定了传统电视机的特征,并在几十年时间里决定了电视画面的质量。 
    
  随着数字电视的出现,广播公司看到了能更充分地利用其分配的带宽的机会。的确,从他们的角度来看,数字电视最突出的优点莫过于容许在同样的带宽内传输更多的频道,并且同样能支持后续的高清晰度电视节目(HDTV)。  冗长的数据 
    
  带宽的限制
    
  HDTV对技术的要求非常高。传统传播模拟信号的NTSC信号在一个频道6MHz带宽内最低要使用4.2MHz的带宽,并以29.97Hz的场频扫描525线。经过数字量化和编码压缩之后,该信号可以被记录在DVD上,其位传输bit率从2Mbits/s到10Mbits/s(支持自适应),平均为4Mbits/s。比较而言,典型的HDTV具有5倍于模拟TV的分辨率。因此在同样条件下,传输数据率应该是模拟信号的5倍才能达到同样的性能。 
    
  无论是传统的空中广播(OTA)、有线电视公司的机顶盒,还是卫星电视,他们都在传输信号时受到带宽的制约,在受限的带宽上他们还要附加占用带宽的服务,包括互动广播、收费频道和电视节目表等等。 
    
  那么,怎样才能解决问题呢?采用压缩技术是一种办法。 
    
  数字视频压缩引起失真 
    
  目前最常用的数字视频压缩算法是MPEG-2。从现有的卫星电视传输、有线数字电视传输到空中数字广播,MPEG-2在各种应用中已经被国际上广为采用。 
    
  MPEG-2首先通过运动补偿去除时间冗余,然后将一帧图像分割成一个个8x8的相素点阵,在每个点阵内使用DCT(离散余弦变换)去除空间冗余。DCT完成后通过量化和重组后压缩就完成了,然后进行可变长编码,最后进行霍夫曼编码。整个压缩过程极大的减少了比特率(>10:1压缩比)。 
    
  然而,比特率的减少也带来了问题,因为编码损失了一些原始的视频信息,有可能引起严重的负作用,所以,MPEG-2被称为有损编码。它丢弃了被认为视觉上较为次要的图像信息。压缩得越大,编码后的图像与原始图像的差异就越大。图像质量和逼真度现在取决于所选择的(或通常是施加的)压缩级别。因为它直接与可用带宽相关,我们必须问问自己,什么时候才不出现过度的视频压缩呢? 
    
  看得见的失真 
    
  在数字信号传输中的带宽限制以及过分的图像压缩,使压缩后的图象完全不同于模拟世界看到的图像。 
    
  通常,模拟图像变差(或噪声)经常是以高斯噪声的形式出现,该噪声的优点是它会保留基本的内容并且因为人眼视觉缺陷而不易被发觉。我们常常会看到那些有些模糊而让人不那么舒服的模拟图像,但是,这并不会让人觉得明显的反感。 
    
  数字噪声遵循的是一种不同的分布模式,更重要的是,其特殊的形态让人的视觉感到很不自然。当将MPEG-2编码(或任何基于DCT模块的编解码)用到极限,失真就主要有两种方式:蚊式噪声(Mosquito noise)和方块效应(Blocking artifacts)。 
    
  蚊式噪声
     
   在清晰的彩色背景上,围绕突出物体、电脑仿真物体或滚动的字符周围的蚊式噪声最为明显。它看起来像某种围绕物体与背景之间高频分界(在前景物体与背景之间形成的尖锐跳变)的朦胧的东西或闪光体,甚至有时它被误认为是环绕物。不幸的是,这种细小的效应在人身体之类更接近自然的形状上也能看到。VIRIS项目组(视频参考损伤系统)将蚊式噪声定义为“伴随着运动物体边缘的失真,表现为围绕着物体四周有一层象飞行物体和/或模糊的气泡的物质(就像蚊子围绕着人头部和肩膀飞)”。 
    
  当重建图像并因为使用用反余弦变换丢弃一些数据时,就会出现蚊式噪声。 
    
  “蚊子”在一张图像的其它部分也可以找到,例如,在特定的纹理分界处或颗粒状物体处也会出现蚊式噪声。结果就有点类似随机噪声了,噪声看起来似乎与纹理或颗粒物混合在了一起,看起来就像画面的原始特征。 
    
  方块效应,名副其实,在图像中表现出令人讨厌和不自然的方块。有时侯表现为一大块,它是一种图像的失真,且是由分块编码结构造成的。 
    
  当编码达到最大化的时候,每个像素点阵就会被相当粗糙地取平均,使之看上去像一个大像素。每一个像素点阵的计算都不一样,这样就造成了各个点阵之间象是有明显的边界一样。 
    
  当物体或摄像机快速运动的时候该效应更为明显。最佳的例子是在NFL(美国国家足球联盟)广播过程中,抱球飞奔的运动员看起来就像老式任天堂游戏机里的马利奥兄弟似的。 
    
  预平滑 
    
  尽管预平滑不是图像压缩处理算法中的一种,但它已经被用于消除这种数字失真。 
    
  广播公司和内容提供商已经越来越意识到其传播系统的缺陷,他们中的一些针对已有的带宽限制采用了相当有争议的解决方案:预平滑。 
    
  通过在信号输入信道之前消除其图像中的高频部分,编码器有更多的时间处理其任务,所产生的图像受到方块效应和蚊式噪声的影响就更小。另一方面,这种一定程度上的过度滤波也损失了原始图像中的所有微细变化和纹理。 
    
  例如,一个蓄须达一周的足球运动员现在看来象是胡须剃得很干净(即使他处于静止状态),而体育场则看起来像一片绿色的大地毯。 
    
  可以证明,尽管有人会觉得预平滑也不错,但这完全是一个不可逆的算法。一旦处理掉了细节,人们就不能再重建它们了。 
    
  然而,方块效应和蚊式噪声确实消失了。
相关资讯
村田BLM15VM系列量产在即:车规级磁珠解决高频通信干扰难题

在智能驾驶飞速发展的时代,5.9GHz频段的C-V2X(蜂窝车联网)和5.8GHz频段的DSRC(专用短程通信)已成为车辆与环境交互的关键神经。然而,GHz频段内日趋复杂的电磁环境却为通信灵敏度与可靠性带来严峻挑战。传统噪声抑制元件在应对高频宽范围干扰时力不从心,高性能宽频噪声解决方案成为行业急需突破的技术瓶颈。村田制作所(Murata)以其深厚的材料技术积淀和创新设计,适时推出了革命性的片状铁氧体磁珠——BLM15VM系列,直击高频车联网通信的核心痛点。

微软战略转型:裁员重组与800亿美元AI投资的双轨并行

据彭博社6月20日报道,微软计划于今年7月启动大规模组织结构调整,预计裁员数千人,主要集中在全球销售与客户服务部门。此举引发行业对科技巨头战略重心迁移的高度关注,尤其引人瞩目的是其裁员节省的资金流向——微软官方确认将在新财年向人工智能基础设施领域投入约800亿美元。

Microchip新一代DSC破解高精度实时控制难题,赋能AI电源与电机系统

在AI服务器爆发式增长、新能源系统复杂度飙升的产业背景下,传统控制芯片正面临三重挑战:碳化硅/氮化镓器件的高频开关控制需求、功能安全标准升级、以及机器学习边缘部署的实时性要求。Microchip最新推出的dsPIC33AK512MPS512与dsPIC33AK512MC510数字信号控制器(DSC),通过78ps PWM分辨率与40Msps ADC采样率的核心突破,为高精度实时控制树立了新基准。

全球扫地机器人市场迎开门红 中国品牌领跑优势持续扩大

根据权威机构IDC最新发布的《全球智能家居设备季度追踪报告》,2025年第一季度全球智能扫地机器人市场迎来强劲开局,总交付量达到509.6万台,较去年同期增长11.9%,连续第二个季度实现超过20%的增长率。市场活力显著提升,展现出强劲复苏势头。

汽车电子革新:TDK高集成PoC电感破解ADAS空间与成本困局

随着ADAS渗透率突破50%(据Yole 2023数据),车载传感器供电与数据传输架构面临革命性变革。传统双线分立设计(电源线+信号线)导致线束占整车重量超3%,且故障率居高不下。TDK株式会社推出的ADL8030VA系列PoC专用电感器,通过单元件高集成方案重构滤波电路,为智能驾驶系统提供空间与可靠性双重优化路径。