MPEG编码器流程及算法概述.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
MPEG编码器流程及算法概述.doc

MPEG4编码器流程及算法概述 MPEG4 编码器流程 MPEG-4视频编码器的实现步骤 图3.3所示是MPEG-4视频编码器的具体实现框图。 首先读取一帧数据,取一个宏块,根据编码控制选择编码类型,是intra帧内编码,还是inter帧间编码。如果是I帧,所有宏块都是intra帧内编码,则读取的宏块数据直接进入DCT、Q(量化)、DC/AC预测(直流系数与交流系数)、RLC(行程编码)并与其他信息一起合成形成码流;如果是P帧,先进行ME(运动估计),然后判断是intra帧内编码,还是inter帧间编码。如果是intra帧内编码,则直接利用宏块本身进行DCT等一系列数据处理;如果是inter帧间编码,则将经过运动估计得到的运动矢量MV传送给MC(运动补偿)单元,结合帧缓存中的上一帧的重建帧数据与当前宏块的像素值做运算,得到残差数据,然后对残差值进行DCT等处理。 在编码过程中,有一个重建图像的过程,其得到的数据存放在帧缓存中,作为下一帧的参考帧。 各层参数 (一)MPEG-4视频数据流结构: 其位流语法从上到下大致可以分为: 视觉对象序列(Visual Object Sequence), 视觉对象(Visual Object), 视频对象层(Video Object Layer), 视频对象平面层(Group of Video Object Plane) 视频对象平面(Video Object Plane)。 VS(Visual Object Sequence):由一系列VO视频对象组成。 场景是一个或多个声视频对象的组合。场景的逻辑结构可以用一棵树表示,树中的节点是声视频对象。MPEG4系统用二进制场景格式BIFS描述场景中声视频对象的空间和时间位置及它们之间的关系。MPEG4的视频比特流提供了对场景的分层描述。在比特流中,表示场景的层是可视对象序列VS(VideoObjectSequence),它是一个完整的MPEG4场景,其中可能包含自然对象或合成的对象以及它们的增强层。 VO(Video Object):是可视场景中景物的抽象描述,从用户的角度,它代表画面中任何有意义的物理实体。视频对象是MPEG-4编码的独立单元,由时间上连续的许多帧构成。VO的构成依赖于工具的应用和系统实际所处的环境,在超低比特率的情况下,VO可以是一个矩形帧,与MPEG-1、H.263兼容;对于基于内容的应用,VO可能是场景中的某一物体,也可能是计算机产生的二维、三维图形等。每一个VO有3类信息描述:形状信息、运动信息和纹理信息。 VOL(Video Object Layer):属于同一VO的形状、运动和纹理信息被编码成一个单独的结构,称为视频对象层(VOL)。它的引入主要是用来实现VO的视域或者空域分级(Scalable)。对同一个VO,可以用不同的空间或时间分辨率编码多层结构,从一个基础层开始,用增加一些增强层次的方法,以分层的方式重建视频。每个视频对象可以编码成可伸缩(多层)或不可伸缩(单层)的视频流,用哪一种方式编码取决于应用。 GOV: VOP(Video Object Plane):VO在某一个时刻的表象即某一帧的VO,称为VOP。假设输入的视频序列的每一帧都被分割成多个任意形状的VOP(在MPEG-1、MPEG-2及H.263中,被处理的图像总是矩形),每个VOP定义场景中特定的视频内容。各个VOP的形状和位置可随帧变化。属于场景中同一实际物体连续的有着任意形状任意位置的VOP序列就是视频对象VO。 VOP是MPEG4中编码的基本单位。每个VOP可以独立地编码,也可以使用运动补偿技术相互依赖地编码。传统的视频帧也可以用矩形VOP表示。VOP包含了视频对象的运动参数、形状信息和纹理等数据。VOP既是一个空间概念也是一个时间概念。从另一个角度说,VOP是视频对象VO在特定时刻的取样。因此,属于场景中同一个物理对象的连续的VOP就代表了一个视频对象VO。从编码的角度来看,VO实际上是由一组同一实体的任意形状和位置的VOP序列组成的。VOP包括主体对象、背景对象以及文字图形三类。 很经典的流程总结: MPEG-4采用基于对象的编码方法.每个场景是由单独编码的视频对象(VideoObjects,即VOs)组成的.每一个VO可以有几个可分级的层(基层和几个增强层),这些层被称为视频对象层(VideoObjectLayers,即VOLs).每一个VOL依次组成了在时间上有序的快照(snapshots)序列,被称为视频对象面(VideoObjectPlanes,即VOPs).对每一个VOP,编码器处理其形状,运动和纹理特征.形状信息的编码是通过用一个矩形框界定并将矩形框分成多个宏块(MacroBlocks,即MBs)来完成的.每个MB可归为如下三

文档评论(0)

zhangningclb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

认证主体张**

1亿VIP精品文档

相关文档

相关课程推荐