MPEG编码器流程及算法概述.doc

下载文档

133
0
约2.03万字
约 10页
2018-06-26 发布于江西
举报
版权申诉
保障服务

MPEG编码器流程及算法概述.doc

1、本文档共10页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

MPEG编码器流程及算法概述.doc

MPEG4编码器流程及算法概述 MPEG4 编码器流程 MPEG-4视频编码器的实现步骤图3.3所示是MPEG-4视频编码器的具体实现框图。首先读取一帧数据，取一个宏块，根据编码控制选择编码类型，是intra帧内编码，还是inter帧间编码。如果是I帧，所有宏块都是intra帧内编码，则读取的宏块数据直接进入DCT、Q(量化)、DC/AC预测(直流系数与交流系数)、RLC(行程编码)并与其他信息一起合成形成码流；如果是P帧，先进行ME(运动估计)，然后判断是intra帧内编码，还是inter帧间编码。如果是intra帧内编码，则直接利用宏块本身进行DCT等一系列数据处理；如果是inter帧间编码，则将经过运动估计得到的运动矢量MV传送给MC(运动补偿)单元，结合帧缓存中的上一帧的重建帧数据与当前宏块的像素值做运算，得到残差数据，然后对残差值进行DCT等处理。在编码过程中，有一个重建图像的过程，其得到的数据存放在帧缓存中，作为下一帧的参考帧。各层参数（一）MPEG-4视频数据流结构：其位流语法从上到下大致可以分为：视觉对象序列(Visual Object Sequence)，视觉对象(Visual Object)，视频对象层(Video Object Layer)，视频对象平面层（Group of Video Object Plane）视频对象平面(Video Object Plane)。 VS(Visual Object Sequence)：由一系列VO视频对象组成。场景是一个或多个声视频对象的组合。场景的逻辑结构可以用一棵树表示,树中的节点是声视频对象。MPEG4系统用二进制场景格式BIFS描述场景中声视频对象的空间和时间位置及它们之间的关系。MPEG4的视频比特流提供了对场景的分层描述。在比特流中,表示场景的层是可视对象序列VS(VideoObjectSequence),它是一个完整的MPEG4场景,其中可能包含自然对象或合成的对象以及它们的增强层。 VO(Video Object)：是可视场景中景物的抽象描述，从用户的角度，它代表画面中任何有意义的物理实体。视频对象是MPEG-4编码的独立单元，由时间上连续的许多帧构成。VO的构成依赖于工具的应用和系统实际所处的环境，在超低比特率的情况下，VO可以是一个矩形帧，与MPEG-1、H.263兼容；对于基于内容的应用，VO可能是场景中的某一物体，也可能是计算机产生的二维、三维图形等。每一个VO有3类信息描述：形状信息、运动信息和纹理信息。 VOL(Video Object Layer)：属于同一VO的形状、运动和纹理信息被编码成一个单独的结构，称为视频对象层(VOL)。它的引入主要是用来实现VO的视域或者空域分级(Scalable)。对同一个VO，可以用不同的空间或时间分辨率编码多层结构，从一个基础层开始，用增加一些增强层次的方法，以分层的方式重建视频。每个视频对象可以编码成可伸缩(多层)或不可伸缩(单层)的视频流，用哪一种方式编码取决于应用。 GOV： VOP(Video Object Plane)：VO在某一个时刻的表象即某一帧的VO，称为VOP。假设输入的视频序列的每一帧都被分割成多个任意形状的VOP(在MPEG-1、MPEG-2及H.263中，被处理的图像总是矩形)，每个VOP定义场景中特定的视频内容。各个VOP的形状和位置可随帧变化。属于场景中同一实际物体连续的有着任意形状任意位置的VOP序列就是视频对象VO。 VOP是MPEG4中编码的基本单位。每个VOP可以独立地编码,也可以使用运动补偿技术相互依赖地编码。传统的视频帧也可以用矩形VOP表示。VOP包含了视频对象的运动参数、形状信息和纹理等数据。VOP既是一个空间概念也是一个时间概念。从另一个角度说,VOP是视频对象VO在特定时刻的取样。因此,属于场景中同一个物理对象的连续的VOP就代表了一个视频对象VO。从编码的角度来看,VO实际上是由一组同一实体的任意形状和位置的VOP序列组成的。VOP包括主体对象、背景对象以及文字图形三类。很经典的流程总结： MPEG-4采用基于对象的编码方法.每个场景是由单独编码的视频对象(VideoObjects,即VOs)组成的.每一个VO可以有几个可分级的层(基层和几个增强层),这些层被称为视频对象层(VideoObjectLayers,即VOLs).每一个VOL依次组成了在时间上有序的快照(snapshots)序列,被称为视频对象面(VideoObjectPlanes,即VOPs).对每一个VOP,编码器处理其形状,运动和纹理特征.形状信息的编码是通过用一个矩形框界定并将矩形框分成多个宏块(MacroBlocks,即MBs)来完成的.每个MB可归为如下三

您可能关注的文档

文档评论（0）

zhangningclb + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta

认证主体张**

1亿VIP精品文档

更多 >

MPEG编码器流程及算法概述.doc