精华内容
下载资源
问答
  • 压缩编码技术

    千次阅读 2017-09-19 08:29:24
    数据压缩的基础 ...(3)知觉冗余:是那些,处于人们听觉和视觉分辨率以下的视音频信号,若在编码时舍去这种在感知门限以下的信号,虽然会使恢复原信号产生一定的失真,但并不能被人们所感知。为此,此种超...

    数据压缩的基础

    (1)空间冗余:相关性的图像部分,在数据中就表现为冗余,空间冗余是视频图像中常见的一种冗余。

    (2)时间冗余:对于电视动画类的图像,其序列中前后相邻的两幅图像之间呈现较强的相关性,这就反映为时间冗余。

    (3)知觉冗余:是指那些,处于人们听觉和视觉分辨率以下的视音频信号,若在编码时舍去这种在感知门限以下的信号,虽然会使恢复原信号产生一定的失真,但并不能被人们所感知。为此,此种超出人们感知能力部分的编码就称为知觉冗余。

    (4)信息熵冗余:也称编码冗余。

     

    数据压缩技术的分类

    (1)无损压缩:它通常使用的是统计编码技术,包括哈夫曼编码、算术编码和行程编码等。

    (2)有损压缩:它通常可以分为特征抽取和量化两大类,特征抽取包括基于模式的编码、分形编码等,量化包括零记忆量化、预测编码、直接映射和变换编码等方法。

     

    数据压缩标准

    (1)JPEG:JPEG2000与传统JPEG最大的不同,在于它放弃了JPEG所采用的以离散余弦变换为主的区块编码方式,而采用以离散小波为主的多解析编码方式。

    (2)MPEG

    • MPEG-1:传输速率为1.5Mbps,每秒30帧,分辨率为352x288,即PAL值,或352x240,即NTSC制。
    • MPEG-2:传输速率 为3~10Mbps,能够向下兼容,分辨率可达720x480
    • MPEG-4:传输速率为4800~64000bps,分辨率为176x144dpi。与前面的标准相比,最大的不同在于提供了更强的交互能力。
    • MPEG-7:为各类多媒体信息提供一种标准化的描述。
    • MPEG-21:目标是将不同的协议、标准、技术有机地融合在一起。

    (3)DVI

    (4)H.261:主要针对在ISDN上实现电信会议应用,特别是面对面的可视电话和视频会议而设计的。

    (5)H.263:主要是针对低带宽通信而设计的,它在低带宽下能提供比H.262更好的图像效果。

     

    最后欢迎大家访问我的个人网站:1024s

    展开全文
  • MPEG4视频压缩编码技术详解

    千次阅读 2019-01-18 14:20:25
    MPEG全称是Moving Pictures Experts Group,它是“动态图象专家组”的英文缩写,该专家组成立于1988年,致力于运动图像及其伴音的压缩编码标准化工作,原先他们打算开发MPEG1、 MPEG2、MPEG3和MPEG4四个版本,以适用...

    MPEG全称是Moving Pictures Experts Group,它是“动态图象专家组”的英文缩写,该专家组成立于1988年,致力于运动图像及其伴音的压缩编码标准化工作,原先他们打算开发MPEG1、 MPEG2、MPEG3和MPEG4四个版本,以适用于不同带宽和数字影像质量的要求。
    目前,MPEG1技术被广泛的应用于VCD,而MPEG2 标准则用于广播电视和DVD等。MPEG3最初是为HDTV开发的编码和压缩标准,但由于MPEG2的出色性能表现, MPEG3只能是死于襁褓了。而我们今天要谈论的主角——MPEG4于1999年初正式成为国际标准。它是一个适用于低传输速率应用的方案。与MPEG1 和MPEG2相比,MPEG4更加注重多媒体系统的交互性和灵活性。下面就让我们一起进入多彩的MPEG4世界。

    MPEG4 的技术特点

    MPEG1、MPEG2技术当初制定时,它们定位的标准均为高层媒体表示与结构,但随着计算机软件及网络技术 的快速发展,MPEG1.MPEG2技术的弊端就显示出来了:交互性及灵活性较低,压缩的多媒体文件体积过于庞大,难以实现网络的实时传播。而MPEG4 技术的标准是对运动图像中的内容进行编码,其具体的编码对象就是图像中的音频和视频,术语称为“AV对象”,而连续的AV对象组合在一起又可以形成AV场 景。因此,MPEG4标准就是围绕着AV对象的编码、存储、传输和组合而制定的,高效率地编码、组织、存储、传输AV对象是MPEG4标准的基本内容。
    在 视频编码方面,MPEG4支持对自然和合成的视觉对象的编码。(合成的视觉对象包括2D、3D动画和人面部表情动画等)。在音频编码上,MPEG4可以在 一组编码工具支持下,对语音、音乐等自然声音对象和具有回响、空间方位感的合成声音对象进行音频编码。
    由于MPEG4只处理图像帧与帧之间有差异 的元素,而舍弃相同的元素,因此大大减少了合成多媒体文件的体积。应用MPEG4技术的影音文件最显著特点就是压缩率高且成像清晰,一般来说,一小时的影 像可以被压缩为350M左右的数据,而一部高清晰度的DVD电影, 可以压缩成两张甚至一张650M CD光碟来存储。对广大的“平民”计算机用户来说, 这就意味着, 您不需要购置 DVD-ROM就可以欣赏近似DVD质量的高品质影像。而且采用MPEG4编码技术的影片,对机器硬件配置的要求非常之低,300MHZ 以上CPU,64M的内存和一个 8M显存的显卡就可以流畅的播放。在播放软件方面,它要求也非常宽松,你只需要安装一个 500K左右的 MPEG4 编码驱动后,用 WINDOWS 自带的媒体播放器就可以流畅的播放了(下面我们会具体讲到)。

    视频编码研究与MPEG标 准演进

    人类获取的信息中70%来自于视觉,视频信息在多媒体信息中占有重要地位;同时视频数据冗余度最大,经压缩处理 后的视频质量高低是决定多媒体服务质量的关键因素。因此数字视频技术是多媒体应用的核心技术,对视频编码的研究已成为信息技术领域的热门话题。

    视 频编码的研究课题主要有数据压缩比、压缩/解压速度及快速实现算法三方面内容。以压缩/解压后数据与压缩前原始数据是否完全一致作为衡量标准,可将数据压 缩划分为无失真压缩(即可逆压缩)和有失真压缩(即不可逆压缩)两类。

    传统压缩编码建立在仙农信息论基础之上的,以经典集合论为工具,用 概率统计模型来描述信源,其压缩思想基于数据统计,因此只能去除数据冗余,属于低层压缩编码的范畴。

    伴随着视频编码相关学科及新兴学科的 迅速发展,新一代数据压缩技术不断诞生并日益成熟,其编码思想由基于像素和像素块转变为基于内容 (content-based)。它突破了仙农信息论框架的束缚,充分考虑了人眼视觉特性及信源特性,通过去除内容冗余来实现数据压缩,可分为基于对象 (object-based)和基于语义(semantics-based)两种,前者属于中层压缩编码,后者属于高层压缩编码。

    与此同 时,视频编码相关标准的制定也日臻完善。视频编码标准主要由ITU-T和ISO/IEC开发。ITU-T发布的视频标准有H.261、 H.262、 H.263、 H.263+、H.263++,ISO/IEC公布的MPEG系列标准有MPEG-1、MPEG-2 、MPEG-4 和MPEG-7,并且计划公布MPEG-21。

    MPEG即Moving Picture Expert Group(运动图像专家组),它是专门从事制定多媒体视音频压缩编码标准的国际组织。MPEG系列标准已成为国际上影响最大的多媒体技术标准,其中 MPEG-1和MPEG-2是采用以仙农信息论为基础的预测编码、变换编码、熵编码及运动补偿等第一代数据压缩编码技术;MPEG-4(ISO/IEC 14496)则是基于第二代压缩编码技术制定的国际标准,它以视听媒体对象为基本单元,采用基于内容的压缩编码,以实现数字视音频、图形合成应用及交互式 多媒体的集成。MPEG系列标准对VCD、DVD等视听消费电子及数字电视和高清晰度电视(DTV&&HDTV)、多媒体通信等信息产业 的发展产生了巨大而深远的影响。

    MPEG-4视频编码核心思想及关键技术

    核心思 想

    在MPEG-4制定之前,MPEG-1、MPEG-2、H.261、H.263都是采用第一代压缩编码技术,着眼于图像信号的统计特性 来设计编码器,属于波形编码的范畴。第一代压缩编码方案把视频序列按时间先后分为一系列帧,每一帧图像又分成宏块以进行运动补偿和编码,这种编码方案存在 以下缺陷:

    · 将图像固定地分成相同大小的块,在高压缩比的情况下会出现严重的块效应,即马赛克效应; 
    · 不能对图像内容进行访问、编辑和回放等*作; 
    · 未充分利用人类视觉系统(HVS,Human Visual System)的特性。

    MPEG- 4则代表了基于模型/对象的第二代压缩编码技术,它充分利用了人眼视觉特性,抓住了图像信息传输的本质,从轮廓、纹理思路出发,支持基于视觉内容的交互功 能,这适应了多媒体信息的应用由播放型转向基于内容的访问、检索及*作的发展趋势。

    AV对象(AVO,Audio Visual Object)是MPEG-4为支持基于内容编码而提出的重要概念。对象是指在一个场景中能够访问和*纵的实体,对象的划分可根据其独特的纹理、运动、形 状、模型和高层语义为依据。在MPEG-4中所见的视音频已不再是过去MPEG-1、MPEG-2中图像帧的概念,而是一个个视听场景(AV场景),这些 不同的AV场景由不同的AV对象组成。AV对象是听觉、视觉、或者视听内容的表示单元,其基本单位是原始AV对象,它可以是自然的或合成的声音、图像。原 始AV对象具有高效编码、高效存储与传输以及可交互*作的特性,它又可进一步组成复合AV对象。因此MPEG-4标准的基本内容就是对AV对象进行高效编 码、组织、存储与传输。AV对象的提出,使多媒体通信具有高度交互及高效编码的能力,AV对象编码就是MPEG-4的核心编码技术。

    MPEG- 4不仅可提供高压缩率,同时也可实现更好的多媒体内容互动性及全方位的存取性,它采用开放的编码系统,可随时加入新的编码算法模块,同时也可根据不同应用 需求现场配置解码器,以支持多种多媒体应用。

    MPEG-4 采用了新一代视频编码技术,它在视频编码发展史上第一次把编码对象从图像帧拓展到具有实际意义的任意形状视频对象,从而实现了从基于像素的传统编码向基于 对象和内容的现代编码的转变,因而引领着新一代智能图像编码的发展潮流。

    关键技术

    MPEG-4除采用第一代视频编码的核心 技术,如变换编码、运动估计与运动补偿、量化、熵编码外,还提出了一些新的有创见性的关键技术,并在第一代视频编码技术基础上进行了卓有成效的完善和改 进。下面重点介绍其中的一些关键技术。

    A. 视频对象提取技术

    MPEG-4实现基于内容交互的首要任务就是把视频/图像 分割成不同对象或者把运动对象从背景中分离出来,然后针对不同对象采用相应编码方法,以实现高效压缩。因此视频对象提取即视频对象分割,是MPEG-4视 频编码的关键技术,也是新一代视频编码的研究热点和难点。

    视频对象分割涉及对视频内容的分析和理解,这与人工智能、图像理解、模式识别和神 经网络等学科有密切联系。目前人工智能的发展还不够完善,计算机还不具有观察、识别、理解图像的能力;同时关于计算机视觉的研究也表明要实现正确的图像分 割需要在更高层次上对视频内容进行理解。因此,尽管MPEG-4 框架已经制定,但至今仍没有通用的有效方法去根本解决视频对象分割问题,视频对象分割被认为是一个具有挑战性的难题,基于语义的分割则更加困难。

    目 前进行视频对象分割的一般步骤是:先对原始视频/图像数据进行简化以利于分割,这可通过低通滤波、中值滤波、形态滤波来完成;然后对视频/图像数据进行特 征提取,可以是颜色、纹理、运动、帧差、位移帧差乃至语义等特征;再基于某种均匀性标准来确定分割决策,根据所提取特征将视频数据归类;最后是进行相关后 处理,以实现滤除噪声及准确提取边界。

    在视频分割中基于数学形态理论的分水岭(watershed)算法被广泛使用,它又称水线算法,其 基本过程是连续腐蚀二值图像,由图像简化、标记提取、决策、后处理四个阶段构成。分水岭算法具有运算简单、性能优良,能够较好提取运动对象轮廓、准确得到 运动物体边缘的优点。但分割时需要梯度信息,对噪声较敏感,且未利用帧间信息,通常会产生图像过度分割。

    B. VOP视频编码技术

    视 频对象平面(VOP,Video Object Plane)是视频对象(VO)在某一时刻的采样,VOP是MPEG-4视频编码的核心概念。MPEG-4在编码过程中针对不同VO采用不同的编码策略, 即对前景VO的压缩编码尽可能保留细节和平滑;对背景VO则采用高压缩率的编码策略,甚至不予传输而在解码端由其他背景拼接而成。这种基于对象的视频编码 不仅克服了第一代视频编码中高压缩率编码所产生的方块效应,而且使用户可与场景交互,从而既提高了压缩比,又实现了基于内容的交互,为视频编码提供了广阔 的发展空间。

    MPEG-4支持任意形状图像与视频的编解码。对于任意形状视频对象。对于极低比特率实时应用,如可视电话、会议电 视,MPEG-4则采用VLBV(Very Low Bit-rate Video,极低比特率视频)核进行编码。

    传统的矩形图在 MPEG-4中被看作是VO的一种特例,这正体现了传统编码与基于内容编码在MPEG-4中的统一。VO概念的引入,更加符合人脑对视觉信息的处理方式, 并使视频信号的处理方式从数字化进展到智能化,从而提高了视频信号的交互性和灵活性,使得更广泛的视频应用及更多的内容交互成为可能。因此VOP视频编码 技术被誉为视频信号处理技术从数字化进入智能化的初步探索。

    C. 视频编码可分级性技术

    随着因特网业务的巨大增长,在速 率起伏很大的IP(Internet Protocol)网络及具有不同传输特性的异构网络上进行视频传输的要求和应用越来越多。在这种背景下,视频分级编码的重要性日益突出,其应用非常广 泛,且具有很高的理论研究及实际应用价值,因此受到人们的极大关注。

    视频编码的可分级性(scalability)是指码率的可调整性,即 视频数据只压缩一次,却能以多个帧率、空间分辨率或视频质量进行解码,从而可支持多种类型用户的各种不同应用要求。

    MPEG-4通过视频 对象层(VOL,Video Object Layer)数据结构来实现分级编码。MPEG-4提供了两种基本分级工具,即时域分级(Temporal Scalability)和空域分级(Spatial Scalability),此外还支持时域和空域的混合分级。每一种分级编码都至少有两层VOL,低层称为基本层,高层称为增强层。基本层提供了视频序列 的基本信息,增强层提供了视频序列更高的分辨率和细节。

    在随后增补的视频流应用框架中,MPEG-4提出了FGS(Fine Granularity Scalable,精细可伸缩性)视频编码算法以及PFGS(Progressive Fine Granularity Scalable,渐进精细可伸缩性)视频编码算法。

    FGS编码实现简单,可在编码速率、显示分辨率、内容、解码复杂度等方面提供灵活的 自适应和可扩展性,且具有很强的带宽自适应能力和抗误码性能。但还存在编码效率低于非可扩展编码及接收端视频质量非最优两个不足。

    PFGS 则是为改善FGS编码效率而提出的视频编码算法,其基本思想是在增强层图像编码时使用前一帧重建的某个增强层图像为参考进行运动补偿,以使运动补偿更加有 效,从而提高编码效率。

    D. 运动估计与运动补偿技术

    MPEG-4采用I-VOP、P-VOP、B-VOP三种帧格式来 表征不同的运动补偿类型。它采用了H.263中的半像素搜索(half pixel searching)技术和重叠运动补偿(overlapped motion compensation)技术,同时又引入重复填充(repetitive padding)技术和修改的块(多边形)匹配(modified block (polygon)matching)技术以支持任意形状的VOP区域。

    此 外,为提高运动估计算法精度,MPEG-4采用了MVFAST(Motion Vector Field Adaptive Search Technique)和改进的PMVFAST(Predictive MVFAST)方法用于运动估计。对于全局运动估计,则采用了基于特征的快速顽健的FFRGMET(Feature-based Fast and Robust Global Motion Estimation Technique)方法。

    在MPEG-4视频编码中,运动估计相当 耗时,对编码的实时性影响很大。因此这里特别强调快速算法。运动估计方法主要有像素递归法和块匹配法两大类,前者复杂度很高,实际中应用较少,后者则在 H.263和MPEG中广泛采用。在块匹配法中,重点研究块匹配准则及搜索方法。目前有三种常用的匹配准则:

    (1)绝对误差和(SAD, Sum of Absolute Difference)准则; 
    (2)均方误差(MSE, Mean Square Error)准则; 
    (3) 归一化互相关函数(NCCF, Normalized Cross Correlation Function)准则。

    在上述三种准则 中,SAD准则具有不需乘法运算、实现简单方便的优点而使用最多,但应清楚匹配准则的选用对匹配结果影响不大。

    在选取匹配准则后就应进行 寻找最优匹配点的搜索工作。最简单、最可靠的方法是全搜索法(FS, Full Search),但计算量太大,不便于实时实现。因此快速搜索法应运而生,主要有交叉搜索法、二维对数法和钻石搜索法,其中钻石搜索法被MPEG-4校验 模型(VM, Verification Model)所采纳,下面详细介绍。

    钻石搜索(DS, Diamond Search)法以搜索模板形状而得名,具有简单、鲁棒、高效的特点,是现有性能最优的快速搜索算法之一。其基本思想是利用搜索模板的形状和大小对运动估 计算法速度及精度产生重要影响的特性。在搜索最优匹配点时,选择小的搜索模板可能会陷入局部最优,选择大的搜索模板则可能无法找到最优点。因此DS算法针 对视频图像中运动矢量的基本规律,选用了两种形状大小的搜索模板。

    · 大钻石搜索模板(LDSP, Large Diamond Search Pattern),包含9个候选位置; 
    · 小钻石搜索模板(SDSP, Small Diamond Search Pattern),包含5个候选位置。

    DS算法搜索过程如下:开始阶段先重复使用大钻石搜索模板,直到最佳匹配块落在大钻石中心。由于 LDSP步长大,因而搜索范围广,可实现粗定位,使搜索不会陷于局部最小,当粗定位结束后,可认为最优点就在LDSP 周围8 个点所围菱形区域中。然后再使用小钻石搜索模板来实现最佳匹配块的准确定位,以不产生较大起伏,从而提高运动估计精度。

    此外Sprite 视频编码技术也在MPEG-4中应用广泛,作为其核心技术之一。Sprite又称镶嵌图或背景全景图,是指一个视频对象在视频序列中所有出现部分经拼接而 成的一幅图像。利用Sprite可以直接重构该视频对象或对其进行预测补偿编码。

    Sprite视频编码可视为一种更为先进的运动估计和补 偿技术,它能够克服基于固定分块的传统运动估计和补偿技术的不足,MPEG-4正是采用了将传统分块编码技术与Sprite编码技术相结合的策略。

    MPEG4 的应用领域

    凭借着出色的性能,MPEG4技术目前在多媒体传输、多媒体存储等领域得到了广泛的应用,下面我们就来看看目 前在那些领域MPEG4技术得到了大显伸手的机会。
    1、精彩的视频世界
    精彩的视频世界是MPEG4技术应用最多也是最为广大朋友所熟悉的 的形式。目前它主要以两种形式出现,一种是DIVX-MPEG4影碟(国内市面上已出现,且D版居多),另一种是网上MPEG4电影。
    (1)、我 们先来说说DIVX-MPEG4影碟,DIVX视频编码技术实际上就是MPEG4压缩技术,它由微软MPEG4V3修改而来,使用的是MPEG4压缩算 法,并同时分离视频和音频。它的核心部分便是由DivX对DVD音视频进行压缩,生成Mpeg4视频格式文件(也就是AVI格式)。
    小提示:笔者 也是经常被朋友所问到:“我看到的MPEG4电影片段明明是avi(扩展名)格式文件,并且Windows的媒体播放器也与之关联,但就是无法播放”。其 实, MPEG4并没有确定必须用什么扩展名,它只是一种编码方法而已。使用avi作为扩展名,是一种习惯性的沿用。
    在计算机上播放MPEG4影 音文件的方法目前有两种:第一种是用诸如DivxPlayer等专门的播放软件来播放;第二种播放方法是安装MPEG4(Divx)插件后,用 Windows自带的媒体播放机来播放。
    (2)、随着网络技术的不断发展,互联网上的视频流应用也成为了近几年的热门话题。目前,在互联网上比较 流行的几种影像格式包括Quicktime、RealPlay以及微软的MediaPlayer等。MPEG4技术出现之后,互联网上又出现了MPEG4 格式的电影,不过在观看前,系统会提示你下载最新的MPEG4解码软件。
    小提示:大家平时在网上可能经常会看见ASF格式的电影,其实它也是微软 公司开发出的一种可以直接在网上观看视频节目的压缩格式。使用的也是MPEG4的压缩算法,但因为它是以网上即时观看电影的视频流格式存在的,所以它的图 像质量相对要差一些。
    2、低比特率下的多媒体通信,
    目前,MPEG4技术已经广泛的应用在如视频电话、视频电子邮件、移动通信、电子新闻 等多媒体通信领域。由于这些应用对传输速率要求较低,一般在4.8~64kbit/s之间,分辨率为176×144左右。因此MPEG4技术完全可以充分 的利用网络带宽,通过帧重建技术压缩和传输数据,以最少的数据量获得最佳的图像质量。
    3、实时多媒体监控。
    多媒体监控领域原来一直是 MPEG1技术担当重任,但近些年来,它们也是“城头变换大王旗”了。由于MPEG4压缩技术原本是一种适用在低带宽下进行信息交换的音视频处理技术,它 的特点是可以动态的侦测图像各个区域变化,基于对象的调整压缩方法可以获得比MPEG1更大的压缩比,使压缩码流更低。因此,尽管MPEG4技术一开始并 不是专为视频监控压缩领域而开发的,但它高清晰度的视频压缩,在实时多媒体监控上,无能是存储量,传输的速率,清晰度都比MPEG1具有更大的优势。
    4、 基于内容存储和检索的多媒体系统。
    由于MPEG4在压缩方法上远远优于MPEG1技术,更是MJPEG技术所不能比拟的。 经过专家的测试表明,在相同清晰度对应MPEG1(500Kbits/sec)码流情况下, MPEG4比MPEG1节省了2/3的硬盘空间,在一般活动场景下也节省近一般的容量。因此无论是从内容存储量,还是从多媒体文件的检索速度来 说,MPEG4技术都是多媒体系统应用的不二之选。
    5、硬件产品上面的应用
    目前,MPEG4技术在硬件产品上也已开始逐步得到应用。特别 是在视频监控、播放上,这项高清晰度,高压缩的技术得到了众多硬件厂商的钟爱,而市场上支持MPEG4技术的产品也是种类繁多。下面笔者就列举一些代表性 的产品,旨在让读者了解MPEG4技术在今天应用范围之广。
    (1)、摄像机:日本夏普公司推出过应用在互联网上的数字摄像机VN-EZ1。这台网 络摄像机利用MPEG4格式,可把影像文件压缩为ASF(高级流格式),用户只要利用微软公司的MediaPlayer播放程序,就可以直接在电脑上进行 播放。
    (2)、播放机:飞利浦公司于今年八月份推出了一款支持DivX的DVD播放机DVD737。它可以支持DivX 3.11、4.xx、5.xx等MPEG4标准,而对于新标准的支持则可以通过升级固件来实现。
    (3)、数码相机:日本京瓷公司在11月中旬发售 其最新款数码相机Finecam L30,这款是采用300万像素、3倍光学变焦设计的数码相机产品, L30采用了MPEG4格式动态视频录制,可以让动态视频录制画面效果比传统数码相机更出色。
    (4)、手机:在手机领域,MPEG4技术更是得到 了广泛的应用,各大手机厂商也都推出了可拍摄MPEG4动态视频的手机型号,如西门子ST55、索尼爱立信P900/P908、LG 彩屏G8000等。
    (5)、 MPEG4数字硬盘:在今年深圳举行的安防展览会上,开发数字录像监控产品的厂家纷纷推出了他们的最新产品,而支持MPEG4的DVR压缩技术也成为改展 会上的亮点。
    如北京华青紫博科技推出的“E眼神MPEG4数字视频王”便是一款基于网络环境的高清晰数字化监控报警系统。内置多画面处理器,集现 场监控、监听、多路同时数字录像与回放等多种功能为一体。
    其实,市场上还有许多基于MPEG4技术的硬件产品,笔者这里就不一一列举了,不过笔者 相信,随着视频压缩技术的不断发展,MPEG4技术的产品会越来越多的出现在我们生活,工作中。

     

     

     

    https://blog.csdn.net/ustcxiangchun/article/details/5697475

    展开全文
  • 音频压缩分为两种,其基本的方法都是消除冗余信息,在这里的冗余信息的是:人的听觉范围以外的音频信息: (1)有损压缩:消除冗余信息后,无法还原出原声。 (2)无损压缩:消除冗余信息后仍能够还原出原声。

    音频压缩技术

    音频压缩分为两种,其基本的方法都是消除冗余信息,在这里的冗余信息指的是:人的听觉范围以外的音频信息:
      (1)有损压缩:消除冗余信息后,无法还原出原声。

      (2)无损压缩:消除冗余信息后仍能够还原出原声。

    音频冗余信息:

    音频压缩技术是在保证信号在听觉方面不产生失真的前提下,对音频数据信号进行尽可能大的压缩。

    压缩的主要方法是去除采集到的音频冗余信息,所谓冗余信息包括人耳听觉范围外的音频信号以及被遮蔽掉的音频信号。

    信号的遮蔽可以分为频域信息和时域信息。

    音频无损技术

    熵编码:

      使用的熵编码进行无损编码,其基本原来是将短的编码替代高频的词汇,句子,用长的句子代表低频词。熵编码常用的三种方法:

      (1)哈夫曼编码:使用一串二进制数代替一串特别长的字符。特点是:频率越高的编码越少,频率越低的编码越长。

      (2)算术编码:通过二进制小数进行编码

      (3)香农编码

    音频编码过程:

      采集到原始的音频数据,经过时域转频域变换,并且通过心理声学模型(滤除人听觉范围以外的频率),将这两个数据汇总之后进行量化编码(有损,无损编码),编码后的得到比特流的数据就可以用在网络的传输上。

    常见的音频编码器

    常见的音频编码器包括OPUS,AAC,Ogg,Speex,iLBC,AMR,G.711等。其中,AAC在直播系统中应用的比较广泛;OPUS是最新的音编码器,WebRTC默认使用OPUS;固话一般用的G。711。

      (1)OPUS:目前比较新的音频编码器,WebRTC默认使用OPUS,延迟小,压缩率高。应用在线教育,视频会议。

      (2)AAC:在直播系统中应用比较广泛的编码器;(分软件和硬件)不适合实时性要求较高的场景

      (3)Ogg:软件收费,应用比较少。

      (4)Speex:显著的特点是支持回音消除,是七八年前应用非常广泛的编码器。

      (5)G.711:固话,电话使用的窄带音频编码器,但是音损非常严重,不适合实时通信。

      (6)其他:iLBC,AMR。

    不同音频编码器的音频编码质量比较OPUS对不同的网络质量(窄带、宽带、超宽带、全带)都有对应的码流选择

    不同音频编码器的音频编码码流不同编码器在不同的延时对码率的支持范围

    AAC编码器

    AAC编码器介绍:

    一,产生AAC全称为Advanced Audio Coding。研发目的:取代MP3格式。与MP3格式的比较:MP3的压缩率比较低,压缩后的文件大;AAC的压缩率比较高,保真性强,即使压缩成很小的数据,还原度仍然很高。最初是基于MPEG-2音频编码技术,在MPEG-4标准出现后,AAC加入了SBR技术和PS技术。

    二,常用的规格

      (1)AACLC:低复杂度规格,码流128k,音质好;

      (2)AAC HE V1

      (3)AAC HE V2

    三,AAC编码家族规格之间的关系

    四,AAC规格描述

     五,AAC格式

    AAC的格式:

      ADIF(Audio data interchange format ):可以确定找个这个数据的开始,就相当与在aac数据前面加了个Header,Header里面就会包含aac数据的一些信息,方便进行编解码。特点是只能从头开始解码,不能从音频数据中间开始,这种格式常用于磁盘文件中

      ADTS(Audio Data Transport Format):在每一帧的数据里面都会有一个同步字,所以他可以在任意的位置开始进行解码,就像流式数据;

    展开全文
  • 数字媒体技术揭秘四、压缩技术4.1 理论基础廿世纪中叶,为了从理论上证明对信息系统进行优化的可行性,Shannon引入了熵的概念,用来表示信息的不确定性,熵越大,信息的不确定性就越大[4],而信息的不确定性越大,其...

    前文:
    数字媒体技术揭秘

    四、压缩技术

    4.1 理论基础

    廿世纪中叶,为了从理论上证明对信息系统进行优化的可行性,Shannon引入了熵的概念,用来表示信息的不确定性,熵越大,信息的不确定性就越大[4],而信息的不确定性越大,其对应的传输和存储成本就越高。换句话说,如果某种信息的熵不是那么大,则人们应该有信心使用有限的资源去承载它。举一个简单的例子,假设气象台负责预报明天是否天晴,而地震局负责预报明天是否地震,那么显然,来自气象台的信息要比来自地震局的信息具有更大的不确定性,也就是说气象信息的熵更大,如若使用喇叭来传递信息,对于气象台而言,以鸣喇叭来表示天晴或者表示天阴,对喇叭的使用寿命影响并不大,地震局则不然,如果以鸣喇叭来表示地震,那这喇叭的使用寿命远大于气象台的那一只。这说明,信息传输的成本是有下限的,这个下限由信源的熵决定,而如何达到或接近这个下限成为通信领域的主要研究内容,数据压缩便是其中的主题之一,在Shannon的通信模型中属于信源编码的范畴。

    这里写图片描述

    通过建立一个简化的信源模型可以算出熵的最大值,这是非常有意义的,基于这个最大熵可以得到传递信息的极限成本。离散平稳无记忆信源就是这样的一个简化模型,源自这种信源的信息统计特性相同,但相互独立,于是可以用一个概率空间[M, P]来抽象这些信息,其中M={M1, M2, …, Mk}是概率分布为P={P1, P2, …, Pk}的一个随机变量,那么M的熵由下面公式给出:

    H(M)=Σ(PilogPi)

    公式中 logPi 表示Mi的信息量:概率越大信息量越小。于是不难发现, H(M)不过是信息量的一个概率平均。对于离散平稳无记忆信源,H(M)也可以看作信源的熵,针对某种特定的分布,这个熵存在最大值,对应的分布叫做最大熵分布。离散无记忆信源的最大熵分布是均匀分布,此时其熵值为log₂(k),k是其可能值的个数。

    如果信源是有记忆的,也就是说信源产生的信息相互并不独立,则需要引入联合熵的概念。以两个相关的随机变量表示信源产生的两个信息来构造一个最简单的模型,以下三个公式成立:

    H(X,Y) = H(X)+H(Y)-I(X,Y) (4-1)
    I(X,Y) = H(X)-H(X|Y) = H(Y)-H(Y|X) (4-2)
    H(X|Y) = H(X,Y)-H(Y) (4-3)

    其中,H(X,Y)为联合熵,表示这两个信息整体上的不确定性;I(X,Y)为互信息量,表示两个信息的相关性,不相关的信息互信息量为0;H(X|Y)叫做相对熵,表示在Y已知的情况下X的不确定性。第一个公式说明,对于相关的信息,其各自熵的和会大于描述其整体不确定性的联合熵。第二个公式定义两个信息的互信息量为其中一个的熵减去其相对熵。第三个公式表示,X在Y已知的情况下的相对熵等于两个信息的联合熵减去Y的熵。

    对于有记忆信源,其熵值不再等于其产生的某一个的信息的熵,这种情况下要使用熵率来描述信源的不确定性,这是一个极限值,假设Hn是信源产生的n个信息的联合熵,则熵率就是n趋于无穷大时的Hn/n。

    数据压缩就是对信源产生的信息进行编码的一个过程,即使用某个符号表,如0和1来表示要传输的信息。这里涉及到两种情形:无损编码和有损编码。对于无损编码来说,要求解码之后的信息和编码之前的信息完全相同,即编码过程不引入任何失真,在这种情况下,如果使用二进制符号来表示信源产生的某个信息,其平均长度不能小于信息的熵或信源的熵率。有损编码则会在编码过程中引入失真,因此,从根本上讲是一个信息率-失真最优化的问题。

    假设编码过程引入的均方失真为D,则存在一个函数R(D),表示不超过给定失真D的前提下对该信源编码所需要的最小的信息率,即所谓的率失真函数。如果信源的概率分布给定,平均失真D仅由信源编码前后的转移概率——亦即编码方式决定,则率失真函数给出的其实是一个信源编码的极限信息率,也就是说,对于既定信源,总可以找到一种编码方式,能够保证在既定失真的前提下达到率失真函数给出的最小信息率。率失真函数取决于信源的统计特性,一般不存在显式的表达式,但是对于某些特定分布的信源,率失真函数能够以明了的形式给出,比如高斯分布的连续无记忆信源的率失真函数为:

    R(D)=½log(σ²/D)(0Dσ²)

    再举一个二值的离散无记忆信源X的例子:概率P分别为0.1、0.2、0.3和0.5的情况下其率失真函数如下图示:

    可以发现,当P=0.5,即均匀分布的情况下,信息率失真函数最靠上,也就是说给定最小失真对应的极限信息率越大。当失真为零时,信息率的极限为1,亦即信源的熵。也就是说,有这样一个信源,它以50%的概率在产生符号0和符号1,则无失真地编码该信源产生的一个符号最少也需要1个比特,注意,这是传输成本最高的一种信源。此时,我们便不难理解气象台的喇叭为什么更容易损坏了。

    4.1.1 变换编码

    从理论上讲,变换的主要目的是去相关。由公式4-1可知,对于相关性很强的两个随机变量,其互信息非常大,导致两个信源的熵的和远大于其联合熵。如果将这两个随机变量看做为一个二维的随机向量,通过一个变换矩阵,可以将{X, Y}变换为 {X’, Y’},在这一过程中,H(X,Y)=H(X’,Y’),如果变换矩阵选择适当,令I(X’,Y’)=0,则H(X’)和H(Y’)将远小于H(X)和H(Y),从而对X’和Y’编码需要的比特数将大大减少。能够使X’和Y’相互独立的变换叫做KL变换,这是一种理论上的最佳变换,但由于相应的变换矩阵需要通过X和Y的统计特性来计算,在工程上很难应用起来。

    可以从更直观的角度来理解这种说法:以图像数据为例,假设每个像素点的亮度范围为0~255,则在空间域独立地来看某个像素点的话,其统计特性是近似均匀的,也就是说,各阶像素值发生的概率大致都差不多,因此,至少需要8个比特编码一个像素值,而不能够给某些像素值多些的比特,而给某些值少一些。但实际上,对于一个来自某幅图像的像素矩阵采样,如果其中某个像素点为值0的话,其它点为255的概率也不会太大。如下图所示,左图是典型的图像数据(采样自Lenna),而右图则极为罕见,在编码的时候,左图数据应该给以多于右图数据的比特数,要达到这样的目标,在缺少完美的矢量量化方法之前,变换不失为一种很好的工具。
    这里写图片描述
    这里写图片描述

    那么,变换域中各点取值的概率分布又如何呢?首先,各点的值域将发生变化,比如DCT变换域各点的取值范围为-2048~2048;其次,各点的概率分布更加独立。 还以上面两幅图像为例,与罕见的图像采样(右图)相比,经典的图像采样(左图)变换域右下方向的值更接近0。因此,对于图像数据来说,变换域右下角出现大量0值是比较常见的,可以使用更少的比特编码这些大概率的情况。换句话说,变换是为了从全局的角度抽取一组数据的特征,并将这些特征分割开来。

    DCT是音视频压缩中的一种常用变换,它虽然不能保证使变换后的随机变量相互独立,但仍能大大减少它们的相关性,而且,DCT变换还能产生能量聚集的效果,即对于变换后的随机向量,能量相对集中在索引较小的分量上,更有利于量化。

    4.1.2 差分编码

    差分编码基于预测来实现,即不编码原始信源数据,而去编码原始信源数据和预测数据的差分数据,主要目的是在不引入失真的前提下减小原信号序列的动态范围。假设信源产生了一个随机序列:

    S(0), ..., S(n-5), S(n-4), S(n-3), S(n-2), S(n-1), S(n)

    设S’(n)为S(n)的预测值:

    S'(n) = f(S(n-1), S(n-2), S(n-3), S(n-4), S(n-5))

    则预测值序列为:

    S'(0), ..., S'(n-5), S'(n-4), S'(n-3), S'(n-2), S''(n-1), S(n)

    令d(n) = S(n)-S’(n),则差分序列为:

    d(0), ..., d(n-5), d(n-4), d(n-3), d(n-2), d(n-1), d(n)

    预测的准则是均方误差最小,及找到一个合适的预测函数f,使d²(n)最小。 与变换编码不同之处是,即使找到了一个最优的预测函数f,差分编码也不一定会提高编码效率。如果随机序列中个分量不具备相关性甚至是负相关的,差分序列中个分量的均方差会变得很大,甚至大于原始序列中各分量的均方差,这种情况下编码效率会严重下降。

    对于一个相关系数接近1的马尔可夫序列,S’(n)=S(n-1)是一个较优的预测函数,这种差分编码便是广泛使用的DPCM技术。

    需要注意的是,在实际的编码过程中,由于解码端无法得到原始值,所以预测函数通常使用预测值来代替原始值,即:

    S'(n) = f(S'(n-1), S'(n-2), S'(n-3), S'(n-4), S'(n-5))

    对于DPCM,S’(n)=S’(n-1)

    4.1.3 熵编码

    通过变换和预测等方法使信源的统计特性得到一定的改善之后(去相关性,降低均方差……),接下来需要进行的是熵编码,也是数据压缩的最后一步,其主要责任是将压缩视频的各种头信息、控制信息以及变换系数转换为二进制的比特流。有两种最基本的熵编码方法:

    • 定长编码: 对所有的待编码信息使用相同长度的码字
    • 变长编码: 使用不同长度的码字

    假设某个待编码的信息元素A∈{A0, A1, …, An},如果采用定长编码,需要的比特数为log₂(n)取整,而使用变长编码,其平均码长的极限取决于该信息的熵H,除非是均匀分布,不然所需要的比特数必定小于log₂(n)。因此,如果某个信息元素在概率分布上是极度不均匀的,通常都会采用变长编码的方式,即概率小的值使用长码字,概率大的值使用短码字。

    指数哥伦布码、Huffman编码和算术编码都是常用的变长编码方法。

    4.1.4 量化

    量化[5]是一种多对一的映射,是引入失真的一个过程,也是限失真信源编码技术的基础。无论是对时间采样后的模拟信号进行数字化的过程,还是对数字序列进行有损压缩的过程,都需要完成一个由输入集合到输出集合的映射,这个映射是由量化来实现的。

    最简单的量化方法是将单个样本的取值进行量化,因为被量化的变量是一维的,所以这种量化方法叫做标量量化。设n阶标量量化器的输入为连续随机变量x,输出为离散随机变量y,其中:

    x∈(A0, An), y∈{Y1, Y2, …, Yn},A0≤ Y1 ≤ A1 ≤ Y2 ≤ …… An-1 ≤ Yn ≤ An。
    则y 的取值由下式决定:

    y=Yi,Ai1xAi

    当量化阶数n一定时,选择合适的Ai 和Yi 可以使量化器的平均失真最小,这时的量化称为最佳标量量化。若输入变量x满足均匀分布,可以将(A0, An)均匀分割成n个小区间,每个小区间的中点作为量化值。这种量化方法叫做均匀量化,对于均匀分布的输入变量来说,均匀量化是最佳标量量化。当采用均方失真函数时,可以计算出其平均失真为Δ²/12,其中Δ = (An-A0)/n。

    然而,从率失真的角度来考虑,最佳标量量化并不能达到最佳率失真编码的要求,通常需要对量化后的数据进行继续进行处理,如熵编码等。

    为了使量化后不再进行后处理而能逼近率失真函数的界,人们开始探讨根据多个连续信源符号联合编码的方法,即矢量量化技术
    假设X = {X1, X2, …, Xn}是信源的一个n维矢量,它的取值范围是n维空间中的一个区域Rn,一个k级的矢量量化器就是X∈Rn到k个n维量化矢量Y1, Y2, …, Y的映射函数Q(X)。对于任意Yi,i = 1, 2, …, k,指定一个n维的区域Ai,对于所有X∈Ai,有Q(X) = Yi。其中Ai称为Yi的包腔,各量化矢量称为码字,它们的集合称为码书。如果选择的码书和各包腔可以使平均失真最小,这时的矢量量化称为最佳矢量量化。

    4.1.5 率失真优化

    率失真函数给出了信源编码的信息率极限,而率失真优化则研究如何达到该极限,即在给定信息率上限Rc的前提下,寻找一种编码方法使D最小化:

    min{D(P)} s.t. R(P) ≤ Rc

    其中,P表示一个信源编码前后的转移概率,代表某种编码方法。

    这是一个典型的有约束的非线性规划问题,可以通过拉格朗日乘子法转化为一个无约束的求极小值的问题:

    min{D(P)+λ*R(P)}

    这里的λ与约束条件Rc息息相关,目标速率越大,则λ越小,当λ为零时,表示不限制目标速率,则只剩下min{D(P)}了。

    实际的编码过程不是数学推理过程,无需对上面的方程求解,只要确定了λ(这是个关键点),通过穷举搜索即可找到最佳的编码方法。

    4.2 图像

    4.3 视频

    4.3.1 混合编码系统

    这里写图片描述
    所谓混合指的是运动预测差分编码和变换编码的混合,其一般编码原理由上图给出,通常是以宏块为单位按照扫描顺序进行编码,当然也不排除基于某种大规模并行运算的编码方法改掉这一方式。整个处理过程中,涉及到的数据包括:

    • P: 预测值
    • D: 差分值
    • D’: 本地恢复的差分值
    • X: 量化后的残差变换系数
    • R: 经过熵编码的残差变换系数

    主要的处理模块包括:

    4.3.1.1 ME:运动估计

    这里的运动估计指的是为待编码宏块中的各个像素点寻找最佳预测值的搜索过程,找到的预测值位于某一帧已经编码并重建的图像中,与被预测的像素点在位置上存在偏差,这些偏差就叫作运动矢量,它们和参考帧的位置共同作为运动估计过程的最终输出物。

    4.3.2.2 MC: 运动补偿

    运动补偿也叫做运动补偿预测,这一过程根据运动估计给出的运动矢量和参考帧位置生成待编码宏块各像素点的预测值。由待编码图像和经运动补偿的参考图像逐点相减可生成一副差分图像,相对与自然图像,差分图像的动态范围大大减小,从而更有力于后续的压缩

    4.3.2.3 T: 变换

    通过对待编码像素与预测值的差值进行一个二维变换,有效地去除空间冗余。

    4.3.2.4 Q: 量化

    变换系数的量化通过引入失真降低比特率。

    4.2.3.5 1/T: 反变换

    这一过程和下一过程的主要目的是生成本地重建图像。由于解码器端无法获取原始图像,为了防止误差积累,需要在编码器端复制解码过程,使用解码后的重建图像代替原始图像进行预测。

    4.2.3.6 1/Q: 反量化

    4.2.3.7 Zigzag: Z扫描

    Z扫描可以将二维的残差变换系数转换为一维的序列,更有利于其后的熵编码。

    4.2.3.8 Entropy: 熵编码

    利用数据流内部的统计特性对一维的残差变换系数进行无损压缩。

    4.2.3.9 Filter: 环内滤波

    环内滤波有两个目的:其一是为了去除因变换产生的块效应;其二是通过改善重建图像,使预测过程更有效。

    4.2.3.10 Intra: 帧内预测

    在某些情况下,无法获得参考帧,或参考帧中的预测值与实际值的差距过大(比如视频序列发生场景切换),则不采用已编码重建图像中的像素值作为预测值,而以当前图像中已编码部分的像素值作为预测值。

    4.2.3.11 模式选择

    此外,编码过程还隐含着一个模式选择的模块,体现在上图中就是决定帧内还是帧间的开关,而实际上除了这个的开关,其他诸如运动补偿、帧内预测都要涉及到模式选择,譬如基于多大的块进行运动补偿、使用哪一个参考帧等。

    运动补偿预测可以用下图来表示
    这里写图片描述

    红色部分为待编码的宏块,彩色部分为利用运动补偿由本地解码的重构图像生成的预测值,而最终编码的是红色部分和彩色部分的差值。可以看出,为了完成该宏块的预测,需要四个运动矢量和两个参考帧。某些编码技术如双向预测及MPEG2中的Dual-Prime会令预测过程更加复杂,预测值需要由两个经运动补偿的预测值加权平均得到:
    这里写图片描述

    展开全文
  • 图像压缩编码原理

    千次阅读 2018-01-10 17:23:12
    什么要进行图像压缩编码? 1) 在数字分量编码中,按照4:2:2格式对电视信号进行取样、量化、编码后,数据率达27MW/S。 2) 在数字高清晰度电视格式中,取样、量化、编码后的数据率会更大。 3) 电视信号...
  • 数据压缩编码方法

    千次阅读 2016-12-18 12:08:20
    经典的数据压缩算法 三大类:预测编码、变换编码、统计编码 常用的解除相关性的措施是预测和变换,其实质都是进行序列的映射。 一般,预测编码有可能完全解除序列的相关性,但须确知序列的概率特性;变换编码一般...
  • 数字压缩编码技术

    千次阅读 2010-07-08 09:35:00
    数字信号有很多优点,但当模拟信号...因此说,数字压缩编码技术是使数字信号走向实用化的关键技术之一,表4 -1 列出了各种应用的码率。 <br />表4 -1 各种应用的码率 应用种类 比特数/
  • 图像压缩编码概述

    万次阅读 2017-04-10 14:25:17
    1.图像压缩编码的必要性 现在是信息爆炸时代,图像数据量特别大,故此在传输或者存储时都需要对数据进行有效的压缩。图像压缩就是对图像数据按照一定的规则进行变换和组合,用少的数据量表示影像。 2.图像压缩编码...
  • 视频编码技术详解

    万次阅读 多人点赞 2020-04-18 14:06:53
     而这一切,离不开视频拍摄技术的不断升级,还有视频制作产业的日益强大。    此外,也离不开通信技术的飞速进步。试想一下,如果还是当年的56K Modem拨号,或者是2G手机,你还能享受到现在动辄10...
  • [实验]无失真信源压缩编码

    千次阅读 2018-03-19 20:09:04
    实验一 无失真信源压缩编码此文系后续整理,懒得copy,对应的方法可以根据需要可以直接下载代码,附件:...
  • Table of Contents 1.图像压缩简介 2.图像压缩用途 3. 源编码与信道编码 4. 有损压缩与无损压缩 2. 图像压缩的必要性 ...为什么要进行编码? 概率高的符号用短码,概率低的符号用长码 Huffman...
  • 图像压缩编码

    2017-04-10 14:19:41
    1.图像压缩编码  图像压缩就是对图像数据按照一定的规则进行变换和组合,用尽可能少的数据量来表示影像。 ①必要性  图像的数据量非常大,为了有效地传输和存储图像,有必要压缩图像的数据量,而且现代通讯技术...
  • 多媒体技术基本数据压缩方法-游程编码游程编码RLE 游程编码RLE 基本思想: 把输入流中连续重复出现的字符用字符对<出现次数,连续重复出现字符>来替换。游程的是出现次数。 样例: 输入 ABBCAAAAACD 输出...
  • 本文介绍一下视频压缩编码和音频压缩编码的基本原理。其实有关视频和音频编码的原理的资料非常的多,但是自己一直也没有去归纳和总结一下,在这里简单总结一下,以作备忘。 1.视频编码基本原理 (1) 视频信号的...
  • 视频压缩编码标准

    万次阅读 2018-08-15 19:29:15
    一、总体介绍思维导图 二、详细叙述 ...信息就是客观世界的描述和分析,它无处不在,无时不在,具有通用性、抽象性、无限性三个特征。...信息化是“在现代信息技术广为普及的基础上,通过...
  • 压缩编码与格式

    千次阅读 2017-07-05 11:15:41
    1、视频编码视频文件压缩过程中的运算方法,同一种格式的视频文件其视频编码和音频编码有可能不同。比如同样是AVI格式的视频文件,其视频编码可以是DIVX、XVID、AVC、H.263、H.264、Windows Madia Video等等,...
  • 视频压缩编码基本原理

    千次阅读 2015-06-17 12:56:09
    本文介绍一下视频压缩编码和音频压缩编码的基本原理。其实有关视频和音频编码的原理的资料非常的多,但是自己一直也没有去归纳和总结一下,在这里简单总结一下,以作备忘。 1.视频编码基本原理 (1) 视频信号的...
  • 图像压缩编码的必要性

    千次阅读 2017-04-10 14:07:14
    1.图像压缩编码的必要性 图像的数据量非常大,为了有效地传输和存储图像,有必要压缩图像的数据量,而且随着现代通信技术的发展,要求传输的图像信息的种类和数据量越来越大,若不对其进行数据压缩,便难以推广应用...
  • 图像压缩编码和解码原理

    千次阅读 2017-02-09 09:48:07
    在实用技术上,可通过以下途径来压缩图像数据的总量。  1、采用亮度(Y)、色度(C)取样方式  实用彩色电视技术没有传输、处理红、蓝、绿三基色信号,而传输、处理亮度信号Y和色度信号C。这种处理方法有利...
  • 图像压缩编码的必要性:图像的数据量非常大。为了有效地传输和存储图像,有必要压缩图像的数据量。随着现代通信技术的发展,要求传输的图像信息的种类和数据量愈来愈大。若不对此进行数据压缩,便难以推广应用。 ...
  • 音频信号的数字化及压缩编码

    千次阅读 2017-03-12 23:14:49
    随着数字电视技术和多媒体通信技术的广泛应用,数字音频压缩编码技术在近20年也得到了快速的发展。典型的编码标准有:MPEG-1、MPEG-2 Audio、MPEG-2 AAC、MPEG-4 Audio和Dolby AC-3音频编码标准等。
  • C++ huffman数据压缩算法实现(附源码)

    千次阅读 多人点赞 2020-12-06 16:02:46
    什么是Huffman压缩 Huffman( 哈夫曼 ) 算法在上世纪五十年代初提出来了,它是一种无损压缩方法,在压缩过程中不会丢失信息熵。并且能够证明 Huffman 算法在无损压缩算法中是最优的。 Huffman 原理简单,实现...
  • 图像压缩原理 1.图像压缩的概念  减少表示数字图像时需要的数据量 2.图像压缩的基本原理  去除多余数据.以数学的观点来看,这一过程... 图像压缩以较少的比特有损或无损地表示原来的像素矩阵的技术,也称图像编码.
  • 经典数据压缩编码方式

    千次阅读 2016-12-28 23:13:45
    经典的数据压缩算法 三大类:预测编码、变换编码、统计编码 常用的解除相关性的措施是预测和变换,其实质都是进行序列的映射。 一般,预测编码有可能完全解除序列的相关性,但须确知序列的概率特性;变换编码一般...
  • 音视频基础_3_音频压缩技术简介

    千次阅读 2020-03-15 20:04:20
    压缩/编码技术与格式之间的关系 由于原始音频数据(PCM数据)体积很大,不利于存储和传输,所以需要压缩压缩技术也被称为编码技术(Encode),二者基本上是同样的意思。编码技术有很多种,比如 MP3 技术,将 PCM ...
  • 1.视频编码基本原理 (1) 视频信号的冗余信息 以记录数字视频的YUV分量格式为例,YUV分别代表亮度与两个色差信号。例如对于现有的PAL制电视系统,其亮度信号采样频率为13.5MHz;色度信号的频带通常为...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 60,305
精华内容 24,122
关键字:

压缩编码技术指什么