精华内容
下载资源
问答
  • 119 摘要:为了使大容量的多媒体数据在网 络上有效的传输,必须对多媒体数据进行压 缩对多媒体数据压缩中的几种无损压缩方 法进行了比较,并对每种方法用一个例子说 明 关键词:数据压缩;霍夫曼树;LZW;二 叉树 引言 随着...
  • 数据压缩知识点整理

    千次阅读 2017-04-27 16:57:20
    数据压缩 是指在不丢失有用信息的前提下, 缩减数据量 以减少存储空间, 提高传输、存储和处理效率, 或按照一定的算法对数据进行重新组织, 减少数据的冗余和存储的空间的一种技术.

    数据压缩知识点整理

    一. 概述

    数据压缩 是指在不丢失有用信息的前提下, 缩减数据量 以减少存储空间, 提高传输、存储和处理效率, 或按照一定的算法对数据进行重新组织, 减少数据的冗余和存储的空间的一种技术.

    数据压缩包括 有损压缩无损压缩

    数据压缩或源编码是按照 特定的编码机制 用比未经编码少的 数据元 表示信息的过程

    对于任何形式的通信, 只有当信息的发送方和接收方都能理解编码机制的时候压缩数据通信才能正常工作.

    数据压缩能够实现是因为多数现实世界的数据都存在 统计冗余

    压缩很重要, 可以帮助减少 硬盘空间/网络带宽等昂贵资源的消耗, 且压缩也需要消耗信息处理资源这类同样昂贵的资源, 所以数据压缩机制的设计需要在 压缩能力(压缩速度, 压缩数据大小), 失真度(质量损失), 所需计算资源,其他需考虑因素之间进行折中.

    • 无损压缩算法通常利用 统计冗余 来实现数据的压缩.

    • 无损数据压缩 是一种可逆的机制, 压缩后的数据还可以恢复到原始数据

    • 有损压缩允许数据可以有一定的程度的保真度损失,允许一定程度的数据损失, 对数据进一步的压缩.

    • 实际中, 对于不含辨别样式的数据任何压缩算法都不能压缩.

    • 试图去压缩已经压缩过的数据, 往往是对数据的扩展.

    二. 压缩分类

    1. 按数据压缩的即时性:

      • 即时压缩

        数据的采集,转换,压缩,传输等处理按时间顺序完成. 网络请求中的压缩(GZIP),电话中语言处理等.(通常要硬件支持->压缩卡)

      • 非即时压缩

        在需要的时候才用的, 常用的pc端解压缩(RAR,ZIP,7z等).

    2. 按数据类别:

      • 数据压缩

        可以包含文件, 但有时也指具有 时效性 的数据, 这些数据是即时采集,及时处理,传输等(即时压缩).

      • 文件压缩

        专指保存在磁盘等物理介质的数据进行压缩(音乐,视频,文档等).

    3. 压缩数据前后数据是否有损

      • 无损压缩

        无损压缩利用数据的 统计冗余 进行压缩.

        数据统计冗余度理论限制: 2: 1 | 5: 1, 所以无损压缩比一般的压缩力较低.

        无损压缩方法广泛应用于 文本数据(电子表格), 程序(可执行文件)特殊应用场合的图像数据 等需要精确存储数据的压缩中.

        无损压缩算法有霍夫曼(Huffman)算法LZW(Lenpel-Ziv & Welch) 压缩算法

      • 有损压缩

        有损压缩利用 人类对视觉,听觉对图像,声音中的某些频率成分不敏感的特性, 允许压缩过程中损失一定的数据,虽然不能完全恢复原始数据,但所损失的部分对于理解原始图像的影响比较小,换的较大的压缩比.

        有损压缩广泛应用于 语音, 图像, 视频等数据的处理中, 常见的声音、图像、视频压缩基本都是有损的。

        在多媒体应用中,常见的压缩方法有:PCM(脉冲编码调制),预测编码,变换编码,插值和外推法,统计编码,矢量量化和子带编码等,混合编码是广泛采用的方法。

        mp3 、divX 、Xvid 、jpeg、 rm 、rmvb、 wma 、wmv等都是有损压缩.

    三. 原理

    事实上,多媒体信息存在许多数据冗余。例如,一幅图像中的静止建筑背景、蓝天和绿地,其中许多像素是相同的如果逐点存储,就会浪费许多空间,这称为 空间冗余。又如,在电视和动画的相邻序列中,只有运动物体有少许变化, 仅存储差异部分 即可,这称为 时间冗余 。此外还有 结构冗余视觉冗余 等,这就为数据压缩提供了条件。

    总之,压缩的理论基础是 信息论。从信息的角度来看,压缩就是去除掉信息中的冗余,即 去除掉确定的或可推知的信息,而 保留不确定的信息,也就是 用一种更接近信息本质的描述来代替原有的冗余的描述,这个本质的东西就是 信息量

    四. 应用

    一种非常简单的压缩方法是行程长度编码,这种方法使用数据及数据长度这样简单的编码代替同样的连续数据,这是无损数据压缩的一个实例。这种方法经常用于办公计算机以更好地利用磁盘空间、或者更好地利用计算机网络中的带宽。对于电子表格、文本、可执行文件等这样的符号数据来说,无损是一个非常关键的要求,因为除了一些有限的情况,大多数情况下即使是一个数据位的变化都是无法接受的。

    对于视频和音频数据,只要不损失数据的重要部分一定程度的质量下降是可以接受的。通过利用人类感知系统的局限,能够大幅度得节约存储空间并且得到的结果质量与原始数据质量相比并没有明显的差别。这些有损数据压缩方法通常需要在压缩速度、压缩数据大小以及质量损失这三者之间进行折衷。

    有损图像压缩用于数码相机中,大幅度地提高了存储能力,同时图像质量几乎没有降低。用于DVD的有损MPEG-2编解码视频压缩也实现了类似的功能。

    在有损音频压缩中,心理声学的方法用来去除信号中听不见或者很难听见的成分。人类语音的压缩经常使用更加专业的技术,因此人们有时也将“语音压缩”或者“语音编码”作为一个独立的研究领域与“音频压缩”区分开来。不同的音频和语音压缩标准都属于音频编解码范畴。例如语音压缩用于因特网电话,而音频压缩被用于CD翻录并且使用 MP3 播放器解码。

    五: 理论依据

    压缩的理论基础是信息论(它与 算法信息论 密切相关)以及 率失真理论,这个领域的研究工作主要是由 Claude Shannon 奠定的,他在二十世纪四十年代末期及五十年代早期发表了这方面的基础性的论文。Doyle 和 Carlson 在2000年写道数据压缩“有所有的工程领域最简单、最优美的设计理论之一”。密码学编码理论 也是密切相关的学科,数据压缩的思想与统计推断也有很深的渊源。

    许多无损数据压缩系统都可以看作是四步模型,有损数据压缩系统通常包含更多的步骤,例如它包括预测、频率变换以及量化。

    六. 流行算法

    Lempel-Ziv(LZ) 压缩方法是最流行的无损存储算法之一。DEFLATE 是 LZ 的一个变体,它针对 解压速度压缩率 进行了优化,虽然它的压缩速度可能非常缓慢,PKZIPgzip 以及 PNG 都在使用 DEFLATE。LZW (Lempel-Ziv-Welch) 是 Unisys 的专利,直到2003年6月专利到期限,这种方法用于 GIF 图像。另外值得一提的是 LZR (LZ-Renau) 方法,它是 Zip 方法的基础。

    LZ 方法使用 基于表格的压缩模型,其中表格中的条目用重复的数据串替换。对于大多数的 LZ 方法来说,这个表格是从最初的输入数据动态生成的。这个表格经常采用霍夫曼编码维护(例如,SHRI、LZX)。 一个性能良好基于 LZ 的编码机制是 LZX,它用于微软公司的 CAB 格式。

    七.算法编码

    最好的压缩工具将概率模型预测结果用于算术编码。算术编码由 Jorma Rissanen 发明,并且由 Witten、Neal 以及 Cleary 将它转变成一个实用的方法。这种方法能够实现比众人皆知的哈夫曼算法更好的压缩,并且它本身非常适合于自适应数据压缩,自适应数据压缩的预测与上下文密切相关。算术编码已经用于二值图像压缩标准 JBIG、文档压缩标准 DejaVu。文本 输入 系统 Dasher 是一个逆算术编码器。

    展开全文
  • 对于数据压缩的问题:“我们要压缩什么”,我的理解是:对在计算机等多媒体中进行传输的视频、音频、文字、图像等所有信息的存储大小进行压缩。  对于数据压缩的问题:“为什么进行压缩”,我的理解是:网络的快速...

         对于数据压缩的问题:“我们要压缩什么”,我的理解是:对在计算机等多媒体中进行传输的视频、音频、文字、图像等所有信息的存储大小进行压缩。

         对于数据压缩的问题:“为什么进行压缩”,我的理解是:网络的快速发展及大数据时代的到来,給我们的生活带来更便利的同时也大大增加了信息和数据的大量传输,我们的网络宽带有限,还有存储容量的问题,如果对传输信息数据不进行压缩,会产生传输速度慢等问题,对大量的数据进行压缩,可以提高数据的传送速度,还可有减少数据的存储容量,提高处理.

        按对象类型可分为:视频压缩、音频压缩和图像压缩。

        按有无损失可分为:有损压缩和无损压缩,无损压缩也称为可逆压缩,有损压缩也称为不可逆压缩。

       五种图像压缩格式:

    BMP图像文件格式无压缩

      BMP是一种与硬件设备无关的图像文件格式,使用非常广。它采用位映射存储格式,除了图像深度可选以外,不采用其他任何压缩,因此,BMP文件所占用的空间很大。BMP文件的图像深度可选lbit、4bit、8bit及24bit。BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。
      由于BMP文件格式是Windows环境中交换与图有关的数据的一种标准,因此在Windows环境中运行的图形图像软件都支持BMP图像格式。它是包括Windows在内多种操作空间图像展现的终极形式,能够被多种Windows应用程序所支持。随着Windows操作系统的流行与丰富的 Windows应用程序的开发,BMP位图格式理所当然地被广泛应用。这种格式的特点是包含的图像信息较丰富,BMP不进行压缩,并可以直接还原16进制和二进制代码,但由此导致了它与生俱生来的缺点–占用磁盘空间过大。所以,目前BMP在单机上比较流行。网络上使用非常少。
      典型的BMP图像文件由三部分组成:位图文件头数据结构,它包含BMP图像文件的类型、显示内容等信息;位图信息数据结构,它包含有BMP图像的宽、高、压缩方法,以及定义颜色等信息。

    PNG图像文件格式无损压缩

      PNG(Portable Networf Graphics)的原名称为”可移植性网络图像”,是网上接受的最新图像文件格式。PNG能够提供长度比GIF小30%的无损压缩图像文件。它同时提供 24位和48位真彩色图像支持以及其他诸多技术性支持。由于PNG非常新,所以目前并不是所有的程序都可以用它来存储图像文件,Photoshop不但可以处理PNG图像文件,也可以用PNG图像文件格式存储。

        视频压缩原理:视频压缩通过减少和去除冗余视频数据的方式,达到有效发送和存储数字视频文件的目的。在压缩过程中,需要应用压缩算法对源视频进行压缩以创建压缩文件,以便进行传输和存储。要想播放压缩文件,则需要应用相反的解压缩算法对视频进行还原,还原后的视频内容与原始的源视频内容几乎完全相同。压缩、发送、解压缩和显示文件所需的时间称为延时。在相同处理能力下,压缩算法越高级,延时就越长。

    GIF文件格式无损压缩

      GIF(Graphics Interchange Format)的原义是”图像互换格式”,是CompuServe公司在 1987年开发的图像文件格式。GIF文件的数据,是一种基于LZW算法的连续色调的无损压缩格式。其压缩率一般在50%左右,它不属于任何应用程序。目前几乎所有相关软件都支持它,公共领域有大量的软件在使用GIF图像文件。
      GIF图像文件的数据是经过压缩的,而且是采用了可变长度等压缩算法。所以GIF的图像深度从lbit到8bit,也即GIF最多支持256种色彩的图像。GIF格式的另一个特点是其在一个GIF文件中可以存多幅彩色图像,如果把存于一个文件中的多幅图像数据逐幅读出并显示到屏幕上,就可构成一种最简单的动画。
      GIF解码较快,因为采用隔行存放的GIF图像,在边解码边显示的时候可分成四遍扫描。第一遍扫描虽然只显示了整个图像的八分之一,第二遍的扫描后也只显示了1/4,但这已经把整幅图像的概貌显示出来了。在显示GIF图像时,隔行存放的图像会给您感觉到它的显示速度似乎要比其他图像快一些,这是隔行存放的优点。
    分为静态GIF和动画GIF两种,支持透明背景图像,适用于多种操作系统,”体型”很小,网上很多小动画都是GIF格式。其实GIF是将多幅图像保存为一个图像文件,从而形成动画,所以归根到底GIF仍然是图片文件格式。
    尽管GIF图像有这样那样的缺点,但这种格式仍在网络上大行其道,这和GIF图像文件短小、下载速度快、可用许多具有同样大小的图像文件组成动画等优势是分不开的。

    JPEG文件格式:有损压缩之DCT

      JPEG是Joint Photographic EXPerts Group(联合图像专家组)的缩写,文件后辍名为”.jpg”或”.jpeg”,是最常用的图像文件格式,由一个软件开发联合会组织制定,是一种有损压缩格式,能够将图像压缩在很小的储存空间,图像中重复或不重要的资料会被丢失,因此容易造成图像数据的损伤。尤其是使用过高的压缩比例,将使最终解压缩后恢复的图像质量明显降低,如果追求高品质图像,不宜采用过高压缩比例。但是JPEG压缩技术十分先进,它用有损压缩方式去除冗余的图像数据,在获得极高的压缩率的同时能展现十分丰富生动的图像,换句话说,就是可以用最少的磁盘空间得到较好的图像品质。而且 JPEG是一种很灵活的格式,具有调节图像质量的功能,允许用不同的压缩比例对文件进行压缩,支持多种压缩级别,压缩比率通常在10:1到40:1之间,压缩比越大,品质就越低;相反地,压缩比越小,品质就越好。比如可以把1.37Mb的BMP位图文件压缩至20.3KB。当然也可以在图像质量和文件尺寸之间找到平衡点。JPEG格式压缩的主要是高频信息,对色彩的信息保留较好,适合应用于互联网,可减少图像的传输时间,可以支持24bit真彩色,也普遍应用于需要连续色调的图像。
      JPEG格式是目前网络上最流行的图像格式,是可以把文件压缩到最小的格式,在 Photoshop软件中以JPEG格式储存时,提供11级压缩级别,以0—10级表示。其中0级压缩比最高,图像品质最差。即使采用细节几乎无损的10 级质量保存时,压缩比也可达 5:1。以BMP格式保存时得到4.28MB图像文件,在采用JPG格式保存时,其文件仅为178KB,压缩比达到24:1。经过多次比较,采用第8级压缩为存储空间与图像质量兼得的最佳比例。
      JPEG格式的应用非常广泛,特别是在网络和光盘读物上,都能找到它的身影。目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小,下载速度快。
      

    JPEG2000文件格式:有损和无损压缩之离散小波变换  

    JPEG2000作为JPEG的升级版,其压缩率比JPEG高约30%左右,同时支持有损和无损压缩。JPEG2000格式有一个极其重要的特征在于它能实现渐进传输,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图像由朦胧到清晰显示。此外,JPEG2000还支持所谓的”感兴趣区域” 特性,可以任意指定影像上感兴趣区域的压缩质量,还可以选择指定的部分先解压缩。

        视频压缩原理:视频压缩通过减少和去除冗余视频数据的方式,达到有效发送和存储数字视频文件的目的。在压缩过程中,需要应用压缩算法对源视频进行压缩以创建压缩文件,以便进行传输和存储。要想播放压缩文件,则需要应用相反的解压缩算法对视频进行还原,还原后的视频内容与原始的源视频内容几乎完全相同。压缩、发送、解压缩和显示文件所需的时间称为延时。在相同处理能力下,压缩算法越高级,延时就越长。

        MPEG / MPG / DAT 


            MPEG是Motion Picture Experts Group 的缩写。这类格式包括了MPEG-1, MPEG-2 和MPEG-4在内的多种视频格式。MPEG-1相信是大家接触得最多的了,因为目前其正在被广泛地应用在 VCD 的制作和一些视频片段下载的网络应用上面,大部分的 VCD 都是用 MPEG1 格式压缩的 ( 刻录软件自动将MPEG1转为.DAT格式 ) ,使用 MPEG-1的压缩算法,可以把一部 120 分钟长的电影压缩到 1.2 GB 左右大小。MPEG-2则是应用在 DVD 的制作,同时在一些 HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当多的应用。使用MPEG-2 的压缩算法压缩一部120 分钟长的电影可以压缩到 5-8 GB 的大小(MPEG2的图像质量是MPEG-1 无法比拟的)。 
     AVI 
       AVI,音频视频交错(Audio Video Interleaved)的英文缩写。AVI这个由微软公司发表的视频格式,在视频领域可以说是最悠久的格式之一。AVI格式调用方便、图像质量好,压缩标准可任意选择,是应用最广泛的格式。
      nAVI 
       如果发现原来的播放软件突然打不开此类格式的AVI文件,那你就要考虑是不是碰到了n AVI。n AVI是 New AVI 的缩写,是一个名为 Shadow Realm 的地下组织发展起来的一种新视频格式。它是由Microsoft ASF 压缩算法的修改而来的(并不是想象中的 AVI),视频格式追求的无非是压缩率和图像质量,所以 NAVI 为了追求这个目标,改善了原始的 ASF 格式的一些不足,让 NAVI 可以拥有更高的帧率。可以这样说,NAVI 是一种去掉视频流特性的改良型 ASF 格式。
       MOV 
       使用过Mac机的朋友应该多少接触过QuickTime。QuickTime原本是Apple公司用于Mac计算机上的一种图像视频处理软件。Quick-Time提供了两种标准图像和数字视频格式 , 即可以支持静态的*.PIC和*.JPG图像格式,动态的基于Indeo压缩法的*.MOV和基于MPEG压缩法的*.MPG视频格式。
      ASF 
       ASF (Advanced Streaming format高级流格式)。ASF 是 MICROSOFT 为了和现在的 Real player 竞争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式。ASF使用了 MPEG4 的压缩算法,压缩率和图像的质量都很不错。因为 ASF 是以一个可以在网上即时观赏的视频“流”格式存在的,所以它的图像质量比 VCD 差一点点并不出奇,但比同是视频“流”格式的 RAM 格式要好。 
     WMV 
       一种独立于编码方式的在Internet上实时传播多媒体的技术标准,Microsoft公司希望用其取代QuickTime之类的技术标准以及WAV、AVI之类的文件扩展名。WMV的主要优点在于:可扩充的媒体类型、本地或网络回放、可伸缩的媒体类型、流的优先级化、多语言支持、扩展性等。
      3GP 
       3GP是一种3G流媒体的视频编码格式,主要是为了配合3G网络的高传输速度而开发的,也是目前手机中最为常见的一种视频格式。   简单的说,该格式是“第三代合作伙伴项目”(3GPP)制定的一种多媒体标准,使用户能使用手机享受高质量的视频、音频等多媒体内容。其核心由包括高级音频编码 (AAC)、自适应多速率 (AMR) 和MPEG-4 和 H.263 视频编码解码器等组成,目前大部分支持视频拍摄的手机都支持3GPP格式的视频播放。
     REAL VIDEO  
       REAL VIDEO (RA、RAM)格式由一开始就是定位就是在视频流应用方面的,也可以说是视频流技术的始创者。它可以在用 56K MODEM 拨号上网的条件实现不间断的视频播放,当然,其图像质量和 MPEG2、DIVX 等比是不敢恭维的啦。毕竟要实现在网上传输不间断的视频是需要很大的频宽的,这方面是ASF 的有力竞争者。
            RM 
      Real Networks公司所制定的音频视频压缩规范称为Real Media,用户可以使用RealPlayer或RealOne Player对符合RealMedia技术规范的网络音频/视频资源进行实况转播并且RealMedia可以根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放。这种格式的另一个特点是用户使用RealPlayer或RealOne Player播放器可以在不下载音频/视频内容的条件下实现在线播放。另外,RM作为目前主流网络视频格式,它还可以通过其Real Server服务器将其它格式的视频转换成RM视频并由Real Server服务器负责对外发布和播放。 
             RM和ASF格式可以说各有千秋,通常RM视频更柔和一些,而ASF视频则相对清晰一些。 
             RMVB 
     这是一种由RM视频格式升级延伸出的新视频格式,它的先进之处在于RMVB视频格式打破了原先RM格式那种平均压缩采样的方式,在保证平均压缩比的基础上合理利用比特率资源,就是说静止和动作场面少的画面场景采用较低的编码速率,这样可以留出更多的带宽空间,而这些带宽会在出现快速运动的画面场景时被利用。这样在保证了静止画面质量的前提下,大幅地提高了运动图像的画面质量,从而图像质量和文件大小之间就达到了微妙的平衡。另外,相对于DVDrip格式,RMVB视频也是有着较明显的优势,一部大小为700MB左右的DVD影片,如果将其转录成同样视听品质的RMVB格式,其个头最多也就400MB左右。不仅如此,这种视频格式还具有内置字幕和无需外挂插件支持等独特优点。要想播放这种视频格式,可以使用RealOne Player2.0或RealPlayer8.0加RealVideo9.0以上版本的解码器形式进行播放。
     MKV    
     MKV不是一种压缩格式,而是Matroska的一种媒体文件,Matroska是一种新的多媒体封装格式,也称多媒体容器 (Multimedia Container)。它可将多种不同编码的视频及16条以上不同格式的音频和不同语言的字幕流封装到一个Matroska Media文件当中。MKV最大的特点就是能容纳多种不同类型编码的视频、音频及字幕流。 
        一种后缀为MKV的视频文件频频出现在网络上,它可在一个文件中集成多条不同类型的音轨和字幕轨,而且其视频编码的自由度也非常大,可以是常见的 DivX、XviD、3IVX,甚至可以是 RealVideo、QuickTime、WMV 这类流式视频。实际上,它是一种全称为Matroska的新型多媒体封装格式,这种先进的、开放的封装格式已经给我们展示出非常好的应用前景。  
      FLV 
       FLV 是FLASH VIDEO的简称,FLV流媒体格式是一种新的视频格式。由于它形成的文件极小、加载速度极快,使得网络观看视频文件成为可能,它的出现有效地解决了视频文件导入Flash后,使导出的SWF文件体积庞大,不能在网络上很好的使用等缺点。
     
            XviD /DivX   (编码方式) 
     Xvid(旧称为XviD)是一个开放源代码MPEG-4视频编解码器,它是基于OpenDivX而编写的。Xvid是由一群原OpenDivX义务开发者在OpenDivX于2001年7月停止开发后自行开发的。Xvid支持多种编码模式,量化(Quantization)方式和范围控,运动侦测(Motion Search)和曲线平衡分配(Curve)等众多编码技术,对用户来说功能十分强大。Xvid的主要竞争对手是DivX。但Xvid是开放源代码的,而DivX则只有免费(不是自由)的版本和商用版本。 
      近五年来,XviD一直是世界上最流行的视频编码器。估计在BT(BitTorrent)和eMule上至少90%的电影电视剧是用XviD压制的。但是在中国的情况有些特殊,因为中国的影视发布者喜欢用RMVB格式。 
       XviD文件扩展名可以是AVI、MKV、MP4等。需要说明的是,仅从扩展名并不能看出这个视频的编码格式。比如说一部电影是.avi格式,但是实际上的视频编码格式可以是DV Code,也可以是XviD或者其他的;音频编码格式可以是PCM、AC3或者MP3 


    MP4 和 MKV 格式比 AVI 更先进,支持更多的功能,比如 字幕。AVI  视频字幕需要另外的 SRT 文件。目前国外绝大多数的影视资源都是 AVI 格式。


    DivX 是一种将影片的 音频 由MP3来压缩、 视频 MPEG-4 技术来压缩的数字 多媒体 压缩格式 DivX 由DivXNetworks公司发明, DivX 配置CPU要求是300MHz以上、内存要求是64M以上、8M以上显存的显卡。DivX 视频编码 技术是为了打破 微软 ASF的种种协定的束缚,由Microsoft  mpeg4  v3修改而来,使用MPEG-4压缩算法。
      随着MP3容量的增加售价的降低、无损音频格式支持技术的成熟、无损音源的逐步增加,MP3的无损时代好像就在眼前。今天我们就简单介绍一下五种无损压缩格式。

    APE格式:

      APE是目前流行的、由Monkey's Audio出品的一种数字音乐文件格式。与MP3、OGG这类有损压缩方式不同,APE是目前世界上惟一得到公认的音频无损压缩格式,也就是说当您将从音频CD上读取的音频数据文件压缩成APE格式后,还可以再将APE格式的文件还原,而还原后的音乐文件与压缩前一模一样,没有任何损失。由于APE的编码率高达800kbps-1400kbps,接近于音乐CD的1411.2kbps,远远高于MP3的编码率,因此它在压缩后的音质和源文件音质几乎毫无差异,其音质之佳已经过了严格的盲听测试,得到了全世界发烧友的公认。

    FLAC格式:

      相比APE,支持FLAC格式的MP3 播放器较多一些,FLAC(Fee Lossless Audio Codec),全称OGG FLAC。从名字就可以看出,它是OGG计划的一部分,因此也是一种开源、免费的音频格式,这也是它能最早得到一些MP3厂商支持的原因。作为一个开放源代码并且完全免费的无损音频压缩格式,目前很多音频处理软件,MP3等都可以输入、输出FLAC格式文件,这也给音频的后期处理带来了便利。FLAC的容错性很强,即使有小段音乐损坏,也不影响后面的音乐播放。

    AppleLossless格式:

      一看名字,就知道它是Apple公司的作品。这种格式制作非常方便,只需用iTunes软件即可直接把音乐CD制作成AplleLossless文件;不过也只有Apple自己的软件才能播放这种格式。

    WMALossless格式:

      同前面的AppleLossless相似,顾名思义这是一种微软推出的音频格式。玩家只需用Windows Media Player 9.0以上版本就可以直接将其从CD上抓下来制成WMALossless格式。

    AAL格式:

      ATRAC Advanced Lossless是由Sony Corporation 开发的一种 ATRAC 格式。通过结合 ATRAC3 或 ATRAC3plus 背后的音频压缩技术以及最新的无损压缩算法,在保持与传统设备的播放兼容性的同时,以很低的数据大小完美实现了数据的无损压缩。 简称AAL文件,现在已经有部分HI-MD产品通过升级可支持AAL文件。

      AAL文件分为两部分,一部分是256k的A3plus也可以是其他的A3或A3+,另一部分是音乐的细节信息.这样对于普通索尼Woklman,就只有256K的那部分回放。只有真正支持AAL的机器,才可以播放其他的细节。

            



    
    展开全文
  • 图像数据压缩方法

    千次阅读 2021-03-03 21:40:32
    数据压缩方法 数据能够进行压缩,是因为数据中存在或多或少的冗余信息,而对于视频和音频等多媒体信息,更可以利用人类自身的感知冗余(失真)特点来实现更高的压缩比例。衡量压缩算法的三个主要性能指标如下: ...

    数据压缩方法

    数据能够进行压缩,是因为数据中存在或多或少的冗余信息,而对于视频和音频等多媒体信息,更可以利用人类自身的感知冗余(失真)特点来实现更高的压缩比例。衡量压缩算法的三个主要性能指标如下:

    压缩比
    压缩质量(失真)
    压缩与解压缩效率

    注:事实上人类视觉系统一般分辨能力约为64灰度等级,而一般图像量化采用256灰度等级,这类冗余我们称为视觉冗余。
    例如,人的视觉对于边缘的急剧变化不敏感,且人眼对图像的亮度信息敏感,对颜色的分辨率弱等,因此视频编码算法需要充分利用人眼的“弱点”进行 “欺骗性”设计.

    数据压缩方法分类:

    1、根据编码后数据与原始数据是否一致:

    1、1 可逆编码(无失真编码,无损压缩)

    例如:Huffman编码、算术编码、行程长度编码等。

    1、2 不可逆编码(有失真编码,有损压缩)

    例如:变换编码和预测编码

    图像压缩编码方法分类:
    在这里插入图片描述

    2、根据压缩原理:

    2、1 信息熵编码(统计编码)

    信息熵编码又称统计编码,它是根据信源符号出现概率的分布特性而进行的压缩编码,基本思想是在信源符号和码字之间建立明确的一一对应关系,以便在恢复时能准确地再现原信号,同事要使平均码长或码率尽量小。最常见的是Huffman编码、Shannon(香农)编码以及算术编码。

    Huffman编码
    Huffman编码属于信息熵编码的方法之一,霍夫曼编码的码长是变化的,对于出现频率高的信息,编码的长度较短:而对于出现频率低的信息,编码长度较长。如此,处理全部信息的总码长一定小于实际信息的码长。

    算术编码
    算术编码把一个信源集合表示为实数线上的0到1之间的一个区间,这个集合的每一个元素都用来缩短这个区间。
    信源集合的元素越多,所得到的区间就越小,当区间变小时,就需要更多的数位来表示这个区间,这就是区间作为代码的原理。算数编码首先假设一个信源的概率模型,然后利用这些概率来缩小表示信源集的区间。

    行程编码
    行程编码又称为运行长度编码或游程编码,是一种统计编码,常用RLE(Run-LengthEncoding)表示。
    这是无损编码,一般包含两项,第一项时用一个符号串代替具有相同值得连续符号,第二项是记录原始数据中有多少个这样的值。
    例如66777770002555558888的行程编码为(6,2)(7,5)(0,3)(2,1)(5,5)(8,4).

    预测编码
    预测编码的原理是利用相邻样本的相关性来预测数据,预测编码可以用于空域(比如同一帧中相邻像素样本之间具有高度相关性),也可以用于时域(比如相邻两帧图像的相同位置的像素样本之间具有高度相关性)。

    这样,预测编码无需编码传输所有的采样值,而是编码传输采样值的预测值与其实际值之间的差值。预测编码分为线性预测及非线性预测,线性预测的典型代表是差分脉冲编码调制( DPCM) 编码。

    空间冗余是图像数据中经常存在的一种冗余,在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成像结构在数字化图像中就表现为数据冗余。时间冗余则是序列图像中所经常包含的冗余,序列图像中的两幅相邻的图像之间有较大的相关性,即反映为时间冗余。空间冗余及时间冗余示意如下图所示。
    在这里插入图片描述
    变换编码

    预测编码方式消除相关性的能力有限,变换编码是一种更高效的编码方式。变换编码的思想是将原始数据从时间域或者空间域变换到另一个更适合于压缩的抽象域,通常为频域。

    即变换编码不是对空间区域的图像信号编码,而是将图像信号映射变换到另外一个正交矢量空间(变换域或频域),产生一系列变换系数,然后对这些系数进行编码处理。

    变换具有可逆性及可实现性,目前普遍采用的是基于块的离散余弦变换(DCT)。

    变换编码的主要分类如下:
    离散余弦变换(DCT)
    离散正弦变换(DST)
    离散小波变换(DWT)
    离散傅立叶变换(DFT)

    模型编码
    模型编码是利用计算机视觉技术和图形学技术对图像信号进行分析和合成,通过对图像的分析和描述,将图像视为实际的三维空间场景的二维平面的投影,进而对图像结构和特征进行分析并提取出特征参数,然后用某种模型进行描述,最后通过对模型参数编码达到视频压缩的目的。

    在解码时,根据参数和模型的“先验”知识重建图像。由于是对“特征参数”进行的编码,因此压缩比较高。模型编码目前主要集中应用于可视电话和会议电视系统中。

    因为此类应用传送的图像中主要感兴趣的内容是人的“头肩像”,是一种基本固定的特定场景,可以预先建立人体头肩像的三维模型,从而进行模型编码。

    混合编码
    用两种或两种以上的方法对图像进行编码称为混合编码,混合编码是近年来广泛采用的一种视频编码压缩方法。
    混合编码通常使用DCT等变换方式进行空间冗余度的压缩,用帧间预测或运动补偿预测进行时间冗余度的压缩,从而达到对运动图像的更高的压缩率。
    视频压缩过程中主要利用的冗余信息如下表所示。
    在这里插入图片描述

    展开全文
  • 多媒体数据压缩技术的失真分类?根据解码后数据与原始数据是否完全一致进行分类,压缩方法可被分为有失真编码和无失真编码两大类。有失真压缩法会压缩了熵,会减少信息量,而损失的信息是不能再恢复的,因此这种压缩...

    多媒体数据压缩技术的失真分类?

    根据解码后数据与原始数据是否完全一致进行分类,压缩方法可被分为有失真编码和无失真编码两大类。

    有失真压缩法会压缩了熵,会减少信息量,而损失的信息是不能再恢复的,因此这种压缩法是不可逆的。无失真压缩法去掉或减少数据中的冗余,但这些冗余值是可以重新插入到数据中的,因此冗余压缩是可逆的过程。

    无失真压缩是不会产生失真。从信息主义角度讲,无失真编码是泛指那种不考虑被压缩信息性质和压缩技术。它是基于平均信息量的技术,并把所有的数据当作比特序列,而不是根据压缩信息的类型来优化压缩。也就是说,平均信息量编码忽略被压缩信息主义内容。在多媒体技术中一般用于文本、数据的压缩,它能保证百分之百地恢复原始数据。但这种方法压缩比较低,如LZW编码、行程编码、霍夫曼(Huffman)编码的压缩比一般在2:1至5:1之间。

    多媒体数据压缩的两种基本方法是什么?

    从信息论的角度看,压缩就是去掉信息中的冗余,即保留不确定的信息,去除确定的信 息.多媒体技术中常用的数据压缩算法分为两大类:无损压缩和有损压缩.冗余压缩法去掉 或减少数据中的冗余,但这些冗余量是可以重新插人到数据中的,因而不会产生失真.其压 缩效率通常较低 有损压缩则采用一些高效的有限失真数据压缩算法, 大幅度减少多媒体中 的冗余信息,其压缩效率远高于无损压缩.无损压缩.这类方法广泛用于文本数据,程序和 特殊应用场合的图像数据(如指纹图像,医学图像等)的压缩.有损压缩广泛应用于语音,图 像和视频数据的压缩.常见的编码方法可以

    多媒体压缩标准有哪些?

    MPEG标准主要有以下五个,MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21等。该专家组建于1988年,专门负责为CD建立视频和音频标准,而成员都是为视频、音频及系统领域的技术专家。及后,他们成功将声音和影像的记录脱离了传统的模拟方式,建立了ISO/IEC1172压缩编码标准,并制定出MPEG-格式,令视听传播方面进入了数码化时代。因此,大家现时泛指的MPEG-X版本,就是由ISO(International Organization for Standardization)所制定而发布的视频、音频、数据的压缩标准。

    MPEG标准的视频压缩编码技术主要利用了具有运动补偿的帧间压缩编码技术以减小时间冗余度,利用DCT技术以减小图像的空间冗余度,利用熵编码则在信息表示方面减小了统计冗余度。这几种技术的综合运用,大大增强了压缩性能。

    多媒体数据压缩技术可分为几大类?

    无损压缩编码有损压缩编码通常解码的运算复杂度低于编码.通过比较解码前后数据的是否一致,把数据编码方法分为无损编码和有损编码2类(即无损压缩和有损压缩)前者是解码前后数据完全一致,没有任何失真和偏差.后者有一定程度偏差和失真,但是没多大影响.常见的压缩算法有信息熵编码(主要有行程长度编码,哈夫曼编码和算术编码),通用编码,预测编码,模型法编码等等.无损压缩的算法一般比较复杂,而且一般的算法多为有损算法.考虑文件和图象的重要型,有时可采用无损压缩,但要注意此种压缩压缩比不会很高.

    展开全文
  • 第三章 数据压缩的基本技术

    千次阅读 2016-12-26 23:23:28
    第三章 数据压缩的基本技术 1、 数据压缩的理论基础:香农的信息论 2、 压缩方法的分类? 无损:无失真的100%的复原,压缩比相对来说不高 数据无损压缩的方法:霍夫曼编码(Huffman coding )、算术编码...
  • 然而,随着要压缩数据集变大,统计编码的结果与熵的偏差也会越来越大,这是因为数据集的不同部分有着不同的概率特征。如果处理的是流数据,比如视频流或音频流,由于整个数据集没有“结尾”,因此就不能“遍历两次...
  • 有损压缩和无损压缩

    千次阅读 2021-03-04 10:50:50
    数据压缩 常用到的压缩方式分为无损和无损两类 无损压缩 Run-Length Lempel-Ziv Huffman 其他无损压缩算法都是由以上三类衍生出来 有损压缩 对于多媒体文件可以采用有损压缩, 比如jpg, mp3, mp4格式, 删除超越人类...
  • 解决数据压缩的问题通常可以从三步来分析:第一步是为什么要做,即数据压缩的必要性问题;第二步是为什么可以做,即分析信源数据的特性,并在此基础上进行数据压缩的可行性分析;第三步是在第二步分析的基础上,如何...
  • 第七章数据压缩技术

    千次阅读 2016-04-30 10:13:26
    第七章 数据压缩技术 转自:http://www.dataguru.cn/article-3856-1.html     本章导读 前面的章节已经介绍了海量数据的存储、查询、分区、容错等技术,这些技术对于海量数据的处理是必不可少的,但要进一步...
  • 多媒体数据表示理论 前言 图像是一类非常重要的多媒体数据,人类获取的信息70%来自视觉系统,所以在所有的多媒体数据中,图像提供的信息最多!但是,在图像数字化之后的数据量是非常大的,由于存储介质和传输的...
  • 什么是数据压缩,一般分为几类?请列举实例说明。什么是信源编码,他与数据压缩有何关系?多媒体通常指哪些媒体,它们通常采用哪些数据压缩和信源编码的方法?压缩编码算法通常由编码器和解码器组成,算法的标准化...
  •   因此,将节点和码字的数据类型定义如下 typedef struct huffman_node_tag //节点数据类型 { unsigned char isLeaf; // 1 表示为叶节点,0 表示不是叶节点 unsigned long count; //这个...
  • 描述多媒体是多种媒体的综合,一般包括文本,声音和图像等多种媒体形式。在计算机系统中,多媒体指组合两种或两种以上媒体的一种人机交互式信息交流和传播媒体。使用的媒体包括文字、图片、照片、声音 、动画和影片...
  • 2018年计算机二级考试Access复习资料:多媒体技术第3章 多媒体技术简介3.1多媒体的概念及特征多媒体是指能够同时对两种或两种以上的媒体进行采集、操作、编辑、存储等综合处理的技术。它的实质就是将以各种形式存在...
  • 03多媒体计算机系统组成MPC性能 1)图像处理能力 2)声音的处理能力 3)MIDI乐器数字接口 4)动画处理能力 5)多媒体数据的存储 6)MPC之间的信息传递 MPC计算机之间的多媒体信息传递方法有以下四种 (1)可移动式硬盘 包括...
  • 文档介绍:第1页第一章:多媒体计算机技术概述 1 、什么是...第二章多媒体计算机系统的组成 1 、触摸屏分为几类?简述常见的触摸屏的工作原理。答:触摸屏根据所用的介质以及工作原理可分为 4种: 电阻式、电容式、红...
  • A、集成性B、交互性C、非线性D、无纸性9、在计算机的应用领域中,属于多媒体技术在教育中的应用是____C______。A、CADB、DBMSC、MCAID、JPEG10、超文本是一种新颖的文本信息管理技术,它是一种____B______的结构。A...
  • 多媒体数据库的主要技术(1)数据建模与存储多媒体数据模型的基本任务是支持结构化数据(如字符、数字)(如视频、声音等)的表示及属性特征的描述;支持,即多媒体的数据模型应能表示各媒体对象间的语、...
  • JPEG压缩方法由于其较高的压缩比和理想的压缩效果,是目前应用最广泛的图像压缩方法。它采用一种特殊的有损压缩算法...JPEG压缩技术十分先进,它用有损压缩方式去除冗余的图像数据,在获得极高的压缩率的同时能展现 十
  • 多媒体技术与应用》知识点整理

    千次阅读 2021-01-08 13:46:14
    第一章 多媒体技术概述 多媒体是指信息表示媒体的多样化,常见的多媒体有文字、图形、图像、声音、音乐、视频、动画 等多种形式。 多媒体技术是利用计算机技术把文本、声音、视频、动画、图形和图像等多种媒体进行...
  • 无损压缩算法专题——无损压缩算法介绍

    千次阅读 多人点赞 2019-12-22 19:50:21
    数据压缩的起源是基于信息论的。信息论之父香农第一次用数学语言阐明了概率与信息冗余度的关系。在1948年发表的论文“通信的数学理论”中,香农指出,任何信息都存在冗余,冗余大小与信息中每个符号的出现概率有关。...
  • 作为通信、介质存贮、数据发行、多媒体计算机等技术的关键环节,图像压缩编码算法的研究是信息技术中最活跃的研究领域之一。尤其是进入21世纪以后,电子技术和通信技术的发展使可视电话、会议电视、数字电视、高清晰...
  • 多媒体终端

    2021-07-28 08:43:17
    多媒体终端(Multimedia Terminal,MT)[编辑]什么是多媒体终端多媒体终端是计算机终端技术、声音技术、图像技术和通信技术的高科技集成产物,是整个多媒体通信系统中的一个重要组成部分。多媒体终端设备是组成通信网络...
  • 语音压缩

    千次阅读 2020-09-28 15:25:11
    随着通信技术的快速发展,语音压缩编码技术得到了快速发展和广泛应用,尤其是最近20年,语音压缩编码技术在移动通信、卫星通信、多媒体技术以及IP电话通信中得到普遍应用,起着举足轻重的作用。语音编码就是将采集...
  • 多媒体基础知识题库

    2021-06-27 12:21:30
    答案:BA、中文、英文、日文B、图像、动画、声音、文字和影视C、拼音码、五笔字型码D、键盘命令、鼠标器操作2、以下选项中用于衡量数据压缩技术性能优劣的重要指标的是( )。 答案:AA、压缩比B、波特率C、比特率D、...
  • JPEG)编码算法及压缩过程的实现摘要本文首先介绍了静态图像压缩(JPEG)编码算法的基本原理、压缩的实现过程及其重要过程的离散余弦变换(DCT)算法的实现原理及软件实现的例程,其次着重介绍了压缩过程中的DCT、量化和...
  • 1、多媒体计算机系统的组成多媒体计算机系统是指支持多媒体数据,并使数据之间建立逻辑联接,进而集成为一个具有交互性能的计算机系统。一般说的多媒体计算机指的是具有多媒体处理功能的个人计算机,简称MPC...
  • 第5部分 多媒体 单选1.[C]目前多媒体计算机中对动态图象数据压缩常采用______。(A)JPEG(B)GIF(C)MPEG(D)BMP2.[B]多媒体技术发展的基础是______。(A)数据库与操作系统的结合(B)通信技术、数字化技术和计算机技术的...
  • 多媒体技术论文题目

    2021-07-06 04:16:01
    多媒体技术涉及的内容包括多媒体数据压缩、多媒体处理、多媒体数据存储、多媒体开发工具等。学习啦小编为大家整理的多媒体技术论文题目,希望你们喜欢。多媒体技术论文题目1、论多媒体技术在军事领域中的应用2、论...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 15,026
精华内容 6,010
关键字:

多媒体数据压缩分为