精华内容
下载资源
问答
  • 频和视频编码的基础知识,介绍了已若干视频编码国际标准(特别是 MPEG-4) ,以便为 进一步学习 H.264 打下良好的基础。 全书共 9 章,在 H.264 部分(第 6~9 章)详尽地论述了 H.264 特点、编码器原理、解码 器原理、编...
  • MPEG-4是一套用于音频、视频信息的压缩编码标准,由国际标准化组织(ISO)和国际电工委员会(IEC)下属的“動態影像专家组”(Moving Picture Experts Group,即MPEG)制定,第一版在1998年10月通過,第二版在1999...

    参考一:

          还是从MPEG-4说起吧。MPEG-4是一套用于音频视频信息的压缩编码标准,由国际标准化组织ISO)和国际电工委员会IEC)下属的“動態影像专家组”(Moving Picture Experts Group,即MPEG)制定,第一版在1998年10月通過,第二版在1999年12月通過。MPEG-4格式的主要用途在於網上串流光碟、語音傳送(視訊電話),以及電視廣播。(摘自Wikipedia)


    再说编码格式吧。H.264被MPEG组织称作AVC(Advanced Video Codec/先进视频编码),是MPEG4标准的第10部分,用来取代之前MPEG4第2部分(简称MPEG4P2)所制定的视频编码,因为AVC有着比MPEG4P2强很多的压缩效率。最常见的MPEG4P2编码器有divx和xvid(开源),最常见的AVC编码器是x264(开源)。而H.265则是次世代的视频编码技术,被MPEG组织称为HEVC(High Efficiency Video Coding),是次世代标准MPEG-H的第2部分,不属于MPEG-4标准,有着比H.264更强的压缩效率。

    最后终于可以说容器。mp4,rmvb,mkv,avi从形式上来说首先都是视频文件的扩展名,其次它们也是视频文件的封装格式(即容器),mp4是MPEG-4标准的第14部分所制定的容器标准。所谓容器,就是把编码器生成的多媒体内容(视频,音频,字幕,章节信息等)混合封装在一起的标准。容器使得不同多媒体内容同步播放变得很简单,而容器的另一个作用就是为多媒体内容提供索引,也就是说如果没有容器存在的话一部影片你只能从一开始看到最后,不能拖动进度条(当然这种情况下有的播放器会话比较长的时间临时创建索引),而且如果你不自己去手动另外载入音频就没有声音。

    关于容器的一个例子是aac/m4a"格式“的音频(这两是一回事,m4a是苹果"发明"的扩展名),这种音频采用的是AAC编码,但实际上也是被封装在MPEG4P14(即mp4)容器里的,因为没有容器的原始AAC数据流是没有索引的,不方便播放器定位。

    不同的容器有不同的特性,mp4是官方指定的容器,属于”太子党“,硬件支持广泛;rmvb是一种封闭标准的容器,只能用来封装realvideo编码的视频;mkv是社区设计的开放性容器,最大的特性在于几乎可以封装一切的编码格式;avi历史悠久,其陈旧的架构本身已经不能适应新的编码格式,可以入土了。

    参考二:

    我通过引入下面三个概念来介绍视频压缩知识。分别是:视频文件格式(简称:文件格式)视频封装格式(简称:视频格式)视频编码方式(简称:视频编码)

    ----------------------------------------------------------------

    一,视频文件格式(简称:文件格式):我们知道Windows系统中的文件名都有后缀,例如1.doc,2.wps,3.psd等等。Windows设置后缀名的目的是让系统中的应用程序来识别并关联这些文件,让相应的文件由相应的应用程序打开。例如你双击1.doc文件,它会知道让Microsoft Office去打开,而不会用Photoshop去打开这个文件。所以常见的视频文件格式如1.avi,2.mpg这些都叫做视频的文件格式,它由你电脑上安装的视频播放器关联。

    ----------------------------------------------------------------

    二,视频封装格式(简称:视频格式):AVI,MPEG,VOB是一种视频封装格式,相当于一种储存视频信息的容器。它是由相应的公司开发出来的。我们可以在自己的电脑上看到的1.avi,2.mpg,3.vob这些视频文件格式的后缀名即采用相应的视频封装格式的名称。以下集中介绍几种封装格式:

    1,AVI格式(后缀为.AVI):它的英文全称为Audio Video Interleaved,即音频视频交错格式。它于1992年被Microsoft公司推出。

    这种视频格式的优点是图像质量好。由于无损AVI可以保存alpha通道,经常被我们使用。缺点太多,体积过于庞大,而且更加糟糕的是压缩标准不统一,最普遍的现象就是高版本Windows媒体播放器播放不了采用早期编码编辑的AVI格式视频,而低版本Windows媒体播放器又播放不了采用最新编码编辑的AVI格式视频,所以我们在进行一些AVI格式的视频播放时常会出现由于视频编码问题而造成的视频不能播放或即使能够播放,但存在不能调节播放进度和播放时只有声音没有图像等一些莫名其妙的问题。

    2,DV-AVI格式(后缀为.AVI):DV的英文全称是Digital Video Format,是由索尼、松下、JVC等多家厂商联合提出的一种家用数字视频格式。

    数字摄像机就是使用这种格式记录视频数据的。它可以通过电脑的IEEE 1394端口传输视频数据到电脑,也可以将电脑中编辑好的的视频数据回录到数码摄像机中。这种视频格式的文件扩展名也是avi。电视台采用录像带记录模拟信号,通过EDIUS由IEEE 1394端口采集卡从录像带中采集出来的视频就是这种格式。

    3,QuickTime File Format格式(后缀为.MOV):美国Apple公司开发的一种视频格式,默认的播放器是苹果的QuickTime。

    具有较高的压缩比率和较完美的视频清晰度等特点,并可以保存alpha通道。大家可能注意到了,每次安装EDIUS,我们都要安装苹果公司推出的QuickTime。安装其目的就是为了支持JPG格式图像和MOV视频格式导入。

    4,MPEG格式(文件后缀可以是 .MPG .MPEG .MPE .DAT .VOB .ASF .3GP .MP4等):它的英文全称为Moving Picture Experts Group,即运动图像专家组格式,该专家组建于1988年,专门负责为CD建立视频音频标准,而成员都是为视频、音频及系统领域的技术专家。

    MPEG文件格式是运动图像压缩算法的国际标准。MPEG格式目前有三个压缩标准,分别是MPEG-1、MPEG-2、和MPEG-4。MPEG-1、MPEG-2目前已经使用较少,着重介绍MPEG-4,其制定于1998年,MPEG-4是为了播放流式媒体的高质量视频而专门设计的,以求使用最少的数据获得最佳的图像质量。目前MPEG-4最有吸引力的地方在于它能够保存接近于DVD画质的小体积视频文件。你可能一定注意到了,怎么没有MPEG-3编码,因为这个项目原本目标是为高分辨率电视HDTV)设计,随后发现MPEG-2已足够HDTV应用,故MPEG-3的研发便中止(百度百科说MPEG-3就是mp3,我认为这个说法并不准确。)。

    5,WMV格式(后缀为.WMV .ASF):它的英文全称为Windows Media Video,也是微软推出的一种采用独立编码方式并且可以直接在网上实时观看视频节目的文件压缩格式。

    WMV格式的主要优点包括:本地或网络回放,丰富的流间关系以及扩展性等。WMV格式需要在网站上播放,需要安装Windows Media Player(简称WMP),很不方便,现在已经几乎没有网站采用了。

    6,Real Video格式(后缀为.RM .RMVB):Real Networks公司所制定的音频视频压缩规范称为Real Media。

    用户可以使用RealPlayer根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放。RMVB格式:这是一种由RM视频格式升级延伸出的新视频格式,当然性能上有很大的提升。RMVB视频也是有着较明显的优势,一部大小为700MB左右的DVD影片,如果将其转录成同样品质的RMVB格式,其个头最多也就400MB左右。大家可能注意到了,以前在网络上下载电影和视频的时候,经常接触到RMVB格式,但是随着时代的发展这种格式被越来越多的更优秀的格式替代,著名的人人影视字幕组在2013年已经宣布不再压制RMVB格式视频。

    7,Flash Video格式(后缀为.FLV):由Adobe Flash延伸出来的的一种流行网络视频封装格式。随着视频网站的丰富,这个格式已经非常普及。

    8,Matroska格式(后缀为.MKV):是一种新的多媒体封装格式,这个封装格式可把多种不同编码的视频及16条或以上不同格式的音频和语言不同的字幕封装到一个Matroska Media档内。它也是其中一种开放源代码的多媒体封装格式。Matroska同时还可以提供非常好的交互功能,而且比MPEG的方便、强大。

    常用视频格式及对应的文件格式


    ----------------------------------------------------------------

    三,视频编码方式(简称:视频编码):所谓视频编码方式就是指能够对数字视频进行压缩或者解压缩(视频解码)的程序或者设备。通常这种压缩属于有损数据压缩。也可以指通过过特定的压缩技术,将某个视频格式转换成另一种视频格式。常见的编码方式有:

    1,H.26X系列 (由ITU[国际电传视讯联盟]主导)包括H.261、H.262、H.263、H.264、H.265。

    1) H.261:主要在老的视频会议视频电话产品中使用。

    2) H.263:主要用在视频会议视频电话网络视频上。

    3) H.264:H.264/MPEG-4第十部分,或称AVC(Advanced Video Coding,高级视频编码),是一种视频压缩标准,一种被广泛使用的高精度视频的录制、压缩和发布格式。

    4) H.265:高效率视频编码(High Efficiency Video Coding,简称HEVC)是一种视频压缩标准H.264/MPEG-4 AVC的继任者。HEVC被认为不仅提升图像质量,同时也能达到H.264/MPEG-4 AVC两倍之压缩率(等同于同样画面质量下比特率减少了50%),可支持4K分辨率甚至到超高画质电视,最高分辨率可达到8192×4320(8K分辨率),这是目前发展的趋势。直至2013年,Potplayer添加了对于H.265视频的解码,尚未有大众化编码软件出现。

    2,MPEG系列(由ISO[国际标准组织机构]下属的MPEG[运动图象专家组]开发 )视频编码方面主要有:

    1) MPEG-1第二部分(MPEG-1第二部分主要使用在VCD上,有些在线视频也使用这种格式。该编解码器的质量大致上和原有的VHS录像带相当。)

    2) MPEG-2第二部分(MPEG-2第二部分等同于H.262,使用在DVDSVCD和大多数数字视频广播系统和有线分布系统(cable distribution systems)中。)

    3) MPEG-4第二部分(MPEG-4第二部分标准可以使用在网络传输、广播和媒体存储上。比起MPEG-2和第一版的H.263,它的压缩性能有所提高。)

    4) MPEG-4第十部分(MPEG-4第十部分技术上和ITU-T H.264是相同的标准,有时候也被叫做“AVC”)最后这两个编码组织合作,诞生了H.264/AVC标准。ITU-T给这个标准命名为H.264,而ISO/IEC称它为MPEG-4 高级视频编码(Advanced Video Coding,AVC)。

    3,其他系列:AMV · AVS · Bink · CineForm · Cinepak · Dirac · DV · Indeo · Video · Pixlet · RealVideo · RTVideo · SheerVideo · Smacker · Sorenson Video · Theora · VC-1 · VP3 · VP6 · VP7 · VP8 · VP9 · WMV。因为以上编码方式不常用,不再介绍。

    ----------------------------------------------------------------

    总之,即使是同一种视频文件格式,如*.MPG。又分为MPEG-1,MPEG-2 ,MPEG-4几种不同的视频封装格式,就算是同一种视频封装格式,如MPEG-4又可以使用多种视频编码方式。视频的编码形式才是一个视频文件的本质所在,不要简单的通过文件格式和封装形式来区分视频。


    展开全文
  • 目前视频流传输中最为重要的编解码标准国际电联的H.261、H.263,运动静止图像专家组的M-JPEG和国际标准化组织运动图像专家组的MPEG系列标准,此外在互联网上被广泛应用的还有Real-Networks的RealVideo、微软公司的...
  • 还是从MPEG-4说起吧,MPEG-4是一套用于音频、视频信息的压缩编码标准,由国际标准化组织(ISO)和国际电工委员会(IEC)下属的“動態影像专家组”(Moving Picture Experts Group,即MPEG)制定,第一版在1998年10...
    还是从MPEG-4说起吧,MPEG-4是一套用于音频视频信息的压缩编码标准,由国际标准化组织ISO)和国际电工委员会IEC)下属的“動態影像专家组”(Moving
     Picture Experts Group,即MPEG)制定,第一版在1998年10月通過,第二版在1999年12月通過。MPEG-4格式的主要用途在於網上串流光碟、語音傳送(視訊電話),以及電視廣播。(摘自Wikipedia)

    再说编码格式吧
    H.264被MPEG组织称作AVC(Advanced Video Codec/先进视频编码),是MPEG4标准的第10部分,用来取代之前MPEG4第2部分(简称MPEG4P2)所制定的视频编码,因为AVC有着比MPEG4P2强很多的压缩效率。最常见的MPEG4P2编码器有divx和xvid(开源),最常见的AVC编码器是x264(开源)

    而H.265则是次世代的视频编码技术,被MPEG组织称为HEVC(High Efficiency Video Coding)
    ,是次世代标准MPEG-H的第2部分,不属于MPEG-4标准,有着比H.264更强的压缩效率

    最后终于可以说容器
    mp4,rmvb,mkv,avi从形式上来说首先都是视频文件的扩展名,其次它们也是视频文件的封装格式(即容器)

    mp4是MPEG-4标准的第14部分所制定的容器标准。所谓容器,就是把编码器生成的多媒体内容(视频,音频,字幕,章节信息等)混合封装在一起的标准。容器使得不同多媒体内容同步播放变得很简单,而容器的另一个作用就是为多媒体内容提供索引,也就是说如果没有容器存在的话一部影片你只能从一开始看到最后,不能拖动进度条(当然这种情况下有的播放器会话比较长的时间临时创建索引),而且如果你不自己去手动另外载入音频就没有声音。

    关于容器的一个例子是aac/m4a"格式“的音频(这两是一回事,m4a是苹果"发明"的扩展名),这种音频采用的是AAC编码,但实际上也是被封装在MPEG4P14(即mp4)容器里的,因为没有容器的原始AAC数据流是没有索引的,不方便播放器定位

    不同的容器有不同的特性,mp4是官方指定的容器,属于”太子党“,硬件支持广泛;rmvb是一种封闭标准的容器,只能用来封装realvideo编码的视频;mkv是社区设计的开放性容器,最大的特性在于几乎可以封装一切的编码格式;avi历史悠久,其陈旧的架构本身已经不能适应新的编码格式,可以入土了.


    MP4/RMVB/MKV/AVI这些属于封装格式。作用就是把视频和音频放到一块,相当于“容器”。其中可以放压缩编码的视频和音频

    mpeg4,H.264.H.265这些属于视频编码格式,是压缩编码视频的。
    AAC,mp3些属于音频编码格式,是压缩编码音频的。

    展开全文
  • G.711编码原理

    2020-12-10 14:27:50
    一. 概述 本文目的: 1、熟悉G711a/u两种格式的基本原理 2、熟悉两种压缩算法的实现步骤及提供源码实现 G.711是国际电信联盟ITU-T定制出来的一套语音压缩标准,它代表了对数...G.711 标准主要有两种压缩算法。 u-law

    一. 概述
    本文目的:
    1、熟悉G711a/u两种格式的基本原理
    2、熟悉两种压缩算法的实现步骤及提供源码实现

    • G.711是国际电信联盟ITU-T定制出来的一套语音压缩标准,它代表了对数PCM(logarithmic pulse-code modulation)抽样标准,是主流的波形声音编解码标准,主要用于电话。

    主要用脉冲编码调制对音频采样,采样率为8k每秒。它利用一个 64Kbps 未压缩通道传输语音讯号。
    压缩率为1:2, 即把16位成8位。
    G.711 标准下主要有两种压缩算法。

    u-law algorithm (又称u-law, ulaw, mu-law),主要运用于北美和日本。
    A-law algorithm,主要运用于欧洲和世界其他地区。特别设计用来方便计算机处理的。
    G.711将14bit(uLaw)或者13bit(aLaw)采样的PCM数据编码成8bit的数据流,播放的时候在将此8bit的数据还原成14bit或者13bit进行播放,不同于MPEG这种对于整体或者一段数据进行考虑再进行编解码的做法,G711是波形编解码算法,就是一个sample对应一个编码,所以压缩比固定为:

    8/14 = 57% (uLaw)
    8/13 = 62% (aLaw)
    3. G.711原理
    G.711是将语音模拟信号进行一种非线性量化, 详细的资料可以在ITU 上下到相关的spec 。下面主要列出一些性能参数:

    G.711(PCM方式)
    采样率:8kHz
    信息量:64kbps/channel
    理论延迟:0.125msec
    品质:MOS值4.10
    算法原理:
    A-law的公式如下,一般采用A=87.6
    在这里插入图片描述
    画出图来则是如下图,用x表示输入的采样值,F(x)表示通过A-law变换后的采样值,y是对F(x)进行量化后的采样值。
    在这里插入图片描述
    由此可见

    在输入的x为高值的时候,F(x)的变化是缓慢的,有较大范围的x对应的F(x)最终被量化为同一个y,精度较低。
    相反在低声强区域,也就是x为低值的时候,F(x)的变化很剧烈,有较少的不同x对应的F(x)被量化为同一个y。意思就是说在声音比较小的区域,精度较高。
    对应反量化公式(即上面函数的反函数):
    在这里插入图片描述

    3.1 G.711A(A-LAW)压缩十三折线法
    G.711A输入的是13位(S16的高13位),这种格式是经过特别设计的,便于数字设备进行快速运算。

    取符号位并取反得到s。
    获取强度位eee,获取方法如下图所示
    获取高位样本位wxyz
    组合为seeewxyz,将seeewxyz逢偶数为取补数。
    A-law如下表计算。

    第一列是采样点,共13bit,最高位为符号位。
    对于前两行,折线斜率均为1/2,跟负半段的相应区域位于同一段折线上。
    对于3到8行,斜率分别是1/4到1/128,共6段折线。
    总共13段折线,这就是所谓的A-law十三段折线法。
    在这里插入图片描述
    示例:

    输入pcm数据为1234,二进制对应为(0000 0100 1101 0010)
    二进制变换下排列组合方式(0 00001 0011 010010)
    1、获取符号位最高位为0,取反,s=1
    2、获取强度位00001,查表,编码制应该是eee=011
    3、获取高位样本wxyz=0011
    4、组合为10110011,逢偶数为取反为11100110,得到E6

    #define SIGN_BIT    (0x80)      /* Sign bit for a A-law byte. */
    #define QUANT_MASK  (0xf)       /* Quantization field mask. */
    #define NSEGS       (8)     /* Number of A-law segments. */
    #define SEG_SHIFT   (4)     /* Left shift for segment number. */
    #define SEG_MASK    (0x70)      /* Segment field mask. */
    static int seg_aend[8] = {0x1F, 0x3F, 0x7F, 0xFF,
                    0x1FF, 0x3FF, 0x7FF, 0xFFF};
    static int seg_uend[8] = {0x3F, 0x7F, 0xFF, 0x1FF,
                    0x3FF, 0x7FF, 0xFFF, 0x1FFF};
     
    static int search(
        int val,    /* changed from "short" *drago* */
        int *   table,
        int size)   /* changed from "short" *drago* */
    {
        int i;      /* changed from "short" *drago* */
     
        for (i = 0; i < size; i++) {
            if (val <= *table++)
                return (i);
        }
        return (size);
    }
     
    int linear2alaw(int pcm_val)        /* 2's complement (16-bit range) */
                                            /* changed from "short" *drago* */
    {
        int     mask;   /* changed from "short" *drago* */
        int     seg;    /* changed from "short" *drago* */
        int     aval;
     
        pcm_val = pcm_val >> 3;//这里右移3位,因为采样值是16bit,而A-law是13bit,存储在高13位上,低3位被舍弃
     
     
        if (pcm_val >= 0) {
            mask = 0xD5;        /* sign (7th) bit = 1 二进制的11010101*/
        } else {
            mask = 0x55;        /* sign bit = 0  二进制的01010101*/
            pcm_val = -pcm_val - 1; //负数转换为正数计算
        }
     
        /* Convert the scaled magnitude to segment number. */
        seg = search(pcm_val, seg_aend, 8); //查找采样值对应哪一段折线
     
        /* Combine the sign, segment, and quantization bits. */
     
        if (seg >= 8)       /* out of range, return maximum value. */
            return (0x7F ^ mask);
        else {
    //以下按照表格第一二列进行处理,低4位是数据,5~7位是指数,最高位是符号
            aval = seg << SEG_SHIFT;
            if (seg < 2)
                aval |= (pcm_val >> 1) & QUANT_MASK;
            else
                aval |= (pcm_val >> seg) & QUANT_MASK;
            return (aval ^ mask);
        }
    }
    
    int alaw2linear(int a_val)      
    {
        int     t;      /* changed from "short" *drago* */
        int     seg;    /* changed from "short" *drago* */
     
        a_val ^= 0x55; //异或操作把mask还原
     
        t = (a_val & QUANT_MASK) << 4;//取低4位,即表中的abcd值,然后左移4位变成abcd0000
        seg = ((unsigned)a_val & SEG_MASK) >> SEG_SHIFT; //取中间3位,指数部分
        switch (seg) {
        case 0: //表中第一行,abcd0000 -> abcd1000
            t += 8;
            break;
        case 1: //表中第二行,abcd0000 -> 1abcd1000
            t += 0x108;
            break;
        default://表中其他行,abcd0000 -> 1abcd1000 的基础上继续左移(按照表格第二三列进行处理)
            t += 0x108;
            t <<= seg - 1;
        }
        return ((a_val & SIGN_BIT) ? t : -t);
    }
    

    3.2 G.711u(u-law)
    使用在北美和日本,输入的是14位,编码算法就是查表,计算出:基础值+平均偏移值

    μ-law的公式如下,μ取值一般为255

    在这里插入图片描述
    在这里插入图片描述
    相应的μ-law的计算方法如下表
    在这里插入图片描述
    在这里插入图片描述
    示例:
    输入pcm数据为1234
    1、取得范围值,查表得 +2014 to +991 in 16 intervals of 64
    2、得到基础值为0xA0
    3、得到间隔数为64
    4、得到区间基本值2014
    5、当前值1234和区间基本值差异2014-1234=780
    6、偏移值=780/间隔数=780/64,取整得到12
    7、输出为0xA0+12=0xAC

    #define BIAS        (0x84)      /* Bias for linear code. 线性码偏移值*/
    #define CLIP            8159    //最大量化级数量
     
    int linear2ulaw( int    pcm_val)    /* 2's complement (16-bit range) */
    {
        int     mask;
        int     seg;
        int     uval;
     
        /* Get the sign and the magnitude of the value. */
        pcm_val = pcm_val >> 2;
        if (pcm_val < 0) {
            pcm_val = -pcm_val;
            mask = 0x7F;
        } else {
            mask = 0xFF;
        }
            if ( pcm_val > CLIP ) pcm_val = CLIP;       /* clip the magnitude 削波*/
        pcm_val += (BIAS >> 2);
     
        /* Convert the scaled magnitude to segment number. */
        seg = search(pcm_val, seg_uend, 8);
     
        /*
         * Combine the sign, segment, quantization bits;
         * and complement the code word.
         */
        if (seg >= 8)       /* out of range, return maximum value. */
            return (0x7F ^ mask);
        else {
            uval = (seg << 4) | ((pcm_val >> (seg + 1)) & 0xF);
            return (uval ^ mask);
        }
     
    }
     
    int ulaw2linear( int    u_val)
    {
        int t;
     
        /* Complement to obtain normal u-law value. */
        u_val = ~u_val;
     
        /*
         * Extract and bias the quantization bits. Then
         * shift up by the segment number and subtract out the bias.
         */
        t = ((u_val & QUANT_MASK) << 3) + BIAS;
        t <<= (u_val & SEG_MASK) >> SEG_SHIFT;
     
        return ((u_val & SIGN_BIT) ? (BIAS - t) : (t - BIAS));
    }
    

    3.2 A-law和u-law对比
    A-law和u-law画在同一个坐标轴中就能发现A-law在低强度信号下,精度要稍微高一些。
    在这里插入图片描述
    实际应用中,我们确实可以用浮点数计算的方式把F(x)结果计算出来,然后进行量化,但是这样一来计算量会比较大,实际上对于A-law(A=87.6时),是采用13折线近似的方式来计算的,而μ-law(μ=255时)则是15段折线近似的方式。

    1. 总结
      G711尽管是一种非常古老的话音编码算法,原理和计算也比较简单,但是其中用到的一些基本原理同样在其他编码算法中得到了应用,对其进行深入的了解有助于更好的理解其他的算法。
    展开全文
  • G.711  G.711  也称为PCM(脉冲编码调制),是国际电信联盟订定出来的一套语音压缩标准,主要用于电话。它主要用脉冲编码调制对音频采样,采样... G.711 标准主要有两种压缩算法。一种是&micro;-law algori...

    G.711
      G.711
      也称为PCM(脉冲编码调制),是国际电信联盟订定出来的一套语音压缩标准,主要用于电话。它主要用脉冲编码调制对音频采样,采样率为8k每秒。它利用一个 64Kbps 未压缩通道传输语音讯号。 起压缩率为1:2, 即把16位数据压缩成8位。G.711是主流的波形声音编解码器。


      G.711 标准下主要有两种压缩算法。一种是&micro;-law algorithm (又称often u-law, ulaw, mu-law),主要运用于北美和日本;另一种是A-law algorithm,主要运用于欧洲和世界其他地区。其中,后者是特别设计用来方便计算机处理的。
    G711 G723 G729线路占多少带宽问题
      带宽=包长度×每秒包数
      =包长度×(1/打包周期)
      =(Ethernet头+IP头+UDP头+RTP头+有效载荷)×(1/打包周期)
      =(208bit +160bit+64bit+96bit +有效载荷)×(1/打包周期)
      =(528bit+(打包周期(秒)×每秒的比特数))×(1/打包周期)
      =( 528 / 打包周期 ) + 每秒比特数
      按照上面的计算公式:
      G711:20ms打包,带宽为 ( 528/20 + 64) Kbit/s=90.4 Kbit/s
      G729:20ms打包,带宽为 ( 528/20 + 8 ) Kbit/s= 34.4 Kbit/s
      G723:5.3k,30ms打包,带宽为 ( 528/30 + 5.3 ) Kbit/s=22.9 Kbit/s
      业界一般按照下表提供的IP网带宽系数和以太网带宽系数来设计网络带宽:

    编解码技术    压缩速率(Kbps)    打包周期(ms)    IP网带宽系数    以太网带宽系数
    G.711 a/u    64    20    1.25    1.41
    G.729 a/b    8    20    0.38    0.54
    G.723.1(5.3kbit/s)    5.3    30    0.27    0.37
    G.723.1(6.3Kbit/s)    6.3    30    0.25    0.36
    H.263(384Kbit/s)    ≈384    10    6    6.2

      注:采用某种编码方式时,用64K乘以相应的带宽系数就可以得出其实际占用的带宽。当然如果是中继接口,还需要考虑信令占据一定的带宽,一般按照2.5%来计算。


      如果看不懂上面的计算方法,只需记住以下结果:
      G711 实际占用带宽 每线90.4kbit/s 100线并发占用 9Mbps
      G729 实际占用带宽 每线34.4kbit/s 100线并发占用 3.4Mbps
      G723 实际占用带宽 每线22.9kbit/s 100线并发占用 2.2Mbps

    展开全文
  • 【音频】G711编码原理

    万次阅读 多人点赞 2018-07-03 16:51:56
    它是国际电信联盟ITU-T定制出来的一套语音压缩标准,它代表了对数PCM(logarithmic pulse-code modulation)抽样标准,主要用于电话。它主要用脉冲编码调制对音频采样...G.711 标准主要有两种压缩算法。一种是u-l...
  • H.264视频编码

    2013-07-24 00:33:18
    视频编码就是通过特定的压缩技术负责将视频压制,将某个视频格式的文件转换成另一种视频格式文件的方式,目前视频流传输中最为重要的编解码标准国际电联的H.261、H.263,运动静止图像专家组的M-JPEG和国际标准化...
  • H.264/AVC是ITU-T VCEG和ISO/IEC MPEG联合制定的最新视频编码国际标准,是目前图像通信研究领域的热点技术之一。H.264的视频编码层(VCL)采用了许多新技术,因而使其编码性能了大幅度提高。但这是以复杂度的...
  • MPEG系列:由ISO(国际标准组织机构)下属的MPEG(运动图象专家组)开发 PV8/PV9:VP8是类似于 H.264 的另一种视频编码,由 On2 公司开发。后来 Google 收购了 On2. 主要应用在webrtc中,音视频通话一般都是基于webrtc...
  • 在数字多媒体压缩领域内很多国际标准,如ISO/ITU-T 技术委员会下的JPEG 标准,CCITT制定的H. 263标准,以及著名的MPEG标准等。  MPEG-4标准于2000年10月公布。MPEG-4 标准的主要特点是对图像中的内容进行编码, 其...
  • 微软的wmv9和Divx/Xvid等都是基于MPEG-4发展起来的编码格式,都不少相通的地方,本文主要介绍视频编码的基础知识,具体的编码设置请参看附录。 下面是沈晟的l两篇短文,可以从中了解MPEG4和divx3.11、divx4/5、...
  • 2.音视频即时通讯现在最常用的就是国际领先和视频编码标准H.264编码,因为H.264/AVC在压缩效率方面更高,一般情况下可以达到MPEG-2及MPEG-4的简化类压缩效率高约2倍。 3.如果音视频即时通讯是采用先进
  • HEVC与3D-HEVC简介

    2017-06-16 10:29:00
    运动图像专家组(MPEG)和视频编码专家组(VCEG)是两大视频标准化组织,MPEG属于国际标准化组织(ISO)和国际电工委员(IEC),其制定的视频编码标准主要有MPEG-1,2和4。而VCEG则属于国际电信联盟(ITU-T),其...
  • G.711  G.711  也称为PCM(脉冲编码调制),是国际电信联盟订定出来的一套语音压缩标准,主要用于电话。它主要用脉冲编码调制对音频采样,采样率为... G.711 标准主要有两种压缩算法。一种是&micro;-...
  • G711原理

    2020-05-27 19:52:52
    G.711是国际电信联盟ITU-T定制出来的一套语音压缩标准,它代表了对数PCM(logarithmic pulse-...G.711 标准主要有两种压缩算法。 u-law algorithm (又称u-law, ulaw, mu-law),主要运用于北美和日本。 A-law alg
  • G.711

    2012-01-05 22:16:45
    G.711  G.711 ... 也称为PCM(脉冲编码调制),是国际电信联盟订定出来的一套语音压缩标准,主要用于电话。它主要用脉冲编码调制对音频采样,采样率为8k每... G.711 标准主要有两种压缩算法。一种是µ-law a
  • 语言压缩技术既节省了存储时所占用的存储空间,又减少了传输时所占用的带宽,而快速发展的数字信号处理(DSP)技术使得实时实现各种复杂的语音压缩算法成为...该标准主要有两种压缩算法,一种是μ律,另一种是A律...
  • a-law原理及算法实现

    千次阅读 2018-01-31 11:12:05
    也称为PCM(脉冲编码调制),是国际电信联盟订定出来的一套语音压缩标准主要用于电话。它主要用脉冲编码调制对音频采样,采样率为8k每秒。它利用一个64Kbps未压缩通道传输语音讯号。起压缩率为1:...
  • 摘要:本文介绍了G.711标准的A律压缩算法的基本原理,设计出了A律编解码的软件流程框图,在以TMS320VC5416为处理器的硬件开发平台上实现了语音信号的A律压缩解压算法,并给出了C54x...该标准主要有两种压缩算法,一
  • 1 引言  MPEG-Ⅱ作为一种运动图像国际标准已经得到广泛应用,数字视频广播(DVB)已经将MPEG-...至于多少传输流分组压缩成为ATM AAL-5 PDU单元,主要与ATM网络协议有关,一般是2个传输流分组压缩成一个AAL-5 PDU单
  • 它支持带LMR的alpha-beta展开和搜索树状部分中的空移动,以及标准MCTS展开或标准alpha-beta搜索。 :神经网络评估实验ala AlaphaZero。 :实验,编码压缩和使用最多6个残局位库(EGBBS) 平行线 可以使用MPI...

空空如也

空空如也

1 2 3
收藏数 60
精华内容 24
关键字:

压缩编码国际标准主要有