精华内容
下载资源
问答
  • 多媒体数据表示理论 前言 图像是一类非常重要多媒体数据,人类获取信息70%来自视觉系统,所以在所有多媒体数据中,图像提供信息最多!...2.人眼视觉系统对图像细节和颜色辨认是一定范围,超

    多媒体数据表示理论

    前言

    图像是一类非常重要的多媒体数据,人类获取的信息70%来自视觉系统,所以在所有的多媒体数据中,图像提供的信息最多!但是,在图像数字化之后的数据量是非常大的,由于存储介质和传输的限制,我们必须对图像数据进行压缩!

    而图像压缩是基于下面两个事实:

    1.图像数据中有许多重复数据,可以使用数学方法表示这些重复数据

    2.人眼的视觉系统对图像细节和颜色的辨认是有一定范围的,超过这个返回人眼就感受不出来了,所以可以吧超出的部分去掉


    主要概念

    1.分辨率

    分辨率分为显示分辨率与图像分辨率

    显示分辨率表示显示器能显示出的像素个数,是显示器的一个衡量指标。在我们显示器上调节的分辨率就是这个分辨率,比如现在常见的1280*720,表示显示器分成720行,每行含有1280个像素点,那么整个屏幕就含有1280*720=921600和像素点


    图像分辨率是指组成一幅图像的像素密度的度量方法,图像大小固定,像素分辨率越高,图像包含的像素点就越多,图像就越逼真。dpi dots per inch在扫描彩色图像时,指定图像的分辨率,用每英寸多少个像素点表示 例如300dpi,8*10英寸的图像 有2400*3000个像素。


    显示分辨率表示确定图像大小,图像分辨率表示图像像素浓度


    2.像素深度

    像素深度又叫色深,指定存储每个像素所用位数(bit)它决定每个像素可能有的颜色数,或者灰度级数(对灰度图像而言)

    计算机常用的像素深度有1位,8位,24位,还有32位的,选用哪一种色深与应用领域有关


    在用二进制数据表示像素时,往往还会加上属性位。RGB 5:5:5 用16位2个字节来表示一个像素数据,其中有一位就是属性位,就是最高位的bit,作用就是控制原图是否可见

    32位表示一个像素时,RGB分别用8bit表示,剩下8bit为Alpha通道位,讲数值归一化后有一个预乘通道位的作用


    3.真伪彩色

    真彩色就是像素值直接表示RGB值

    全彩色图像就是RGB8:8:8 因为这种数据量太大,一般都用RGB5:5:5


    伪彩色的像素值是一个颜色地址,通过Color Look-Up Table CLUT 表来查找,这样产生的图像通常称为调色板图像,在调色板图像中有两个矩阵,一个是图形矩阵像素->CLUT表项入口地址,我理解为一个颜色索引,另一个矩阵为调色板矩阵,矩阵中每一个元素代表一个颜色


    4.位图bit mapper image与矢量图vector based image

    请记住:他们是计算机上图像的不同的表示方法,要深入理解这个表示方法一次,说明它们只是不同的显示图的一套理念

    矢量图法用一系列的计算机指令来表示图像。

    位图法是将一幅图分为许多个像素,每个像素用若干二进制位表示该像素的颜色,亮度和属性

    矢量图侧重于绘制,创造,位图侧重于获取,去复制。

    现实图像适用位图,人工图像例如地图适用矢量图

    位图文件显示比矢量图快


    5.灰度图像与彩色图像

    灰度图像仅保留像素的亮度信息

    彩色图像:

    真彩色图像是24位像素表示,8位像素表示通常称为调色板图像


    6.图像的颜色模型

    发光的有源物体用RGB相加混色模型

    不发光的无源物体用CMY相减混色模型

    RGB相加混色模型与CMY相减混色模型有互补色,数值上互补, RGB111表示白,CMY000是白

    HSL颜色模型 H色调  S饱和度  L亮度

    windows定义了16种标准颜色,叫做16色VGA(Video Graphics Array)


    7.彩色空间的线性变换

    为了使用人的视觉特性,达到降低数据量的目的,

    通常把RGB空间转换到其他空间去

    目前采用的空间主要有三种YIQ,YUV,YCC

    记录下RGB转换为YUV的转换关系

    Y=0.299R+0.587G+0.114B

    U=0.147R-0.289G+0.436B

    V=0.615R-0.515G-0,.100B


    展开全文
  • 常用的文件后缀都哪些?

    千次阅读 2019-07-21 06:49:39
    ACA Microsoft代理使用角色文档 acf 系统管理配置 acm 音频压缩管理驱动程序,为Windows系统提供各种声音格式的编码和解码功能 aif 声音文件,支持压缩,可以使用Windows Media Player和QuickTime Player播放 AIF...
    ACA Microsoft的代理使用的角色文档 
    acf 系统管理配置
    acm 音频压缩管理驱动程序,为Windows系统提供各种声音格式的编码和解码功能
    aif 声音文件,支持压缩,可以使用Windows Media PlayerQuickTime Player播放
    AIF 音频文件,使用Windows Media Player播放
    AIFC 音频文件,使用Windows Media Player播放
    AIFF 音频文件,使用Windows Media Player播放
    ani 动画光标文件扩展名,例如动画沙漏
    ans ASCII字符图形动画文件
    arc 一种较早的压缩文件,可以使用WinZip,WinRAR,PKARC等软件打开
    arj 压缩文件。可以使用WinZip,WinRAR,PKARC等软件打开
    asf 微软的媒体播放器支持的视频流,可以使用Windows Media Player播放
    asp 微软的视频流文件,可以使用Windows Media Player打开
    asp 微软提出的Active Server Page,是服务器端脚本,常用于大型网站开发,支持数据库连接,类似PHP。可以使用Visual InterDev编写,是目前的大热门
    asx Windows Media 媒体文件的快捷方式
    au 是Internet中常用的声音文件格式,多由Sun工作站创建,可使用软件Waveform Hold and Modify 播放。Netscape Navigator中的LiveAudio也可以播放.au文件
    avi 一种使用Microsoft RIFF规范的Windows多媒体文件格式,用于存储声音和移动的图片
    bak 备份文件,一般是被自动或是通过命令创建的辅助文件,它包含某个文件的最近一个版本,并且具有于该文件相同的文件名
    bas Basic 语言源程序文件,可编译成可执行文件,目前使用Basic开发系统的是Visual Basic
    bat 批处理文件,在MS-DOS中,.bat文件可执行文件,有一系列命令构成,其中可以包含对其他程序的调用
    bbs 电子告示板系统文章信息文件
    bfc Windows的公文包文件
    bin 二进制文件,其用途依系统或应用而定
    bmp Bitmap位图文件,这是微软公司开发Paint的自身格式,可以被多种Windows和Windows NT平台及许多应用程序支持,支持32位颜色,用于为Windows界面创建图标的资源文件格式。
    c C 语言源程序文件,在C语言编译程序下编译使用
    cab Microsoft制订的压缩包格式,常用于软件的安装程序,使用Windows自带的实用程序,Extract.exe可以对其解压缩,WinZip,WinRAR等都支持这种格式
    cal Windows 中的日历文件
    cdf Internet Explorer的频道文件
    cdr CorelDraw中的一种图形文件格式,它是所有CorelDraw应用程序中均能够使用的一种图形图像文件格式
    cdx 索引文件,存在于Dbase,Foxbase,Foxpro系统软件环境
    cfg 配置文件,系统或应用软件用于进行配置自己功能,特性的文件
    chm 编译过后的HTML文件,常用于制作帮助文件和电子文档
    clp 在Windows下剪贴板中的文件格式
    cmd 用于Windows NT/2000的批处理文件,其实与BAT文件功能相同,只是为了与DOS/Windows 9x下的BAT有所区别
    cmf 声卡标准的音乐文件,FM合成器等可以回放
    cnf NetMeetting会议连接文件
    cnt 联机帮助文件目录索引文件,通常和同名的.hlp文件一起保存
    col 由Autodesk Animator,Autodesk Animator Por等程序创建的一种调色板文件格式,其中存储的是调色板中各种项目的RGB值
    com DOS可执行命令文件,一般小于64KB
    cpl 控制面板扩展文件,Windows操作系统使用
    cpp C++语言源程序,非常强大的语言,在各种平台中都有相应的开发系统
    crd Windows中的卡片文件
    crt 用于安全方面的证书认证文件
    cur Windows下的光标资源文件格式,可用光标编辑软件编辑
    css Text/css文件
    dat 数据文件,在应用程序中使用
    dat VCD中的图象声音文件,VCD播放软件可调用,或是通过VCD机播放
    dbf 数据库文件,Foxbase,Dbase,Visual FoxPro,等数据库处理系统所产生的数据库文件
    dcx 传真浏览文档文件
    ddi 映象文件,DUP,HD,IMG等工具可展开
    dev 设备驱动程序
    dib 设备无关位图文件,这是一种文件格式,其目的是为了保证用某个应用程序创建的位图图形可以被其它应用程序装载或显示一样
    dir 目录文件
    dll Windows动态连接库,几乎无处不在,但有时由于不同版本DLL冲突会造成败各种各样的问踢
    doc 是目前市场占有率最高的办公室软件Microsoft Office中的字处理软件Word创建的文档
    dos Windows保留的MS-DOS的某些系统文件
    dot Microsoft Word的文档模板文件,通过模板可以简化一些常用格式文档的创建工作,而且可以内嵌VBA程序来实现某些自动化功能
    drv 设备驱动程序文件,用在各种系统中
    dwg AutoCAD的图纸文件,也是许多绘图软件都支持的格式,常用于共享数据
    dxb AutoCAD创建的一中图形文件格式
    dxf 图形交换格式,一种计算机辅助设计的文件格式,最初开发用来与AutoCAD一起使用,以便于图形文件在应用程序之间的传递,它以ASCII方式储存图形,在表现图形的大小方面十分精确
    der Certiticate文件
    dic Txt文件
    emf 由Microsoft公司开发的Windows 32位扩展图元文件格式,其总体设计目标是要弥补在Microsoft Windows 3.1(Win16)中用的*.wmf文件格式的不足,使得图元文件更加易于使用
    eps 用PostScript语言描述的一种图形文件格式,以文本文件保存,在PostScript图形打印机上能打印出高品质的图形图象,最高能表示32位图形图象
    err 编译错误文件,存在于Dbase,Foxbase,Foxpro系列软件环境
    exe 可执行文件,虽然后缀名相同,但具有不同的格式和版本
    exp 3DS使用的显示卡驱动程序
    exc Txt文件
    flc Autodesk Animator和Animatorpro的动画文件,支持256色,最大的图象象索是64000*64000,支持压缩,广泛用于动画图形中的动画序列,计算机辅助设计和计算机游戏应用程序
    fnd 保存的搜索结果
    fon 点阵字库文件
    for Fortran语言程序
    fot 指向字体的快捷键
    fp 配置文件,存在于Dbase,Foxbase,Foxpro系列软件的环境下
    fpt 备注字段文件,存在于Dbase,Foxbase,Foxpro系列软件的环境下
    frt 报表文件,存在于Dbase,Foxbase,Foxpro系列软件的环境下
    frx 报表文件,存在于Dbase,Foxbase,Foxpro系列软件的环境下
    fxp 编译后的程序,存在于Dbase,Foxbase,Foxpro系列软件的环境下
    gif 在各种平台的各种图形处理软件上均能够处理的,经过压缩的一种图形文件格式
    grh 方正公司的图象排版文件
    grp Windows下的程序管理器产生的组窗口文件
    goc Gocserve
    gra MSGraph.Chart.5
    h C语言源程序头文件
    hlp Windows应用程序帮助文件
    hqx Macintosh中使用BinHex将二进制文件编码为7位的文本文件,大多数Macintosh文件皆以.hqx出现(.bin极少使用),在Macintosh中,可使用StuffIt Expander对.hqx解码,在Windows中可使用BinHex 13解码
    ht 超级终端
    htm 保存超文本描述语言的文本文件,用于描述各种各样的网页,使用各种浏览器打开
    html 同.htm文件
    icm 图象配色描述文件
    ico Windows中的图标文件,可以包含同一个图标的多种格式,使用图标编辑软件创建
    idf MIDI乐器定义
    idx 索引文件,存在于Dbase,Foxbase,Foxpro系列软件的环境下
    iff 文件交换格式文件,这种文件格式多用于Amiga平台,在这种平台上它几乎可以存储各种类型的数据,在其它平台上,IFF文件格式多用于存储图象和声音文件
    image MAcintosh磁盘映象文件,常见于萍果机的FTP网点,在Macintosh中由Shrink Wrap处理
    ime Windows下的输入法文
    img 磁盘映象文件,用HD-COPY,WinImage等工具打开后可以恢复到一张磁盘上
    inc 汇编语言包含文件,类似C/C++中的.H文件
    inf Windows下的软件安装信息,Windows的标准安装程序根据此文件内的安装信息对软件,驱动程序等进行安装
    ini Windows中的初始化信息文件,已经用的不多了,新的应用程序将设置保存在系统的注册表中
    jar 一种压缩文件,ARJ的新版本,不过不太流行,可以使用WinJar,Winrar等打开
    jpeg 一种图片压缩文件,同.jpg
    jpg 静态图象专家组制订的静态图象压缩标准,具有很高的压缩比,使用非常广泛,可使用PhotoShop等图象处理软件创建
    lnk 快捷方式,这个文件指向另一个文件,开始菜单的程序文件夹下每条项目都是一个LNK文件
    log 日志文件,通常用来记录一些事件之类
    lzh 一种古老的压缩文件,可以使用WinRAR打开
    mac Macintosh中使用的一中灰度图形文件格式,在Macintosh Paintbrush中使用,其分辨率只能是720*567
    mag 图形文件格式
    mdb Microsoft Access使用的数据库格式,是非常流行的桌面数据库
    men 内存应用文件,存在于Dbase,Foxbase,Foxpro系列软件的环境下
    mid 音频压缩文件,曾经非常流行,不过在现在的软件中用的很少了
    mif MIDI乐器
    mov 使用Apple's QuickTime格式的电影文件,在Macintosh中由Sparkle,FastPlayer,MoviePlayer等软件播放,在Windows中可由Quicktime播放
    movie QuickTime或苹果机的影视格式,在Macintosh中由Sparkle,FastPlayer,MoviePlayer等软件播放,在Windows中可由QuickTime播放
    mp3 采用MPEG-1 Layout 3标准压缩的音频文件,是网上主要的压缩音频文件,这种文件由于具有极高的压缩率和失真低的特点,是目前音乐盗版的主要文件格式,但目前受到VQF,WMA等新标准的挑战
    mpg 采用MPEG-1标准压缩的视频文件,与VCD使用的格式非常相近,提供CD质量的音频信号和320*240的视频分辩率,目前的媒体播放软件大都能播放,Microsoft的WMV8和MPEG-4压缩的AVI文件是其强大的竞争对手
    mpt Macintosh中使用的一种图形文件格式
    msg Microsoft邮件文档
    obj 对象代码
    ovl 由于软件功能多,内存偏小,不能一次性全部调入内存的可执行文件可能有同文件名的ovl文件
    pcd 位图文件,由Eastman Kodak开发,被所有的平台所支持,PCD支持24位颜色,最大的图象像索是2048*3072,用于在CD-ROM上保存图片
    pcs 动画文件,是Macromedia开发的动画文件格式,为Macintosh应用程序使用,支持压缩,支持256色,用于保存动画数据,是Quick Time的前身
    pcx 图像文件,PCX格式是ZSOFT公司在开发图像处理软件Paintbrush是开发的一种格式,这是一种经过压缩的格式,占用磁盘空间较少
    pdf 图文多媒体文件,Adobe公司定义的电子印刷品文件格式,它是一种事实上的标准,在Internet网上的很多电子印刷品,都是.pdf格式
    psd 是PhotoShop中使用的一种标准图形文件格式,能够保存图像数据的每一个细小部分,包括层,附加的蒙版通道以及其他内容
    pwl Windows下的口令文件
    qt Machintosh 的QuickTime影视格式,在Macintosh中由Sparkle,FastPlayer,MoviePlayer等软件播放,在Windows中可由Quicktime播放
    qtm 动画文件,这种文件格式是由Apple计算机公司开发,被Apple Macintosh和Microsoft Windows平台所支持,支持25位颜色,最大图像分辩率是64000*64000,支持压缩,用于保存音频和运动视频信息
    rec Windows下的记录器宏文件
    reg Windows 95/98的系统及应用程序注册文件,这种文件虽然以纯文本文件保存,但一样存在版本问题,不同的操作系统使用的REG文件版本是不同的
    rle 一种压缩过的位图文件格式,RLE压缩方案是一种极其成熟的压缩方案,特点是无损失压缩,既节省了磁盘空间又不损失任何图像数据,但在打开这种压缩文件时,要花费更多时间,此外,一些兼容性不太好的应用程序可能会搭不开
    rm Windows下的RealPlayer所支持的视频压缩文件,网上非常流行的流式视频文件,很多实时视频新闻等都是采用这种格式的,不过,最新的Windows Media Video V8已经对其发起了强大的攻势
    rmi MIDI音序文件
    rtf 丰富文本格式文件,以纯文本描述内容,能够保存各种格式信息,可以用写字版,Word等创建
    sav 存档文件
    scp 用于Windows系统中Internet拨号用户,自动拨号登录用的脚本文件,可避免手动登录时繁琐的键盘输入
    scr 屏障保护文件
    sct 屏幕文件
    scx 屏幕文件
    set Microsoft备份集文件,用于保存要备份的内容,设置等信息
    shb 指向一个文档的快捷方式
    snd Mac声音文件,Apple计算机公司开发的声音文件格式,被Macintosh平台和多种Macintosh应用程序所支持,支持某些压缩
    sql 查询文件,在Dbase,Foxbase,Foxpro系列软件的环境下使用
    svg SVG可以算是目前最火热的图像文件格式了,它是基于XML由WorldWideWebConsortium联盟开发的,SVG是可缩放的矢量图
    svx Amiga声音文件,Commodore所开发的声音文件格式,被Amiga平台和应用程序所支持,不支持压缩
    swf flash是Micromedia公司的产品,严格说它是一种动画编辑软件,实际上它是制作出一种后缀名为.swf的动画,这种格式的动画能用比较小的体积来表现丰富的多媒体形式,并且还可以与HTML文件达到一种"水乳交融"的境界
    swg 虚拟内存交换文件,由操作系统使用
    sys 系统文件,驱动程序等,在不同的操作系统中有不同的定义
    tbk 临时数据库文件,在Dbase,Foxbase,Foxpro系列软件的环境下使用
    tga 图像文件,此文件格式的结构比较简单,属于一种图形,图像数据的通用格式,在多媒体领域有着很大影响,是计算机生成图像向电视转换的一种首选格式
    tiff 图像文件,此图像格式复杂,存储内容多,占用存储空间大,其大小是GIF图像的3倍,是相应的JPEG图像的10倍,最早流行于Macintosh,现在Windows主流的图像应用程序都支持此格式
    tmp 临时文件,一般是系统和应用程序产生的临时使用的文件,当系统和应用程序退出时,会自动地删除其建立的临时文件,如果是非正常退出,临时文件可能保留在磁盘上,在单任务系统下,可立即删除它们,在多任务系统下,应删除那些不是正在使用的临时文件
    txt 文本文件
    url InternetShortcut(internet 上URL地址的快捷方式)
    vcd 虚拟光驱工具制作的光盘镜像文件
    ver 版本描述,用于描述某个软件的版本信息的文件,内容因软件而异
    voc 声音文件,此文件格式由Creative Labs公司开发,被Windows和DOS平台所支持,支持压缩
    vxd 虚拟设备驱动程序,在Windows操作系统中非常常见,是重要的系统文件
    wab 通信簿文件,由系统中的通信簿程序使用
    wav 音频文件,此文件格式是在Windows上用于保存音频信息的资源格式,Windows中由Waveform Hold and Modify或Navigator,或"媒体播放机"播放,存在许多编码方式,需要相应的解码程序才能播放
    win 窗口文件,在Dbase,Foxbase,Foxpro系列软件的环境下使用
    wmf Microsoft Windows中常见的一种图元文件格式,它具有文件短小,图案造型化的特点,整个图形常由各个独立的组成部分拼接而成,但其图形往往较粗糙,并且只能在Microsoft Office中调用编辑
    wpc 写字板文档转换
    wps Wps文本文件,有多种版本,可以使用Wps Office,Wps 2000等打开
    wri Windows写字板文档
    xab Microsoft邮件地址簿
    xbm Animator Pro创建的一种图形文件格式,其中包含用来描述多边形的一系列点的信息
    zip 是DOS/Windows中最常见文件压缩格式,也是互联网上的标准压缩格式,可以包含路径和多个文件

    转载于:https://www.cnblogs.com/xiohao/p/3297961.html

    展开全文
  • 录制成amr声音文件的实现代码

    千次阅读 2006-10-08 12:17:00
    首先让我们了解一下Nokia手机上常用的声音文件格式,一般的Nokia手机都会支持wav,midi,pcm,amr这几种文件格式。其中wav波形文件一般比较大,由于手机资源有限,它的使用范围不是很广。而midi和amr的存储格式则...
     
    

    如果你搜一下Nokia或NewLC论坛,会有很多问关于如何录制amr声音文件的帖子。首先让我们了解一下Nokia手机上常用的声音文件格式,一般的Nokia手机都会支持wav,midi,pcm,amr这几种文件格式。其中wav波形文件一般比较大,由于手机资源有限,它的使用范围不是很广。而midi和amr的存储格式则比较小,应用比较广泛;Nokia默认的录制的声音文件保存为amr格式。

    需要熟悉的几个类:CMdaAudioPlayerUtility,CMdaAudioRecorderUtility和CMdaAudioConvertUtility。

    以前有人说录制成amr文件需要先流成pcm格式,然后对得到的pcm数据进行转换后存盘;但最简单的方法还是直接录制成amr文件。哦,说了一堆乱七八糟的东西,忘了说心得了,其实也很简单。直接使用CMdaAudioRecorderUtility::OpenFileL()方法录制成amr文件是可以实现的,但在调用iMdaAudioRecorderUtility->OpenFileL(aFile);之前,需要加上CEikonEnv::Static()->FsSession().Replace(aFile,aFile)来确保aFile文件是存在的,并且现在里面没有数据。然后就是不要调用SDK例子里的iMdaAudioRecorderUtility->SetPosition(

    TTimeIntervalMicroSeconds( 0 ) )和iMdaAudioRecorderUtility-

    >CropL()。呵呵,简单吧!

    下面是源代码:

    //===================================

    void CMyAudioRecorder::ConstructL(const TDesC& aFile)
    {
     // Create a file audio recorder utility instance
     iMdaAudioRecorderUtility = CMdaAudioRecorderUtility::NewL(

    *this );

     // this is very important here
     CEikonEnv::Static()->FsSession().Replace(aFile,aFile);
     iMdaAudioRecorderUtility->OpenFileL(aFile);
    }

    //-------------
    void CMyAudioRecorder::RecordL()
    {
         // Create a file audio recorder utility instance
         iMdaAudioRecorderUtility = CMdaAudioRecorderUtility::NewL(

    *this );

         // this is very important here
         CEikonEnv::Static()->FsSession().Replace(aFile,aFile);
          iMdaAudioRecorderUtility->OpenFileL(aFile);

        // Record from the device microphone
        iMdaAudioRecorderUtility->SetAudioDeviceMode(
                                               

    CMdaAudioRecorderUtility::ELocal );
        // Set maximum gain for recording
        iMdaAudioRecorderUtility->SetGain(

    iMdaAudioRecorderUtility->MaxGain() );
       
        // 下面两句是不能留的!
        //iMdaAudioRecorderUtility->SetPosition(

    TTimeIntervalMicroSeconds( 0 ) );
        //iMdaAudioRecorderUtility->CropL();

        //start recorder

        iMdaAudioRecorderUtility->RecordL();
    }

    展开全文
  • 原文链接1 不同的文件用哪个好?  [中关村在线音频频道原创]对于很多音频爱好者、普通消费者甚至一部分发烧友来说,都有这样一个疑问:目前常见音频格式种类之多,...39度发烧堂:常用音频格式有什么区别?  笔

    原文链接

    1 不同的文件用哪个好?


      [中关村在线音频频道原创]对于很多音频爱好者、普通消费者甚至一部分发烧友来说,都有这样的一个疑问:目前常见的音频格式种类之多,能挑花眼也一点都不夸张,在这些名字各不相同的格式背后,都有什么区别?为了体积便携我们应该选择那些格式,为了更好的声音我们应该选择那些格式,如果想两者并存我们又应该选择那些格式?
      
    这里写图片描述

    39度发烧堂:常用音频格式有什么区别?


      笔者作为一个音频设备的发烧友,也自认为算是一个音乐的发烧友,收藏的唱片和音乐文件也并不算少,对于不同的音频格式来说,可以说主流的音频格式都使用过也并不深入的研究过,虽然对于及其深度的技术方面来说也许并不甚了解,但是对于它们之间的区别还是可以做一个简单的分享的。

      并且随着近几年HiFi圈中DSD音频流的崛起,近几年已经不再是PCM编码垄断音频文件行业,DSD码流也成为了非常主流的一种格式,而在这篇文章中笔者也将会简单的介绍DSD音频文件格式以及个人对于DSD音频格式的一些看法,网友朋友们也不妨在留言区域留下自己对于DSD和PCM两种格式的看法。
      

    2 首先,什么是PCM编码格式?


      PCM中文称脉冲编码调制(Pulse Code Modulation),是70年代末发展起来的,记录媒体之一的CD,在80年代初由飞利浦和索尼公司共同推出。脉码调制的音频格式也被DVD-A所采用,它支持立体声和5.1环绕声,1999年由DVD讨论会发布和推出的。脉冲编码调制的比特率,从14-bit发展到16-bit、18-bit、20-bit直到24-bit;采样频率从44.1kHz发展到192kHz。PCM脉码调制这项技术可以改善和提高的方面则越来越来小。只是简单的增加PCM脉码调制比特率和采样率,不能根本的改善它的根本问题。其原因是PCM的主要问题在于:

      (1)任何脉冲编码调制数字音频系统需要在其输入端设置急剧升降的滤波器,仅让20Hz-22.05kHz的频率通过(高端22.05kHz是由于CD44.1kHz的一半频率而确定)。

      (2)在录音时采用多级或者串联抽选的数字滤波器(减低采样频率),在重放时采用多级的内插的数字滤波器(提高采样频率),为了控制小信号在编码时的失真,两者又都需要加入重复定量噪声。这样就限制了PCM技术在音频还原时的保真度。
      
    这里写图片描述
    码率越高的PCM录音就越接近模拟信号的圆滑正弦波
     
      对于我们最常说的“无损音频”来说,一般都是指传统CD格式中的16bit/44.1kHz采样率的文件格式,而知所以称为无损压缩,也是因为其包含了20Hz-22.05kHz这个完全覆盖人耳可闻范围的频响频率而得名,当然现在的各种PCM格式编码高码率文件已经层出不穷非常常见,但是就像上文中所说的,高码率并不能有效地提升PCM编码采样率的频响范围,而只能增加其采样点来得到更加类似模拟录音的平滑波形。

      也正因为几乎所有的有损压缩格式都是从WAV格式压缩、转换而来,其实内部的编码依然是PCM,所以曾经很多MP3设备并不支持FLAC、APE、AAC等等格式,是因为它们不支持这些文件的解压缩,但是从没有一款播放器不支持WAV格式,因为WAV格式本身,就等于PCM码流。
      

    3 WAV、APE、FLAC那个才是更好的选择?


      对于目前常见的PCM码率文件来说,最常见的三种文件格式也就是WAV、APE、FLAC了,而这三种格式之间又有怎么样的差别呢?

      WAV波形文件是音响设备和很多软件可以直接读取的波形文件,基本上不存在编解码问题。flac和ape都对WAV进行了编码,故能换取较小的体积,但同时造成解码播放时,因播放器材解析力很敏感(或者说技术所限),会因出现一定的jitter抖动(解析复杂编码所致)而导致播放效果不够饱满和流畅。这点你可以通过统一转换为WAV格式来试听解决。

      对于WAV格式来说,是目前的常规无损压缩格式中体积最大的文件格式,由于FLAC和APE都对WAV进行了更高技术的编码,所以换取了较小的体积,这也是这两种格式之所以出现的根本原因。而对于FLAC和APE两种格式来说,虽然体积大小差不多,但是采用了不同的压缩格式,所以对于设别来说在播放时候需要占用的资源多少也并不相同,简单地说占用资源多少的比例为:APE最大、FLAC中、WAV占用最小。最简单的例子就是如果你用一款配置并不算很高的随身播放设备,比如刷了rockbox的iPod Classic或者一些目前主流的便携播放器,使用APE会有明显的卡顿以及续航的减少,而FLAC和WAV则没有什么明显的区别。

    注意:

    • APE如果存在错误,播放会直接停止
    • FLAC格式只有在转换的时候才能报错
    • FLAC格式的错误采用静音处理


      并且除了压缩比例和占用资源的不同,APE、FLAC和WAV在纠错方面也有不同。首先最为传统的WAV格式其实并没有纠错的处理,所以即使在播放的码率中有错误,WAV也会照常播放下去,在错误的地方可能会发生爆音等问题。而APE对于错误则是直接停止播放,而这点也是被很多人所诟病的,如果你的APE文件中存在错误,那么整个音轨几乎都报废了。而FLAC使用的则是静音的策略,如果播放中出现错误,则将错误的地方静音处理。
      

    4 送葬CD的MP3、AAC格式的优劣


      对于这两个目前全世界用户最多的音频格式来说,它们有两个共同点:1.它们都不是无损压缩格式音频。2.它们联手终结了CD在音乐行业的老大地位。

      也许对于中国的用户来说,对于MP3格式更加熟悉,用户也基本都是从MP3格式开始使用直到现在为止,但是AAC确实是一个不能不提的音频格式,它因苹果发扬光大,并且在iPod的垄断之路上立下了汗马功劳,甚至可以说,AAC不仅仅目送CD走下历史舞台,传统消费级MP3产品也是被它赶下神坛的。至今在iTunes Store的专辑音乐销售中,音乐的格式依然是AAC而不是MP3。
    这里写图片描述
    MP3格式在20KHz以上都直接被砍掉

      首先,MP3是一种国内用户最为耳熟能详的有损压缩格式,而隶属世界上的有损压缩格式其实数不胜数,而MP3成功的原因究竟是什么?首先是它的压缩比,传统的音频压缩文件只能达到8:1左右的压缩比。而MP3格式则是将这个压缩比提升到了10:1甚至12:1的高比例压缩,也因为MP3音频编码具有10:1~12:1的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取文件的尺寸,并且完全砍掉20KHz以上的部分,相同长度的音乐文件,用.mp3格式来储存,一般只有.wav文件的1/10,因而音质要次于CD格式或WAV格式的声音文件。但由于其文件尺寸小,音质好;所以在它问世之初还没有什么别的音频格式可以与之匹敌,因而为.mp3格式的发展提供了良好的条件。直到现在,这种格式还是很流行,作为主流音频格式的地位难以被撼动。但是树大招风,MP3音乐的版权问题也一直找不到办法解决,因为MP3没有版权保护技术,说白了也就是谁都可以用。

      AAC实际上是高级音频编码的缩写。AAC是由Fraunhofer IIS-A、杜比和AT&T共同开发的一种音频格式,它是MPEG-2规范的一部分。AAC所采用的运算法则与MP3的运算法则有所不同,AAC通过结合其他的功能 来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质。AAC也是目前最好的有损格式之一。有多种编码,faac,nero为常见,比特率最高为448kbps,并且在448kbps的比特率下已经几乎很难分辨和无损压缩的区别。
      

    5 人气正旺的DSD格式有多强大?


      最近的HiFi圈里可以说刮起了一阵DSD的台风,所有设备一夜之间都开始支持DSD格式,甚至这个传统的行业里的顶级大牌们也都开始争先恐后的更新自己的解码设备来支持DSD格式的码流文件,而对于这个体积巨大,曾经SACD独用的编码格式究竟有着何等的魅力?

    这里写图片描述
    DSD究竟有多强大?

      DSD(Direct Stream Digital)直接比特流数字,它是Sony与Philips在1996年宣布共同发展的高解析数字音响规格,DSD新技术与DVD的音响技术指针竞争,用1bit比特流的方式取样,采样率2.4MHz(CD 44.1kHz取样的64倍)的高取样方式,直接把模拟音乐讯号波形以脉冲方式转变为数字讯号,以将近四倍于CD的空间,储存音乐,因此可以提供更为优秀的声音效果,由于取样次数高,所以取样过的波形很圆顺,比较接近原来的模拟波形。再者由于不采用多位,省却位转换程序,降低了因为数字滤波而可能产生的失真与噪声。还有,由于不像多位系统般容易(位越高就越容易)受到电源或外部干扰的影响,因此理论上质量会比较稳定。当前的SACD player,兼容性,无论是DSD支持者或是传统CD的拥护者,都将是双赢的局面。SACD(Super Audio CD)是新一代数码音响规格,以超高速取样(2.8224MHz,为CD的64倍)声音以0和1连续的量子化,可听频域的动态范围约为120dB,可能收录频域约1000kHz,结和了传统模拟的温暖及超高的分辨率,SACD多声道的音质包含了6个独立的音轨,每一个音轨都可以读到没有经过任何压缩而完整的DSD规格(Full DSD Bit Rate)。

      但是其实DSD的问题很严重并且显而易见,与之前的格式问题相比,DSD的问题并不在它的声音素质上,可以说DSD的声音素质是毋庸置疑的优秀的。但是其实这种技术诞生已经将近20年的时间,而在近两年才火起来,那么前面的十多年它去哪了?一些录音业内人士曾经告诉我,其实在推广DSD录音的时候索尼和飞利浦将DSD录音设备的价格定价非常昂贵,几乎没有录音棚愿意购买,于是DSD格式也就逐渐的胎死腹中,而时隔这么多年再次出现,现在的扬声器和解码、放大的技术发展都能更好的展现出DSD的高水平,但是问题一样明显:没得听。

      真正喜欢音乐的朋友会发现DSD的音频基本分为两种:PCM码流转录和DSD直接录制。而后者很少有值得聆听的专辑,除了部分流行音乐之外,古典音乐几乎没有很好的演绎。而对于PCM转录来说,在录音的源头就并不能达到DSD的水平,也就变得毫无意义。
      

    总结:


      1. 对于这几类的音频格式来说,相信广大读者也有一个比较深刻的认识了,对于自己的使用需求来说,选择合适的音乐文件是节省空间和减少自己麻烦是必不可少的。
      2. 原始音频->以小于192KHz频率小于24bit采样->去掉20Hz~20.5KHz以外频率信号->PCM格式
      3. PCM格式->非压缩转换->wav文件->编码转换->FLAC/APE文件
      4. PCM格式->有损压缩转换->MP3文件orAAC文件
      5. 原始音频->以2.4MHz频率1bit采样->DSD格式
      6. MP3格式没有版权保护、AAC是苹果主推的格式
      7. 由PCM格式转码的文件不能达到DSD的真实水平
      

    展开全文
  • 文件-常用方法(一)

    2020-07-01 17:26:35
    文件(File)是 最常见数据源之一,在程序中经常需要将数据存储到文件中,例如图片文件、声音文件等数据文件,也经常需要根据需要从指定文件中进行数据读取。当然, 在实际使用时,文件都包含一个的格式,这个...
  • 一、计算机中常用的声音文件格式有_____、_____、_____等;常用的图片文件格式有_____、_____、_____等。二、影响波形声音文件质量的要素有_____、_____、_____等。三、下列文件格式,采用的是无损压缩的有_________...
  • ADPCM WAVE文件的压缩与解压缩[原创]

    万次阅读 热门讨论 2005-10-13 21:15:00
    一、概述: 本文叙述了如何通过IMA-ADPCM压缩和解压缩算法来完成从IMA-ADPCM文件转换为PCM文件的过程。...二、WAVE文件的认识 WAVE文件是计算机领域最常用的数字化声音文件格式之一,它是微软专门为Windows系统定
  • J2ME播放声音

    2008-07-04 10:30:00
    在J2ME中,处理声音需要使用到Mobile Media ... 一般手机支持的声音文件格式为wav、mid和mpg等。具体请查阅你的手机说明文档。 在声音处理中,很多处理的方式,这里说一下最常用的情况,播放JAR文件中的wav文件。
  • 如何播放声音

    2005-12-15 13:05:00
    如何播放声音 在J2ME中,处理声音需要使用到... 一般手机支持的声音文件格式为wav、mid和mpg等。具体请查阅你的手机说明文档。 在声音处理中,很多处理的方式,这里说一下最常用的情况,播放JAR文件中的wav文件。
  • 但语音文件仅限于WAV格式。大家最常用的语音库是WyabdcRealPeopleTTS、OtdRealPeopleTTS。这两个库单词量严重不足,很多常用的词也不能发音。StarDict提供另外一套方案,即用TTS程序代替真人发音。这是没办法的办法...
  • 前言本文主要记录python下音频常用的操作,以.wav格式文件为例。其实网上很多现成的音频工具包,如果仅仅调用,工具包是更方便的。更多pyton下的操作可以参考: 用python做科学计算1、批量读取.wav文件名:这里...
  • J2ME如何播放声音

    2011-02-09 13:50:00
    在J2ME中,处理声音需要使用到Mobile ... 一般手机支持的声音文件格式为wav、mid和mpg等。具体请查阅你的手机说明文档。 在声音处理中,很多处理的方式,这里说一下最常用的情况,播放JAR文件中的wav文件。 ...
  • J2ME播放声音流程简介

    2009-10-12 19:24:00
    在J2ME中,处理声音需要使用到...一般手机支持的声音文件格式为wav、mid和mpg等。具体请查阅你的手机说明文档。在声音处理中,很多处理的方式,这里说一下最常用的情况,播放JAR文件中的wav文件。播放声音文件的流...
  • 使用python写Wave文件

    万次阅读 2018-04-06 15:43:16
      WAV是Microsoft开发的一种声音文件格式,虽然它支持多种压缩格式,不过它通常被用来保存未压缩的声音数据(PCM脉冲编码调制)。WAV三个重要的参数:声道数、取样频率和量化位数。 声道数:可以是单声道或者是...
  • 视频格式封装

    2013-09-23 17:29:58
    比较常用的有以下封装格式 1 AVI AVI容器-成熟的老技术  AVI是微软1992年推出用于对抗苹果Quicktime的技术,尽管国际学术界公认AVI已经属于被淘汰的技术,但是由于windows的通用性,和简单易懂的开发API,还在被...
  • UNITY 常用优化策略

    2018-09-03 19:27:56
    Unity在导入资源时候可以使用类型丰富的文件,这不意味着在我们生成App中同样也是这些文件,资源通过Unity资源管道变成了较为统一的格式。我们在导入资源时候很多参数可以调整, 1 首先从声音开始...
  • 视频封装格式简介

    2016-08-01 14:46:53
    比较常用的有以下封装格式1 AVIAVI容器-成熟的老技术 AVI是微软1992年推出用于对抗苹果Quicktime的技术,尽管国际学术界公认AVI已经属于被淘汰的技术,但是由于windows的通用性,和简单易懂的开发API,还在被广泛...
  • 视频封装格式详解

    2016-07-19 10:47:55
    比较常用的有以下封装格式 1 AVI AVI容器-成熟的老技术  AVI是微软1992年推出用于对抗苹果Quicktime的技术,尽管国际学术界公认AVI已经属于被淘汰的技术,但是由于windows的通用性,和简单易懂的开发API,...
  • 1、Wave文件WAV是Microsoft开发的一种声音文件格式,虽然它支持多种压缩格式,不过它通常被用来保存未压缩的声音数据(PCM脉冲编码调制)。WAV三个重要的参数:声道数、取样频率和量化位数。声道数:可以是单声道...
  • 在J2ME中,处理声音需要使用到... 一般手机支持的声音文件格式为wav、mid和mpg等。具体请查阅你的手机说明文档。 在声音处理中,很多处理的方式,这里说一下最常用的情况,播放JAR文件中的wav文件。 播放声音
  • 所谓超文本,因为它可以加入图片、声音、动画、多媒体、一个文件跳转到另外一个文件,与世界各地主机的文件连接。 HTML作用就是用标记标签来描述网页,把网页内容在浏览器中展示出来。 HTML骨架格式 HTML...
  • 推荐常见视频格式有:avi、mpg、flv、swf  注意: 为了避免出错,我们通常会将视频文件与PPT文件放置在同一文件夹内。  现将常用视频插入PPT最简单且有效方法总结如下: 一、avi视频...
  • 安装pip情况下 直接pip installer 所需要pyinstaller组件(可在官网安装) 常用操作: 打包成一个文件夹: pyinstaller script.py 打包成一个绿色exe文件: pyinstaller -F -w script.py 其中-F...

空空如也

空空如也

1 2 3 4 5 ... 7
收藏数 130
精华内容 52
关键字:

常用的声音文件格式有