精华内容
下载资源
问答
  • 人耳能听到的频率范围是200-20KHz, 二,什么是CODEC? 在声卡上往往可以找到一颗或者2颗甚至3颗4面有引脚的正方形芯片,面积一般为0.5-1.0平方厘米。这就是CODEC。CODEC就是多媒体数字信号编解码器,主要负责...

    一,什么是声音?

    能量波,有频率有振幅,频率高低就是音调,振幅大小就是音量

    采样率是对频率采样,采样精度是对幅度采样

    人耳能听到的频率范围是200-20KHz,

    二,什么是CODEC?

    在声卡上往往可以找到一颗或者2颗甚至3颗4面有引脚的正方形芯片,面积一般为0.5-1.0平方厘米。这就是CODEC。CODEC就是多媒体数字信号编解码器,主要负责数字->;

    数字->模拟信号转换(DAC)和模拟->数字信号的转换(ADC)。不管是音频加速器好,还是I/O控制器好,他们输入输出的都是纯数字信号,我们要使用声卡上的Line Out插孔输出信号的话,信号就必须经过声卡上的CODEC的转换处理。可以说,声卡模拟输入输出的品质和CODEC的转换品质有着重大的关系,音频加速器或I/O控制器决定了声卡内部数字信号的质量,而CODEC则决定了模拟输入输出的好坏

    三,什么是DAC ADC?

    模数、数模转换,不同精度对应不同的声音保真

    四,什么是SRC?Sample Rate Convertor(采样率转换器)

    声音是一种能量波,有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线。波是无限光滑的,弦线其实由无数点组成,由于存储空间是相对有限的,数字编码过程中,必须对弦线的点进行采样。采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取得点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有2个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率为44.1kHz。光有频率信息是不够的,我们还必须获得该频率的能量值并量化,用于表示信号强度。量化值为2的整数次幂,我们常见的CD位16bit的采样大小,即2的16次方。

    SRC的作用就是改变信号的采样率,低采样率往高采样率转换时就是一个重采样的过程,重采样对象不再是原始信号,而是这个低采样率的信号,因为采样率不够需要插入更多的采样点以达到需要的采样率和采样大小,在信号频率较低的时候,重采样算法的好坏并不会影响到什么,因为波长长,采样点多,但是高频就很难对付了,因为波长短,采样点少,44.1kHz的采样率情况下,一个20kHz的波仅仅有3个不到的采样点,转换到更高频率的时候势必插入更多的点,要尽量保持原貌,这个点该怎么插,这是一个非常有难度的算法

    举一个例子:假设三角形是一秒时间长度的一个波,采样率为3Hz,现在我们需要将采样率SRC到4Hz,我们唯一能作的就是时间轴(水平向)等分出4个点,取这个点垂直线和三角形边交汇处的值,这个过程就是重采样,结果变成了一个梯形。在波形图中,垂直的轴对应波的能量值,这意味着波的信号强度变弱了,出现了衰减。这个例子可以说明非整数倍的频率转换将改变波形,改变是不可避免的,算法好可以尽量保证转化后的波形和转换前的相似,但好的算法非常少,现有的大部分声卡SRC算法都是很糟糕的,正如上面这个例子一样,高频衰减就是因为SRC导致的,SRC还会导致一些其他问题,例如互调失真加剧等

    五,时域采样定理


    频带为F的连续信号 f(t)可用一系列离散的采样值f(t1),f(t1±Δt),f(t1±2Δt),...来表示,只要这些采样点的时间间隔Δt≤1/2F,便可根据各采样值完全恢复原来的信号f(t)

    六,什么是Crystal?

    Crystal中文名就是石英晶体振荡器或者简称晶振。常见的声卡都支持44.1kHz和48kHz的信号输入,而这2种采样率不是整数倍关系,如果同时支持这2种采样率输出的话,声卡上需要2颗晶振。分别为12.288MHz和24.576MHz(或者为他们整数倍的频率)。

    七,音频采样 AD

    数码音频系统是通过将声波波形转换成一连串的二进制数据来再现原始声音的,实现这个步骤使用的设备是模/数转换器(A/D)它以每秒上万次的速率对声波进 行采样。

    每一次采样都记录下了原始模拟声波在某一时刻的状态,称之为样本。将一串的样本连接起来,就可以描述一段声波了。

    把每一秒钟所采样的数目称为采样频率,单位为HZ(赫兹)。采样频率越高所能描述的声波频率就越高。

    采样率决定声音频率的范围(相当于音调),可以用数字波形表示。以波形表示的频 率范围通常被称为带宽。要正确理解音频采样可以分为采样的位数和采样的频率。

    在当今的主流采集卡上,采样频率一般共分为 22.05KHz、44.1KHz、48KHz三个等级,22.05 KHz只能达到FM广播的声音品质,44.1KHz则是理论上的CD音质界限,48KHz则更加精确一些。对于高于48KHz的采样频率人耳已无法辨别出 来了,所以在电脑上没有多少使用价值

    八,采样位数 采样精度

    采样位数可以理解为采集卡处理声音的解析度。这个数值越大,解析度就越高,录制和回放的声音就越真实。我们首先要知道:电脑中的声音文件是用数字0和1来 表示的。所以在电脑上录音的本质就是把模拟声音信号转换成数字信号。反之,在播放时则是把数字信号还原成模拟声音信号输出。采集卡的位是指采集卡在采集和播放声音文件时所使用数字声音信号的二进制位数。采集卡的位客观地反映了数字声音信号对输入声音信号描述的准确程度。8位代表2的8次方--256,16 位则代表2的16次方--64K。比较一下,一段相同的音乐信息,16位声卡能把它分为64K个精度单位进行处理,而8位声卡只能处理256个精度单位,造成了较大的信号损失,最终的采样效果自然是无法相提并论的。

    九,WAV音频格式文件大小、播放时间换算

    采样率一般是44.1K,16bit采样精度,存储成WAV格式大小 = 44.1KHz(采样率) X 16bit(采样精度) X 2(双声道) X 播放时间

    WAV格式是没有压缩无损的,MP3格式是按1:12压缩保存的,所以MP3格式大小等于上式的1/12。

    十,ALSA

    ALSA是Advanced Linux Sound Architecture(高级Linux声音架构),它在Linux操作系统上提供了音频和MIDI(Musical Instrument Digital Interface,音乐设备数字化接口)的支持。在2.6系列内核中,ALSA已经成为默认的声音子系统,用来替换2.4系列内核中的OSS(Open Sound System,开放声音系统)。

      ALSA的主要特性包括:高效地支持从消费类入门级声卡到专业级音频设备所有类型的音频接口,完全模块化的设计,支持对称多处理(SMP)和线程安全,对OSS的向后兼容,以及提供了用户空间的alsa-lib库来简化应用程序的开发。

    十一,OSS(Open Sound System)是Linux中的另外一个音频驱动程序框架

    OSS音频开发详解

    展开全文
  • 音频基础知识

    2020-05-02 22:00:07
    1、采样率(sample rate) ...人耳能听到频率范围大约在20Hz~20kHz之间,所以为了保证声音不失真,采频率在40kHz以上; 一个通过一秒钟采样点数,常见的44.1kHz,表示一秒钟采样数据是44100个。 2、量化精...

    1、采样率(sample rate)

    采样就是把模拟信号转化为数字信号的过程;

    采样频率越高,音频质量越高,数据量也越大;

    采样频率不低于音频信号最高频率的两倍,就可以还原原始的声音;

    人耳能听到频率范围大约在20Hz~20kHz之间,所以为了保证声音不失真,采频率在40kHz以上;

    一个通过一秒钟的采样点数,常见的44.1kHz,表示一秒钟的采样数据是44100个。

     

    2、量化精度(位宽)

    每个采样点,都需要一个数值表示,一般是4bit、8bit、16bit、32bit等;

    位数越多,表示越精细,声音质量越好,数量也越大;

    常见的位宽是:8bit和16bit。

     

    3、声道数

    声道数一般表示声音录制时的音源数或回放时相应的扬声器数量

    常见的是单声道(Mono)和双声道(Stereo)

     

    4、音频帧

    我们常听说的有视频帧,每一帧就是一张图像,而音频帧并没有明确的概念;

    一般约定2.5ms~60ms为单位的数据量为一帧音频。

    假设某通道的音频信号采样频率为8kHz,位宽16bit,20ms一帧,双通道,则一帧音频数据大小为:

    int size = 8000 * 16bit * 0.02s * 2 = 5120 bit = 640 byte

     

    5、比特率(码率)

    指一个音频流中每秒中通过的数据量

    计算:采样率* 位宽 * 声道数,单位:bps

    比如常见的码率有:128kbit/s、160kbit/s和320kbit/s

     

    展开全文
  • 音频格式介绍和说明

    2020-09-28 15:29:58
    频谱掩蔽效应: 人耳所能察觉的声音信号的频率范围为20Hz~20KHz,在这个频率范围以外的音频信号属于冗余信号,属于可操作。 时域掩蔽效应: 当强音信号和弱音信号同时出现时,弱信号会听不到,因此,弱音信号也...

    零、音频压缩的原理

    音频文件压缩的原理很简单:因为有冗余信息,因此可以压缩。

    主要有两种方式实现:

    • 频谱掩蔽效应: 人耳所能察觉的声音信号的频率范围为20Hz~20KHz,在这个频率范围以外的音频信号属于冗余信号,属于可操作。
    • 时域掩蔽效应: 当强音信号和弱音信号同时出现时,弱信号会听不到,因此,弱音信号也属于冗余信号。

    常见的压缩格式有:MP3,AAC,OGG,WMA,Opus,FLAC,APE,m4a,AMR等等。

    一、PCM格式

    经过前文的学习和了解,我们已经知道:声音从模拟信号转化为数字信号的技术,需要经过采样、量化、编码三个过程将模拟信号数字化,这三个步骤和过程中:

    • 采样:对模拟信号采集样本,该过程是从时间上对信号进行数字化,例如每秒采集 44100 次,即采样频率 44.1 khz。
    • 量化:既然是将音频数字化,那就需要使用二进制来表示声音的每一个样本。例如每个样本使用 16 位长度来表示,即音频的位深度为16位。
    • 编码:编码就是按照一定的格式记录采样和量化后的数据,比如顺序存储或压缩存储等。编码后经由不同的算法,音频被保存为不同的格式,例如 MP3、AAC 等。

    那么何为PCM呢?

    总结来说,PCM 就是最为原始的一种格式,PCM 数据是音频的裸数据格式,不经过任何压缩。Android开发中 使用MediaRecorder时, 录制集成了编码、压缩等功能,AudioRecord 录制的是 PCM 格式的音频文件

    二、WAV格式

    前文提到过音频会被编码成不同的格式,而常见的压缩编码格式 WAV 格式是与 PCM 数据最为接近的一种格式。

    概念

    Waveform Audio File Format(WAVE,或者是WAV后缀而被大家所熟悉),它采用RIFF(Resource Interchange File Format)文件格式结构。通常用来保存PCM格式的原始音频数据,所以通常被称为无损音频。但是严格意义上来讲,WAV也可以存储其它压缩格式的音频数据。

    格式解析

    WAV文件遵循RIFF规则,其内容以区块(chunk)为最小单位进行存储。

    WAV文件一般由3个区块组成:

    • RIFF chunk
    • Format chunk
    • Data chunk。
    • 另外,文件中还可能包含一些可选的区块,如:Fact chunk、Cue points chunk、Playlist chunk、Associated data list chunk等。

    总结来说:WAV 编码不会进行压缩操作,它只在 PCM 数据格式前加上 44 字节(并不一定严格是 44 字节)来描述音频的基本信息,例如采样率、声道数、数据格式等。WAV格式结构组成如下图所示:

    很明显,如上的结构分成了3种颜色,现在来看看 WAV 文件头的格式:

    RIFF区块

    FORMAT区块

    ① 以'fmt '为标识 ② Size表示该区块数据的长度(不包含ID和Size的长度) ③ AudioFormat表示Data区块存储的音频数据的格式,PCM音频数据的值为1 ④ NumChannels表示音频数据的声道数,1:单声道,2:双声道 ⑤ SampleRate表示音频数据的采样率 ⑥ ByteRate每秒数据字节数 = SampleRate * NumChannels * BitsPerSample / 8 ⑦ BlockAlign每个采样所需的字节数 = NumChannels * BitsPerSample / 8 ⑧ BitsPerSample每个采样存储的bit数,8:8bit,16:16bit,32:32bit

    DATA区块

    • 以data为标识
    • Size表示音频数据的长度,N = ByteRate * seconds
    • Data音频数据

    举例说明WAV格式

    如下图所示,是一段WAV格式的音频使用记事本打开的预览图:

    结合上述讲的WAV文件格式的结构组成,对该内容进行分析如下:

    WAV格式字段说明

    第一列表示长度,第二列表示添加的字段及其含义。

    三、AAC音频格式

    AAC是另外一种音频格式,全称是Advanced Audio Coding,是一种专为声音数据设计的文件压缩格式。他的目的是为了取代MP3格式,与MP3不同,该采用了全新的算法进行编码,更加高效,具有更高的“性价比”。利用AAC格式,可使人感觉声音质量没有明显降低的前提下,更加小巧。

    AAC的特点

    • 应用范围比较广泛。很多泛娱乐化直播系统,都是采用AAC编码。
    • AAC本身编解码器质量非常高。作为一种高压缩比的音频压缩算法,但是还能保存较好的音质。

    AAC音频格式

    • ADIF (Audio Data Interchange Format): 这种格式只需要在文件开头存一个很小的头,包括采样率,采样大小,声道数量等基本信息,就可以对文件进行解读。这种格式只能从头开始解码,常用在磁盘文件中。
    • ADTS (Audio Data transport Stream): 该格式每一帧前面都有一个同步字,占用7-9个字节,好处是可以在音频流的任何位置开始解码,他类似于数据流格式。因为每一帧前面都有同步字,所以ADTS文件要比ADIF增加一些数据量。
    展开全文
  • 摘要:使用CPLD与音频专用数模/模数集成电路实现音频精确延时系统,详细阐述了设计思路并给出了系统自顶向下的设计过程。...这些芯片普遍采用较低的采样速率,仅对输入信号的低频分量进行处理,采样
  •  我们能够听见的音频信号的频率范围大约是20Hz-2OkHz,其中语音大约分布在300Hz-4kHz之内  男性语音为180Hz,女性歌声为600Hz,钢琴上 C调至A调间为440Hz,电视机发出人所能听到的声音是17kHz,人耳能够感知的最高...


    以下内容为个人自己整理的,不定时更新!

    1

     我们能够听见的音频信号的频率范围大约是20Hz-2OkHz,其中语音大约分布在300Hz-4kHz之内  

    男性语音为180Hz,女性歌声为600Hz,钢琴上 C调至A调间为440Hz,电视机发出人所能听到的声音是17kHz,人耳能够感知的最高声音频率为20kHz

     

    2、常用音频格式

    WAVE、MIDI、MP3、RM常见音频格式简介

    WAVE--WINDOWS系统最基本音频格式---*.wav

    1、占用巨大硬盘空间,音质最好,支持音乐与语音
    2、通常采样使用44KHZ采样/秒,16位/采样,立体声,双声道,CD音质
    3、一分钟音乐占用大约10M硬盘空间,56K调制解调器需要30分钟才能完成网络传送

    MIDI--电子合成音乐---*.mid

    1、与WAVE格式截然不同,只有音乐,没有语音
    2、使用音色库回放,有软硬波表之分,
    3、十分节省磁盘空间,但是音质回放对声卡依赖较大
    4、无法使用TotalRecorder录制mid音乐
    5、可以使用Wingroove软波表或其它软件转为wave

    MP3--最流行音频压缩格式---*.mp3

    1、节省硬盘空间,有损压缩,无法复原
    2、音质与不同压缩编码软件有关
    3、音乐与语音,可以使用各种采样比率

    RM--网络流媒体压缩格式---*.rm/*.ra

    1、节省磁盘空间,有损压缩,无法复原
    2、在目前比较窄的网络带宽下,与Real Server服务器配合,使用Real Player在客户端
    比较流畅地播放音视频媒体

    其它还有:

    1、微软的WMA编码--*.wma
    2、微软的ASF流媒体编码--*.asf
    3、Yamaha的VQF编码--*.vqf

     

    3 大小计算

     

    存储量=(采样频率*采样数位)/8(字节数)

    若采用双声道录音,存储量再增加一倍。例如,数字激光唱盘(CD-DA,红皮书标准)的
    标准采样频率为44.lkHz,采样数位为16位,立体声,可以几乎无失真地播出频率高达2
    2kHz的声音,这也是人类所能听到的最高频率声音。激光唱盘一分钟音乐需要的存储量
    为:

    44.1*1000*l6*2*60/8=10,584,000(字节)=10.584Mbytes    wav  未压缩

     

    所以比特率(数码率)就是44.1*1000*l6*2 = 1411.2 Kbps

     

    到目前为止,音频信号经压缩后的数码率降低到32至256kbit/s,语音可以低至8kbit/s以下。

     

     

    4

    采样率:每秒采集数据的次数
    采样精度:每次采集数据的位数
    通道数:存在几路音频
    比特率:针对编码格式,表示压缩编码后每秒的音频数据量大小。

    音频的帧的概念没有视频帧那么清晰,几乎所有视频编码格式都可以简单的认为一帧就是编码后的一副图像。

    但音频帧跟编码格式相关,它是各个编码标准自己实现的。因为如果以PCM(未经编码的音频数据)来说,它根本就不需要帧的概念

     


     

    展开全文
  • 信道传输的是电磁波信号,而电磁波是有一定的频率范围,带宽指的就是这段有效的频率范围的值 即:带宽 = 最高有效频率 - 最低有效频率 好比我们人的耳朵能听见一定频率范围内的声音(20 -20000Hz),那么19000Hz...
  •  ①高音扬声器:专门重放功率放大器输出的音频信号高频部分,其工作频率范围一般为2.5-25kHz。  ②中音扬声器:专门重放功率放大器输出的音频信号中频部分,其工作频率范围一般为500-7500Hz。  ③低音扬...
  • 这种啸叫的产生常常会影响音频信号的保真度,使得正常的音频信号放大失真,影响表演讲话等,严重情况下会使输出功率极度增大,达到饱和状态,因而会烧坏音频高音单元,损坏功放电路。 针对啸叫的问题,本文设计了一...
  • I2S总线

    2019-09-19 10:55:09
    如上图所示,自然界声音的频率范围最大为20KHz,根据香浓采样定律,采样频率只要大于2*Fs,采集的数据即可无失真的还原原始信号常见的CD,采样率为44.1KHz;这样当采样频率达到48KHz时即可无失真采样还原所有的...
  • 由于声频范围宽至九至十个倍频程,要使扬声器的振动系统在如此宽的频率范围内,完全线性地按照电信号振动十分困难,再要求具有线性的声辐射 特性.几乎是不可能的。  一个解决的途径是把声频范围分成数段.再用数只...
  • 由于声频范围宽至九至十个倍频程,要使扬声器的振动系统在如此宽的频率范围内,完全线性地按照电信号振动十分困难,再要求具有线性的声辐射 特性.几乎是不可能的。  一个解决的途径是把声频范围分成数段.再用数只...
  • 可能是以下一种情形:根据设计,很多仪表放大器可以在最高数十千赫的频率范围内表现出极佳 的共模抑制性能。但是,非屏蔽的放大器接触到数十或数百“兆赫”的RF辐射时,就可能会出现问题。此时放大器的输入级可能会出现...
  • 作为音频信号的传输,USB接口的传输速度足以满足其高数据量传送,而无线通信中,现在除了较为常见的FM之外还有红外、蓝牙、2.4G等,他们速度均可以达到普通要求。 目前,无线USB声卡中的Codec芯片较为成熟,有常见的...
  • 射频放大器的频率范围在20kHz到300GHz,并且通常与输入或输出阻抗耦合,该输入输出阻抗与传输线阻抗、电压与电流的比率相匹配。通常50欧姆和75欧姆是射频端口的常见阻抗值,因此射频放大器通常在这些阻抗下被指定...
  • [转载] 关于扬声器

    千次阅读 2013-07-08 00:20:40
     扬声器种类很多,分类方式也五花八门,一般可根据其工作原理、振膜形状以及放声频率范围来分类。   一、扬声器构造  我们最常见的电动式锥形纸盆扬声器。电动式锥形扬声器即过去我们常说成纸盆扬声器,尽管...
  • 【白噪音和粉红噪音】煲机必备无损噪音 下载

    千次下载 热门讨论 2010-05-04 11:42:20
    在人耳可听的频率范围内,具有相同能量的噪声称为白噪声。白噪声广泛用于环境声学测量中。 ===================================分割线================================= 附上wav格式的白噪音 粉红噪音各一个...
  • 煲机的概述:  指新买回的音响器材得通电一段时间后才会让重放的音质变好。 煲机是一种快速使器材老化稳定的措施。...在人耳可听的频率范围内,具有相同能量的噪声称为白噪声。白噪声广泛用于环境声学测量中。
  • 模拟录音方式直接记录音频信号的波形,重放时用磁头拾取信号。目前模拟录音动态范围可达到80db(分贝,信噪比的单位),为进一步提高音质,采用数字音频技术。 计算机内的音频必须是数字形式的。数字声音是一个数据...
  • 3、多种信号音电路 主要完成各种信号产生与发送,它由下列电路组成: A、450Hz拨号音电路 B、忙音发生电路 C、回铃音发生电路 D、25Hz振铃信号电路 4、CPU中央集中控制处理器电路 主要完成对系统电路各种控制...
  • Pr65教学.rar

    2011-01-30 04:17:15
    我们知道,在进行录音时,录入某段音频可能由很多频率段组成,尤其在音源较多情况下,为了使整个作品层次分明,就需要对其做必要均衡处理。比如:为了突出小提琴音色亮丽,需要提升它高频区;而BASS、底鼓...
  • Proteus仿真—40个单片机初学程序.

    热门讨论 2009-04-13 13:00:56
    用P1.0输出1KHz和500Hz的音频信号驱动扬声器,作报警信号,要求1KHz信号响100ms,500Hz信号响200ms,交替进行,P1.7接一开关进行控制,当开关合上响报警信号,当开关断开告警信号停止,编出程序。 2. 电路原理图 ...
  • 数据源支持模拟数据(默认)、数据库采集、串口通信(需定制)、网络通信(需定制)、网络请求等,可自由设定每个子界面采集间隔即数据刷新频率。 采用纯QWidget编写,亲测Qt4.6到Qt5.15任意版本,理论上支持后续...
  • 这个项目可指定让AGP装置来使用系统内存大小,这取用大小是PCI内存地址范围的一部份,可分配给图形内存空间。 Init Display First: 这个项目可选择当系统开机时先行对AGP或是PCI插槽来做初始化动作。 [AGP...

空空如也

空空如也

1 2
收藏数 29
精华内容 11
关键字:

常见音频信号的频率范围