精华内容
下载资源
问答
  • librosa

    2019-02-01 14:04:23
    ubuntu系统、python2.7,安装librosa,需要joblib==0.11.0版本,版本不匹配可能会报librosa:TypeError: expected string or buffer
    • ubuntu系统、python2.7,安装librosa,需要joblib==0.11.0版本,版本不匹配可能会报librosa:TypeError: expected string or buffer
    librosa
    #-*-coding:utf-8-*-
    import librosa
    import numpy as np
    
    def get_spectrograms(fpath):
       '''Returns normalized log(melspectrogram) and log(magnitude) from `sound_file`.
       Args:
         sound_file: A string. The full path of a sound file.
    
       Returns:
         mel: A 2d array of shape (T, n_mels) <- Transposed
         mag: A 2d array of shape (T, 1+n_fft/2) <- Transposed
       '''
       # num = np.random.randn()
       # if num < .2:
       #     y, sr = librosa.load(fpath, sr=hp.sr)
       # else:
       #     if num < .4:
       #         tempo = 1.1
       #     elif num < .6:
       #         tempo = 1.2
       #     elif num < .8:
       #         tempo = 0.9
       #     else:
       #         tempo = 0.8
       #     cmd = "ffmpeg -i {} -y ar {} -hide_banner -loglevel panic -ac 1 -filter:a atempo={} -vn temp.wav".format(fpath, hp.sr, tempo)
       #     os.system(cmd)
       #     y, sr = librosa.load('temp.wav', sr=hp.sr)
    
       # Loading sound file
       y, sr = librosa.load(fpath, sr=22050)
    
    
       # Trimming
       y, _ = librosa.effects.trim(y)
    
       # Preemphasis
       y = np.append(y[0], y[1:] - 0.95 * y[:-1])
    
       # stft
       linear = librosa.stft(y=y,n_fft=2048,hop_length=int(0.0125*22050),win_length=int(0.05*22050))#(1025,54)
    
       # magnitude spectrogram
       mag = np.abs(linear)  # (1+n_fft//2, T) #(1025,54)
    
       # mel spectrogram
       mel_basis = librosa.filters.mel(22050, 2048, 80)  # (n_mels, 1+n_fft//2) #(80,1025)
       mel = np.dot(mel_basis, mag)  # (n_mels, t) #(80, 54)
       # to decibel
       mel = 20 * np.log10(np.maximum(1e-5, mel))
       mag = 20 * np.log10(np.maximum(1e-5, mag))
    
       # normalize
       mel = np.clip((mel - 20 + 100) / 100, 1e-8, 1)#(80, 54)
       mag = np.clip((mag - 20 + 100) / 100, 1e-8, 1)#(1025, 54)
    
       # Transpose
       mel = mel.T.astype(np.float32)  # (T, n_mels)     #(54, 80)
       mag = mag.T.astype(np.float32)  # (T, 1+n_fft//2) #(54, 1025)
    
       return mel, mag
    if __name__ == "__main__":
       get_spectrograms("1-1.wav")
    

    T表示时间方向,帧率为22050

    展开全文
  • librosa.core.resample — librosa 0.7.2 documentation,重采样官方文档
  • librosa_parameters librosa的参数优化代码
  • librosa A python package for music and audio analysis. Documentation See https://librosa.org/doc/ for a complete reference manual and introductory tutorials. The advanced example gallery should...
  • librosa教程

    2021-07-02 11:16:11
    Librosa教程 这一篇很详细了

    语音信号处理——librosa教程

    librosa的教程,这一篇很详细了

    展开全文
  • librosa 安装

    千次阅读 2019-11-05 19:56:15
    参考博客: ... https://pypi.org/project/librosa/ librosa 安装时总是不成功,网络不好超时。 conda install -c conda-forge librosa 或者: pip install librosa 通过源码安装,下载地址:...

    参考博客: https://blog.csdn.net/zzc15806/article/details/79603994

    https://pypi.org/project/librosa/

    librosa 安装时总是不成功,网络不好超时。

    conda install -c conda-forge librosa  
    或者:
    pip install librosa

    通过源码安装,下载地址:(成功)

    https://pypi.org/project/librosa/#history 

    tar xzf librosa-VERSION.tar.gz
    cd librosa-VERSION/
    python setup.py install
    

    最近几次安装都是先通过源码安装,然后再  pip install librosa 

     

     

    展开全文
  • librosa学习

    2020-09-01 11:58:27
    librosa.feature.mfcc 主要学习利用该库提取mfcct特征,望各位批评指正。 MFCCs (Mel-frequency cepstral coefficients):梅尔倒谱系数 librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, dct_type=2, norm...

    Librosa

    Librosa是一个用于音频、音乐分析、处理的python工具包,一些常见的时频处理、特征提取、绘制声音图形等功能应有尽有,功能十分强大。
    api官方文档学习地址:http://librosa.org/doc/latest/index.html

    安装

    Librosa官网提供了多种安装方法,详细如下:

    pypi
    最简单的方法就是进行pip安装,可以满足所有的依赖关系,命令如下:

    pip install librosa

    conda
    如果安装了Anaconda,可以通过conda命令安装:

    conda install -c conda-forge librosa

    source (一般在linux系统)
    直接使用源码安装,需要提前下载源码,即tar.gz文件(https://github.com/librosa/librosa/releases/),通过下面命令安装:

    tar xzf librosa-VERSION.tar.gz
    cd librosa-VERSION/
    python setup.py install

    常用功能

    api官方文档学习地址:http://librosa.org/doc/latest/index.html

    代码实现

    1.读取音频

    导入包:

    import librosa

    Librosa默认的采样率是22050,如果需要读取原始采样率,需要设定参数sr=None:

     y, sr = librosa.load('./train0001.wav', sr=None)

    'beat.wav’的原始采样率为44100。如果需要重采样,只需要将采样率参数sr设定为你需要的值:

    y, sr = librosa.load('./beat.wav', sr=16000)

    注:此时只改变了采样率,未改变采样精度。

    2.特征提取

    • Log-Mel Spectrogram特征
      是目前在语音识别和环境声音识别中很常用的一个特征,由于CNN在处理图像上展现了强大的能力,使得音频信号的频谱图特征的使用愈加广泛,甚至比MFCC使用的更多。
    # extract mel spectrogram feature
    melspec = librosa.feature.melspectrogram(y, sr, n_fft=1024, hop_length=512, n_mels=128)
     # convert to log scale
    logmelspec = librosa.power_to_db(melspec)
    
    >>> logmelspec.shape
    (128, 1156)

    Log-Mel Spectrogram特征是二维数组的形式,128表示Mel频率的维度(频域),194为时间帧长度(时域),所以Log-Mel Spectrogram特征是音频信号的时频表示特征。其中,n_fft指的是窗的大小,这里为1024;hop_length表示相邻窗之间的距离,这里为512,也就是相邻窗之间有50%的overlap;n_mels为mel bands的数量,这里设为128。

    • MFCC特征
     # extract mfcc feature
    mfccs = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=40)
    
    >>> mfccs.shape
    (40, 1156)

    Librosa还有很多其他音频特征的提取方法,比如CQT特征、chroma特征等,在第二部分“librosa常用功能”给了详细的介绍。

    librosa.feature.mfcc
    主要学习利用该库提取mfcct特征,望各位批评指正。
    MFCCs (Mel-frequency cepstral coefficients):梅尔倒谱系数

    librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, dct_type=2, norm='ortho', lifter=0, **kwargs

    输入参数:

    1. y: 语音时间序列。np.ndarray [shape=(n,)] or None
    2. sr: y的采样频率。number > 0 [scalar]
    3. S: 能量对数log-power梅尔谱。np.ndarray [shape=(d, t)] or None
    4. n_mfcc: MFCCs返回时数目。 int > 0 [scalar]
    5. dct_type:{1, 2, 3} 离散余弦变换(DCT)类型。默认2。
    6. norm: None or ‘ortho’。如果dct_type是2或3,设置norm='ortho’使用正交标准DCT基。dct_type=1不支持标准化。
    7. lifter: 如果 lifter>0, 提升倒谱滤波。设置lifter >= 2 * n_mfcc强调高阶系数。随着lifter的增加,权重系数近似为线性。
    8. kwargs: additional keyword arguments.

    返回参数:

    1. MFCC sequence(M):np.ndarray [shape=(n_mfcc, t)]

    3.谱分解

    在这里插入图片描述

    comps, acts = librosa.decompose.decompose(S, n_components=None, transformer=None, sort=False, fit=True, **kwargs)

    分解一个特征矩阵
    给定一个谱S,分解成分量components和激活矩阵activations。也即是S ~= components.dot(activations)
    默认情况下,利用非负矩阵分解法(non-negative matrix factorization,NMF),来自 sklearn.decomposition。
    参数:
    1.输入的特征矩阵(如幅度谱)
    S:np.ndarray [shape=(n_features, n_samples), dtype=float]
    2.想要分解的分量数目,若设置为None,就默认n_feature的值
    n_componentsint > 0 [scalar] or None
    3.transformer:None or object
    变换类型,若设置None,默认 sklearn.decomposition.NMF。否则,任何具有与NMF类似接口的对象都可以。transformer 必须遵循 scikit-learn传统,即输入数据必须是(n_samples, n_features)。
    transformer.fit_transform()应该是S的转置S.T,返回值存储(转置)为activations。
    分量components将会返回为:transformer.components_.T。

    S ~= np.dot(activations, transformer.components_).T

    S ~= np.dot(transformer.components_.T, activations.T)

    4.sort:bool
    如果为True,则分量按峰值频率升序排序。
    如果与transformer一起使用,则将对分解参数的副本应用排序,而不是对内部参数进行排序。

    5.fit:bool
    如果为True,则从输入S估计组件。
    如果为False,则假定组件是预先计算的,并存储在transformer中,不进行更改。

    6.kwargs:Additional keyword arguments to the default transformer

    返回:

    components: np.ndarray [shape=(n_features, n_components)]matrix of components (basis elements).

    activations: np.ndarray [shape=(n_components, n_samples)]
    变换后矩阵/激活矩阵

    例子:

    >>> y, sr = librosa.load(librosa.ex('choice'), duration=5)
    >>> S = np.abs(librosa.stft(y))
    >>> comps, acts = librosa.decompose.decompose(S, n_components=8)
    展开全文
  • librosa库安装

    2020-07-08 10:59:03
    如果直接使用pip成功安装,关掉本文节省时间。...2.解压librosa安装包并切换到目录安装 tar xzf librosa-0.7.2.tar.gz cd librosa-0.7.2 python setup.py install https://librosa.org/librosa/inst
  • librosa安装: pip install librosa报错 报错内容: ERROR: Cannot uninstall ‘llvmlite’. It is a distutils installed project and thus we cannot accurately determine which files belong to it which would ...
  • 安装librosa

    千次阅读 2018-08-19 19:06:31
    https://pypi.org/project/librosa/ https://pypi.org/project/librosa/#files (下载) https://blog.csdn.net/qq_34638161/article/details/102923125 conda install-cconda-forgelibrosa (可行) 或者: ...
  • 该函数是音频信号短时傅里叶变化的librosa实现,旧版本调用方式为librosa.core.stft, 目前新版本已经修改为librosa.stft 文档地址 : https://librosa.org/doc/0.8.0/generated/librosa.stft.html 函数头: librosa....
  • librosa.feature.mfcc参数介绍 librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, dct_type=2, norm=‘ortho’, **kwargs) y:np.ndarray [shape=(n,)] 或 None 音频时间序列 sr:number > 0 [scalar] y...
  • import librosa import librosa.display import matplotlib.pyplot as plt y,sr = librosa.load(audio_file, mono=True, offset=0.0) print("shape of y:", y.shape, ", sample rate:", sr) y1 = librosa.core.....
  • librosa_display_specshow.py

    2021-08-19 09:44:04
    librosa_display_specshow.py
  • 音频处理库—librosa的安装与使用

    万次阅读 多人点赞 2018-03-18 23:00:58
    目录 序言 一、libsora安装 pypi conda source 二、librosa常用功能 核心音频处理函数 音频处理 频谱表示 幅度转换 时频转换 特征提取 绘图显示 三、常用功能代码实现 ...Librosa是一个用于...
  • librosa-0.6.1rc0.tar.gz

    2021-07-15 10:44:57
    librosa-0.6.1rc0,librosa早期版本,适用于低版本的tensorflow
  • librosa入门学习

    千次阅读 2018-12-12 15:52:31
    今天开始学习librosa这个库,这个库主要用于音频处理,对于机器学习音频分类的初步处理工作很有用 第一步肯定需要学习怎样读取音频文件 1.librosa中对音频文件的基本处理模块如下 1)load模块用于读取音频文件,...
  • librosa语音信号处理

    千次阅读 2020-09-04 18:32:57
    librosa是一个非常强大的python语音信号处理的第三方库,本文参考的是librosa的官方文档,本文主要总结了一些重要,对我来说非常常用的功能。学会librosa后再也不用用python去实现那些复杂的算法了,只需要一句语句...
  • librosa-0.7.2.tar.gz

    2020-07-06 19:08:01
    直接使用pip安装失败,改用librosa Source安装。但是没有梯下载很慢,上传最新版本的到这里供下载。
  • librosa安装错误

    千次阅读 2020-03-26 01:20:48
    我用conda安装了librosa这个包 conda install -c conda-forge librosa 但是一直报错: 找了很多方法都不行,后来才发现是因为VScode是直接启动的,不是在anaconda端启动的。从anaconda启动后便无此错误了。 .....
  • librosa绘制音频图

    2021-03-06 11:06:03
    librosa绘制音频图 今天偶然发现librosa库可以绘制音频特征相关图,作下记录和总结。 import librosa.display import numpy as np import matplotlib.pyplot as plt # 这里插入提取音频的路径 y, sr = librosa.load...
  • librosa窗函数

    千次阅读 2018-06-11 20:26:41
    librosa使用的是scipy.signal.get_window(window, Nx, fftbins=True)进行窗函数的调用。 支持的窗函数列表:
  • librosa-0.7.0.tar.gz

    2020-04-26 12:52:54
    因为之前下载的比较慢,所以试着把librosa安装包上传,希望能解决下载慢的问题!使用source安装时即可下载,版本0.7.0。
  • Python librosa模块介绍

    2021-01-22 10:27:53
    librosa语音信号处理模块 参考链接:https://www.cnblogs.com/LXP-Never/p/11561355.html
  • librosa 歌声合成

    2019-08-20 23:20:52
    文章目录librosa 歌声合成 librosa 歌声合成 # -*- coding:utf-8 -*- # /usr/bin/python ''' @Author : Yan Errol @Describe: @Evn : @Date : 2019-08-04 16:33 ''' from __future__ import division, print_...
  • librosa使用source安装

    2020-04-26 12:59:32
    librosa安装 librosa安装包下载 打开Anaconda Prompt,进入到所下载的包目录下,输入以下命令: tar xzf librosa-VERSION.tar.gz # 解压(VERSION根据自己下载的版本修改) cd librosa-VERSION/ # 进入librosa安装包...
  • 今天小编就为大家分享一篇对python中Librosa的mfcc步骤详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • python 音频库 librosa

    千次阅读 2017-11-14 12:31:13
    http://librosa.github.io/librosa/tutorial.html

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 2,433
精华内容 973
关键字:

librosa