精华内容
参与话题
问答
  • Kaldi

    千次阅读 2017-11-21 10:18:25
    关于kaldi 什么是kaldikaldi 是一个基于C++编写的用于语音识别的工具箱,kaldi一般被用于进行语音识别的研究者和相关人士。   kaldi命名  According to legend, Kaldi was the Ethiopian goatherder who ...

    关于kaldi

    什么是kaldi?

    kaldi 是一个基于C++编写的用于语音识别的工具箱,kaldi一般被用于进行语音识别的研究者和相关人士。

     

    kaldi命名

       According to legend, Kaldi was the Ethiopian goatherder who discovered the coffee plant.(官网上这么写的)

     

    kaldi和其他工具箱

       kaldi的目的和应用范围类似于HTK(较早的一种语音识别工具箱,详细介绍见网址http://htk.eng.cam.ac.uk/),kaldi的目标是拥有基于C++编写灵活和流行的代码,易于修改和扩展,也包括重要的特征。

     

     1、通过有限状态机(FSTs)进行代码集成

    可以编译OpenFst工具包(使它成为一个库)

     

     2、广义的线性代数

    包括一个矩阵库,它包括标准的BLAS和LPACK

     

    3、可扩展设计

    尽可能以简单的形式提供我们的算法,例如,我们的解码器是一个基于(框架,FST输入符号)元组评分索引的对象,这就意味着解码器可以适合任何数据源,如神经网络。

     

    4、开放许可

    该代码是在Apache2.0许可的,这是限制最少的许可证之一。

     

    5、完整的知识谱

    我们的目标是提供完整的构建语音识别系统的方法,这些工作可以广泛用于数据库,例如Linguistic Data Consortium(LDC)提供的数据。

    开放完整的知识谱的目标是Kaldi的一个重要方面,在开发许可的背景下代码是公开的,允许修改和从新发布,我们希望大家可以发布自己的代码,类似于Kaldi的脚本示例。

    在限制的时间内我们试图尽可能的完善Kaldi的文档,在短期内我们不能生成类似HTK完整的文档。尤其是现在有很多介绍HTK的材料,对于外行来说是系统的介绍语音识别,这将不可能出现在Kaldi的文档中。Kaldi的很多文件仅仅是以可以被专家接受的形式下编写的。在未来我希望它更容易获取,记住我们的目标对象是一些语音识别和正在接受训练的研究者。总的来说,Kaldi不是一个傻瓜式的语音识别工具,这将是你做了很多没有有意义的操作。

    展开全文
  • kaldi

    千次阅读 2017-01-05 16:11:34
    第一阶段:./cmd.sh . ./path.sh(设置执行路径以及命令脚本名字)ps:decode 解码 train 训练第二阶段:data preparation(数据准备阶段)执行 local/ thchs-30_data_prep.sh为了创建: wav.scp, utt2spk.scp, spk2utt.scp,...

    第一阶段:./cmd.sh . ./path.sh(设置执行路径以及命令脚本名字)

    这里写图片描述

    ps:decode 解码 train 训练


    第二阶段:data preparation(数据准备阶段)

    执行 local/ thchs-30_data_prep.sh

    为了创建: wav.scp, utt2spk.scp, spk2utt.scp, text 还有words.txt phone.txt

    这里写图片描述

    - 循环遍历thchs30/thchs30-openslr/data_thchs30/data/ 中 dev test train 3个文件夹内的wav 视频(6g视频) 获取它们的名字(如:C08_559 )

    - 循环遍历thchs30/thchs30-openslr/data_thchs30/目录下的 data test train 3个文件夹内的wav 视频(6g视频) 获取.wav.trn

    - 它们的名字(如:C08_559 ) 生成了 utt2spk, wav.scp 存放在egs/thchs30/s5/data/ 中 dev test train 3个文件夹

    - 它们的.wav.trn 生成了phone.txt word.txt 存放在egs/thchs30/s5/data/ dev test train 3个文件夹

    - utils包 utils/utt2spk_to_spk2utt.pl 利用 utt2spk 产生 spk2utt (两者排序不同而已) 存放在egs/thchs30/s5/data/ dev test train 3个文件夹

    这里写图片描述

    上图为目录,下图为utt2spk(由上图数据生成下图数据)

    这里写图片描述

    ps:C13与C14 是不同的讲话者

    更多文件解释在:http://blog.csdn.net/dzp443366/article/details/54094950

    第三阶段:产生的MFCC特征以及计算CMVN

    MFCC就是语音特征提取

    1. steps/make_mfcc.sh

    2.steps/compute_cmvn_stats.sh

    第四阶段:建立一个大的词汇,包括词的训练和解码

    源码备注:(就是上述标题意思)

    prepare language stuff

    build a large lexicon that invovles words in both the training and decoding.

    这里写图片描述

    查看两个生成文件语句,从resource包中复制dict文件夹到 项目中的data文件夹

    看一下dict里面的文件 lexicon.txt 以及phones.txt

    这里写图片描述

    上图为lexicon.txt

    格式为: <词汇> <音素>


    这里写图片描述

    上图为:nonsilence_phones.txt

    格式为:全部音标

    我们把这一步看作准备大量的素材,用于后续构造训练器。

    第五阶段 算法训练

    步骤为: 单音素训练, tri1三因素训练, trib2进行lda_mllt特征变换,trib3进行sat自然语言适应,trib4做quick

    后面就是dnn了

    这些操作的文件夹 是

    - data/mfcc/train (mfcc模块)

    - data/lang (语音模型)

    - exp/mono_ali (mono:单音节训练)

    - exp/exp/tril

    展开全文
  • KALDI - Kaldi

    2019-08-27 17:21:29
    KALDI - Kaldi KALDI http://www.kaldi-asr.org/ Documentation http://kaldi-asr.org/doc/index.html Models http://www.kaldi-asr.org/models.html Kaldi中文手册 ...

    KALDI - Kaldi

    KALDI
    http://www.kaldi-asr.org/

    Documentation
    http://kaldi-asr.org/doc/index.html

    Models
    http://www.kaldi-asr.org/models.html

    Kaldi 中文手册
    https://shiweipku.gitbooks.io/chinese-doc-of-kaldi/content/index.html

    Kaldi Speech Recognition Toolkit
    https://github.com/kaldi-asr/kaldi

    Kaldi is a toolkit for speech recognition, intended for use by speech recognition researchers and professionals.
    Kaldi 是语音识别的工具包,旨在供语音识别研究人员和专业人士使用。

    automatic speech recognition,ASR:自动语音识别
    computer speech recognition
    speech to text,STT
    speech recognition:语音识别

    References

    解析深度学习:语音识别实践

    展开全文
  • Kaldi Speech Recognition Toolkit To build the toolkit: see ./INSTALL. These instructions are valid for UNIX systems including various flavors of Linux; Darwin; and Cygwin (has not been tested on more ...
  • Kaldi Resample

    2020-11-26 12:27:58
    s <a href="https://github.com/kaldi-asr/kaldi/blob/master/src/feat/resample.cc#L368">LinearResample</a>. <p>Other torchaudio Kaldi PRs <a href="https://github.com/pytorch/audio/pull/119">Spectrogram...
  • 下载Kaldi git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden 目录结构 其中,tools、src、egs这三个目录是比较重要的。 tools目录下面全部都是Kaldi依赖的包。其中主要有: ...

    下载

    安装git

    sudo apt-get install git

    下载Kaldi

    git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden

    目录结构

    其中,tools、src、egs这三个目录是比较重要的。

    tools目录下面全部都是Kaldi依赖的包。其中主要有:

    OpenFST:Weighted Finite State Transducer library,是一个用来构造有限状态自动机的库。我们知道隐马尔科夫模型就可以看成是一个有限状态自动机的。这是最重要的一个包。

    ATLAS:这是一个C++下的线性代数库。做机器学习自然是需要很多矩阵运算的。

    IRSTLM:这是一个统计语言模型的工具包。

    sph2pipe:这是宾夕法尼亚大学linguistic data consortium(LDC)开发的一款处理SPHERE_formatted数字音频文件的软件,它可以将LDC的sph格式的文件转换成其它格式。

    src目录存放的是Kaldi的源代码。egs存放的是Kaldi提供的一些例子。我们现在要做的就是编译安装Kaldi依赖的各种库,然后编译安装

    Kaldi。

    Kaldi编译

    依赖软件包

    sudo apt-get install autoconf automaker gcc g++ libtool subversion gawk
    sudo apt-get install libatlas-dev libatlas-base-dev gfortran zlib1g-dev 

    编译安装使用到的工具

    cd kaldi-trunk/tools
    make

    配置kaldi

    cd ../src
    ./configure

    编译kaldi

    make all

    参考地址:http://kaldi-asr.org/doc/about.html

    展开全文
  • Kaldi Features

    2020-11-28 04:33:26
    <div><p>Hi All, <p>Is it possible to use Kaldi features as the input for model training? <p>Thanks,</p><p>该提问来源于开源项目:SeanNaren/deepspeech.pytorch</p></div>
  • kaldi中基于决策树的状态绑定

    万次阅读 多人点赞 2019-08-14 11:57:17
    为什么要做状态绑定 假如我们有218monophone,然后现在要考虑上下文音素对发音的影响,这时候我们通常使用triphone。那么会有几个triphone呢?答案是218的3次方。如果不进行聚类,我们需要建立(218的3次方)*3个混合...
  • Migrate Kaldi tests

    2020-11-27 13:48:39
    <div><p>We used to test kaldi against a saved kaldi output <a href="https://github.com/pytorch/audio/blob/master/test/test_compliance_kaldi.py">here, but we now have an infrastructure to run kaldi in ...
  • Kaldi MFCC

    2020-11-26 10:23:22
    <div><p>We want to write compute-mfcc-feats for compliance.kaldi.mfcc in torchaudio</p><p>该提问来源于开源项目:pytorch/audio</p></div>
  • kaldi简介

    万次阅读 2019-03-27 16:56:55
    最近准备开始进行语音识别算法的学习,所以决定拿kaldi进行解读,这样一方面更加增加自己C++的基本功,另一方面也可以让自己慢慢走入语音识别的大门,自己的路,决定了就走下去,不管有多难。 首先我决定从kaldi的...
  • 添加唤醒词模型训练,见wakeup_words目录,CSDN介绍:https://blog.csdn.net/cj1989111/article/details/88017908 添加aishell1语料转换为aishell2的组织方式,并可以训练GMM, CSDN介绍: ...
  • kaldi安装

    千次阅读 2019-02-05 13:00:28
    kaldi 依赖于python3 (自己安装好) git clone https://github.com/kaldi-asr/kaldi cd kaldi/tools/extras ./check_dependencies.sh #缺少包会提示,自己安装一下 cd ../ make cd ../src ./configure make depend ...
  • kaldi群和kaldi新手群

    千次阅读 2016-06-22 12:06:32
    从2014年2月27日开始建立kaldi学习群(群号:367623211),经过一段时间的努力,今天终于群达到1000人了,后期将逐步清理一些人,腾出一些位置。 此外,如果你是新手,欢迎加入kaldi学习新手群(群号:279295537)...
  • kaldi工具箱

    2018-03-10 20:56:34
    kaldi工具箱,kaldi是一款语音识别工具库,由Daniel Povey进行开发和维护,整个框架比较成熟,在容纳经久不衰的GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别模型之外,还将现阶段比较“火”的DNN、CNN、LSTM、BLSTM等...
  • Kaldi 解码

    千次阅读 2017-06-19 18:33:55
    gmm-align-compiled 功能:给定基线GMM模型,对每一句话,根据这句话的特征和这句话的fst,生成对应的对齐状态序列。 用法: ² Usage: gmm-align-compiled[options] model-in graphs-rspecifier feature-...
  • Kaldi WFST

    千次阅读 2017-11-22 18:01:02
      HCLG.fst由四部分构成 1. G:语言模型WFST,输入输出符号相同,实际是一个WFSA(acceptor接受机),为了方便与其它三个WFST进行操作,将其视为一个输入输出相同的WFST。 2. L:发音词典WFST,输入符号:...
  • Kaldi使用

    千次阅读 2018-06-09 17:40:48
    下载和安装 参考网站http://kaldi-asr.org/doc/install.html git clone ...cd kaldi cd tools extras/check_dependencies.sh#这一步之后会提示安装缺少的东西,按照提示安装就是了 ma...
  • kaldi lattice

    千次阅读 2017-01-23 19:52:26
    概况两种lattice结构Lattice结构FST的形式,weight包括两部分(graph cost和acoustic cost),输入是transition-ids,输出是words。 其中weight的graph cost包含LM+transition+pronunciation三部分。...
  • kaldi 安装

    千次阅读 2017-08-25 19:08:11
    一、预习安装包(系统Ubuntu) #install some package first sudo apt-get install libtool sudo apt-get install autoconf sudo apt-get install wget ...sudo apt-get install subver
  • Kaldi解码

    千次阅读 2019-05-14 21:02:01
    online2-wav-nnet3-latgen-faster 在线解码,文件输入输出 decode.sh运行程序 ./online2-wav-nnet3-latgen-faster --do-endpointing=false --frames-per-chunk=20 --extra-left-context-initial=0 ...
  • kaldi mfcc

    2018-06-07 14:39:11
    Kaldi特征提取之-预处理背景本质上语音信号是一维的时间信号,随时间上下波动。现实中,人们再说话时会受到各种音素的干扰,为了进一步进行处理,我们必须进行必要的预处理以便之后的特征提取。诸如FBank,MFCC,PLP...
  • kaldi解码

    2019-07-12 11:06:14
    https://blog.csdn.net/weixin_38858860/article/details/84067308参考这个博客看
  • kaldi log

    2017-03-20 18:26:00
    2019独角兽企业重金招聘Python工程师标准>>> ...
  • kaldi资料

    2018-10-19 16:12:39
    Kaldi官网 http://kaldi-asr.org/doc/index.html 包括一大堆原理和工具的使用说明,有什么问题请首先看这个。... Kaldi中文翻译1 如果感觉英语读起来比较头疼的话建议搜一下这个来看看,是对官网...
  • Kaldi 安装

    2018-11-13 22:06:29
    1.下载并编译安装 git clone ...cd kaldi/src # 如果没装cuda需要先安装cuda,参考:https://blog.csdn.net/u012325865/article/details/73034018 ./configure --cudatk-di...
  • Kaldi 杂记

    千次阅读 2017-06-19 21:35:25
    台式机器:I5-6500 GTX950, ubuntu14.04(新手建议不要太新的ubutnu,出现问题不好百度) 1. 安装CUDA7.5 到NVIDIA下载CUDA安装包,然后在安装一些可能需要的库:  sudo apt-get install ppa-purge ...

空空如也

1 2 3 4 5 ... 20
收藏数 2,785
精华内容 1,114
关键字:

Kaldi