kaldi安装_kaldi openfst 安装 - CSDN
精华内容
参与话题
  • Kaldi是一款基于C++编写的开源语音识别工具箱。这款工具既可以在Windows下编译也可以在Linux下编译。本次我是在虚拟机装上了Ubuntu。文档里面也说还是建议在Linux下使用Kaldi。 一、下载 下载直接利用git版本控制...

    Kaldi是一款基于C++编写的开源语音识别工具箱。这款工具既可以在Windows下编译也可以在Linux下编译。本次我是在虚拟机装上了Ubuntu 16.04.03,64位,可以联网。文档里面也说还是建议在Linux下使用Kaldi。

    一、下载

    下载直接利用git版本控制系统就可以了,打开终端,直接在你的实验目录下输入命令:

    git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden

    不一会就从github上下载下来了。当然,首先得确保你安装了git。要是没安装的话,就先输入:

    sudo apt-get install git

    安装git版本控制软件。

    二、各目录功能

    下载完毕以后,cd kaldi-trunk进去看看下载了一些什么东西。 

    其中,./tools,./src和./egs这三个目录是比较重要的。

    ./tools目录下面全部都是Kaldi依赖的包。其中主要有:

    1. OpenFST:Weighted Finite State Transducer library,是一个用来构造有限状态自动机的库。我们知道隐马尔科夫模型就可以看成是一个有限状态自动机的。这是最终要的一个包,Kaldi的文档里面说:If you ever want to understand Kaldi deeply you will need to understand OpenFst.
    2. ATLAS:这是一个C++下的线性代数库。做机器学习自然是需要很多矩阵运算的。
    3. IRSTLM:这是一个统计语言模型的工具包。
    4. sph2pipe:这是宾夕法尼亚大学linguistic data consortium(LDC)开发的一款处理SPHERE_formatted数字音频文件的软件,它可以将LDC的sph格式的文件转换成其它格式。

    ./src目录存放的是Kaldi的源代码

    ./egs存放的是Kaldi提供的一些例子。我们现在要做的就是编译安装Kaldi依赖的各种库,然后编译安装Kaldi。

    三、Kaldi的编译

    安装之前需要确保你安装了这些软件:

    apt-get
    subversion
    automake
    autoconf
    libtool
    g++
    zlib
    libatal
    wget

    安装方法为在shell里输入:

    sudo apt-get install subversion
    sudo apt-get install automake
    sudo apt-get install autoconf
    sudo apt-get install libtool
    sudo apt-get install g++
    sudo apt-get install wget
    sudo apt-get install libatlas-dev
    sudo apt-get install libatlas-base-dev
    sudo apt-get install zlib1g
    sudo apt-get install zlib1g-dev 

    1.在./tool目录下输入make,开始编译,输入make -j 4命令可以加快速度(多核并行处理)。 
    2.之后切换到./src目录下,输入./configure进行配置,然后输入make all进行编译。当然这个过程也可以并行处理加速,输入make -j 4。经过漫长的编译过程以后,就安装完毕了。

    展开全文
  • kaldi安装过程

    千次阅读 2019-04-18 10:10:45
    1.下载kaldi的文件 git clone https://github.com/kaldi-asr/kaldi.git 2.进入tools cd tools cat INSTALL 按照指令一步步进行 extras/check_dependencies.sh #检查依赖性,没有的包按照指令安装 make or make -...

    1.下载kaldi的文件

    git clone https://github.com/kaldi-asr/kaldi.git
    

    2.进入tools

    cd tools
    cat INSTALL
    

    按照指令一步步进行

    extras/check_dependencies.sh
    #检查依赖性,没有的包按照指令安装
    make  
    or  
    make -j 4(多线程加快进度)
    

    3.进入src

    cd src
    cat INSTALL
    

    按照指令安装

     ./configure --shared
      make depend -j 8
      make -j 8
    

    在make depend -j 8的时候遇到问题
    在这里插入图片描述
    原因是:cuda安装的版本没有cublas的依赖包,更新cuda至有依赖的版本

    apt-get upgrade cuda
    

    再次make,等待30min以上
    在这里插入图片描述

    4.检查是否确实安装成功

    • 跑一个小程序
    cd egs/yesno/s5
    sh run.sh
    

    输出显示
    在这里插入图片描述

    • 或者检查生成文件
    cd src/bin
    

    各种编译之后的可执行文件已经存在
    在这里插入图片描述

    cd src
    featbin/copy-feats
    

    在这里插入图片描述
    成功!

    展开全文
  • 语音识别 kaldi安装

    万次阅读 多人点赞 2020-08-10 22:16:45
    这3篇博客主要是总结了两种用kaldi进行中文语音识别的方法,并详细的写了如何编译安装kaldi、相关模型的训练、导入和相关环境配置。算是自己近期学习的一个总结,也希望可以帮助到需要的人。 另外两篇的地址 kaldi...

    本篇博客主要记录了我编译安装kaldi的过程,算是自己近期学习的一个总结,也希望可以帮助到需要的人。

    kaldi是什么

    kaldi是一个用C++写的语音识别工具包。kaldi旨在供语音识别研究员使用。当然,kaldi也可以用作声纹识别。关于他的详细介绍可以访问kaldi的官方文档

    kaldi与中文语音识别

    感谢很多大神与科研工作者在kaldi上开源了他们的数据集和训练模型,让我这样的小白可以站在巨人的肩膀上前行。目前我所了解到有3个开源的中文语音识别例子。

    1. 清华大学开源的thchs30数据集(疯狂为CSLT打电话~~~)
    2. CVTE公司开源的CVTE Mandarin Model模型
    3. Beijing Shell Shell Technology公司开源的aishell数据集

    如果有同学知道其他的数据集or模型,中英文皆可,欢迎联系我补充啊~

    编译与安装kaldi

    注意:为了提高训练的速度,kaldi最好安装在GPU云服务器下。如果没有服务器话,使用虚拟机应该也是可以的,但一定要分配足够的内存空间和存储空间。下面我就以我使用的centos服务器为例,介绍kaldi的编译与安装。

    编译与安装大概分为3步

    1. 安装git、下载kaldi的源码
    2. 安装编译所需依赖包
    3. 配置、编译kaldi

    1.kaldi的下载

    kaldi的所有源码开源在了GitHub上,可以直接git下载到服务器上,首先得确保服务器上安装了git,如果没有安装的话,就先安装git

    sudo yum install git -y
    

    接着git clone下载kaldi

    git clone https://github.com/kaldi-asr/kaldi.git
    

    下载完成kaldi源码后,我们将得到如下一个文件结构的目录。

    kaldi/
    ├── COPYING
    ├── egs/				//egs目录里存放了使用kaldi完成的开源语音识别/声纹识别项目
    ├── INSTALL				//编译安装kaldi的指导
    ├── misc/
    ├── README.md
    ├── scripts/
    ├── src/				//src文件夹里存放了kaldi源码
    ├── tools/				//tools文件夹里存放了语音处理的工具包
    └── windows/				//windows文件夹存放了在windows下编译安装kaldi的文件
    

    2.安装编译所需要的依赖包

    编译之前需要确操作系统中安装有如下包

      subversion
      automake
      autoconf
      libtool
      g++
      zlib
      libatal
      wget
      sox
    

    首先进入到kaldi/tools目录下,接着在调用check_dependencies.sh脚本检查系统中的包是否安装完全

    cd kaldi/tools
    extras/check_dependencies.sh
    

    如图所示,这个shell脚本会提示系统需要安装的包,按照提示安装即可。

    img

    安装完成后再次运行这个脚本,如果提示OK就可以开始进行kaldi的编译。

    3.编译kaldi

    首先编译tools,在在kaldi/tools目录下输入

    make
    

    我使用的服务器是i7有8个核心,因此输入make -j 8可以使用8个核心一起编译,加快编译速度。

    之后转到kaldi/src目录下,输入如下命令

    cd ../src
    

    在src目录下首先要运行configure进行配置,由于每个人的cuda版本、安装路径不一定相同,所以这里需要根据自己的服务器情况进行修改,如下是我的configure配置方案,仅供参考。

    ./configure --static \
                --use-cuda=yes \
                --cudatk-dir=/home/zy/cuda/cuda-8.0 \
                --mathlib=OPENBLAS \
                --openblas-root=../tools/OpenBLAS/install \
                --threaded-math=no \
                --static-math=yes \
                --static-fst=yes \
                --fst-root=../tools/openfst
    

    配置完成后,就可以进行src的编译了

    make depend
    make
    

    同样,如果是多核CPU的话,你可以使用make depend -j 8make -j 8加快编译速度

    完成后会有提示成功和失败,结束make后就算完成了kaldi的编译与安装了~


    参考资料:

    1. CSDN博客:Kaldi的下载安装与编译
    2. kaldi-ctc的安装、编译、测试
    展开全文
  • kaldi 安装ubuntu 16.04

    千次阅读 2017-06-23 15:04:38
    首先下载kaldi包git clone https://github.com/kaldi-asr/kaldi.git然后安装依赖库进 cd tools tools文件 运行 ./extras/check_dependencies.sh 根据它要求安装 各种库 我的是缺这些:sudo apt-get install ...

    首先下载kaldi包

    git clone https://github.com/kaldi-asr/kaldi.git

    然后安装依赖库


    cd tools
    tools文件 运行
    ./extras/check_dependencies.sh

    根据它要求安装 各种库
    我的是缺这些:

    sudo apt-get install zlib1g-dev libtool subversion libatlas3-base

    再运行一次:
    ./extras/check_dependencies.sh
    然后就有
    ./extras/check_dependencies.sh: all OK.
    然后编译这些tools
    make -j 8
    如果有报错,可能是g++版本不对
    这样外部库就装好了

    编译kaldi,src

    下面进入src编译相关的GMM/NNET等的库
    cd src
    然后输入

      ./configure --shared
      make depend -j
      make -j
    

    特别慢,等着就行了。
    最后看到
    echo Done
    Done
    就成功了。

    例子

    跑个例子:
    cd egs
    找到yesno
    运行./run.sh
    成功即对

    展开全文
  • 语音识别工具kaldi安装(一)

    千次阅读 2019-03-01 14:44:46
    Kaldi是一个非常强大的语音识别工具库,主要由Daniel Povey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。其中DNN-HMM中的神经网络还可以由配置文件自定义,DNN、CNN、TDNN、...
  • Kaldi学习手记(一):Kaldi的编译安装

    万次阅读 热门讨论 2015-10-12 16:02:00
    Kaldi是一款基于C++编写的开源语音识别工具箱。这款工具既可以在Windows下编译也可以在Linux下编译。不过听学姐说以后还是在Linux下做开发多一些,我就想干脆顺便把Linux环境熟悉熟悉,于是就安了个虚拟机装上了...
  • kaldi安装

    2020-09-20 09:38:00
    kaldi 项目源地址:https://github.com/kaldi-asr/kaldi 应用过Alibaba-MIT-Speech补丁https://github.com/alibaba/Alibaba-MIT-Speech的分支: https://github.com/tramphero/kaldi 最新版本的 不能直接应用...
  • kaldi安装及测试

    千次阅读 2018-11-14 15:09:05
    Linux 环境下安装步骤: 1、安装前需要对你的Linux进行配置,你需要安装的软件有: apt-get subversion automake autoconf libtool g++ zlib libatal wget 具体安装方法如下: (1) sudo apt-get install...
  • &1. kaldi学习之路 之 kaldi安装编译

    千次阅读 2018-01-17 18:37:54
    看了很多篇论文,语音识别领域质量较高的文章大多数还是英文的比较靠谱,看了几个月的论文终于有点头绪了,找到了自己的创新点,开始打算用Tensorflow训练实验,后来经多方人士推荐语音这块还是用Kaldi更好,...
  • 今天在运行Kaldi AIshell 脚本的时候提示我kaldi_lm没有安装,如下图 于是我按照提示安装kaldi_lm, 切换到kaldi根目录下,进入tools目录下,运行/extras/install_kaldi_lm.sh 发现报错,报错内容如下: #...
  • 最近需要进行语音识别的学习,选择了kaldi作为开发平台,在尝试了网上的很多安装方法后,寻找了一种最简洁的安装方法,总结如下: 第一步:先安装git 命令: sudo apt-get install git 第二步:下载并更新kaldi...
  • 语音识别工具Kaldi环境配置及安装手册(更新加强版)
  • kaldi上使用gpu以及如何安装cuda

    万次阅读 2014-11-19 21:01:37
    本博客是在@冒顿的指导下完成的。
  • kaldi 语音识别 ubuntu 16.04安装教程

    万次阅读 2019-09-15 22:47:26
    Kaldi 底层是使用C++ 编写的语音识别工具,旨在供语音识别研究员使用。 也是语音识别领域最常用的一个工具。 它自带了很多特征提取模块、语音模型代码,可直接使用或重新训练GMM-HMM 等模型。 还支持GPU进行训练...
  • centos7编译安装kaldi

    千次阅读 2017-11-27 17:42:36
    首先,需要在系统安装git工具yum install -y git然后克隆kaldi源码git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden下载完毕以后,cd kaldi-trunk进去看看下载了一些什么东西。...
  • kaldi安装错误最终版

    千次阅读 2014-03-14 20:46:28
    相信关注我博客的人知道,之前我已经把kaldi出现的错误写了博文。这次主要因为我之前的电脑内存不够,换了个稍微大点的内存,在这里提醒下学习kaldi的各位朋友,注意kaldi所需要的电脑配置,以下是我的一些看法: ...
  • Kaldi是一个非常强大的语音识别工具库,主要由Daniel Povey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。其中DNN-HMM中的神经网络还可以由配置文件自定义,DNN、CNN、TDNN、...
  • Ubuntu安装kaldi

    千次阅读 2019-01-18 15:31:47
    故决定自看官网教程安装。在此记录下详细过程以便后需,也望能有助于各网友。 1.打开终端,更新。sudo apt-get update,sudo apt-get upgrade 2.进入kaldi官网(http://kaldi-asr.org/doc/install.html) 复制:...
  • 语音识别系统kaldi----实例说明

    万次阅读 2013-12-21 20:13:36
    最近一直在折腾kaldi,在这个庞大的系统面前,自己是那么的微小。由于数据库的原因,我只能运行kaldi所给例子的一部分。下面就来说说最近的进展吧。  第一个例子就是yesno这个例子。由于提供数据,而且数据比较小,...
  • kaldi安装编译

    千次阅读 2017-07-24 14:23:37
    kaldi 安装 编译
1 2 3 4 5 ... 20
收藏数 803
精华内容 321
关键字:

kaldi安装