kaldi语音识别_kaldi语音识别实战网盘 - CSDN
精华内容
参与话题
  • 语音识别 kaldi 的安装

    万次阅读 多人点赞 2020-08-10 22:16:45
    这3篇博客主要是总结了两种用kaldi进行中文语音识别的方法,并详细的写了如何编译安装kaldi、相关模型的训练、导入和相关环境配置。算是自己近期学习的一个总结,也希望可以帮助到需要的人。 另外两篇的地址 kaldi...

    本篇博客主要记录了我编译安装kaldi的过程,算是自己近期学习的一个总结,也希望可以帮助到需要的人。

    kaldi是什么

    kaldi是一个用C++写的语音识别工具包。kaldi旨在供语音识别研究员使用。当然,kaldi也可以用作声纹识别。关于他的详细介绍可以访问kaldi的官方文档

    kaldi与中文语音识别

    感谢很多大神与科研工作者在kaldi上开源了他们的数据集和训练模型,让我这样的小白可以站在巨人的肩膀上前行。目前我所了解到有3个开源的中文语音识别例子。

    1. 清华大学开源的thchs30数据集(疯狂为CSLT打电话~~~)
    2. CVTE公司开源的CVTE Mandarin Model模型
    3. Beijing Shell Shell Technology公司开源的aishell数据集

    如果有同学知道其他的数据集or模型,中英文皆可,欢迎联系我补充啊~

    编译与安装kaldi

    注意:为了提高训练的速度,kaldi最好安装在GPU云服务器下。如果没有服务器话,使用虚拟机应该也是可以的,但一定要分配足够的内存空间和存储空间。下面我就以我使用的centos服务器为例,介绍kaldi的编译与安装。

    编译与安装大概分为3步

    1. 安装git、下载kaldi的源码
    2. 安装编译所需依赖包
    3. 配置、编译kaldi

    1.kaldi的下载

    kaldi的所有源码开源在了GitHub上,可以直接git下载到服务器上,首先得确保服务器上安装了git,如果没有安装的话,就先安装git

    sudo yum install git -y
    

    接着git clone下载kaldi

    git clone https://github.com/kaldi-asr/kaldi.git
    

    下载完成kaldi源码后,我们将得到如下一个文件结构的目录。

    kaldi/
    ├── COPYING
    ├── egs/				//egs目录里存放了使用kaldi完成的开源语音识别/声纹识别项目
    ├── INSTALL				//编译安装kaldi的指导
    ├── misc/
    ├── README.md
    ├── scripts/
    ├── src/				//src文件夹里存放了kaldi源码
    ├── tools/				//tools文件夹里存放了语音处理的工具包
    └── windows/				//windows文件夹存放了在windows下编译安装kaldi的文件
    

    2.安装编译所需要的依赖包

    编译之前需要确操作系统中安装有如下包

      subversion
      automake
      autoconf
      libtool
      g++
      zlib
      libatal
      wget
      sox
    

    首先进入到kaldi/tools目录下,接着在调用check_dependencies.sh脚本检查系统中的包是否安装完全

    cd kaldi/tools
    extras/check_dependencies.sh
    

    如图所示,这个shell脚本会提示系统需要安装的包,按照提示安装即可。

    img

    安装完成后再次运行这个脚本,如果提示OK就可以开始进行kaldi的编译。

    3.编译kaldi

    首先编译tools,在在kaldi/tools目录下输入

    make
    

    我使用的服务器是i7有8个核心,因此输入make -j 8可以使用8个核心一起编译,加快编译速度。

    之后转到kaldi/src目录下,输入如下命令

    cd ../src
    

    在src目录下首先要运行configure进行配置,由于每个人的cuda版本、安装路径不一定相同,所以这里需要根据自己的服务器情况进行修改,如下是我的configure配置方案,仅供参考。

    ./configure --static \
                --use-cuda=yes \
                --cudatk-dir=/home/zy/cuda/cuda-8.0 \
                --mathlib=OPENBLAS \
                --openblas-root=../tools/OpenBLAS/install \
                --threaded-math=no \
                --static-math=yes \
                --static-fst=yes \
                --fst-root=../tools/openfst
    

    配置完成后,就可以进行src的编译了

    make depend
    make
    

    同样,如果是多核CPU的话,你可以使用make depend -j 8make -j 8加快编译速度

    完成后会有提示成功和失败,结束make后就算完成了kaldi的编译与安装了~


    参考资料:

    1. CSDN博客:Kaldi的下载安装与编译
    2. kaldi-ctc的安装、编译、测试
    展开全文
  • 语音识别kaldi

    2018-12-26 10:28:37
    转记一篇关于语音识别的入门...kaldi是使用c++写的语音识别的工具,apache 授予了v2.0的证书(果真应验,apache旗下无弱将)。kaldi旨在供语音识别研究员使用。   =========== 声 变 文======== 文 合成 音 ====...

    转记一篇关于语音识别的入门教程,https://www.zhihu.com/question/65516424  

    kaldi是什么

    kaldi是使用c++写的语音识别的工具,apache 授予了v2.0的证书(果真应验,apache旗下无弱将)。kaldi旨在供语音识别研究员使用。

     

    =========== 声 变 文======== 文 合成 音 ====

    展开全文
  • Kaldi 语音识别基础教程

    千次阅读 2019-02-19 23:30:48
    Kaldi 是一款语音识别工具,可以快速训练语音识别模型。Kaldi 主要是用 C++ 编写,是用 Shell、Python 和 Perl 来作为胶水进行模型训练,并且 Kaldi 是完全免费开源的。 Kaldi 语音识别模型的快速构建,具有大量语音...

    Kaldi 是一款语音识别工具,可以快速训练语音识别模型。Kaldi 主要是用 C++ 编写,是用 Shell、Python 和 Perl 来作为胶水进行模型训练,并且 Kaldi 是完全免费开源的。

    Kaldi 语音识别模型的快速构建,具有大量语音相关算法以及优质的论坛受到国内外企业和开发者的追捧。

    本场 Chat 将以以下几个模块进行延展:

    1. Kaldi 介绍;
    2. Kaldi 环境构建;
    3. Kaldi 目录介绍;
    4. Kaldi 相关 Shell 知识介绍;
    5. Kaldi Egs 介绍;
    6. Kaldi Egs 中 AIShell 例子讲解;
    7. 如何使用独立语音进行语音模型构建。

    阅读全文: http://gitbook.cn/gitchat/activity/5c6a4fbdb4e4ea7959820d68

    您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。

    FtooAtPSkEJwnW-9xkCLqSTRpBKX

    展开全文
  • kaldi中文语音识别

    2020-06-12 14:30:35
    编译与安装kaldikaldi进行中文语音识别本文记录了我编译安装kaldi和两种用kaldi进行中文语音识别的过程,包括如何kaldi的简单介绍、环境的配置、相关模型的训练、导入,算是自己近期学习的一个总结,也希望可以...

    目录
    kaldi是什么
    kaldi与中文语音识别
    编译与安装kaldi
    用kaldi进行中文语音识别
    本文记录了我编译安装kaldi和两种用kaldi进行中文语音识别的过程,包括如何kaldi的简单介绍、环境的配置、相关模型的训练、导入,算是自己近期学习的一个总结,也希望可以帮助到需要的人~~~


    kaldi是什么
    kaldi是一个用C++写的语音识别工具包。kaldi旨在供语音识别研究员使用。当然,kaldi也可以用作声纹识别。关于他的详细介绍可以访问kaldi的官方文档

    kaldi与中文语音识别
    感谢很多大神与科研工作者在kaldi上开源了他们的数据集和训练模型,让我这样的小白可以站在巨人的肩膀上前行。

    编译与安装kaldi
    注意:为了提高训练的速度,kaldi最好安装在GPU云服务器下。如果没有服务器话,使用虚拟机应该也是可以的,但一定要分配足够的内存空间和存储空间。下面我就以我使用的centos服务器为例,介绍kaldi的编译与安装。

    编译与安装大概分为3步

    安装git、下载kaldi的源码
    安装编译所需依赖包
    配置、编译kaldi

    1.kaldi的下载

    kaldi的所有源码开源在了GitHub上,可以直接git下载到服务器上,首先得确保服务器上安装了git,如果没有安装的话,就先安装git sudo yum install git -y

    接着git clone下载kaldi

    git clone https://github.com/kaldi-asr/kaldi.git

    下载完成kaldi源码后,我们将得到如下一个文件结构的目录。

    kaldi/
    ├── COPYING
    ├── egs/                //egs目录里存放了使用kaldi完成的开源语音识别/声纹识别项目
    ├── INSTALL                //编译安装kaldi的指导
    ├── misc/
    ├── README.md
    ├── scripts/
    ├── src/                //src文件夹里存放了kaldi源码
    ├── tools/                //tools文件夹里存放了语音处理的工具包
    └── windows/                //windows文件夹存放了在windows下编译安装kaldi的文件

    2.安装编译所需要的依赖包

    编译之前需要确操作系统中安装有如下包

      subversion
      automake
      autoconf
      libtool
      g++
      zlib
      libatal
      wget
      sox

    首先进入到kaldi/tools目录下,接着在调用check_dependencies.sh脚本检查系统中的包是否安装完全

    cd kaldi/tools
    extras/check_dependencies.sh

    如图所示,这个shell脚本会提示系统需要安装的包,按照提示安装即可。

    安装完成后再次运行这个脚本,如果提示OK就可以开始进行kaldi的编译。

    3.编译kaldi

    首先编译tools,在在kaldi/tools目录下输入

    make

    我使用的服务器是i7有8个核心,因此输入make -j 8可以使用8个核心一起编译,加快编译速度。

    之后转到kaldi/src目录下,输入如下命令

    cd ../src

    在src目录下首先要运行configure进行配置,由于每个人的cuda版本、安装路径不一定相同,所以这里需要根据自己的服务器情况进行修改,如下是我的configure配置方案,仅供参考。

    ./configure --static \
                --use-cuda=yes \
                --cudatk-dir=/home/zy/cuda/cuda-8.0 \
                --mathlib=OPENBLAS \
                --openblas-root=../tools/OpenBLAS/install \
                --threaded-math=no \
                --static-math=yes \
                --static-fst=yes \
                --fst-root=../tools/openfst

    配置完成后,就可以进行src的编译了

    make depend
    make

    同样,如果是多核CPU的话,你可以使用make depend -j 8和make -j 8加快编译速度

    完成后会有提示成功和失败,结束make后就算完成了kaldi的编译与安装了~

    用kaldi进行中文语音识别
    完成kaldi的安装后,就可以用kaldi做语音识别了~


    参考资料:
    kaldi-ctc的安装、编译、测试
    {
        Author: "byr-zyziszy",
        Mail: "test@foxmail.com",
        Github: "https://github.com/jbase",
        Date: "2020-6-12"
    }
     

    展开全文
  • kaldi中文语音识别_基于thchs30(8)

    千次阅读 2018-09-07 13:36:32
    接上回,我们继续看run.sh #copy feats and cmvn to test.ph, avoid duplicated mfcc & cmvn #拷贝mfcc特征和cmvn到test.ph,避免重复的mfcc和cmvn cp data/mfcc/test/feats.scp data/mfcc/test_phone &...
  • 语音识别工具箱之kaldi介绍

    万次阅读 多人点赞 2013-12-04 19:40:08
    我对kaldi的了解也就是语音识别+深度学习。如果不是kaldi有dnn模型,或许我更愿意用htk吧。其实,基本的都差不多吧。kaldi可以说是更加丰富吧。本来准备开题开语音识别,但是由于导师的反对,不得不做现在的歌曲人声...
  • kaldi中文语音识别_基于thchs30(5)

    千次阅读 2018-05-23 17:37:37
    接上回if [ -f $data/segments ]; then #这里是查看data/mfcc/train下是否存在segments,如果存在则执行then后面的脚本,否则执行else后面的,这个文件不存在,所以之后调用else后面的处理 echo "...
  • The main goal of this lab is to get acquainted with Kaldi. We will begin by creating and exploring a data directory for the TIMIT dataset. Then we will extract features for TIMIT upon which we can ...
  • kaldi上第一个免费的中文语音识别例子

    万次阅读 多人点赞 2016-02-04 12:46:09
    今天在清华大学cslt实验室王东老师的分享下,kaldi终于有了免费的中文语音识别的例子,网址为:https://github.com/kaldi-asr/kaldi/tree/master/egs/thchs30。各位可以根据这个来训练自己的模型。 再次谢谢王东...
  • 语音识别系统kaldi----实例说明

    万次阅读 2013-12-21 20:13:36
    最近一直在折腾kaldi,在这个庞大的系统面前,自己是那么的微小。由于数据库的原因,我只能...具体的可以见我之前的博客:语音识别工具箱之kaldi介绍 。  第二个例子是rm里面的s4。具体的步骤也很简单,首先运行./getd
  • Kaldi是一个非常强大的语音识别工具库,主要由Daniel Povey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。其中DNN-HMM中的神经网络还可以由配置文件自定义,DNN、CNN、TDNN、...
  • 公告 为了方便语音合成、语音识别入门者相互交流、互相学习帮助,特建: 语音合成技术交流新手群857378993 KALDI语音识别新手群 279295537
  • 求教,我录制了一个WAV,要用kaldi进行在线识别,我该如何生成它的.scp呢?
  • Kaldi学习(一)

    万次阅读 2018-06-09 17:03:30
    最近准备开始进行语音识别算法的学习,所以决定拿kaldi进行解读,这样一方面更加增加自己C++的基本功,另一方面也可以让自己慢慢走入语音识别的大门,自己的路,决定了就走下去,不管有多难。首先我决定从kaldi的...
  • 作为一个持续关注前沿领域的科技菌,我推荐过《知识图谱》,推荐过《推荐系统》...... 但是今天,博文菌还想给大家安利一部新的前沿...在《Kaldi语音识别实战》诞生之前,Kaldi 社区的活跃开发者们更关注推进核心...
  • kaldi 在线中文识别系统搭建

    万次阅读 2020-04-20 15:05:29
    原始数据下载... 总共三个tgz文件: data_thchs30.tgz [6.4G] ( speech data and transcripts ) test-noise.tgz [1.9G] ( standard 0db noisy test data ) resource.tgz [24M] ( supplementary
  • kaldi简介

    千次阅读 2019-03-27 16:56:55
    最近准备开始进行语音识别算法的学习,所以决定拿kaldi进行解读,这样一方面更加增加自己C++的基本功,另一方面也可以让自己慢慢走入语音识别的大门,自己的路,决定了就走下去,不管有多难。 首先我决定从kaldi的...
  • kaldi 语音识别 ubuntu 16.04安装教程

    万次阅读 2019-09-15 22:47:26
    Kaldi 底层是使用C++ 编写的语音识别工具,旨在供语音识别研究员使用。 也是语音识别领域最常用的一个工具。 它自带了很多特征提取模块、语音模型代码,可直接使用或重新训练GMM-HMM 等模型。 还支持GPU进行训练...
  • kaldi说话人识别示例(egs/sre10,egs/sre16)中,数据总共有两大类,一是训练集(training),二是评估数据集(evaluation)。对于评估数据集又分为两类,一是用来注册(enrollment)的数据集,二是测试(test)集...
  • Kaldi

    千次阅读 2018-11-15 10:53:10
    kaldi 是一个基于C++编写的用于语音识别的工具箱,kaldi一般被用于进行语音识别的研究者和相关人士。   kaldi命名  According to legend, Kaldi was the Ethiopian goatherder who discovered the coffee plant...
1 2 3 4 5 ... 20
收藏数 1,750
精华内容 700
关键字:

kaldi语音识别