精华内容
下载资源
问答
  • 2020-12-04 14:06:29

    1、先安装PyAudio

    python -m pip install PyAudio-0.2.11-cp37-cp37m-win_amd64.whl

    2、安装语音识别

    pip install SpeechRecognition

    3、安装离线语音识别

    python -m pip install pocketsphinx-0.1.15-cp37-cp37m-win_amd64.whl

    4、无普通话库

    下载地址

    Mandarin->cmusphinx-zh-cn-5.2.tar.gz

    需要做的事情

    cd py36asr/lib/python3.6/site-packages/speech_recognition/pocketsphinx-data/

    tar zxvf cmusphinx-zh-cn-5.2.tar.gz

    mv cmusphinx-zh-cn-5.2 zh-cn

    cd zh-cn

    mv zh_cn.cd_cont_5000 acoustic-model

    mv zh_cn.lm.bin language-model.lm.bin

    mv zh_cn.dic pronounciation-dictionary.dict

    更多相关内容
  • 基于Windows操作系统的离线语音识别人工智能 这是用python编写的基本自然语言UI。 它使用Windows的语音API,因此仅适用于Windows操作系统。 与Google语音API相比,Windows语音识别可以离线使用。 python程序使用...
  • Python离线语音识别

    2020-11-23 14:52:59
    您可以使用python中的pocketsphinx,使用pip install pocketsphinx进行安装.代码如下所示:import sys, osfrom pocketsphinx.pocketsphinx import *from sphinxbase.sphinxbase import *modeldir = "../../../model...

    您可以使用python中的pocketsphinx,使用pip install pocketsphinx进行安装.代码如下所示:

    import sys, os

    from pocketsphinx.pocketsphinx import *

    from sphinxbase.sphinxbase import *

    modeldir = "../../../model"

    datadir = "../../../test/data"

    # Create a decoder with certain model

    config = Decoder.default_config()

    config.set_string('-hmm', os.path.join(modeldir, 'en-us/en-us'))

    config.set_string('-dict', os.path.join(modeldir, 'en-us/cmudict-en-us.dict'))

    config.set_string('-kws', 'command.list')

    # Open file to read the data

    stream = open(os.path.join(datadir, "goforward.raw"), "rb")

    # Alternatively you can read from microphone

    # import pyaudio

    #

    # p = pyaudio.PyAudio()

    # stream = p.open(format=pyaudio.paInt16, channels=1, rate=16000, input=True, frames_per_buffer=1024)

    # stream.start_stream()

    # Process audio chunk by chunk. On keyword detected perform action and restart search

    decoder = Decoder(config)

    decoder.start_utt()

    while True:

    buf = stream.read(1024)

    if buf:

    decoder.process_raw(buf, False, False)

    else:

    break

    if decoder.hyp() != None:

    print ([(seg.word, seg.prob, seg.start_frame, seg.end_frame) for seg in decoder.seg()])

    print ("Detected keyword, restarting search")

    decoder.end_utt()

    decoder.start_utt()

    关键字列表应如下所示:

    forward /1e-1/

    down /1e-1/

    other phrase /1e-20/

    这些数字是检测的阈值

    展开全文
  • linux离线语音识别

    2019-04-29 15:50:53
    是一个linux下的离线语音识别, 包含win64, X86等so库文件
  • 本demo测试时运行的环境为:Windows + Python3.7 本demo测试成功运行时所安装的第三方库及其版本如下,您可自行逐一或者复制到一个新的txt文件利用pip一次性安装: cffi1.12.3 gevent1.4.0 greenlet0.4.15 pycparser...
  • 讯飞支持的语言里面没有python,本实例参考《Linux下 python调用讯飞离线语音合成(tts)》基础上,实现了基于Python3.7的调用C语言封装的函数来间接的使用离线语音识别功能实例。
  • 离线语音识别,树莓派语音识别科大讯飞语音识别离线包。
  • 使用本机离线语音识别进行语音命令的节点模块。 为什么 我正在构建一个 NW.js/atom-shell 类型的应用程序,我希望能够使用语音命令进行控制。 自然地,我尝试使用webkitSpeechRecognition但就我的特殊目的而言,这并...
  • python离线语音转文字

    千次阅读 2021-07-11 16:02:51
    最好还是调api import speech_recognition as sr def wav2txt(): r = sr.Recognizer() # 打开语音文件 with sr.AudioFile('./test.wav') as source: audio = r.record(source) # print('文本内容: ', r.recognize_...

    1、安装SpeechRecognition第三方库  

    pip install SpeechRecognition

     2、安装pocketsphinx第三方库,安装时,可能会报错error: command 'swig.exe' failed: No such file or directory

    这时候需要安装,swig

    swig下载地址:

    阿里云:https://www.aliyundrive.com/s/XGvEKWH9r3c

    百度网盘:链接:https://pan.baidu.com/s/17qEWcJ0qI21MoqGwUdV0lw 提取码:7myi

    下载之后,放在你想放的地方,然后配置环境变量

    注意,无论是cmd,还是pycharm安装,都需要重启

    最后执行命令:pip install pocketsphinx,可以正常安装

    3、代码:注意,默认只能转为英语,如果要转为汉字,需要下载中文语言、声学模型

    中文语言、声学模型下载地址:

    链接:https://pan.baidu.com/s/13BFUnOlzubl6cOGQ8E8haQ 
    提取码:z8s1

    下载之后解压,然后把zh-CN文件夹粘贴到

    /speech_recognition/pocketsphinx-data

    文件夹下,注意,如果是虚拟环境,speech_recognition文件夹在venv\Lib\site-packages下,如果不是虚拟环境,就看你的第三方包都安装在哪里了

    也可以下载最新的声学模型

    下载地址:https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/

    下载之后,解压

    把解压出来的zh_cn.cd_cont_5000文件夹重命名为acoustic-model、zh_cn.lm.bin命名为language-model.lm.bin、zh_cn.dic中dic改为dict格式,zh_cn替换为pronounciation-dictionary

     最后把这个三个文件放在zh-CN文件夹中,把zh-CN文件夹放在speech_recognition文件夹在venv\Lib\site-packages下

    注意:识别的准确度不是很高,最好还是调api

    import speech_recognition as sr
    def wav2txt():
        r = sr.Recognizer()
        # 打开语音文件
        with sr.AudioFile('./test.wav') as source:
            audio = r.record(source)
        # print('文本内容: ', r.recognize_sphinx(audio, language='zh-CN'))  # 汉语
        try:
            print('文本内容: ', r.recognize_sphinx(audio, language='zh-CN'))  # 汉语
            # print('文本内容: ', r.recognize_sphinx(audio))  # 英语
        except Exception as e:
            print('报错了,报错内容---',e)
    
    wav2txt()

    展开全文
  • 一、PocketSphinx 安装1、RedHat/CentOS:yum install pulseaudio-libs-develUbuntu/Debian:apt install libpulse-dev2、git clone --recursive https://github.com/bambocher/pocketsphinx-python3、cd pocketsphinx...

    一、PocketSphinx  安装

    1、RedHat/CentOS:

    yum install pulseaudio-libs-devel

    Ubuntu/Debian:

    apt install libpulse-dev

    2、git clone --recursive https://github.com/bambocher/pocketsphinx-python

    3、cd pocketsphinx-python

    4、vim pocketsphinx-python/deps/sphinxbase/src/libsphinxad/ad_openal.c

    Change

    #include

    #include

    to

    #include

    #include

    5、python setup.py install

    二、SpeechRecognition安装

    pip install SpeechRecognition

    三、中文模型安装

    1、下载 cmusphinx-zh-cn-5.2.tar.gz

    地址:

    https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Mandarin/

    2、解压后重命名部分文件:

    cmusphinx-zh-cn-5.2 -> zh-CN

    zh_cn.cd_cont_5000 -> acoustic-model

    zh_cn.lm.bin -> language-model.lm.bin

    zh_cn.dic -> pronounciation-dictionary.dict

    3、拷贝到安装目录

    cp zh-CN /xxx/python3/lib/python3.7/site-packages/speech_recognition/pocketsphinx-data/

    四、测试代码

    # -*- coding:utf-8 -*-

    import speech_recognition as sr

    def wav2txt(wav_file,language):

    r = sr.Recognizer()

    audio= ""

    with sr.AudioFile(wav_file) as src:

    audio= r.record(src)

    print(r.recognize_sphinx(audio,language=language))

    fp1=r'my16k.wav'

    fp2=r'audio-file.flac'

    wav2txt(fp1,"zh-CN")

    wav2txt(fp2,"en-US")

    展开全文
  • python 实现实时字幕生成
  • speech_recognition:适用于Python语音识别模块,支持在线和离线的多个引擎和API
  • 一、简单说点   因为手头有一个项目,该项目需要在香橙派上实现语音控制,并且带有语音唤醒功能。简单来说,就是通过唤醒词唤醒香橙派,然后...开发语言使用的Python,不得不说,使用Python来进行语音识别,是真的方
  • 声音的本质是震动,震动的本质是位移关于时间的函数,波形文件(.wav)中记录了不同采样时刻的位移。...案例:画出语音信号的波形和频率分布,(freq.wav数据地址)# -*- encoding:utf-8 -*-import numpy as np...
  • 输入要转换的内容,程序直接帮你把转换好的mp3文件输出(因为下一步–语音识别–需要.pcm格式的文件,程序自动执行格式转换,同时生成17k.pcm文件,暂时不用管,(你也可以通过修改默认参数改变文件输出的位置,名称...
  • 科大讯飞属于第三方服务,但是支持的语言里面...代码贴上来:def text_to_voice(text):"""科大讯飞离线语音合成:param text: 转换文本开发API文档:http://mscdoc.xfyun.cn/windows/api/iFlytekMSCReferenceManual/f...
  • python语音识别模块

    2020-12-01 22:54:14
    {"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里技术人对外发布原创技术内容的最大平台;社区覆盖了云计算、大数据、人工智能、...
  • 开源离线语音识别(SpeechRecognition)

    千次阅读 2021-07-23 11:03:58
    本次将使用SpeechRecognition和pocketsphinx进行离线语音识别
  • 其中用到语音识别,调用的是讯飞与百度的api,前者使用js是实现,后者用python3实现(因为自己使用python)环境:python3.5centos 7流程整个百度语音识别rest api 使用分为三部分:1 (申请操作)创建应用,获取应用的 ...
  • 首先,我们来捋一下一个好的智能控制终端需要什么功能: 1.得随叫随到,不需要的时候就...这里我主要实现离线版本的,使用各个互联网大厂API的联网版本的,在网上有很多教程,我这里就不再详细说明了。 我们动手让来
  • 基于Sphinx的离线语音识别应用 安装SpeechRecognition模块,安装库后调用时,库名为speech_recognition pip install -i https://pypi.doubanio.com/simple/ SpeechRecognition 安装PocketSphinx pip install -i...
  • win+python实现离线语音识别

    万次阅读 2018-12-05 19:28:29
    安装SpeechRecognition模块 使用recognize_sphinx(),安装PocketSphinx 使用测试: import speech_recognition as sr # obtain audio from the microphone r = sr.Recognizer() print(r) ...pri...
  • ASRT语音识别算法,使用python语言
  • 在人工智能高速发展的今天,语音识别技术被带入到人们的工作和生活中,开始...下面这篇文章分享Python用ctypes调用动态库的方式使用科大讯飞语音识别。ctypes 是 Python 的一个模块,它提供了C语言相关的数据类型,...
  • I want to create a speech recognition script for the Raspberry Pi in Python and need an asynchronous/continuous speech recognition library. Asynchronous means that I need endless running of the recogn...
  • 二、配置工程属性将SDK中bin,include,libs文件夹复制到新建工程demo文件夹下在demo目录新建文件demo.c,详细源码请参考samples中对应的语音示例,修改一下文件路径如下:#include #include #include #include #...
  • 适用于Python3的离线文本语音转换(TTS)转换器 pyttsx3是Python中的文本到语音转换库。 与替代库不同,它可以离线运行。 安装 : pip install pyttsx3 如果出现安装错误,请确保首先使用以下命令升级轮毂版本:...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 2,522
精华内容 1,008
关键字:

python离线语音识别