-
2020-12-04 14:06:29
1、先安装PyAudio
python -m pip install PyAudio-0.2.11-cp37-cp37m-win_amd64.whl
2、安装语音识别
pip install SpeechRecognition
3、安装离线语音识别
python -m pip install pocketsphinx-0.1.15-cp37-cp37m-win_amd64.whl
4、无普通话库
下载地址
Mandarin->cmusphinx-zh-cn-5.2.tar.gz
需要做的事情
cd py36asr/lib/python3.6/site-packages/speech_recognition/pocketsphinx-data/
tar zxvf cmusphinx-zh-cn-5.2.tar.gz
mv cmusphinx-zh-cn-5.2 zh-cn
cd zh-cn
mv zh_cn.cd_cont_5000 acoustic-model
mv zh_cn.lm.bin language-model.lm.bin
mv zh_cn.dic pronounciation-dictionary.dict
更多相关内容 -
Basic_Ai:基于Windows操作系统的离线语音识别人工智能Python
2021-05-08 10:23:55基于Windows操作系统的离线语音识别人工智能 这是用python编写的基本自然语言UI。 它使用Windows的语音API,因此仅适用于Windows操作系统。 与Google语音API相比,Windows语音识别可以离线使用。 python程序使用... -
Python离线语音识别
2020-11-23 14:52:59您可以使用python中的pocketsphinx,使用pip install pocketsphinx进行安装.代码如下所示:import sys, osfrom pocketsphinx.pocketsphinx import *from sphinxbase.sphinxbase import *modeldir = "../../../model...您可以使用python中的pocketsphinx,使用pip install pocketsphinx进行安装.代码如下所示:
import sys, os
from pocketsphinx.pocketsphinx import *
from sphinxbase.sphinxbase import *
modeldir = "../../../model"
datadir = "../../../test/data"
# Create a decoder with certain model
config = Decoder.default_config()
config.set_string('-hmm', os.path.join(modeldir, 'en-us/en-us'))
config.set_string('-dict', os.path.join(modeldir, 'en-us/cmudict-en-us.dict'))
config.set_string('-kws', 'command.list')
# Open file to read the data
stream = open(os.path.join(datadir, "goforward.raw"), "rb")
# Alternatively you can read from microphone
# import pyaudio
#
# p = pyaudio.PyAudio()
# stream = p.open(format=pyaudio.paInt16, channels=1, rate=16000, input=True, frames_per_buffer=1024)
# stream.start_stream()
# Process audio chunk by chunk. On keyword detected perform action and restart search
decoder = Decoder(config)
decoder.start_utt()
while True:
buf = stream.read(1024)
if buf:
decoder.process_raw(buf, False, False)
else:
break
if decoder.hyp() != None:
print ([(seg.word, seg.prob, seg.start_frame, seg.end_frame) for seg in decoder.seg()])
print ("Detected keyword, restarting search")
decoder.end_utt()
decoder.start_utt()
关键字列表应如下所示:
forward /1e-1/
down /1e-1/
other phrase /1e-20/
这些数字是检测的阈值
-
linux离线语音识别
2019-04-29 15:50:53是一个linux下的离线版语音识别, 包含win64, X86等so库文件 -
python实现语音识别前期准备(调用科大讯飞平台)
2020-12-21 17:59:58本demo测试时运行的环境为:Windows + Python3.7 本demo测试成功运行时所安装的第三方库及其版本如下,您可自行逐一或者复制到一个新的txt文件利用pip一次性安装: cffi1.12.3 gevent1.4.0 greenlet0.4.15 pycparser... -
基于Python3.7的讯飞离线语音合成SDK
2020-10-30 11:50:02讯飞支持的语言里面没有python,本实例参考《Linux下 python调用讯飞离线语音合成(tts)》基础上,实现了基于Python3.7的调用C语言封装的函数来间接的使用离线语音识别功能实例。 -
树莓派语音识别科大讯飞语音识别离线包
2018-06-18 16:06:45离线语音识别,树莓派语音识别科大讯飞语音识别离线包。 -
voice-command:使用本机离线语音识别进行语音命令的节点模块
2021-06-09 07:45:37使用本机离线语音识别进行语音命令的节点模块。 为什么 我正在构建一个 NW.js/atom-shell 类型的应用程序,我希望能够使用语音命令进行控制。 自然地,我尝试使用webkitSpeechRecognition但就我的特殊目的而言,这并... -
python离线语音转文字
2021-07-11 16:02:51最好还是调api import speech_recognition as sr def wav2txt(): r = sr.Recognizer() # 打开语音文件 with sr.AudioFile('./test.wav') as source: audio = r.record(source) # print('文本内容: ', r.recognize_...1、安装SpeechRecognition第三方库
pip install SpeechRecognition
2、安装pocketsphinx第三方库,安装时,可能会报错error: command 'swig.exe' failed: No such file or directory
这时候需要安装,swig
swig下载地址:
阿里云:https://www.aliyundrive.com/s/XGvEKWH9r3c
百度网盘:链接:https://pan.baidu.com/s/17qEWcJ0qI21MoqGwUdV0lw 提取码:7myi
下载之后,放在你想放的地方,然后配置环境变量
注意,无论是cmd,还是pycharm安装,都需要重启
最后执行命令:pip install pocketsphinx,可以正常安装
3、代码:注意,默认只能转为英语,如果要转为汉字,需要下载中文语言、声学模型
中文语言、声学模型下载地址:
链接:https://pan.baidu.com/s/13BFUnOlzubl6cOGQ8E8haQ
提取码:z8s1下载之后解压,然后把zh-CN文件夹粘贴到
/speech_recognition/pocketsphinx-data
文件夹下,注意,如果是虚拟环境,speech_recognition文件夹在venv\Lib\site-packages下,如果不是虚拟环境,就看你的第三方包都安装在哪里了
也可以下载最新的声学模型
下载地址:https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/
下载之后,解压
把解压出来的zh_cn.cd_cont_5000文件夹重命名为acoustic-model、zh_cn.lm.bin命名为language-model.lm.bin、zh_cn.dic中dic改为dict格式,zh_cn替换为pronounciation-dictionary
最后把这个三个文件放在zh-CN文件夹中,把zh-CN文件夹放在speech_recognition文件夹在venv\Lib\site-packages下
注意:识别的准确度不是很高,最好还是调api
import speech_recognition as sr def wav2txt(): r = sr.Recognizer() # 打开语音文件 with sr.AudioFile('./test.wav') as source: audio = r.record(source) # print('文本内容: ', r.recognize_sphinx(audio, language='zh-CN')) # 汉语 try: print('文本内容: ', r.recognize_sphinx(audio, language='zh-CN')) # 汉语 # print('文本内容: ', r.recognize_sphinx(audio)) # 英语 except Exception as e: print('报错了,报错内容---',e) wav2txt()
-
语音识别离线语音识别,SpeechRecognition
2021-03-05 16:48:45一、PocketSphinx 安装1、RedHat/CentOS:yum install pulseaudio-libs-develUbuntu/Debian:apt install libpulse-dev2、git clone --recursive https://github.com/bambocher/pocketsphinx-python3、cd pocketsphinx...一、PocketSphinx 安装
1、RedHat/CentOS:
yum install pulseaudio-libs-devel
Ubuntu/Debian:
apt install libpulse-dev
2、git clone --recursive https://github.com/bambocher/pocketsphinx-python
3、cd pocketsphinx-python
4、vim pocketsphinx-python/deps/sphinxbase/src/libsphinxad/ad_openal.c
Change
#include
#include
to
#include
#include
5、python setup.py install
二、SpeechRecognition安装
pip install SpeechRecognition
三、中文模型安装
1、下载 cmusphinx-zh-cn-5.2.tar.gz
地址:
https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Mandarin/
2、解压后重命名部分文件:
cmusphinx-zh-cn-5.2 -> zh-CN
zh_cn.cd_cont_5000 -> acoustic-model
zh_cn.lm.bin -> language-model.lm.bin
zh_cn.dic -> pronounciation-dictionary.dict
3、拷贝到安装目录
cp zh-CN /xxx/python3/lib/python3.7/site-packages/speech_recognition/pocketsphinx-data/
四、测试代码
# -*- coding:utf-8 -*-
import speech_recognition as sr
def wav2txt(wav_file,language):
r = sr.Recognizer()
audio= ""
with sr.AudioFile(wav_file) as src:
audio= r.record(src)
print(r.recognize_sphinx(audio,language=language))
fp1=r'my16k.wav'
fp2=r'audio-file.flac'
wav2txt(fp1,"zh-CN")
wav2txt(fp2,"en-US")
-
python实现免费同声传译 (离线语音识别+免费翻译接口+系统声音录制)
2022-03-01 10:14:55python 实现实时字幕生成 -
speech_recognition:适用于Python的语音识别模块,支持在线和离线的多个引擎和API
2021-02-05 11:29:01speech_recognition:适用于Python的语音识别模块,支持在线和离线的多个引擎和API -
Ubuntu20.04 使用Python实现全过程离线语音识别(包含语音唤醒,语音转文字,指令识别,文字转语音)
2022-05-16 21:10:05一、简单说点 因为手头有一个项目,该项目需要在香橙派上实现语音控制,并且带有语音唤醒功能。简单来说,就是通过唤醒词唤醒香橙派,然后...开发语言使用的Python,不得不说,使用Python来进行语音识别,是真的方 -
Python实现语音识别和语音合成功能
2020-11-30 11:27:25声音的本质是震动,震动的本质是位移关于时间的函数,波形文件(.wav)中记录了不同采样时刻的位移。...案例:画出语音信号的波形和频率分布,(freq.wav数据地址)# -*- encoding:utf-8 -*-import numpy as np... -
python3实现语音转文字(语音识别)和文字转语音(语音合成)
2020-12-16 23:35:30输入要转换的内容,程序直接帮你把转换好的mp3文件输出(因为下一步–语音识别–需要.pcm格式的文件,程序自动执行格式转换,同时生成17k.pcm文件,暂时不用管,(你也可以通过修改默认参数改变文件输出的位置,名称... -
使用python语言调用科大讯飞离线语音合成
2020-12-03 06:19:37科大讯飞属于第三方服务,但是支持的语言里面...代码贴上来:def text_to_voice(text):"""科大讯飞离线语音合成:param text: 转换文本开发API文档:http://mscdoc.xfyun.cn/windows/api/iFlytekMSCReferenceManual/f... -
python语音识别模块
2020-12-01 22:54:14{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里技术人对外发布原创技术内容的最大平台;社区覆盖了云计算、大数据、人工智能、... -
开源离线语音识别(SpeechRecognition)
2021-07-23 11:03:58本次将使用SpeechRecognition和pocketsphinx进行离线语音识别。 -
python调用百度语音识别api
2021-01-14 00:42:57其中用到语音识别,调用的是讯飞与百度的api,前者使用js是实现,后者用python3实现(因为自己使用python)环境:python3.5centos 7流程整个百度语音识别rest api 使用分为三部分:1 (申请操作)创建应用,获取应用的 ... -
基于python和深度学习(语音识别、NLP)实现本地离线智能语音控制终端(带聊天功能和家居控制功能)
2022-01-16 11:44:22首先,我们来捋一下一个好的智能控制终端需要什么功能: 1.得随叫随到,不需要的时候就...这里我主要实现离线版本的,使用各个互联网大厂API的联网版本的,在网上有很多教程,我这里就不再详细说明了。 我们动手让来 -
一分钟上手!离线就能使用的python语音识别库Sphinx(英语、普通话)
2020-03-03 09:57:56基于Sphinx的离线语音识别应用 安装SpeechRecognition模块,安装库后调用时,库名为speech_recognition pip install -i https://pypi.doubanio.com/simple/ SpeechRecognition 安装PocketSphinx pip install -i... -
win+python实现离线语音识别
2018-12-05 19:28:29安装SpeechRecognition模块 使用recognize_sphinx(),安装PocketSphinx 使用测试: import speech_recognition as sr # obtain audio from the microphone r = sr.Recognizer() print(r) ...pri... -
ASRT_SpeechRecognition-master_ASRT在地识别_python_ASRT离线识别_语音识别pytho
2021-09-11 11:21:42ASRT语音识别算法,使用python语言 -
用Python来使用科大讯飞语音识别,so easy
2020-12-03 06:19:36在人工智能高速发展的今天,语音识别技术被带入到人们的工作和生活中,开始...下面这篇文章分享Python用ctypes调用动态库的方式使用科大讯飞语音识别。ctypes 是 Python 的一个模块,它提供了C语言相关的数据类型,... -
树莓派异步/连续语音识别在Python
2021-07-16 13:43:22I want to create a speech recognition script for the Raspberry Pi in Python and need an asynchronous/continuous speech recognition library. Asynchronous means that I need endless running of the recogn... -
ubuntu16.04安装科大讯飞Linux SDK实现离线语音合成(TTS) - pytorch中文网
2020-12-03 06:19:35二、配置工程属性将SDK中bin,include,libs文件夹复制到新建工程demo文件夹下在demo目录新建文件demo.c,详细源码请参考samples中对应的语音示例,修改一下文件路径如下:#include #include #include #include #... -
pyttsx3:适用于python的离线文本到语音合成
2021-05-03 20:58:56适用于Python3的离线文本语音转换(TTS)转换器 pyttsx3是Python中的文本到语音转换库。 与替代库不同,它可以离线运行。 安装 : pip install pyttsx3 如果出现安装错误,请确保首先使用以下命令升级轮毂版本:...