树莓派 语音识别_树莓派语音识别 - CSDN
精华内容
参与话题
  • 基于树莓派语音识别和语音合成

    千次阅读 热门讨论 2019-11-20 22:35:49
    基于树莓派语音识别和语音合成 摘要 语音识别技术即Automatic Speech Recognition(简称ASR),是指将人说话的语音信号转换为可被计算机程序所识别的信息,从而识别说话人的语音指令及文字内容的技术。目前语音...

    基于树莓派的语音识别和语音合成

    摘要

    语音识别技术即Automatic Speech Recognition(简称ASR),是指将人说话的语音信号转换为可被计算机程序所识别的信息,从而识别说话人的语音指令及文字内容的技术。目前语音识别被广泛的应用于客服质检,导航,智能家居等领域。树莓派自问世以来,受众多计算机发烧友和创客的追捧,曾经一“派”难求。别看其外表“娇小”,内“心”却很强大,视频、音频等功能通通皆有,可谓是“麻雀虽小,五脏俱全”。本文采用百度云语音识别API接口,在树莓派上实现低于60s音频的语音识别,也可以用于合成文本长度小于1024字节的音频。
    此外,若能够结合snowboy离线语音唤醒引擎可实现离线语音唤醒,实现语音交互。

    材料:

    树莓派3B+ ×1
    USB声卡 ×1
    麦克风 ×1
    PC ×1
    音视频线材若干

    树莓派3B+

    实现过程:

    一、 百度云语音识别 python-SDK的安装

    1. 为了能够调用百度云语音识别API接口,需要申请属于自己的百度AI开发者账号,安装SDK(Software Development Kit,软件开发工具包)。
      申请属于自己的百度AI开发者账号

    2. 进入百度云平台,进入百度语音控制台后,创建自己的应用,获取属于你的ID号和密钥。
      创建应用获取ID号和密钥

    3. Python-SDK的下载与安装

      将下载的SDK包拷贝到树莓派pi目录下,终端界面解压安装,安装过程如下:
      解压包:unzip aip-python-sdk-2.0.0.zip
      安装SDK包: sudo pip install baidu-aip
      指令代码

    二.修改编辑官方python测试程序

    1. 语音识别程序:
    #_*_ coding:UTF-8 _*_
    # @author: zdl 
    # 百度云语音识别Demo,实现对本地语音文件的识别。
    # 需安装好python-SDK,录音文件不不超过60s,文件类型为wav格式。
    # 音频参数需设置为 单通道 采样频率为16K PCM格式 可以先采用官方音频进行测试
    
    # 导入AipSpeech  AipSpeech是语音识别的Python SDK客户端
    from aip import AipSpeech
    import os
    
    ''' 你的APPID AK SK  参数在申请的百度云语音服务的控制台查看'''
    APP_ID = '17xxxx11'
    API_KEY = 'QZhVe5xxxxxvhYVA'
    SECRET_KEY = 'bGlGGxbWLxxxxxxxxA8tshAGA'
    
    # 新建一个AipSpeech
    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
    
    
    # 读取文件
    def get_file_content(test):   #filePath  待读取文件名
        with open(test, 'rb') as fp:
            return fp.read()
    
            
    def stt(test):         # 语音识别
        # 识别本地文件
        result = client.asr(get_file_content(test),
                            'wav',
                            16000,
                            {'dev_pid': 1536,}      # dev_pid参数表示识别的语言类型 1536表示普通话
                            )
        print (result)
    
    
        # 解析返回值,打印语音识别的结果
        if result['err_msg']=='success.':
            word = result['result'][0].encode('utf-8')       # utf-8编码
            if word!='':
                if word[len(word)-3:len(word)]==',':
                    print (word[0:len(word)-3])
                    with open('demo.txt','wb+') as f:
                        f.write(word[0:len(word)-3])
                    f.close()
                else:
                    print (word.decode('utf-8').encode('gbk'))
                    with open('demo.txt','wb+') as f:
                        f.write(word)
                    f.close()
            else:
                print ("音频文件不存在或格式错误")
        else:
            print ("错误")
    
    # main函数 识别本地录音文件yahboom.wav
    if __name__ == '__main__':
        
        stt('test.wav')
    
    
    1. 语音合成程序:
    #_*_ coding:UTF-8 _*_
    # @author: zdl 
    # 百度云语音合成Demo,实现对本地文本的语音合成。
    # 需安装好python-SDK,待合成文本不超过1024个字节
    # 合成成功返回audio.mp3 否则返回错误代码
    
    # 导入AipSpeech  AipSpeech是语音识别的Python SDK客户端
    from aip import AipSpeech
    import os
    
    ''' 你的APPID AK SK  参数在申请的百度云语音服务的控制台查看'''
    APP_ID = '17xxxx1'
    API_KEY = 'QZhVxxxxxxxxxxxhYVA'
    SECRET_KEY = 'bGlGGxxxxxxxxxxxxPGP8A8tshAGA'
    
    # 新建一个AipSpeech
    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
    
    # 将本地文件进行语音合成
    def tts(demo):
        f = open(demo,'r')
        command = f.read()
        if len(command) != 0:
            word = command
        f.close()
        result  = client.synthesis(word,'zh',1, {
            'vol': 5,'per':0,
        })
        
    # 合成正确返回audio.mp3,错误则返回dict 
        if not isinstance(result, dict):
            with open('audio.mp3', 'wb') as f:
                f.write(result)
            f.close()
            print ('tts successful')
    
    # main
    
    if __name__ == '__main__':
    
    tts('demo.txt')
    
    

    测试和分析:

    测试过程中,我对此功能进行三次测试,测试用例分别为:

    1. 短句“北京理工大学”
    2. 短句“智能语音交互技术”
    3. 绕口令
      “刘奶奶找牛奶奶买牛奶,牛奶奶给刘奶奶拿牛奶,刘奶奶说牛奶奶的牛奶不如柳奶奶的牛奶,牛奶奶说柳奶奶的牛奶会流奶,柳奶奶听见了大骂牛奶奶你的才会流奶,柳奶奶和牛奶奶泼牛奶吓坏了刘奶奶,大骂再也不买柳奶奶和牛奶奶的牛奶”

    此三条测试用例,分别从长句和短句,简单含义和复杂含义,是否有易混音三个方面对比进行测试,对百度语音技术的准确性提出了较高的要求。

    测试前,需要提前用录音软件录制好三段音频,然后用Adobe Audition软件对音频格式化处理,因为百度智能云语音识别技术支持原始 PCM 的录音参数必须符合 16k 采样率、16bit 位深、单声道,支持的格式有:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。

    结果及结论:

    测试一:短句“北京理工大学”
    短句“北京理工大学”

    测试二:短句“智能语音交互技术”
    短句“智能语音交互技术”

    测试三:绕口令
    绕口令

    三个测试均成功运行。

    语音识别方面,此程序成功运行后,会在python-IDE中产生返回值结果,并会在路径/home/pi内产生一个demo.txt文件,文件内容即为输入音频文件的文字识别结果。百度在语音识别方面做出的努力可见一斑,通过调整程序中的参数,可以识别除普通话以外其他语言的音频文件(如英语),而且准确度较高,尤其是短句识别甚高,在易混淆字音重复出现的绕口令中,仅将其中一个“柳”字错误识别为“牛”。
    在这里插入图片描述

    语音合成方面,程序以上述的demo.txt为输入,将文字上传到百度云数据库,转换成功后反馈“successful”到IDE界面,并在目录/home/pi文件夹下生成audio.wav音频文件,此文件即为由文字合成的语音。测试发现,次音频信号在生活中较为熟悉的停顿处有较为明显的顿挫感,但是在长难句中,无法做到顿挫处的智能识别。

    遇到的问题:

    在整个编程过程中,可以说是举步维艰,由于自身能力有限,初学python和Linux,导致在系统操作和规范方面有很多的盲区,导致犯了很多诸如Linux系统授权、python缩进、命令行书写等十分低级的错误,一度陷入程序不断报错却不知错在何处的尴尬境地。同时,由于百度语音识别技术对于上传的音频有着较为苛刻的要求,必须符合 16k 采样率、16bit 位深、单声道等,对于这些内容的不熟悉也走了很多弯路。
    最令我惊艳的是,百度智能云计算AI开放平台为程序员搭建了一个十分全面,而且性能强悍的平台,从语音到图像,再到智能数据,涉猎了我们所熟知的绝大多数AI领域,其中对不同实现方式进行了细致的备注和说明,为我实现此项目扫清了障碍。
    错误码

    深入开发的设想:

    在完成上述功能的实现之后,我尝试让树莓派实现类似与智能音箱的人机交互功能(全网已有大神实现),实现过程中无疑要用到snowboy引擎,它一款高度可定制的唤醒词检测引擎,可以用于实时嵌入式系统,并且始终监听(即使离线)。当前,它可以运行在 Raspberry Pi、(Ubuntu)Linux 和 Mac OS X 系统上。在一些棘手的解决方案中,它可以运行完整的自动语音识别(ASR,Automatic Speech Recognition)来执行热词检测。但是,我在尝试实现过程中遇到了几个无法解决的问题:

    1. 由于树莓派内置声卡没有麦克风,需要利用外接声卡执行热词唤醒,但是在Linux系统中更改声卡驱动成了我越不去的坎儿,尝试了网络上更改驱动的多种方式后,无一能更够成功更改,我仍需继续在Linux方向深入学习。
    2. 在树莓派上下载好portaudio后,编译过程中频繁报错,涉及到gcc相关内容,我在这方面仍需继续努力。

    致谢:

    感谢百度智能云提供的云计算支持

    参考文献:

    1. https://ai.baidu.com/docs#/ASR-Online-Python-SDK/f55e8c00
    2. https://www.cnblogs.com/rnckty/p/8067115.html
    3. https://blog.csdn.net/sinat_35162460/article/details/86544772
    4. https://snowboy.kitt.ai/
    5. https://blog.csdn.net/sinat_35162460/article/details/86547013

    成果
    作者:Boyle Zhao
    2019年11月于北京理工大学

    展开全文
  • 教你如何在树莓派上搭建语音识别服务

    万次阅读 多人点赞 2019-09-25 19:26:09
    最近项目原因需要我完成一个在树莓派上的离线语音识别,忙活了近一周,起初用了开源的PocketSphinx,但是不得不说,识别率低的惊人,甚至可以说有些字词根本没法识别,除非你自己制作声学模型,不然这玩意儿就是个...

    最近项目原因需要我完成一个在树莓派上的离线语音识别,忙活了近一周,起初用了开源的PocketSphinx,但是不得不说,识别率低的惊人,甚至可以说有些字词根本没法识别,除非你自己制作声学模型,不然这玩意儿就是个摆设。

    接下来,根据我的摸索,教大家如何在树莓派上搭建语音识别模块。

    首先,前往讯飞开放平台下载SDK,平台选择Linux。你需要注册相关信息,最后你所下载的SDK中会自动填入你的key。

    因为科大讯飞官方在新版本SDK移除了树莓派的支持,我把以前的版本上传了,供大家使用:
    https://github.com/Qianlitp/RaspberryPiSDK

    解压后如图
    这里写图片描述
    进入目录,里面有如下的文件:
    这里写图片描述
    我们这里直接选择进入官方所给的例子进行运行:
    这里写图片描述

    关键点,因为这个是Linux系统的版本,和树莓派不一样,我们需要修改一下库文件的引用路径:
    首先,编辑32bit_make.sh:

    sudo vim 32bit_make.sh,将内容修改为以下:
    这里写图片描述

    保存退出后,继续,sudo vim Makefile,修改下面划红线的位置为如图:
    这里写图片描述

    好了,接下来执行source 32bit_make.sh
    有可能会出现权限相关的问题,建议直接从主文件递归给权限:
    sudo chmod -R 774 Linux_voice_1.109

    如果出现下面的内容,那就说明没什么问题了
    这里写图片描述

    接着,在Linux_voice_1.109/bin目录下会生成一个可执行文件:
    这里写图片描述

    我们执行它,./iat_sample 正常情况下会显示
    这里写图片描述

    这里选0会直接识别,识别的语音为官方所给的测试语音文件,保存在当前目录的wav文件夹下,识别结果为中美数控。选1则会使用用户词表,文件为当前目录下的userwords.txt,识别结果为中美速控,原因大家自己思考。
    这里写图片描述

    好了,现在识别解决了,我们来解决录音的问题

    我试过很多在linux下的录音软件,不是不能设置详细的参数,就是无法控制录音时间。比如sox,这个软件很好,但是我看了帮助文档发现,要停止录音必须手动Ctrl+C。

    不过问题还是被我解决了:
    sudo apt-get install alsa-oss

    安装完以后,执行:
    arecord -d 3 -r 16000 -c 1 -t wav -f S16_LE test.wav

    -d : 录音时间(s)
    -r : 频率
    -c : 音轨
    -t : 文件类型
    -f : 格式
    

    因为科大讯飞要求单音轨,16000HZ,16bit的采样,支持wav或者pcm

    录音结束后,文件保存在当前目录,将它移动到bin/wav/下,并且修改文件名替换掉以前的文件。
    或者你直接可以在sample/iat_sample/下修改C文件源代码,改变音频文件位置和文件名(很简单的,打开C文件,找到传路径的地方,改一下就好,改完记得重新编译)。

    我们再次执行bin/iat_sample,成功识别。

    在这里我只是讲述了如何在树莓派上将语音识别SDK简单跑起来,更多的改善大家可以自己解决。
    有错误的地方还望大家指正。

    我提供的SDK已经申请过认证,无限制次数使用,大家可用于学习和测试开发。

    展开全文
  • 全套树莓派语音识别、语音唤醒方案,包含各种代码,包括舵机操控,包括远程视频的方案都在里面,绝对物超所值
  • 本文采用百度云语音识别API接口,实现低于60s音频的语音识别,也可以用于合成文本长度小于1024字节的音频,此外采用snowboy离线语音唤醒引擎可实现离线语音唤醒,实现语音交互。基于本内容可实现语音控制小车,语音...

    本文采用百度云语音识别API接口,实现低于60s音频的语音识别,也可以用于合成文本长度小于1024字节的音频,此外采用snowboy离线语音唤醒引擎可实现离线语音唤醒,实现语音交互。基于本内容可实现语音控制小车,语音控制音箱、语音交互。。。
    可以查看我的github获取更多信息:https://github.com/dalinzhangzdl/AI_Car_Raspberry-pi
    一、 百度云语音识别 python-SDK的安装
    工欲善其事必先利其器,下面先来武装一下自己,申请属于自己的百度AI开发者账号,安装SDK(Software Development Kit,软件开发工具包)。
    1、进入百度云平台,进入百度语音控制台后,创建自己的应用,获取属于你的ID号和密钥:
    APP_ID = ‘114xxxx5’
    API_KEY = ‘NYIvd23qqGAZxxxxxxxxxxxxxxx’
    SECRET_KEY = ‘DcQWQ9Hxxxxxxxxxxxxxxxxxxxxxx’
    2、SDK的下载与安装
    应用创建完成后下载相应的开发SDK,这里采用python开发,下载python-SDK即可
    在这里插入图片描述
    SDK的安装:
    将下载的SDK包拷贝到树莓派pi目录下,终端界面解压安装,安装过程如下:
    解压包:unzip aip-python-sdk-2.0.0.zip
    安装SDK包: sudo pip install baidu-aip
    在这里插入图片描述
    在这里插入图片描述
    遵循以上步骤操作,就搭建好属于自己的语音识别和语音合成平台,再添加一个麦克风和一个喇叭或者音箱就可以进行语音识别方面的开发了,语音控制小车,控制智能家电等。

    二、Python-SDK 实现语音识别和语音合成
    1、python-SDK实现语音识别
    遵循SDK文档进行快速开发,务必阅读文档。如果对自己的录音进行测试,需先采用格式工厂对录音文件进行转换,确保录音的音频参数符合云语音识别的要求。单通道、采样频率为16K PCM格式,也可先直接采用官方的音频进行测试。
    程序如下:

    #_*_ coding:UTF-8 _*_
    # @author: zdl 
    # 百度云语音识别Demo,实现对本地语音文件的识别。
    # 需安装好python-SDK,录音文件不不超过60s,文件类型为wav格式。
    # 音频参数需设置为 单通道 采样频率为16K PCM格式 可以先采用官方音频进行测试
    
    # 导入AipSpeech  AipSpeech是语音识别的Python SDK客户端
    from aip import AipSpeech
    import os
    
    ''' 你的APPID AK SK  参数在申请的百度云语音服务的控制台查看'''
    APP_ID = '114xxxx5'
    API_KEY = 'NYIvd23qqGAZxxxxxxxxxxxxxxx'
    SECRET_KEY = 'DcQWQ9Hxxxxxxxxxxxxxxxxxxxxxx'
    
    # 新建一个AipSpeech
    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
    
    
    # 读取文件
    def get_file_content(filePath):   #filePath  待读取文件名
        with open(filePath, 'rb') as fp:
            return fp.read()
    
    		
    def stt(filename):         # 语音识别
        # 识别本地文件
        result = client.asr(get_file_content(filename),
                            'wav',
                            16000,
                            {'dev_pid': 1536,}      # dev_pid参数表示识别的语言类型 1536表示普通话
                            )
        print result
    
    	# 解析返回值,打印语音识别的结果
        if result['err_msg']=='success.':
            word = result['result'][0].encode('utf-8')       # utf-8编码
            if word!='':
                if word[len(word)-3:len(word)]==',':
                    print word[0:len(word)-3]
                    with open('demo.txt','w') as f:
                        f.write(word[0:len(word)-3])
                    f.close()
                else:
                    print (word.decode('utf-8').encode('gbk'))
                    with open('demo.txt','w') as f:
                        f.write(word)
                    f.close()
            else:
                print "音频文件不存在或格式错误"
        else:
            print "错误"
    
    # main函数 识别本地录音文件yahboom.wav
    if __name__ == '__main__':
        
        stt('test.wav')
        
    

    2、python-SDK实现语音合成
    语音合成较语音识别简单,合成文本长度必须小于1024字节,如果本文长度较长,可以采用多次请求的方式。下面是合成本地文件demo程序:

    #_*_ coding:UTF-8 _*_
    # @author: zdl 
    # 百度云语音合成Demo,实现对本地文本的语音合成。
    # 需安装好python-SDK,待合成文本不超过1024个字节
    # 合成成功返回audio.mp3 否则返回错误代码
    
    # 导入AipSpeech  AipSpeech是语音识别的Python SDK客户端
    from aip import AipSpeech
    import os
    
    ''' 你的APPID AK SK  参数在申请的百度云语音服务的控制台查看'''
    APP_ID = '114xxxx5'
    API_KEY = 'NYIvd23qqGAZxxxxxxxxxxxxxxx'
    SECRET_KEY = 'DcQWQ9Hxxxxxxxxxxxxxxxxxxxxxx'
    
    # 新建一个AipSpeech
    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
    
    # 将本地文件进行语音合成
    def tts(filename):
        f = open(filename,'r')
        command = f.read()
        if len(command) != 0:
            word = command
        f.close()
        result  = client.synthesis(word,'zh',1, {
            'vol': 5,'per':0,
        })
    	
    # 合成正确返回audio.mp3,错误则返回dict 
        if not isinstance(result, dict):
            with open('audio.mp3', 'wb') as f:
                f.write(result)
            f.close()
            print 'tts successful'
    
    # main
    
    if __name__ == '__main__':
    
    tts('demo.txt')
    
    展开全文
  • 树莓派语音识别

    千次阅读 2017-05-19 22:51:43
    现在的 Linux 桌面已经发展的很好了,在桌面下播放音乐操作起来也很简单。那么我们还记得在桌面不是那么好的时候我们是怎么播放音乐的么?哎,我是想不起来了,实在是太难了。  不过现在我们可以先安装一个小软件...

     现在的 Linux 桌面已经发展的很好了,在桌面下播放音乐操作起来也很简单。那么我们还记得在桌面不是那么好的时候我们是怎么播放音乐的么?哎,我是想不起来了,实在是太难了。

      不过现在我们可以先安装一个小软件,然后通过命令行来使用这个软件播放音乐,感觉还是很不错滴。

      这个软件的名字叫:SOX,支持很多格式的音频文件,如 WAV,MP3,MPG,OGG,FLAC 等等。满足我们日常使用是足够足够的了。

      好了,首先,第一步我们需要把它安装到我们的系统里。

    1、打开一个终端(Ctrl+Alt+T),然后输入如下命令:

    sudo apt-get install sox

    upload/2013_05/130529084453491.png

    2、给系统安装软件需要管理员密码。输入密码后回车。

    upload/2013_05/130529084453492.png

    3、在安装的时候询问你是否继续的时候输入 Y 来确认继续安装。

    upload/2013_05/130529084453493.png

    4、好了,只要等待它完成安装就可以了。完成安装以后,我们就可以通过下面的命令来让 SOX 可以播放它所支持的音频格式文件:

    sudo apt-get install sox libsox-fmt-all

    upload/2013_05/130529084453494.png

    5、好了,现在可以使用 SOX 来播放我们计算机里的音频文件了。

    6、比如要播放系统中所有音频文件,我们可以采用这个命令:

    play *mp3

    upload/2013_05/130529084453495.png

    7、如果要播放某个特定的文件,那么采用这个命令:

    play file-name.extension

    比如:

    play Aqua_Barbie_Girl.mp3

    可以只播放 Aqua_Barbie_Girl.mp3 这 MP3。

    upload/2013_05/130529084453496.png

    8、在播放的时候,我们可以按下 Ctrl+C 来终端当前音频的播放转到下一个音频。

    9、关于更多的 SOX 的操作命令我们可以使用 man 命令来查看详细的介绍。希望大家能有所发现。

    man sox


    如果想了解文件的的头部信息而又不想看到一大堆的信息,可以用-V和-n联合,如:
    sox -V *.wav -n
    Input File     : '杨望.wav'
    Sample Size    : 16-bit (2 bytes)
    Sample Encoding: signed (2's complement)
    Channels       : 2
    Sample Rate    : 44100
    Duration       : 03:56.84 = 10444800 samples = 17763.3 CDDA sectors
    Endian Type    : little
    Reverse Nibbles: no
    Reverse Bits   : no
    就会打印出本目录下所有wav文件的头部信息。



    -r 抽样数,单位赫兹
    -c channels,通道数
    -b 每个抽样的比特数


    例如:

    rec -b 16 -r 16000 -c 1 file.wav

    展开全文
  • 树莓派打造智能语音控制系统

    万次阅读 多人点赞 2019-08-17 21:36:58
    树莓派的智能语音控制系统,该系统使用麦克风对语音进行采集,通过调用语音识别云服务对语音进行识别以及合成,再将识别的语音转化为机器识别的指令,从而实现机器人对话和控制机器人执行相应操作的效果。树莓派成本...
  • 离线语音识别,树莓派语音识别科大讯飞语音识别离线包。
  • 树莓派系列二(语音识别)

    万次阅读 2017-04-11 11:14:58
    树莓派的基本概念和安装系统在系列文章一中介绍了.这篇准备介绍一下语音识别. 一直想研究一下语音识别...识别效果业界领先,这几年百度语音识别也在追赶,这次的研究让我对百度的语音识别效果刮目相看,Google的在国内不用
  • 本人的SDK是2017年1月30号左右下载的,可以在http://www.xfyun.cn/科大讯飞官网注册,选择相应的...1、因为最新版SDK不支持树莓派了,所以要下载个RaspberryPi文件来支持在树莓派上使用: 下载地址在: https://pa...
  • 1、最终实现方案(树莓派、php+html、arecord、百度语音、face++图像识别)1.1、硬件部分因为加了一个开关来控制语音的录入,所以用到了树莓派的中断,因此硬件的话除了树莓派的话就是多了一个开关还有几条杜邦线和...
  • 最近尝试在树莓派上完成一些语音方向的应用,例如像语音唤醒和关键词的识别,前期搜索了一下,可以选择的国内平台有百度语音,科大讯飞, 云之声等。这几家都有自己的开发者开放平台都提供了语音唤醒,语音关键词...
  • 一个友好的语音交互系统不仅是体现机器人的AI的重要方面,也是人机交互的重要方面。机器人不同于其他智能硬件,语音交互系统已经成为机器人的基本设计需求,没有友好流畅的语音交互系统的机器人不是一款成功的机器人...
  • 我重构了整个代码,全部用python编程,请点击此处以查看详情语音聊天机器人第二...从这以下的代码我已经放弃维护,可以借鉴实现思路奥,用百度语音可以实现语音识别使用方法:终端进入/../../man_machine_interactio...
  • 使用树莓派录音和播放音乐

    万次阅读 2018-08-11 23:01:40
    目前有一个想法是用树莓派做一款智能聊天机器人的智能硬件,通过声卡录音,将语音识别成文字,然后再解析做相关操作。 所以我首先在树莓派上测试一下声卡。 我购买的是淘宝上的usb声卡,价格只要7元钱。 然后又在...
  • 树莓派3B+ 语音识别之USB声卡的使用

    千次阅读 2018-12-08 00:43:06
    首先pc上ssh远程连接到树莓派,lsusb命令查看当前的usb设备,然后插入usb声卡后,lsusb查看该usb设备是否被识别到。 接下来,我们使用cat /proc/asound/cards 查看当前usb声卡设备插入后设备驱动能否被正常加载,...
  • 树莓派文本转化为语音

    千次阅读 2014-07-25 11:17:54
    原文地址:http://elinux.org/RPi_Text_to_Speech_(Speech_Synthesis)
  • 树莓派+Python实现语音交互

    千次阅读 2019-08-06 14:19:44
    树莓派+Python实现语音交互 前言: 还记得老式黑白电视机吗?那个时候人们看电视,开机、换台、调音、收信号以及关机都是需要人走到电视机面前手动操作。夏天还好,到了冬天,一家人窝在被子里,为了换台或者关电视...
  • 前面的文章snowboy已经可以使用唤醒词了,接下在我们使用百度的语音识别来让树莓派听懂我们的话。基于python目前只有在线模式的,希望百度可以早些日子给出离线的SDK,那么会方便多了。 在百度的技术文档中其实写的...
  • 科大讯飞语音识别SDK(支持树莓派

    千次下载 热门讨论 2020-07-30 23:32:12
    别在这里下载了,浪费积分,我改不了,建议去github免费下载: https://github.com/Qianlitp/RaspberryPiSDK
  • 离线语音唤醒 snowboy 1、snowboy介绍、安装与测试 Snowboy 是一款高度可定制的唤醒词检测引擎,可以用于实时嵌入式系统,并且始终监听(即使离线)。当前,它可以运行在 Raspberry Pi、(Ubuntu)Linux 和 Mac OS...
1 2 3 4 5 ... 20
收藏数 1,328
精华内容 531
关键字:

树莓派 语音识别