-
2021-01-16 17:33:46
一、语音识别简介
语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。
语音识别技术,也被称为自动语音识别ASR,就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。
语音识别SDK开发包是各大语音识别公司为用户提供的一套有关语音识别的二次开发接口,用户可以利用这个接口快速地开发符合客户需求的语音识别应用。
目前主要的语音识别服务商有:
百度、腾讯、科大讯飞、云知声、阿里巴巴、华为
百度、讯飞、腾讯、阿里等服务商的语音识别均已开始收费,但提供有限时间的试用。
华为的HiAI是免费的,但仅限于华为终端使用。
二、华为HiAI简介
华为语音识别基于HUAWEI HiAI开放平台。
HUAWEI HiAI是面向智能终端的AI能力开放平台,基于 “芯、端、云”三层开放架构。
HUAWEI HiAI的优势在于充分利用了华为麒麟芯片的NPU能力,结合华为EMUI把能力内置于端侧,可实现快捷接入,轻量级部署,Engine与App解耦独立部署,快速升级支持模型在线更新。另一个优势在于华为HiAI 是免费开放给开发者使用的。
华为语音识别引擎是面向移动终端的语音识别能力,向开发者提供人工智能应用层API,可以将语音文件、实时语音数据流转换为汉字序列,准确率达到90%以上
三、华为语音识别的使用
1.注册认证下载
首先需要注册认证,进入华为开发者联盟页面,登录华为开发者联盟官网。
接着进入服务接入,首先点击 “管理中心” > “开发服务”,点击HUAWEI HiAI卡片添加HUAWEI HiAI服务。
接着签署华为开发者HiAI服务协议
然后就可以进行SDK的下载了,点击“SDK下载”下载SDK压缩包。
开发HiAI应用建议使用Android Studio 3.0.1及以上版本,终端处理器不低于kirin 970,并且系统软件版本不低于EMUI 8.1.0。
2.开发步骤
(1)添加依赖库
将huawei-hiai-pdk-1.0.0.aar、huawei-hiai-asr-10.0.4.309.aar包复制至工程中的app/libs下。
在build.gradle中将huawei-hiai-pdk-1.0.0.aar、huawei-hiai-asr-10.0.4.309.aar添加至工程中。
(2)程序设计
1)语音识别引擎的初始化,
调用createAsrRecognizer()方法创建引擎,
配置语音输入来源和静音检测时间,
调用mAsrRecognizer.init方法进行初始化,init方法有两个参数:
第一个参数是intent,将刚才设置的语音输入来源和静音检测时间传入。
第二个参数是一个AsrListener,用来监听语音识别的各种状态,这个Listener需要实现。
2)初始化完成后,当用户点击语音识别按键时,调用startListening()方法进行语音识别。
AsrListener类中的onResults和onPartialResults方法可以获取识别结果,获取了识别结果或部分识别 结果后,需要对有用的结果进行处理,如果识别到了“前”,则需要发送小车端需要的前进命令 “ONA”,如果识别到了“左”,则发送左转命令“ONC”,以此类推。
3)当不需要识别时,可以调用取消或停止识别方法。
4)页面销毁时,需要调用引擎释放方法,释放引擎。
四、完整代码
关注公众号“ Android硬开发 ”,回复“蓝牙小车”
更多相关内容 -
huaweicloud-ais-android-demo:重写了华为云语音识别服务的Java SDK,兼容Android平台, 可在Java SE平台试...
2021-04-28 03:27:24调整了华为云人工智能服务的java sdk和demo的依赖库,使其代码能方便的移植到Android平台运行, 同时重构了demo代码结构以方便开发app时复用代码。 AIS Java SDK: 代码移植步骤 将ais-asr-android-demo/dependency的... -
华为云语音识别:一句话识别API调用
2019-09-24 17:02:05查看了华为云的语音交互服务SIS,有两种:录音文件识别以及一句话语音识别 名称 功能 录音文件识别 可以实现5小时以内的音频到文字的转换。支持垂直领域定制,对应领域转换效果更佳。 一句话识别...最近想做一个智能硬件(实现单片机使用W600连接上位机或直接实现语音识别)
查看了华为云的语音交互服务SIS,有两种:录音文件识别以及一句话语音识别
名称 功能 录音文件识别 可以实现5小时以内的音频到文字的转换。支持垂直领域定制,对应领域转换效果更佳。
一句话识别 可以实现语音到文字的转换。支持垂直领域定制,对应领域转换效果更佳。 在看了这两种模式后,选择了一句话识别,方便在下位机方面进行开发(前些时间已经实现STM32对语音文件实现8K采样率16bit的PCM格式WAV文件生成)
跳转到一句话识别的API介绍(https://support.huaweicloud.com/api-sis/api-sis.pdf),发现使用时需要先获取该用户的token(呃 通过拨打华为云的客服电话解决了这个问题)
获取用户Token采用POST方式,地址格式为:
针对不同的服务端点选择Endpoint,后缀是相同的/v3/auth/tokens
此时使用华为云推荐的软件(Postman)来实现这个过程
使用这个地址, 进行提交
此时会反馈你的Token(只能使用24小时),如果打算长期使用请选择SDK (https://support.huaweicloud.com/sdkreference-sis/sis_05_0004.html),目前只有JAVA格式的,本文主要介绍API方式
得到Token就可以进行语音识别啦!!这里还是使用POST的方式,此时地址会发送改变,一句话语音识别的两个服务端点为:
区域名称 终端节点(Endpoint) 华北-北京一 sis-ext.cnnorth-1.myhuaweicloud.com 华北-北京四 sis-ext.cnnorth-4.myhuaweicloud.com 因为我的是华北-北京四,这里选择sis-ext.cnnorth-4.myhuaweicloud.com,继续查看该API手册,发现对于提交语音数据的包格式定义如下:
此时POST地址为: https://sis-ext.cn-north-4.myhuaweicloud.com/v1/{projectid}/asr/short-audio
获取Projectid的方式:将光标放在用户名下面选择我的凭证:
得到projectid后开始发包:
我采用的是WAV自识别模式,使用的WAV文件为AU生成的录音文件,利用BASE64编码转换后进行发送:
data数据为转码后的base64格式,因为太长就不放上来了。此时点击SEND
测试成功,本篇结束。
-
【上电即上华为云】华为云smart语音识别_AI_Voice_wifi_RISC-V_LCD_ST7789
2021-04-23 09:28:38华为云smart语音识别_AI_Voice_wifi_RISC-V_LCD_ST7789:上电即上华为云 一句话总结:语音识别将改变我们的生活!!!应用场景上有很多想象空间,产品经过语音改造后让人耳目一新.【摘要】 语音识别将改变我们的生活!!!应用场景上有很多想象空间,产品经过语音改造后让人耳目一新,定制多国语言可打造全球爆款产品。本文实现一款smart语音识别案例,由AI语音识别芯片、WiFi芯片(RISC-V,含蓝牙)、LCD显示屏构成,当然更重要的是上电即上华为云。
华为云smart语音识别_AI_Voice_wifi_RISC-V_LCD_ST7789:上电即上华为云
一句话总结:语音识别将改变我们的生活!!!应用场景上有很多想象空间,产品经过语音改造后让人耳目一新,定制多国语言可打造全球爆款产品。本文实现一款smart语音识别案例,由AI语音识别芯片、WiFi芯片(RISC-V,含蓝牙)、LCD显示屏构成,当然更重要的是上电即上华为云。
2分钟了解,请看先视频:
语音识别芯片,RISC-V架构WiFi芯片,LCD显示屏,华为云融合案
方案说明
(1)现在实现一个华为云smart语音识别案例。
技术点:
AI语音识别芯片、WiFi芯片(RISC-V架构,含蓝牙)、LCD显示屏(ST7789)、上电即上华为云
整体方案介绍:
(1)AI语音识别芯片:由四川声达创新提供。本次采用离线语音识别芯片,通过AI芯片算力,将语音识别、语义理解等功能直接在终端设备上处理,具有保护用户隐私、响应速度快、无需网络即可控制等优势。
离线+在线语音识别案例,稍后会出文章,敬请关注。
(2)WiFi芯片(RISC-V架构,含蓝牙):由博流提供,BL602片上XIP FLASH为2MBytes,RAM为276KBytes,已经比常见的MCU资源要丰富,而且wifi与蓝牙可同时运行。本文采用openCPU方式开发博流BL602芯片,通过串口UART与语音芯片交互,通过SPI驱动LCD显示屏。
流程是:MIC麦克风接收语音,由语音芯片进行离线处理,处理后Data通过UART发给WIFI芯片,同时通过喇叭进行本地播放。WIFI芯片串口接收Data后,通过SPI刷新LCD显示屏,同时通过MQTT协议向华为云IoT平台上报消息,登录华为云可看到结果。反之,如果从华为云IoT平台下发MQTT控制命令,WIFI模组接收Data后,通过SPI刷新LCD显示屏,同时通过UART串口发给语音芯片。语音芯片接收Data后,本地喇叭播放。
(3)LCD显示屏:网上买的,分辨率240*240(RGB 565),芯片型号为ST7789。
一、WiFi BL602(RISC-V)基础SDK、华为云智联patch
基础SDK
bl_iot_sdk.rar
语音补丁
patch_hwcloud_AI_Voice_wifi_RISC-V_LCD_ST7789_20210421-1633.rar
注意:只需要基础SDK和语音补丁。
二、AI语音识别芯片固件
bin文件
Firmware_V200(你好小北).bin
【答1】如需要定制语音识别功能,定制多国语言等,请联系四川声达创新。
三、使用步骤
WIFI模组
(1)WIFI模组(博流BL602_RISC-V)和华为云的操作,请参考:
【上电即上华为云】华为云openCPU智联模组_wifi_BL602(RISC-V)_MQTT
https://bbs.huaweicloud.com/blogs/238212
打补丁
(1)语音补丁包:
patch_hwcloud_AI_Voice_wifi_RISC-V_LCD_ST7789_20210421-1633.rar
修改代码
(1)修改wifi热点和接入密码。
components\3rdparty\hwcloud_iot_link\iot_link\network\tcpip\lwip_bl_socket\lwip_bl_socket_imp.c
#define HWCLOUD_SSID "maxsussid"
#define HWCLOUD_PWD "12345678"
(2)修改设备ID和接入密码。
components\3rdparty\hwcloud_iot_link\iot_link\demos\oc_mqtt_demo\oc_mqtt_water_meter.c
#define CN_EP_DEVICEID "60056c19aaafca02dbd25786_bl602_mqtt_12345678"
#define CN_EP_PASSWD "12345678"
【注意】请根据华为云实际显示设备ID进行设置。
编译
(1)cd进入/bl_iot_sdk/customer_app/bl602_demo_wifi目录。执行./genromap命令。
(2)出现Building Finish,表示编译成功,WIFI固件生成完成。
(3)打开BLDevCube.exe下载软件(我是Windows 64位系统)。注意下图Factory Params的设备树位置。BouffaloLabDevCube-1.4.7-win32\bl602\device_tree\bl_factory_params_IoTKitA_40M.dts
(4)请使用下载资料包的bl_factory_params_IoTKitA_40M.dts进行替换。主要修改ttyS1的GPIO口为tx为gpio14脚,rx为gpio17脚。ttyS1串口用于跟语音识别芯片进行Uart交互。
(5)下载成功后,显示Success。如果不清楚怎么下载,请看一下文章。【上电即上华为云】华为云openCPU智联模组_wifi_BL602(RISC-V)_MQTT
https://bbs.huaweicloud.com/blogs/238212
硬件连线
(1)请根据下图所示,进行硬件连线。
自建热点
(1)使用手机自建热点。
配置WLAN热点,网络名称 maxsussid,密码是 12345678
(2)打开手机热点。
(3)给WIFI模组上电。给语音模组上电。打开串口调试助手SecureCRT.exe,选择WIFI模组的LOG串口。
(4)按一下WIFI模组的Reset键,查看WIFI模组的LOG。
(5)LCD显示屏出现界面。
(6)此时查看华为云的设备,显示已经在线。
华为云调试
(1)建议可以先看一遍完整的视频,了解如何调试。
(2)语音芯片的唤醒词“你好小北”。然后,说“调到50度”。显示屏显示下面界面。
(3)华为云上可以看到上报数据50。
华为下发命令
(1)代码里已经预置了三个命令
{"cmd_value":"less water"}
{"cmd_value":"high temp"}
{"cmd_value":"low temp"}
(2)选择CreateCommand命令,输入device_id,输入paras为{"cmd_value":"less water"},点击调试,华为云向WIFI模组下发命令。
https://apiexplorer.developer.huaweicloud.com/apiexplorer/debug?product=IoTDA&api=CreateCommand
(3)WIFI模组接收到命令后,显示屏显示“水量不足”的报警。同时语音识别芯片,也播放“水量不足,请加水”的提示语。
其他
(1)其他副标题功能,请大家自行测试。
包括打开主机、关闭主机、调到48度、调高一度、调到50度、降低一度、调到49度、睡眠模式、解除睡眠、开启锁定、解除锁定、定时7小时、定时8小时、取消定时、增加音量、减小音量、打开语音、关闭语音。
详情请参考视频内容。
完成
ok。
源码获取
weixin关注公众号beigugong,或者扫描下方二维码。
回复AI_Voice_wifi_RISC-V,获取源码下载链接。
相关
【上电即上华为云】华为云openCPU智联模组_wifi_8720_MQTT
【上电即上华为云】华为云openCPU智联模组_wifi_8720_LwM2M
【上电即上华为云】华为云openCPU智联模组_wifi_BL602(RISC-V)_MQTT
【上电即上华为云】华为云openCPU智联模组_wifi_BL602(RISC-V)_LwM2M
【上电即上华为云】华为云openCPU智联模组_wifi_BL602(RISC-V)_CoAP
【上电即上华为云】华为云AIoT智联开发板_mcu_HK32F103Vx
【上电即上华为云】华为云smart智联PLC无线网关_plc_3121N-H(3121N-IED)
【上电即上华为云】华为云openCPU智联模组_wifi_HF-LPX70_RISC-V_LwM2M
【上电即上华为云】华为云openCPU智联模组_wifi_HF-LPX70_RISC-V_CoAP
【上电即上华为云】华为云all-in-one智联模组_NB-IoT_BC95-CNV(BC28-CNV)_LwM2M_at
【上电即上华为云】华为云all-in-one智联模组_NB-IoT_BC95-CNV(BC28-CNV)_MQTT_at
【上电即上华为云】华为云all-in-one智联模组_NB-IoT_BLE_BC95-CNV_BC28-CNV_openCPU
【上电即上华为云】华为云all-in-one智联模组_NB-IoT_BLE_BC95-CNV_BC28-CNV_蓝牙APP
【上电即上华为云】华为云smart智联PLC_NB-IoT_BLE无线网关_plc_3121N-IED_BC95-CNV
【上电即上华为云】(视频演示)语音识别、RISC-V架构WiFi芯片、LCD显示屏融合案例
【上电即上华为云】华为云smart语音识别_AI_Voice_wifi_RISC-V_LCD_ST7789
本帖地址
-
android 语音识别demo
2018-09-05 21:59:39代码是简单的语音识别demo,使用的是科大讯飞的api,想看的同学可以看看。 -
华为自带的语音识别功能太实用了!这样操作,3秒语音变文字
2021-07-25 02:31:25原标题:华为自带的语音识别功能太实用了!这样操作,3秒语音变文字如果用过华为手机的小伙伴肯定都知道,华为手机有很多实用的实用的功能,对于商务人士来说,特别...1、华为语音识别操作小编要说的呢,就是这个语...原标题:华为自带的语音识别功能太实用了!这样操作,3秒语音变文字
如果用过华为手机的小伙伴肯定都知道,华为手机有很多实用的实用的功能,对于商务人士来说,特别有用,例如:无线投屏、智能识物等功能,又方便又好用,今天小编要说的是华为手机中一个超好用的功能,有了这个功能,我们可以解放双手,以后打字都不用手打了,直接说话就可以!!!还不知道的小伙伴们赶紧来看看吧!
1、华为语音识别操作
小编要说的呢,就是这个语音备忘功能,简直是会议记录的小能手,我们首先打开手机里的备忘录,点击右下角的【+】号,新建一个备忘录~
然后在页面底部我们可以看到一个麦克风的图案,点击它~
然后我们就可以对着它说话啦!它会自动把你说的话转换成文字,记到备忘录里,是不是特别方便呢?有了它在也不用担心手速跟不上领导的语速了,会议开始前直接打开录音,录下来之后转成文本,妥妥的一字不漏!
2、语音翻译
如果是在外企工作的职场人士,肯定经常需要跟外国人打交道,有时还要开一些跨国会议,外国人讲话的语速偏快,有时候脑子里还没翻译过来已经进入下一个议题了,听的云里雾里,怎么办?我们可以用语音翻译来解决!
我们在手机里安装一个迅捷PDF转换器,在小功能页面有一个【语音翻译功能】
点进去之后,我们可以看到它有汉译英和英译汉两种功能,我们按住下方的麦克风标志,对着它说话,它就会自动识别你说话的内容,直接将你说话的内容翻译成对应的另一种语言。
是不是很方便呢?你还知道华为手机里哪些超好用的功能吗?欢迎一起分享鸭~返回搜狐,查看更多
责任编辑:
-
基于深度学习算法的语音识别(华为云)
2021-02-25 10:18:22基于深度学习算法的语音识别 训练完模型后可反复使用,训练时可以选购云环境,节省时间,本地除非你的服务器性能够强劲,本次教程基本上也是实验级别的,主要是看看代码,本次实验我的小米配置不行,就直接把代码写... -
调用云服务实现语音识别合成以及感情分析
2022-04-20 10:52:57免费调用华为云服务实现语音识别,情感分析和语言合成 -
华为云物联网设备接入及OBS使用
2021-07-31 21:21:37记录华为云的上云操作及OBS对象上传文件等操作,大部分操作在WSL Ubuntu中完成,与树莓派环境基本一致。 linux操作系统连接华为云 参考这篇文档:Linux配置上云环境及demo 上传TOPIC /* Topic: $oc/devices/{... -
AI智能语音识别计算器
2022-01-20 11:20:06AI智能语音识别计算器 -
【上电即上华为云】(视频演示)语音识别、RISC-V架构WiFi芯片、LCD显示屏融合案例
2021-04-20 10:54:30【摘要】 【上电即上华为云】(视频演示)语音识别、RISC-V架构WiFi芯片、LCD显示屏融合案例 语音识别芯片,RISC-V架构WiFi芯片,LCD显示屏,华为云融合案 语音识别将改变我们的生活! 此案例资源开放,稍后... -
科大讯飞语音识别_科大讯飞 语音识别_科大讯飞语音识别系统 - 云+社区 - 腾讯云...
2020-10-28 02:03:02到目前为止科大讯飞的javasdk不支持客户端和服务端分开的情况,也就是说,语音合成是在服务端的话筒的播放,语音识别需要服务端的麦克风录音,so,javasdk对于javaweb没有任何卵用。 下面是javase版本的dome的介绍:... -
语音识别-音频流获取
2019-07-09 11:08:13机器学习之语音识别,通过html5标签获取音频流,通过生成的blob音频流对接AI接口进行语音识别【推荐华为、百度语音识别接口】 -
语音识别—前端录音上传服务器进行语音识别
2021-06-10 12:35:55采用前端录音,Websocket搭建Node服务器,音频对象Blob使用Websocket传给后端服务器后写入本地音频文件,然后调用百度AI语音识别本地音频文件,最后将识别结果传给前端显示。百度语音识别查看文档知道了我想要的信息... -
带你认识传统语音识别技术
2022-01-05 11:30:04摘要:隐马尔可夫链HMM模型自从1980年代被用于语音识别以来,一直都是实际语音识别系统的主流方法。 -
漫游语音识别技术——带你走进语音识别技术的世界
2021-08-22 22:09:59一看到语音识别,不知道大家有没有想到智能语音交互助手,苹果的“Siri”、华为的“小 E”、OPPO 的“小欧”、小米的“小爱同学”,总有一款你接触过,还有目前发展火热的智能音箱“小度小度”、天猫精灵、微信的... -
重磅!普惠AI--华为云语音语义万次调用1元购,有奖问答@评论区等你来!
2019-09-18 08:07:46语音交互是一种人机交互方式,以开放API的方式提供给用户,用户通过实时访问和调用API获取语音交互结果。自然语言处理是针对各类企业及开发者提供的用于文本分析及挖掘的云服务,旨在帮助用户高效的处理文本。 目前... -
我的电脑每次启动语音识别总是显示“由于语言配置不受支持,无法启动语音识别”;
2021-07-16 06:46:37常规 电脑: 宏碁 Aspire 4930 笔记本电脑 操作系统:...声卡驱动没有更新前麦克风没有反应,语音识别的教程都无法进行;现在更新至最新后麦克风正常,可以完成语音识别的教程;但是到启动语音识别时就会发生上述问题。 -
初探语音识别ASR算法
2021-12-28 10:19:55摘要:语音转写文字ASR技术的基本概念与数学原理简介。 -
HarmonyOS之AI能力·语音识别技术
2021-06-29 18:21:09它基于华为智慧引擎(HUAWEI HiAI Engine)中的语音识别引擎,向开发者提供人工智能应用层 API。该技术可以将语音文件、实时语音数据流转换为汉字序列,准确率达到 90% 以上(本地识别 95%)。 语音识别技术,也称为... -
硬件开发——语音模块开发 (包含语音识别模块代码等资料包 )
2022-04-27 14:55:56语音识别(购买方式) 车牌识别(购买方式) 华为手机(购买方式) 拿到硬件开发,首先要资料 一、语音识别模块参数 型号:YS-LDV7 名称:一体化语音识别模块 规格:43*29.7MM 供电电压:5V (内部工作电压 3.3V... -
第6课时 语音识别
2020-04-09 09:09:31本课内容选自《人工智能启蒙》第一册第4节《语音识别》部分的内容,本节课要求学生通过学习,初步理解语音识别的含义、简单了解语音识别的6个过程、了解并体验语音识别在生活中的常见应用。 学情分析: ... -
使用react-native-audio进行华为云语音交互服务(实时语音转写)大致流程
2020-09-10 09:26:36使用服务:华为云 使用框架:socket.io 1、 使用websocket与服务端交互 举例:华为云-实时语音转写连续模式-websocket握手 交互流程: 握手成功——发出开始指令——传输二进制数据——接收文本数据——…——发出... -
语音识别公司排名
2020-10-27 18:32:51腾讯云语音识别服务开放实时语音识别、一句话识别和录音文件识别三种服务形式,满足不同类型开发者需求... 语音识别 简介 腾讯云语音识别 为企业提供极具性价比的语音识别服务 被微信王者荣耀 腾讯视频等大量内部... -
Tongue Twister-快速集成华为实时语音识别服务玩转绕口令
2020-11-25 10:55:31Tongue Twister-快速集成华为实时语音识别服务玩转绕口令前言应用场景开发步骤总结[GitHub Demo](https://github.com/HMS-Core/hms-ml-demo/tree/master/ApplicationCases/WoodenMan) 前言 实不相瞒,小编作为了一个... -
『享受华为云ModelArts智慧云盛宴』零代码轻松实现物体检测
2022-01-25 20:29:33——⚡我的『华为云ModelArts』体验式学习过程与心得感受⚡ 文章目录『享受ModelArts智能盛宴』零代码轻松实现物体检测——⚡我的『华为云ModelArts』体验式学习过程与心得感受⚡一、????参考链接????二、????华为云... -
如何用几行Python代码在物联网设备上实现语音AI自动识别?
2021-05-23 18:28:26本文将对HaaS平台的Python轻应用快速实现语音自动识别的例子,介绍HaaS平台的云端一体特点以及软硬件积木高效的特点。 本文将分为几个部分介绍语音自动识别的全过程: 实现效果 实现原理 未来展望 2、语音自动...