精华内容
下载资源
问答
  • LD3320 语音识别模块 语音一体化带单片机、IO 语音模块,例程,模块介绍、应用提高 其他共享配套参考程序 语音识别技术论文资料 LD3320并行串行读写辅助明.pdf LD3320开发手册.pdf LD3320数据手册.pdf LD3320芯片...
  • HLK-V20模块语音识别模块资料
  • 绍了一种以ARM为核心的嵌入式语音识别模块的设计与实现。模块的核心处理单元选用ST公司的基于ARM Cortex-M3内核的32位处理器STM32F103C8T6。本模块以对话管理单元为中心,通过以LD3320芯片为核心的硬件单元实现语音...
  • SNR9815VR-M 高精度语音识别模块, 继 SNR6812VR-M 后推出的更高精度、 高性能语音识别模块, 具备更先进的识别算法, 识别距离远且在噪声环境下表现依然出色, 特别适合应用在大家电产品(例 如:油烟机)。 该模块只...
  • 这学期跟同学一起计划实现一项小制作,对最主要的LD3320语音识别模块做一个小说明,因为在我们设计的过程中,网上都有很多这种类似的文章,但是跟Arduino交互的好像还没有。成品还没做出来,毕竟要求创新,后期会...
  • SNR6812VR-M 语音识别模块, 继 SNR3512VR-M 后推出的升级版语音识别模块, 具备更强的电源抗 干扰能力, 在市电供电的产品上性能表现十分稳定, 内部集成更高阶的语音识别算法,识别精度更高, 噪声环境下表现依然...
  • 绿深LD3320语音识别模块(原理图+代码+使用手册+开发工具+操作视频),简单操作容易上手,语音控制识别的新选择,串口通信减少IO占用,效率更高。
  • 语音识别模块

    2014-06-27 16:28:16
    语音识别芯片,
  • LD3320语音识别模块

    2019-02-18 21:27:00
    LD3320语音识别模块相关代码及技术文档描述,配有原理图及PCB
  • 微雪LD3320语音模块代码+使用方法说明+ Arduino模块库文件。
  • 使用WEGASUN-M6语音识别,快速小项目,比赛进行开发,傻瓜式,易上手,学生必选
  • YS-LDV7语音识别模块使用手册V1.2,购买硬件时包含的操作文档,很实用
  • 电子-语音识别模块原理图.pdf,单片机/嵌入式STM32-F0/F1/F2
  • YS-LDV7语音识别模块资料,里面有配套程序,串口软件,芯片资料,还有新手教学视频,以及抗干扰的方法等。
  • 主要介绍了python之语音识别speech模块,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
  • CASR-DEMO(中文自动语音识别演示系统) 关于本项目的一些说明 首先,欢迎大家关注项目,进行学习研究。收到一些小伙伴的问题我就集中回答下,这里是demo的源码,有两个版本其一是称为speech_env,这是一个简单的...
  • 语音识别模块介绍 DFRobot语音识别模块使用Gravity I2C接口通信,兼容绝大部分主控,非常适合接入教育场景使用。三种语音识别模式和三种语音输入方式使模块可以集成入更多的场景。 这块语音识别模块特别简单好用,...

    语音识别模块介绍
    DFRobot语音识别模块使用Gravity I2C接口通信,兼容绝大部分主控,非常适合接入教育场景使用。三种语音识别模式和三种语音输入方式使模块可以集成入更多的场景。

    这块语音识别模块特别简单好用,连接上语音识别模块,再添加几行简单的代码,您的项目就可以听懂您说的话。无需机器学习,无需特定人语音,无需联网,随时随地都可以进行语音识别,结合语音合成模块还可以实现语音对话。

    DFRobot-Gravity: I2C语音识别模块

    DFRobot-Gravity: I2C语音识别模块
    语音识别模块特性
    Arduino系列主控兼容、micro:bit兼容、掌控板兼容

    支持mind+图形化编程

    无需联网

    识别效果好

    无需自主学习

    无特定人语音

    编程简单易上手

    Gravity I2C通信方式,兼容3.3V和5V

    板载驻极体麦克风、3.5mm麦克风接口以及3.5mm音频输入接口

    三种语音识别模式,自动识别、按键触发、关键词触发

    板载一颗RBG语音识别模式指示灯和红色LED电源指示灯

    语音识别模块LD3320A芯片

    语音识别模块应用场景

    智能语音控制垃圾分类

    语音识别交互

    语音控制终端

    比赛&项目制作

    语音识别模块配送清单

    Gravity:I2C语音识别模块 x1

    Gravity-4P I2C/UART传感器连接线 x1

    领夹式麦克风(3.5mm三极接口) x1

    Gravity:I2C语音识别模块配送清单
    更多关于Gravity:I2C语音识别模块详细信息和使用WIKI请访问DFRobot创客商城

    展开全文
  • UnityWindows自带关键字语音识别演示项目,demo是 unity 2017.3.1f的
  • freeswitch对接讯飞语音识别模块源码分享,从头开始编译
  • 本文档仅仅对stm32 和 LD3320的开发的一些细节进行说明,具体代码并不在本文档
  • stm32f407驱动语音模块
  • 具有识别深度的非特定人声语音识别模块,识别深度达32层(可以根据客户需求定制),在保证语音识别率的前提下,一次设置可以识别1600个短句,现有其他的语音识别模块一次设置只能识别几十个短句。
  • LD3320语音识别模块分析

    千次阅读 2021-10-20 17:31:39
    LD3320语音识别模块分析 LD3320是非特定人语音识别芯片,即语音声控芯片。最多可以识别50条预先内置的指令。 识别原理  声音分帧: 声音是一种波,常见的mp3等格式都是压缩格式,必须转为非压缩的纯波形文件来...

    LD3320语音识别模块分析

      LD3320是非特定人语音识别芯片,即语音声控芯片。最多可以识别50条预先内置的指令。

    识别原理

     声音分帧:
      声音是一种波,常见的mp3等格式都是压缩格式,必须转为非压缩的纯波形文件来处理,比如Windows PCM文件,也就是wav文件。wav文件李存储的除了一个文件头以外就是声音波形的一个个点。比如下图一个波形示例:
    在这里插在这里插入图片描述入图片描述

      在语音开始识别之前,需要把首尾端的静音切除,降低对后续步骤造成的干扰。而这个静音切除的操作叫做VAD。
      对声音分析,即需要对声音进行分帧——把声音切开成一小段一小段,每一小段就是一帧。而分帧需要使用移动窗函数来实现。
      语音数据和视频数据不同,本没有帧的概念,但是为了传输与存储,我们采集的音频数据都是一段一段的。为了程序能够进行批量处理,会根据指定的长度(时间段或者采样数)进行分段,结构化为我们编程的数据结构,这就是分帧。
    在这里插入图片描述

     观察序列提取:
      分帧后,语音就变成了很多小段。但波形在时域上几乎没有描述能力,因此必须将波形作变换。常见的一种变换方法是提取MFCC特征,根据人耳的生理特性,把每一帧波形变成一个多维向量,可以简单地理解为这个向量包含了这帧语音的内容信息。这个过程叫做声学特征提取。实际应用中,这一步有很多细节,声学特征也不止有MFCC这一种,具体这里不讲。
      至此,声音就成了一个12行(假设声学特征是12维)、N列的一个矩阵,称之为观察序列,这里N为总帧数。观察序列如下图所示,图中,每一帧都用一个12维的向量表示,色块的颜色深浅表示向量值的大小。
     矩阵变文本:
    基本概念:
      音素:单词的发音由音素构成。对英语,一种常用的音素集是卡内基梅隆大学的一套由39个音素构成的音素集,参见The CMU Pronouncing Dictionary‎。汉语一般直接用全部声母和韵母作为音素集,另外汉语识别还分有调无调,不详述。
      状态:这里理解成比音素更细致的语音单位。通常把一个音素划分成3个状态。

      三个步骤:①帧识别成状态②状态组合成音素③音素组合成单词
    在这里插入图片描述

       每个小竖条代表一帧,若干帧语音对应一个态,每三个状态组合成一个音素,若干个音素组合成一个单词。也就是说,只要知道每帧语音对应哪个状态了,语音识别的结果也就出来了。
      每帧音素对应的状态就看某帧对应哪个状态的概率最大。
    在这里插入图片描述

      而概率的来源涉及到“声学模拟”,里面存了一大堆参数,通过这些参数就可以找到帧对应状态的概率。同时这些参数来源于模型训练。

     隐马尔可夫模型(Hidden Markov Model,HMM)
      由于会有多余的音素对应状态影响最终结果,因此为了解决这个问题,提高准确率,使用HMM。
      该模型主要步骤:①构建状态网络, ②从状态网络中寻找与声音最匹配的路径。
      搭建状态网络,是由单词级网络展开成音素网络,再展开成状态网络。语音识别过程其实就是在状态网络中搜索一条最佳路径,语音对应这条路径的概率最大,这称之为“解码”。路径搜索的算法是一种动态规划剪枝的算法,称之为Viterbi算法,用于寻找全局最优路径。
    在这里插入图片描述

      这里所说的累积概率,由三部分构成,分别是:
      观察概率:每帧和每个状态对应的概率;
      转移概率:每个状态转移到自身或转移到下个状态的概率;
      语言概率:根据语言统计规律得到的概率。
      其中,前两种概率从声学模型中获取,最后一种概率从语言模型中获取。语言模型是使用大量的文本训练出来的,可以利用某门语言本身的统计规律来帮助提升识别正确率。语言模型很重要,如果不使用语言模型,当状态网络较大时,识别出的结果基本是一团乱麻。这样基本上语音识别过程就完成了。

    模块处理与应用

    工作模式
    普通模式:直接说话,模块直接识别。
    按键模式:按键触发开始ASR进程。
    口令模式:需要一级唤醒词(类似于苹果手机中的唤醒Siri,“嗨,Siri”。
    在这里插入图片描述

    代码移植
     向LD模块中添加关键词
    在这里插入图片描述

     用户执行函数User_handle(nAsrRes); 处理语音识别结果
    在这里插入图片描述

     根据不同结果,串口打印不同的指令
    在这里插入图片描述

     MCU根据指令不同,执行不同的动作
      以JSON格式发送数据至串口,与语音识别模块相连的MCU接收此结果,然后对此字符串进行解析,进而得到当前识别的命令是什么,进而做相应的动作。
    在这里插入图片描述

     LDV7模块固件下载:

    • 打开编译后的.hex文件
      在这里插入图片描述

    • 选对串口号,芯片型号后,选择“下载/编程”按钮,然后给STC单片机上电或者复位。
      在这里插入图片描述

    • 发出语音,测试语音识别结果
      在这里插入图片描述

    最后输出

    1. {“VoiceCommandCode”:0}收到
    2. {“VoiceCommandCode”:1}“报时吧”命令识别成功
    3. {“VoiceCommandCode”:0}收到
    4. {“VoiceCommandCode”:2}“现在时间”命令识别成功
    5. {“VoiceCommandCode”:0}收到
    6. {“VoiceCommandCode”:3}“报时”命令识别成功
    7. {“VoiceCommandCode”:0}收到
    8. {“VoiceCommandCode”:4}“今天温度”命令识别成功
    9. {“VoiceCommandCode”:0}收到
    10. {“VoiceCommandCode”:6}“当前湿度”命令识别成功
    11. {“VoiceCommandCode”:0}收到
    12. {“VoiceCommandCode”:7}“当前天气”命令识别成功

    引用:LD3320语音识别模块:LDV7模块使用详解

    展开全文
  • 内含有YS-V0.7语音识别模块的配套资料(含部分开源基础代码)以及新手视频。这个语音识别模块其实就是一个单片机。有IO口可以直接输出,还可以使用串口通信与其他上位机配套用。
  • python语音识别模块

    2020-12-01 22:54:14
    {"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里技术人对外发布原创技术内容的最大平台;社区覆盖了云计算、大数据、人工智能、...

    {"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里技术人对外发布原创技术内容的最大平台;社区覆盖了云计算、大数据、人工智能、IoT、云原生、数据库、微服务、安全、开发与运维9大技术领域。","link1":"https://developer.aliyun.com/group/?spm=a2c6h.12883283.1377930.25.7287201c9RKTCi&groupType=other","link":"https://developer.aliyun.com/","icon":"https://img.alicdn.com/tfs/TB1TlXBEkT2gK0jSZPcXXcKkpXa-200-200.png","btn2":"开发者藏经阁","tip":"打通开发者成长路径,学习中心 。全线阿里云技术大牛公开课,立即查看","btn1":"技术与产品技术圈","link2":"https://developer.aliyun.com/topic/ebook?spm=a2c6h.12883283.1362932.15.7287201c9RKTCi","title":"阿里云开发者社区"}],"search":[{"txt":"学习中心","link":"https://developer.aliyun.com/learning?spm=a2c6h.13788135.1364563.41.299f5f24exe3IS"},{"txt":"技能测试中心 ","link":"https://developer.aliyun.com/exam?spm=a2c6h.13716002.1364563.42.6cac18a3JWCM5U"},{"txt":"开发者云 ","link":"https://developer.aliyun.com/adc/?spm=a2c6h.13716002.1364563.59.6b0818a3DV0vzN"},{"txt":"在线编程 ","link":"https://developer.aliyun.com/coding?spm=5176.13257455.1364563.57.701e7facHvqi5r"},{"txt":"学习中心 ","link":"https://developer.aliyun.com/learning?spm=a2c6h.12883283.1364563.41.5f1f201c5CLDCC"},{"txt":"高校计划 ","link":"https://developer.aliyun.com/adc/college/?spm=a2c6h.13716002.1364563.58.6cac18a3JWCM5U"}],"countinfo":{"search":{"length_pc":0,"length":0},"card":{"length_pc":0,"length":0}}}

    {"$env":{"JSON":{}},"$page":{"env":"production"},"$context":{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里技术人对外发布原创技术内容的最大平台;社区覆盖了云计算、大数据、人工智能、IoT、云原生、数据库、微服务、安全、开发与运维9大技术领域。","link1":"https://developer.aliyun.com/group/?spm=a2c6h.12883283.1377930.25.7287201c9RKTCi&groupType=other","link":"https://developer.aliyun.com/","icon":"https://img.alicdn.com/tfs/TB1TlXBEkT2gK0jSZPcXXcKkpXa-200-200.png","btn2":"开发者藏经阁","tip":"打通开发者成长路径,学习中心 。全线阿里云技术大牛公开课,立即查看","btn1":"技术与产品技术圈","link2":"https://developer.aliyun.com/topic/ebook?spm=a2c6h.12883283.1362932.15.7287201c9RKTCi","title":"阿里云开发者社区"}],"search":[{"txt":"学习中心","link":"https://developer.aliyun.com/learning?spm=a2c6h.13788135.1364563.41.299f5f24exe3IS"},{"txt":"技能测试中心 ","link":"https://developer.aliyun.com/exam?spm=a2c6h.13716002.1364563.42.6cac18a3JWCM5U"},{"txt":"开发者云 ","link":"https://developer.aliyun.com/adc/?spm=a2c6h.13716002.1364563.59.6b0818a3DV0vzN"},{"txt":"在线编程 ","link":"https://developer.aliyun.com/coding?spm=5176.13257455.1364563.57.701e7facHvqi5r"},{"txt":"学习中心 ","link":"https://developer.aliyun.com/learning?spm=a2c6h.12883283.1364563.41.5f1f201c5CLDCC"},{"txt":"高校计划 ","link":"https://developer.aliyun.com/adc/college/?spm=a2c6h.13716002.1364563.58.6cac18a3JWCM5U"}],"countinfo":{"search":{"length_pc":0,"length":0},"card":{"length_pc":0,"length":0}}}}

    展开全文
  • 用STM32RCT6实现控制语音识别模块,实现人机对话,播放音乐等
  • 龙丘版语音识别模块

    2019-02-15 11:49:40
    第0步 测试开发板第1步 安装语音程序编译环境软件第2步 熟悉开发板第3步 安装USB驱动第4步 下载程序到开发板第5步 使用源代码第6步 语音模块语音芯片进阶
  • 春节前在DF商城看到上架两款新品,分别是离线语音识别模块、离线语音合成模块,它们和二哈识图一起组成了“人工智能三剑客”。其中语音识别模块有现货,语音合成模块接受预定。心痒痒想在春节尝鲜,看商城公告春节...

    春节前在DF商城到上架两款新品,分别是离线语音识别模块、离线语音合成模块,它们和二哈识图一起组成了“人工智能三剑客”。其中语音识别模块有现货,语音合成模块接受预定。心痒痒想在春节尝鲜,看商城公告春节发货截止日期2月7日,于是6日上午匆匆下单,美滋滋等着发货。然而, 6日是周末,人家已放假了……
    DF创客商城产品介绍

    18日开工后发货还是及时的,昨天收到后兴冲冲测试了下,录制了一个测试视频放朋友圈。虽然还没有拿它们作出什么像样的作品,但中午朱老师在掌控群里说老师们对这个模块很感兴趣,所以先写个简单的测评吧!

    下单的时候没有看附件清单,所以包装里倒出来下图中的这么一条麦克风还是很意外的。领夹式,做工很好,用来录个网课也能用上。
    Gravity:I2C语音识别模块配送清单
    配送清单

    Gravity:I2C语音识别模块 x1
    Gravity-4P I2C/UART传感器连接线 x1
    领夹式麦克风(3.5mm三极接口) x1

    接下来给主角一组闪亮的特写
    Gravity:I2C语音识别模块正面特写

    模块正面
    Gravity:I2C语音识别模块正面图

    语音识别芯片ICRoute LD3320
    板载的语音识别芯片ICRoute LD3320和麦克风
    语音识别芯片ICRoute LD3320技术资料
    查了下LD3320的技术资料,
    厂家罗列了以下主要特点:

    芯片LD3320特点

    LD3320的技术特征其实也就是这款语音识别模块的技术特征。说人话,这是一款能离线独立实现语音识别的人工智能芯片,且具有准确率高,无需训练,拿起来就用的优势。

    板载LED

    板载LED

    板载按钮
    板载按钮

    这两个部件有什么用呢?原来这款模块支持三种识别模式,指示灯和按钮是配合不同模式使用的。

    Gravity:I2C语音识别模块识别模式

    Mind+的用户库里已提供该模块的库文件,导入后可以直观看到模块下拉菜单中的对应设置选项。

    Mind+用户库

    识别模式选择

    Gravity:I2C语音识别模块背面图

    模块背面除了有个可接配套麦克风的MIC接口,还有个3.5mm LineIn接口,所以该模块还可以通过音频线与手机、电脑等具备音频输出功能的设备相连。突发奇想,是不是可以借助它,让一些老古董,比如磁带随身听、收音机啥的变身某种具备人工智能属性的有趣装置?

    小试“剑术”

    来都来了,总要比划比划啊!同门师兄“二哈识图”指挥过的机械臂你能搞定不?

    o 材料清单

    掌控板×1

    I/O拓展板×1

    离线语音识别模块×1

    SG90舵机×2

    2自由度云台套件×1

    o 引脚定义

    引脚定义

    o 连线示意图

    Gravity:I2C语音识别模块连线示意图

    o 程序设计

    程序设计比较简单,模块初始化后以拼音的方式添加关键词

    记得别落下了“设置完成 开始识别”这句。

    Gravity:I2C语音识别模块程序设计

    o 效果测试

    响应速度比联网的方式优秀多了。

    识别到关键词后,

    指示灯会闪烁一下,

    随即作出相应动作。

    Gravity:I2C语音识别模块效果图

    看图片很难完整感受,

    大家戳视频吧!

    Gravity:I2C语音识别模块应用动态图

    小结

    无论对于创客制作还是人工智能教学,我觉得三剑客都是风口上的好东东,理由如下:

    1.做中学,让学习人工智能的梯度更加平滑

    个人认为适合中小学生学习人工智能的路径大概有三个阶段:

    人工智能学习三个阶段

    在软硬件门槛没有降低之前,阶段二和阶段三的顺序可能需要互换,这样的难度和跨度会让孩子们“然后没有了然后”。而“三剑客”的凑齐,则可以让孩子们尽早尝试用低门槛的人工智能软硬件解决学习、生活中的真实问题,这样更容易激发孩子们学习人工智能的兴趣,也让学习的梯度更加平滑,让更多的孩子找到内驱力。

    2.为现阶段涉及人工智能的科创活动提供具备可操作性的平台。

    在“三剑客”出现之前,教学和赛事中涉及的人工智能项目一般还需要联网实现,由此导致的教学、赛事组织的复杂性,以及由于响应延时导致的较差的体验感,是相关教学和活动开展的瓶颈。现在,图像识别、语音合成、语音识别三个人工智能重要方向的离线实现,足够组成一个适合孩子们的更具备可操作性的学习与活动平台啦。

    文章来源"DF创客社区", 作者: digi_cow

    展开全文

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 44,656
精华内容 17,862
关键字:

语音识别模块

友情链接: mnf.rar