精华内容
下载资源
问答
  • 语音识别模块

    2014-06-27 16:28:16
    语音识别芯片,
  • 具有识别深度的非特定人声语音识别模块,识别深度达32层(可以根据客户需求定制),在保证语音识别率的前提下,一次设置可以识别1600个短句,现有其他的语音识别模块一次设置只能识别几十个短句。
  • 来源:大比特商务网 作者:欧蕾伊随着...为了建立强大的语音识别系统与提升用户体验,上海雅创电子集团于近期发布语音识别模块新品。语音识别模块新品型号为TXVT4G6M-S v2.0,该模块支持本地语音应用,采用 ARM 系...

    来源:大比特商务网 作者:欧蕾伊

    随着语音识别技术在人工智能领域上不断被应用,社会各个角落随处可听到语音引导的声音。根据Research and Markets报告显示,到2023年,语音识别市场的价值将达到180亿美元。为了建立强大的语音识别系统与提升用户体验,上海雅创电子集团于近期发布语音识别模块新品。

    语音识别模块新品型号为TXVT4G6M-S v2.0,该模块支持本地语音应用,采用 ARM 系列 cortex-M4 处理器作为主控平台,软件算法采用东芝数字解决方案公司方案,利用词语触发语音识别算法可实现快速,准确的语音识别判断,并通过播放器实现语音反馈和通信接口应用交互。无需联网,5m以内识别率可达到95%。另外,语音识别指令支持自定义,能实现离线状态下的人机交互应用。

    70e957b12f1b1698646a2621167673df.png

    主要特征:

    1.模块尺寸: 44.2mmX26.4mmX6mm

    2.工作电压: DC3.3V~5.5V(推荐 DC5.0V)

    3.待机电流: 100mA@DC5.0V

    4.指令峰值电流:140mA@ DC5.0V

    5.喇叭功率4Ω2W

    6.支持 UART通讯接口

    7.支持客户自定义语音指令系统

    8.支持多层级指令系统

    50fa5154bcf495d9f5e860edc8386b90.png

    今次更新的模块具有3大亮点,第一,可自由设定词汇或命令词来启动终端设备;第二可对应中文、美式英语、日语三种语言;第三配置要求低、计算量小、识别速度快。主要应用于智能厨电、智能跑步机、智能家电、头盔等设备。

    值得一提的是,该模块提供语音触发功能部件(中间件)和触发命令辞典(辞典文件),并且可根据用户想要设定的单词来创建并提供辞典文件,只需在上层应用中合并中间件和辞典文件就可使用。

    92fbc351da4472624821bca98296d725.png

    本文为大比特资讯原创文章,如需转载请在文前注明来源

    展开全文
  • LD3320 语音识别模块 语音一体化带单片机、IO 语音模块,例程,模块介绍、应用提高 其他共享配套参考程序 语音识别技术论文资料 LD3320并行串行读写辅助明.pdf LD3320开发手册.pdf LD3320数据手册.pdf LD3320芯片...
  • 简介:WTK6900B02是深圳唯创知音电子有限公司研发、生产的高识别率可离线更换语音识别语句的语音识别模块,结合了WTK6900B02 V2.03-P1与WTK6900B02 V2.03-P2两个模块,共同使用实现了可更换词条的语音识别版本。...

    简介:

    WTK6900B02是深圳唯创知音电子有限公司研发、生产的高识别率可离线更换语音识别语句的语音识别模块,结合了WTK6900B02 V2.03-P1与WTK6900B02 V2.03-P2两个模块,共同使用实现了可更换词条的语音识别版本。另外语音识别芯片供用户选择,可点下方图片查看。

    ProductsStd_295.html   ProductsStd_295.html

    【应用案例视频】

    案例可点击文字进入演示视频地址:  语音识别台灯演示视频-博士狗

    特征与优势:

    --WTK6900B02 V2.03-P1模块特征

    ☆具有USB接口,可以通过PC机自由更换存储器内容

    ☆可连接Flash,SD卡,TF卡(目前使用Flash)

    ☆兼容WINXP、WIN7、WIN8系统

    --WTK6900B02 V2.03-P2模块特征

    ☆半米内识别率90%以上

    ☆识别方式:直接识别、按键识别、唤醒词识别

    ☆烧写特性:可多次重复烧写

    ☆非特定人语音识别

    ☆可以通过语音指令控制输出

    ☆可以通过单片机串口控制播放指定语音

    ☆工作电压:DC 1.8V-5.5V,使用3.3V识别率更佳

    ☆功耗:7MA(不带FLASH,喇叭,led),休眠为5UA

    ☆三种输出模式:串口输出、IO输出、喇叭播放

    ☆PWM输出可直接推动0.5W/8Ω或1W/8Ω扬声器

    ☆使用更换词条功能的时候必须外挂SPI Flash,存储词条以及播报语音

    ☆可以存储多组词条,但是同一时刻只能出现一组词条

    ☆语音支持32种语言,如中文、英语、粤语、日语等

    ☆与WTK6900B02 V2.03-P1一起使用可更换词条(词条必须由厂家提供)

    ☆能否开发功能:yes

    目前我司语音识别芯片/语音识别模块类产品可识别语种如下:

    Greek/English           希腊/English

    Hindi/English          欣迪语/English

    Hungarian               匈牙利语

    Italian                 意大利语

    Korean/English          韩语/English

    Norwegian               挪威语

    Polish                  波兰语

    Portugueese(BRA)        葡萄牙语()

    Portugueese(EU)         葡萄牙语(欧盟)

    Russian/English         俄语/English

    Slovak                  斯洛伐克语

    Spanish(EU)             西班牙语(欧盟)

    Spanish(SA)             西班牙语()

    Swedish                瑞典

    Thai/English            泰语/English

    Turkish                 土耳其语

    Ukrainian/English       乌克兰语/English

    Vletnamese              越南人

    Chinese(CHN)/English中文(大陆)/English

    Chinese(TWN)/English中文(台湾)/English

    English(Worldwide) 英语(全球范围)

    English(AU) 英语(通用)

    English(UK) 英语(英国)

    English(US) 英语

    English(EastAsia) 英语(东亚)

    Japanese/English        日语/English

    Arabic                  阿拉伯语

    Bahasa                  印度尼西亚语

    Cantoneese(HK)/English 粤语(香港)/English

    Czech                   捷克语

    Finnish                 芬兰语

    French                  法语

    German                 德语

    Greek/English           希腊语/English

    Hindi/English           欣迪语/English

    更多语种,敬请待续,或可直接咨询在线工程师。

    我司专注语音芯片行业近20载,目前已服务于超5000家企业,许多国内外知名大型企业指定的一级供应商,拥有研发、生产实力,软硬件实力兼具的高新技术企业,WT品牌风靡语音行业,高性价比以及高稳定性、高质量,是我们的根本,产品种类多,不管您是需求哪种,基本我们都可以提供,我们还提供免费烧录服务以及免费技术服务,支持语音方案定制开发,语音内容支持定制,欢迎您的垂询。

    ProductsStd_295.html

    应用举例

    ◆台灯类:床头灯,护眼灯,喂奶灯,LED灯具等等

    ◆多功能小家电:养生壶,电饭锅,晾衣架,加湿器,语音识别空气净化器、语音识别风扇等等

    ◆对讲机类

    ◆办公用品:排插等等

    ◆玩具类:故事机,鹦鹉学舌,闹钟等等

    ◆ 成人用品上声控应用,例如飞机杯等等;

    展开全文
  • LD3320语音识别模块

    2019-02-18 21:27:00
    LD3320语音识别模块相关代码及技术文档描述,配有原理图及PCB
  • freeswitch对接讯飞语音识别模块源码分享,从头开始编译
  • 大家好,我是阿乐,今天给大家讲解一下LD3320语音识别模块。先来看看模块实物,它是长这个样子的:LD3320语音识别模块实物我现在用来给大家做讲解的这个模块是已经集成了单片机在上面,这样子开发起来就更简单一些,...

    大家好,我是阿乐,今天给大家讲解一下LD3320语音识别模块。

    先来看看模块实物,它是长这个样子的:

    6ff628ae9b6c192a8565068d620eb7a7.png

    LD3320语音识别模块实物

    我现在用来给大家做讲解的这个模块是已经集成了单片机在上面,这样子开发起来就更简单一些,不用移植程序,直接在例程里改关键词,然后编译上传就可以了。

    在模块背后黑色大大那块就是单片机啦,它是STC11的单片机:

    c670fd6e5238728d2baa9af986692c99.png

    模块背面的STC单片机

    在模块正面,有个小小的很多脚的那个就是LD3320芯片了,就是图中红色圈圈中的那个:

    883853a09994f16b58fe1aa389f5ebde.png

    看看单芯片的样子:

    91ac67c165c6294d723f277322013690.png

    LD3320是一颗基于非特定人语音识别(SI-ASR:Speaker-Independent Automatic Speech Recognition)技术的语音识别芯片,或者说是语音声控芯片。

    在这里给大家讲讲什么是非特定人语音识别。通俗点讲就是不用针对指定发音人的识别技术,这种语音识别技术不分年龄、性别,只要发音人说的是相同的语言就可以识别。再说得简单点,就是说只要是拼音可以拼出的发音,都是可以输入芯片进行识别的。

    这个语音识别模块它不是智能的,不是说我们问它什么它就可以回答什么,它不像我们手机上的语音助手比如小爱或者Siri那样,能跟我们对答如流。这个模块能识别的内容,是需要我们提前设定好的,我们把要识别的关键词语列好,然后把这些关键词语以字符的形式传送到 LD3320 内部,这样才可以对用户说出的关键词语进行识别,而且在同一时刻,它最多是在50条关键词语中进行识别。

    这个模块虽然不是智能的,但是它开发起来简单呀,价格也不算贵,而且它可以在识别到关键词后直接从IO口输出高低电平,或者从串口打印出数据。这就很好玩啦,我们可以用它来控制各种家电,控制小车,用来传输命令等,还是非常有意思的。

    2115cfaf8643c986b6769c5e1e7013dd.png

    这个模块有三个工作模式:1、普通模式;2、口令模式;3、按键触发模式。不同的工作模式可以通过程序编程来实现。

    普通模式就是模块工作时,我们直接说话,模块直接识别。

    口令模式就是模块工作时,我们先要说出一个一级口令,比如“芝麻开门”,模块在识别到正确的一级口令后才进行下一级的识别。

    按键触发模式就是模块工作时,我们在进行语音识别之前,需要先按一下按键,接下来才能进行下一步的识别。

    这三个模式我觉得口令模式比较实用,接下来讲讲用口令模式去控制IO口高低电平的变化,进而去控制一个继电器的闭合与断开。

    看到下图中这个语音识别模块的图片,红色框框中的引脚就是我们可以用的IO,竖着那一排由下而上标着P10~P17有八个,横着那一排从左往右是P34、P33,P23~P27,P41,也有8个,这样我们可以用的IO口就有16个啦,这16个IO口可以用来控制继电器,LED,或者接单片机的IO口。

    f7c18500772ca0ebd3f5f5469f18c112.png

    上图中,最左边由下而上标着5V,GND,TX,RX的四个引脚就是用来给模块下载程序的地方,串口就在这里了。我们通过串口给其它模块或者单片机发数据也是从这里接。

    好,接下来我们就直接用这个P10引脚来控制继电器吧,这个模块输出的是3.3V的TTL电平,就算是用5V的继电器也不能直接控制,我们就给它加个三极管,然后再通过三极管来控制继电器。

    画出这个电路图如下图:

    d64968f08de1cd3000114824bd41f9c0.png

    电路中,语音识别模块的P10引脚出来直接接一个200Ω的电阻,电阻的另一头接到9013NPN三极管的基极,9013三极管发射极接地,接电源负极,集电极接1N4148二极管的正极和继电器的一个控制引脚,继电器的另一个控制引脚接到+5V电源。这样子当P10端口输出高电平时,三极管导通,继电器吸合;当P10端口输出低电平时,三极管截止,继电器断开。我们就可以通过继电器去控制各种家电了。在电路图中,我是让继电器控制一盏220V的灯。电路图中1N4148二极管和继电器并接,而且是将二极管的负极接到电源正极,二极管在这里起到续流的作用,可以保护三极管。

    如下图是我根据这个电路图焊好的继电器模块,顺便给这个语音识别模块做了个底座,只要把语音识别模块安到底座上,就可以通过底座给语音模块供电,也把P10口和继电器电路的控制端口接在一起了。

    16db92dec4eba99a143de787dbb0d198.png
    f2fe21a469e755815a818c6067d12328.png

    好,接下来就是程序编程了,示例程序很多看起来很复杂,如果只是做简单的开发,我们没必要把每个细节全部弄懂,我们只要知道修改识别关键词的地方在哪就得了。

    如下图,在左边工程栏里找到“LDChip.C”这个文件,双击打开:

    e23a53c982ccd176f59e0e4ca92b2261.png

    在 LDChip.C (下图中红色圈圈1)文件中下滑找到274行“uint8 LD_AsrAddFixed() ”这个函数,函数中,278,279这两行有两个数组,DATE_A 和DATE_B,后面跟着数字,这个DATE_A后面的数字表示的是关键词的个数,而DATE_B后面的数字表示的是这些关键词中最长一句的长度。我们将要添加三个关键词命令:“芝麻开门”,“打开继电器”,“关闭继电器”,所以DATE_A 后面跟着个3;而这三个命令的拼音中,包含空格,长度最长的是“guan bi ji dian qi”,有18个,所以DATE_B后面跟着18,如图中的红色圈圈2。

    再看到280~284行,这里边就是添加关键词拼音的地方啦,我们要在这里输入要识别的命令的拼音,比如一级口令是:“芝麻开门”,二级口令是:“打开继电器”,“关闭继电器” ,如图中的红色圈圈3。

    cdd9403792d4573362e094f0a361c4f6.png

    285~289的这个数组是识别码数组(上图中的红色圈圈4),所添加的识别码为预先定义好的宏定义常量值,同时必须和关键词一一对应。图中取每个关键词命令的拼音首字母大写,格式是“CODE_拼音首字母大写”。如“芝麻开门”就是“CODE_ZMKM”。

    好,接下来去定义识别码,这些东西我们要先定义才能使用,如下图,在左边工程栏(图中红色圈圈1)找到并双击打开LDChip.h 这个文件,下滑找到第40行,看到#define这一堆这里(图中红色圈圈2),这里就是添加和修改识别码的地方,我们可以根据自己的需要和喜好任意定义识别码和宏名,但必须和刚才前面所使用的识别码配对,否则会提示未定义错误。识别码后面的数字字母不用理它,如果增加识别的关键词的个数,按顺序往下增大就可以,如“0x03,0x04”等。

    5287a06a0a2f34d63e155f1879f8f14b.png

    好,最后们要修改处理函数,就是说当模块识别到我们的命令了,需要做什么,是从哪个IO口输出高电平还是低电平,这就是在处理函数这里实现了。如下图,在左边工程栏(图中红色圈圈1)找到并双击打开main.c函数,然后下滑找到 202行“void User_handle(uint8 dat)”这个函数(图中红色圈圈2),在这个函数中可以根据自己的使用情况在相对应的识别码后添加识别成功后的操作。

    a53d1337a936a3a1f786cfb8e173d10c.png

    上图中,红色方框3中框起来的就是当模块识别到“打开继电器”这个命令后执行的程序,令“PA1=1”,也就是让PA1输出一个高电平,而PA1在主程序前边已经定义好,PA1=P10,所以就是让P10引脚输出一个高电平,这时候三极管导通,继电器就会吸合。

    同理,红色方框4中框起来的就是当模块识别到“关闭继电器”这个命令后执行的程序,令“PA1=0”,也就是让PA1输出一个低电平,而PA1在主程序前边已经定义好,PA1=P10,所以就是让P10引脚输出一个低电平,这时候三极管截止,继电器就会断开。

    下图就是在主程序前边定义的PA1,“sbit PA1=P1^0”就是令P1^0=PA1,这样子PA1代表的就是P1^0端口。红色框框中的都是定义好的端口,我们后面用到这些时可以直接用,无需再去定义。

    60e49cd6c5eb3c7cbcb296e354bad3bf.png

    好,到这一步为止,就完成了整个程序的修改,接下来重建工程完成编译,生成HEX文件,再通过USB下载器把HEX文件下载到模块上就可以了。

    最后的效果演示大家看下面的视频吧,看视频比较直观。在视频中有整个制作过程的详细教程,大家可以根据视频教程来学习、制作。开发制作这个作品要求大家有一定的单片机编程基础,起码懂得安装编程软件,懂得软件的基本操作,懂得修改代码,懂得给51单片机下程序,就这几样,如果会这几样,做起来也不难。

    点击这里观看详细视频教程

    哈哈,最后祝大家制作成功,玩得愉快,更多精彩内容欢迎关注头条号:创客e工坊,下期见,拜拜~

    展开全文
  • 这次毕业设计,制作的是一款音响,里面需要用到语音识别模块,所以入手了这一款。 LD-V7配合STM32使用,因为我用的模块比较多,所以没有过多的USART串口可以使用。 因此,我打算利用这个模块上的IO口进行中间判断。 ...

    导言

    这次毕业设计,制作的是一款音响,里面需要用到语音识别模块,所以入手了这一款。
    LD-V7配合STM32使用,因为我用的模块比较多,所以没有过多的USART串口可以使用。
    因此,我打算利用这个模块上的IO口进行中间判断。
    在这里插入图片描述模块图片

    比如:

    我说:开灯
    语音模块就置P1.0为高电平。P1.0和stm32的一个引脚相连。
    当STM32检测到与P1.0相连引脚变为高电平,则控制LED灯打开。
    于此同时,我把TTS(文字转语音模块)与语音模块的串口相连,则语音模块打印的“开灯”会直接输给TTS模块,这样子TTS模块就会把开灯语音给播报出来。

    好处

    通过这一番处理,我就减少了两个USART的串口使用,还有因为这个语音模块(LD-V7)他的IO口有7个,所以用来做基本的语音控制是足够的。
    所以现在7个IO口我要用口令来控制他;

    例如

    口令:继电器开
    》》 P1.0高电平
    》》语音模块播报:继电器以打开
    》》STM32检测到引脚变高,直接输出高电平给继电器,打开继电器。

    实际操作

    当我用语音模块接单片机的5V电源发现语音模块总是会重启,应该是,这个5V 直接从usb口过来,没有经过处理,然后这个模块对于电源的要求有比较高,所以一受到干扰,他就重新启动。
    我开始用一个usb转ttl模块给他供电,发现正常。

    为了能统一在一块板上,我试了下有经过处理的3.3V,发现stm32的3.3v 也能驱动,而且不会有多大的问题,存在一个小问题就是,即使接在stm32的电源3.3V上,也没有单独用usb转ttl模块上的5V来的好,不过将就了, 后续会自己设置开发板进行改进。

    在这里插入图片描述

    模块使用

    这个模块使用非常简单,因为里面的语音识别是集成在芯片系统上了,所以你也看不到,也不需要进行设置。你只需要吧你的词条写进去,或者然后再把相应的输出写好就可以完成了。(果然是高集成的模块)
    这里有一下比较好的建议就是要有一些垃圾关键词,来避免识别错误。

    识别原理

    垃圾关键词的应用

    (自行粗略理解的,并不是什么计算!)
    就是你说一句话,然后模块用拼音去和你的发音做比较,在关键词中找出那些接近程度大于多少的(假定50%),然后再从一堆大于(50% )里面输出一个最接近的。
    这里就会造成一个问题:加入你只有一个关键词:睡觉
    然后你说了一句:睡了 他识别到睡所以有50% 以上的相似,但是他没有‘睡了’这个比他更接近的关键词,所以他就会输出睡觉的结果。这样子他就是错误了。如果你设置一些拟声词,有可能随随便便就触发了,所以最好吧拟声词设置为垃圾关键词,即,识别后不进行输出。
    ‘以上所有的资源大家搜索一下就可以找到,如果找不到可以私信我,我可以发给你们。*
    如果有其他的问题可以评论区指出,有问必答,知无不言。

    如果有用,不妨点个赞或者关注一下,消息第一时间通知!

    在这里插入图片描述

    展开全文
  • 基于STM32的嵌入式语音识别模块设计,摘要:介绍了一种以ARM为核心的嵌入式语音识别模块的设计与实现。模块的核心处理单元选用ST公司的基于ARMCortex-M3内核的32位处理器STM32F103C8T6。本模块以对话管理单元为中心,...
  • 什么叫语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将...语音识别模块是在一种基于嵌入式的语音识别技术的模块,主要包括语音识别芯片和一些其他的附属电路,能够方便的与主控...
  • 摘要:介绍了一种以ARM为核心的嵌入式语音识别模块的设计与实现。模块的核心处理单元选用ST公司的基于ARM Cortex-M3内核的32位处理器STM32F103C8T6。本模块以对话管理单元为中心,通过以LD3320芯片为核心的硬件单元...
  • 介绍了一种以ARM为核心的嵌入式语音识别模块的设计与实现。模块的核心处理单元选用ST公司的基于ARM Cortex-M3内核的32位处理器STM32F103C8T6。本模块以对话管理单元为中心,通过以LD3320芯片为核心的硬件单元实现...
  • 语音识别模块,离线的,不需要网络就可以直接识别语音的模块
  • 电子-语音识别模块原理图.pdf,单片机/嵌入式STM32-F0/F1/F2
  • 1.使用语音模块:LDV7 语音识别模块 模块参数: 型号:YS-LDV7 名称:一体化语音识别模块 规格:43*29.7MM 供电电压:5V (内部工作电压 3.3V) 待机电流:30MA 识别时电流:45MA IO 口输出:高电平为 3.3V 通信方式...
  • 春节前在DF商城看到上架两款新品,分别是离线语音识别模块、离线语音合成模块,它们和二哈识图一起组成了“人工智能三剑客”。其中语音识别模块有现货,语音合成模块接受预定。心痒痒想在春节尝鲜,看商城公告春节...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,123
精华内容 449
关键字:

语音识别模块