精华内容
下载资源
问答
  • 讯飞离线语音命令识别测试, 做的DEMO测试, 想交流的可以联系我。
  • 在ubuntu下使用adb 命令识别Android设备需配置adb_usb.ini文件 文件路径: ~/.android/ ,若不存在创建该文件。 adb_usb.ini 在文件里面输入插入设备id信息,如下面1368就是设备的id。 获取设备id方法:输入lsusb命令...

    ubuntu 使用adb shell命令配置

    在ubuntu下使用adb 命令识别Android设备需配置adb_usb.ini 文件

    文件路径:  ~/.android/ ,若不存在创建该文件。

    adb_usb.ini 在文件里面输入插入设备id信息,如下面1368就是设备的id。

    获取设备id方法:输入lsusb命令

    root@android:~/.android$ lsusb

    Bus 001 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub

    Bus 002 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub

    Bus 002 Device 025: ID 1368:5d04 *** Inc.

    。。。。。

    这个1368就是我连接的手机设备id。


    接下来你可以用adb device 命令了

    root@android:~/.android$ adb devices

     



    本文转自Work Hard Work Smart博客园博客,原文链接:http://www.cnblogs.com/linlf03/p/3435773.html,如需转载请自行联系原作者

    展开全文
  • ROS 语音命令识别包 通过订阅话题,你可以轻易的扩展你的语音指令。语音识别是基于科大讯飞语音听写WebAPI来实现。 准备工作 注册科大讯飞开发者帐号 获取id 和key ip地址加入白名单 修改launch文件的id key和文件...

    ROS 语音命令识别包

    通过订阅话题,你可以轻易的扩展你的语音指令。语音识别是基于科大讯飞语音听写WebAPI来实现。

    准备工作

    • 注册科大讯飞开发者帐号
    • 获取id 和key
    • ip地址加入白名单
    • 修改launch文件的id key和文件存储路径
    • launch

    获取识别结果

    • /reg_result
      通过订阅这个话题,消息类型为std_msgs/String来获取识别结果。

    快来GitHub体验一下吧。

    https://github.com/Miaowaaaa/voice_command_ros

    欢迎Fork和Star.

    展开全文
  • htk 搭建语音命令识别工具包

    千次阅读 2014-04-29 14:03:25
    在这里,我们以一个常用命令(打开、关闭、开始、停止)的语音识别任务为例,介绍一下如何利用HTK快速地建立这样一个语音命令识别系统,让电脑识别出你所说的简单命令。当然,如果要想识别任何其它的词,原理及过程...

    摘要

    体验过百度语音产品的你一定能感受到语音交互的魅力。在这里,我们以一个常用命令(打开、关闭、开始、停止)的语音识别任务为例,介绍一下如何利用HTK快速地建立这样一个语音命令识别系统,让电脑识别出你所说的简单命令。当然,如果要想识别任何其它的词,原理及过程也完全相同。

     

    工具包介绍
    HTK的全称是”Hidden Markov Model Toolkit”,是英国剑桥大学工程学院开发的隐马尔可夫模型(后面简称为隐马模型)工具包,可以方便有效的建立及操作隐马模型。隐马模型在许多人工智能领域都有着成功的应用,比如语音识别,当前国际上主流的语音识别系统仍是基于隐马模型建立的。HTK的开发也主要是针对语音识别的应用及研究。

    HTK是一个开源工具包,可以在http://htk.eng.cam.ac.uk/进行免费下载,工具包中包含许许多多的模块及工具,都是用纯C代码写成的,基本都以H开头。其中也有非常详细的文档可供参考。

    建立语音训练数据
    首先我们需要录音以采集足够的语音数据,对于“打开、关闭、开始、停止”这四个命令都需要录一些相应的语音样本,同时也需要对录下的语音做一些简单的标注。录音和标注可以采用HTK工具包中的HSLab来完成。

    比如在命令行下运行“HSLab打开.sig”,然后点击“Rec”健开始录音,点击“Stop”键录音结束。这时就会在当前目录下生成一个名为“打开_0.sig”文件,再进行一次录音则生成“打开_1.sig”,以此类推。默认的录音采样率为16kHz,我们采用默认的设置就可以了。

    录音后需要对语音进行简单的标注,标注也是用HSLab工具,运行后按“Mark”键,选择需要标注的区域,按“Labelas”,输入标注的符号,然后回车确定即可。在本问的例子中,每个语音样本都是孤立的命令词,我们只需要标注出3个部分:起始静音部分(标记为sil),命令词语音部分(标记为命令词,如“打开”),结束静音部分(标记为sil)。标注完成,点击“Save”键保存,会生成一个后缀为“lab”的文件。

    特征提取
    语音识别系统并不直接在语音信号上进行识别,而是先要进行特征提取,包括分帧,加窗,求取频谱及倒谱,这样确保提取出的特征更加紧凑并尽可能多的保留语音内容的信息。

    HTK中负责提取特征的是HCopy工具,它将wav格式的语音文件转化为包含若干特征

    矢量的特征文件。具体命令如下:

    HCopy  –A  –D  –C  hcopy.conf  -S  hcopy.scp

    其中hcopy.conf是一个配置文件,用于对特征提取过程中的参数进行配置,如下所示: 

    hcopy.scp为待处理语音源文件与特征目标文件对的列表,格式如下:

     

    隐马模型结构定义

    在本文的例子中,有五个需要建模的声音单元:“打开”,“关闭”,“开始”,“停止”,“sil”。对于每一个声音单元都将采用一个对应的隐马模型来建模。需要确定的隐马模型结构参数包括:

      1.状态个数

      2.每个状态的输出函数形式

      3.状态间的跳转关系

    在本例中我们采用最常用的结构配置,如下所示:

     

    模型包括4个有输出的状态{S2,S3,S4,S5},第一个和最后一个状态{S1,S6}不产生输出,只是为了操作方便。每个状态的输出函数b采     用对角方差阵的混合高斯分布函数来描述。
    隐马模型训练

      1. 模型初始化

    在训练开始必须对模型参数进行初始化,初始化是会影响训练的收敛速度与准确性。HTK提供了两种初始化工具:HInit和HCompv.

        (1) 采用HInit初始化

       HInit -A -D -T 1 -S trainlist.txt -M model/hmm0 \

               -H model/proto/hmmfile -l label -L label_dir nameofhmm

      其中,nameofhmm是隐马模型的名称,如“开始”、“关闭”;hmmfile是一个描述隐马模型原型的文件,如拓扑结构,转移关系,特征维数等;model/hmm0为初始化生成的初始模型文件。

        (2) 采用HCompv初始化

       HCompv -A -D -T 1 -S trainlist.txt -M model/hmm0flat \

                    -H model/proto/hmmfile -f 0.01 nameofhmm

    2. 参数重估

    模型参数的估计采用HRest工具,调用该工具完成一轮参数的重新估计,具体命令行如下:

    HRest -A -D -T 1 -S trainlist.txt -M model/hmmi -H vFloors \

              -H model/hmmi-1/hmmfile -l label -L label.dir nameofhmm

    其中,trainlist.txt文件包含所有用于训练的mfcc特征文件列表,label_dir是存放标注文件(.lab)的目录,vFloors是由HCompv生成的最小方差值的文件。

    整个训练过程需要迭代多次,通常5-10轮次,每次迭代时,HRest程序可输出数据的似然值。

    识别任务语法及词典定义

    对于任意一个识别任务我们要定义该识别任务的语法,并生成待识别的网络,识别网络即包括所有可能识别的词或句子。在HTK中,支持用户写一个类似EBNF语法范式的文本文件,HParse工具可以自动对该文本文件进行解析,生成相应的识别网络文件。

    对于本文中的例子,描述其语法的文本文件“gram.txt”如下:

     

    其中,花括号表示允许0至多次出现,方括号表示0或1次出现。

    然后可通过HParse生成识别网络文件“net.slf”

    HParse -A -D -T 1 gram.txt net.slf

    生成的识别网络如下图所示:

     

    除了建立识别语法文件,还需要建立词典,词典是为了将最终识别的结果与隐马模型描述的单元名称建立对应关系,由于在本例中我们是直接以词为单元来建立模型,所以这里的词典就非常简单,词典“dict.txt”如下所示:

     

    识别及测试

    模型训练完成后就可以进行识别和测试了:

    1. 首先录入待识别的语音,如“input.sig”,利用HCopy将其转换为MFCC特征矢量文件input.mfcc(与训练时提取特征过程相同)。

    2. 识别是通过Viterbi算法在特征矢量上进行计算,与各个单词的隐马模型进行匹配。这一步是通过工具HVite进行的,具体命令行如下:
    HVite -A -D -T 1 -H hmmdef.mmf -i reco.mlf -w net.slf \

               dict.txt hmmlist.txt input.mfcc

      其中“reco.mlf”为输出识别结果的文件,其识别结果形式如下所示:

    识别及测试

    模型训练完成后就可以进行识别和测试了:

    1. 首先录入待识别的语音,如“input.sig”,利用HCopy将其转换为MFCC特征矢量文件input.mfcc(与训练时提取特征过程相同)。

    2. 识别是通过Viterbi算法在特征矢量上进行计算,与各个单词的隐马模型进行匹配。这一步是通过工具HVite进行的,具体命令行如下:
    HVite -A -D -T 1 -H hmmdef.mmf -i reco.mlf -w net.slf \

               dict.txt hmmlist.txt input.mfcc

      其中“reco.mlf”为输出识别结果的文件,其识别结果形式如下所示:

     

    3. 当然HTK也支持采用一种更自然的方式进行识别测试,即直接录音进行识别,具体命令行如下:

      HVite -A -D -T 1 -C directin.conf -g -H hmmsdef.mmf \

              -w net.slf  dict.txt hmmlist.txt  

      运行该命令后,命令行会出现“READY[1]>”,此时便可进行声音录入,按任意键结束录音,程序会进行识别并将结果显示在屏幕上,    然后出现“READY[2]>”进行下一次录音及识别。

      由于在这种识别方式里由程序自动进行特征提取,配置文件direction.conf中需包含录音音频格式及特征提取过程所需的各类参数,一个具体示例如下:

     

    展开全文
  • linux shell的命令识别

    2019-07-02 17:10:36
    ``` #!/bin/bash for file in "ls /tmp/*" do echo $file done ``` 这一段代码可以输出tmp下的文件名 ...可是这样就只会输出ls,想知道shell脚本是如何识别命令和普通字符 菜鸟一只
  • 堡垒机审计命令识别技术分析说明

    千次阅读 2016-07-07 14:24:36
    堡垒机审计命令识别技术分析说明   麒麟开源堡垒机除了录相,还需要做操作辨认,首要的操作辨认功用包括: ssh/telnet的操作指令辨认 ftp/sftp 的操作指令辨认 RDP/VNC/X11 的翻开窗口title辨认 RDP/VNC/X11 ...

    堡垒机审计命令识别技术分析说明

     

    麒麟开源堡垒机除了录相,还需要做操作辨认,首要的操作辨认功用包括:

    ssh/telnet的操作指令辨认

    ftp/sftp   的操作指令辨认

    RDP/VNC/X11 的翻开窗口title辨认

    RDP/VNC/X11 窗口中的文字辨认

    RDP  剪切版内容辨认

    RDP/VNC/X11  键盘记载

     

    关于一个只能录相的开源堡垒机,其可用性是十分差的,由于开源堡垒机的审计功用首要用于事后,假如发生了内部运维事情,而且时刻点难以确定,审计员有必要面对海量的日志进行辨认,由专人对每个会话自始至终看全部操作录相。而操作过程往往是一瞬间的事,比方几天的操作日志也许有上千个小时,可是呈现疑问的操作也许只在几秒钟,这时的劳动强度和单调程度是相当大的,一个人要从上千小时的录相中找到几秒种的有疑问的录相,难度之大能够想像。

     

    咱们也从前出过某电信后台数据库被人删除的疑问,那时咱们体系的RDP辨认功用还没有做,所以咱们派专人,接连看了七天的日志,最终才找到责任人。

    因而,一个开源堡垒机的好坏,不只是操作界面是不是漂亮、日志报表是不是通用,最主要的标准是剖析功用是不是好,假如一但剖析辨认做的到位,当呈现疑问时,能够大大减小审计人员的精确程度,直接找到责任人。

     

    麒麟开源堡垒机的操作辨认功用中,FTP/SFTP的指令操作开发是最简略的,由于指令本身在协议中有标,开发时只需解开FTP/SFTP的协议流,能够直接得到。

     

    telnet/ssh的指令辨认是较难的功能,由于TELNET/SSH关于指令在协议中是没有标示的,和在屏上其它回显相同,都是一个一个的字符,实践开发中,很通在实践回显中找到哪个是指令,哪个是回显,而键盘记载,只能对指令辨认有协助,并不能经过键盘记载来记载到指令,由于敲击键盘的时候,用户有也许在vi等行修正器中,这时操作的并不是指令而且一些文件修正,另外现在的linux bash中有许多快捷键,比方指令能够经过上翻找到,能够用TAB补齐,此外,运维人员在输入指令的时候,用退格去修正等也会形成指令辨认无法经过键盘记载来完成,TELNET/SSH的指令辨认,只能经过将键盘与回显相关的方法辨认,程序在判别用户键盘击打次序的同时,判别回显字符,当呈现回车的时候,将前面的所有键盘记载下来,而且在回显中进行一些判别,就能够精确的记载用户操作的指令,这种形式,代理程序还有必要判别的出用户是不是在vi等修正器形式中,麒麟开源开源堡垒机体系的telnet/ssh指令辨认开发周期大约为2个月,后期做了许多的修正,现在指令辨认率达到了99.9%

     

    RDP/X11/VNC的窗口title辨认和窗口内部文字辨认,能够说是一个业界的难题,由于RDP全部显示没有字符,完全是经过GDI函数绘出,因而,即便解开了RDP的流,也无法从流中得到任何文字 ,由于全部是GDI函数绘出的图形,麒麟开源开源堡垒机的RDP/X11/VNC窗口的辨认开发周期大约为4个月,现在现已能够辨认出窗口标题和内部操作文字。

    此外,RDP的键盘记载、剪切版记载也能够在协议中辨认,键盘记载对比键盘,解开RDP协议即可得到剪切版杂乱些,由于触及内部文字编码辨认。

    今后会在其它文章中详细描述这些辨认技能的原理。

    展开全文
  • 网址:使用深度学习进行语音命令识别 数据1G,付费校园网伤不起直接load吧。 load('commandNet.mat') 然后…进来一个空数组… 解决方法:原来需要先把这个示例程序再matlab中打开(什么原理?) 点击网页...
  • 本系统的目的是在廉价定点数字信号处理器(DSP)芯片上实现语音识别。在微机平台,一般采用隐含Markov模型(HMM)进行语音识别,该算法在识别阶段计算量较少,适应性强,但是需要大量的前期训练工作。由于DSP系统...
  • jupyter 命令识别失败

    2018-11-14 10:53:26
    在我重新安装anaconda之后在cmd的黑窗里打不开jupyter notebook了, 只能从anaconda的 prompt里运行。 目前还没找到原因。
  • Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而,HP不久便决定放弃OCR业务,Tesseract也从此尘封。 数年以后,HP意识到,与其将Tesseract束之高阁,...
  • 环境配置:  树莓派B+ , ubuntu 14.04, ROS, ... 通过vs1003的麦克风采集声音,然后将声音转码为讯飞要求的pcm格式,然后在树莓派中调用讯飞提供的在线命令识别API,完成语音识别功能. 碰到的问题:  
  • 在这里,我们以一个常用命令(打开、关闭、开始、停止)的语音识别任务为例,介绍一下如何利用HTK快速地建立这样一个语音命令识别系统,让电脑识别出你所说的简单命令。当然,如果要想识别任何其它的词,原理及过程...
  • 从百问网下载了dnw工具,放在Ubuntu下执行,报了错误bash: /usr/bin/dnw: 没有那个文件或目录。这个命令能够自动补全,也设置了可执行...运行命令sudo apt-get install ia32-libs,提示的信息如下:再次运行命令sudo a
  • 在官网下载离线SDK,找到官方提供的帮助文档,其中Development Manual.pdf是关于API说明,用于帮助你理解demo中代码,BNF Grammar Development Manual.pdf比较关键,帮助你定义自己的离线命令语法格式。 下面是...
  • 一些基本的Windows命令往往可以识别木马的蛛丝马迹,而且在保护网络安全上起到很大的作用。 利用以下命令可以识别木马,远离木马烦扰。 检测网络连接 如果你怀疑自己的计算机上被别人安装了木马,或者是中了病毒...
  • 通过ping命令识别服务器类型

    千次阅读 2010-02-03 10:16:00
    判断服务器用的什么系统还可以用一个简单的方法,就是你在dos下或虚拟dos下或在linux下输入ping命令 比如你要查百度的服务器就输入 ping www.baidu.com 你会看到如下的信息 Relay from 202.108.22.5 : bytes=32 time...
  • 开源堡垒机除了录相,还需要做操作辨认,首要的操作辨认功用包括: ssh/telnet的操作指令辨认 ftp/sftp 的操作指令辨认 RDP/VNC/X11 的翻开窗口title辨认 RDP/VNC/X11 窗口中的文字辨认 RDP 剪切版内容辨认 ...
  • 场景:使用本地构建语法,离线识别命令词。 修改文件AsrDemo.java mLocalGrammar 修改为你自己的语法 mAsr.setParameter(SpeechConstant.GRAMMAR_LIST, "语法名称"); demo里面使用的是无ui界面的命令识别,...
  • 隐马模型在许多人工智能领域都有着成功的应用,比如语音识别,当前国际上主流的语音识别系统仍是基于隐马模型建立的。HTK的开发也主要是针对语音识别的应用及研究。 HTK是一个开源工具包,可以在http
  • $ vi .bash_profile 加入如下几行: alias ll='ls -alFG' alias la='ls -AG' alias ls='ls -FGh' 最后source使其生效就好啦: $ source .bash_profile
  • 文件名称:DrClient(DrcomAndPPOE).zip 可以输入: root@ubuntu:/usr/local/lib# unzip DrClient\(DrcomAndPPOE\).zip  以“\“来代表
  • 命令识别

    2017-03-07 02:47:42
    科大讯飞离线命令识别Demo
  • 环境 视窗7(64) 的Python 2.7.3(32) PIP安装scrapyPYTHON - scrapy startproject命令命令不被识别我有路径设置C:\ Python27; C:\ Python27 \脚本安装所有的依赖库后(LXML,OpenSSL的,pywin32,扭曲,Zope的),我...
  • 识别Linux中的目录命令 识别常见的文件命令 pwd(当前工作目录)命令用于显示当前目录的完整路径名。 下面的命令演示了pwd命令的用法:$pwd cd命令将当前目录更改为指定的目录。 你也可以用。(双点)选项,用cd命令移动...
  • 语音命令识别

    千次阅读 2018-08-25 16:46:53
    语音命令识别的方案有:讯飞在线\离线语音命令识别,还有一个方案是基于TensorFlow的机器学习。后者不需要费用,但是需要训练(所谓训练不是像宠物一样,每个宠物都需要训练一遍,而一次训练生成模板后,所...
  • docker 命令无法识别

    千次阅读 2019-08-24 20:20:14
    安装完win10docker以后发现怎么敲命令都是无法识别, cmd “docker --version”,显示“不是内部或外部命令,也不是可运行的程序 或批处理文件”。 使用PowerShell更出现“无法将“docker”项识别为 cmdlet、函数...
  • 讯飞离线语音命令识别

    万次阅读 2017-12-28 17:58:50
    讯飞离线语音命令识别 1、注册并下载sdk 2、创建工程 3、权限 4、拷贝jar包 5、初始化引擎 6、功能代码 7、打赏1、注册并下载sdk讯飞官网地址:http://www.xfyun.cn/*选择立即开通并登录* 弹出对话框,选择创建...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 11,990
精华内容 4,796
关键字:

命令识别