精华内容
下载资源
问答
  • 人工智能识别技术发展及其运用.pdf
  • DAO KE ER WANG LUO KE JI YOU XIAN GONG SI 为美好的明天加油 少年强则国强第 PAGE 1 少年强则国强 第 PAGE 1 页 共 NUMPAGES 1 页 计算机人工智能识别技术应用思考 摘要:随着计算机人工智能技术的快速发展和普及...
  • 人工智能识别技术在T1期肺癌诊断中的临床应用研究.pdf
  • GitChat 作者:王晓明 医学影像与人工智能的结合,是数字医疗领域较新的分支和产业热点

    GitChat 作者:王晓明
    更多IT技术分享,尽在微信公众号:GitChat

    前言

    医学影像与人工智能的结合,是数字医疗领域较新的分支和产业热点。医学影像的解读需要长时间专业经验的积累,医生的培养周期相对较长,很多程度上,深度学习和医生的学习过程是一样的,通过海量知识的学习理解和应用,而人工智能在对图像的检测效率和精度两个方面,可以做得比专业医生更快。

    大数据与人工智能等前沿技术在医疗领域应用已经成为一种趋势,将大数据驱动的人工智能应用于癌症诊断中,无疑为患者僻出一线生机,不仅可以挽救无数患者的生命,而且对于缓解医疗资源和医患矛盾也有重大意义。

    一、医学影像的简要介绍

    医学影像是指为了医疗或医学研究,对人体或人体某部分,以非侵入方式取得内部组织影像的技术与处理过程。它包含以下两个相对独立的研究方向:医学成像系统(medical imaging system)和医学图像处理(medical image processing)。前者是指图像行成的过程,包括对成像机理、成像设备、成像系统分析等问题的研究;后者是指对已经获得的图像作进一步的处理,其目的是或者是使原来不够清晰的图像复原,或者是为了突出图像中的某些特征信息,或者是对图像做模式分类等等。

    现代医学影像学的高速发展,医学影像技术已经由传统单一普通X线加血管造影检查形成包括UI、CT、CR、DR、MRI、PET、PET-CT、数字减影血管造影以及PACS等多种技术组成的医学影像学体系。影像成像技术的不断丰富使医学影像从“辅助检查手段”变为现代医学最重要的临床诊断和鉴别诊断方法。接下来医学影像将向三个方向发展:(1)由单一形态学影像检查设备向“形态+功能”的融合型影像发展;(2)由大型设备转向小型、简便的床边化仪器,未来将越来越多地投入应用到重症监护、家庭医疗、预防保健等领域;(3)现代医学影像技术与放射治疗手段结合,使诊断与治疗一体化。我们认为,更先进和便利的影像诊断设备将使临床诊疗将更加依赖于影像检查,带来影像需求增多,循环促进影像设备领域的发展。

    大数据人工智能分析技术使得医学影像诊断软硬件变得更智能化。用深度学习技术分析医学影像和视频是一个新的研究方向。通过已训练好的卷积神经网络,能很快地搭建并训练自己的深度学习系统。

    二、用 Python 进行图像处理的基础

    用于图像处理的库有很多,其中 OpenCV(Open computer vision) 比较主流,基于C/C++,支持Linux/Windows/MacOS/Android/iOS,并提供了Python,Matlab和Java等语言的接口,因为其丰富的接口,优秀的性能和商业友好的使用许可,不管是学术界还是业界中都非常受欢迎。作为当前非常流行的动态语言之一,Python不仅使用非常简单,而且功能强大。通过Python来学习OpenCV框架,可以让你很快理解计算机视觉的基本概念以及重要算法。

    安装时,既可以用 pip install opencv-python,也可以从 opencv.org 下载源码。本文简单介绍pip安装的方式。

    pip install --upgrade setuptools
    
    pip install numpy Matplotlib
    
    pip install opencv-python
    

    enter image description here
    图2-1 加载胃部病历切片的Python代码示例

    三、用于图像识别的神经网络

    1943年,心理学家W.S.McCulloch和数理逻辑学家W.Pitts建立了神经网络和数学模型,称为MP模型。他们通过MP模型提出了神经元的形式化数学描述和网络结构方法,证明了单个神经元能执行逻辑功能,从而开创了人工神经网络研究的时代。

    卷积神经网络是对人工神经网络的进一步改进,是一种专门为了识别二维图像而设 计的一种能够自动提取图像特征的特殊的多层感知器。原始图像不需要太多的预处理就 可以较好的学习到图像的不变性特征。目前,典型的卷积神经网络是一个多层的、可训练的体系结构。包括输入、卷积层(局部连接层)、抽样层、归一化层、全连接层、逻辑回归层和输出层等等。如何提高卷积神经网络对图像的识别效果,需要识别的数据集 如何找到最合适的网络结构和参数配置,以及对于不同的数据集都具有一定兼容性的网络结构成为现在研究的热点。

    典型的卷积神经网络的概念模型如图 3-1 所示。每一层是由多个二维平面组成。网络中包括卷积层和池化层,分别表示为 C 层和 S 层。网络中间还包含着一些隐藏层,它们在全连接层。在网络体系结构中,输入层只有一个,它直接接收二维对象,对于样本的特征提取过程是嵌套在卷积和池化过程中。在全连接层内包含多个隐含层,主要实现分类的过程。

    enter image description here
    图3-1 卷积神经网络通用模型

    图3-2中显示了卷积层神经网络结构中最重要的部分,这个部分被称之为过滤器(filter)或者内核(kernel)。因为TensorFlow文档中将这个结构称之为过滤器(filter),所以我们将统称这个结构为过滤器。如图4所示,过滤器可以将当前层神经网络上的一个子节点矩阵转化为下一层神经网络上的一个单位节点矩阵。单位节点矩阵指的是一个长和宽都为1,但深度不限的节点矩阵。

    enter image description here
    图3-2 卷积层过滤器(filter)结构示意图

    在一个卷积层中,过滤器所处理的节点矩阵的长和宽都是由人工指定的,这个节点矩阵的尺寸也被称之为过滤器的尺寸。常用的过滤器尺寸有3×3或5×5。因为过滤器处理的矩阵深度和当前层神经网络节点矩阵的深度是一致的,所以虽然节点矩阵是三维的,但过滤器的尺寸只需要指定两个维度。过滤器中另外一个需要人工指定的设置是处理得到的单位节点矩阵的深度,这个设置称为过滤器的深度。注意过滤器的尺寸指的是一个过滤器输入节点矩阵的大小,而深度指的是输出单位节点矩阵的深度。如图3-2所示,左侧小矩阵的尺寸为过滤器的尺寸,而右侧单位矩阵的深度为过滤器的深度。

    TensorFlow对卷积神经网络提供了非常好的支持,下面的程序实现了一个卷积层的前向传播过程。从以下代码可以看出,通过TensorFlow实现卷积层是非常方便的。

        # 通过tf.get_variable的方式创建过滤器的权重变量和偏置项变量。上面介绍了卷积层
        # 的参数个数只和过滤器的尺寸、深度以及当前层节点矩阵的深度有关,所以这里声明的参数变
        # 量是一个四维矩阵,前面两个维度代表了过滤器的尺寸,第三个维度表示当前层的深度,第四
        # 个维度表示过滤器的深度。
        filter_weight = tf.get_variable(
            'weights', [5, 5, 3, 16], 
            initializer=tf.truncated_normal_initializer(stddev=0.1))
        # 和卷积层的权重类似,当前层矩阵上不同位置的偏置项也是共享的,所以总共有下一层深度个不
        # 同的偏置项。本样例代码中16为过滤器的深度,也是神经网络中下一层节点矩阵的深度。
        biases = tf.get_variable(
            'biases', [16], initializer=tf.constant_initializer(0.1))
    
        # tf.nn.conv2d提供了一个非常方便的函数来实现卷积层前向传播的算法。这个函数的第一个输
        # 入为当前层的节点矩阵。注意这个矩阵是一个四维矩阵,后面三个维度对应一个节点矩阵,第一
        # 维对应一个输入batch。比如在输入层,input[0,:,:,:]表示第一张图片,input[1,:,:,:] 
        # 表示第二张图片,以此类推。tf.nn.conv2d第二个参数提供了卷积层的权重,第三个参数为不
        # 同维度上的步长。虽然第三个参数提供的是一个长度为4的数组,但是第一维和最后一维的数字
        # 要求一定是1。这是因为卷积层的步长只对矩阵的长和宽有效。最后一个参数是填充(padding)
        # 的方法,TensorFlow中提供SAME或是VALID两种选择。其中SAME表示添加全0填充,
        # “VALID”表示不添加。
        conv = tf.nn.conv2d(
            input, filter_weight, strides=[1, 1, 1, 1], padding='SAME')
    
        # tf.nn.bias_add提供了一个方便的函数给每一个节点加上偏置项。注意这里不能直接使用加
        # 法,因为矩阵上不同位置上的节点都需要加上同样的偏置项。虽然下一层神经网络的大小为
        # 2×2,但是偏置项只有一个数(因为深度为1),而2×2矩阵中的每一个值都需要加上这个
        # 偏置项。
        bias = tf.nn.bias_add(conv, biases)
        # 将计算结果通过ReLU激活函数完成去线性化。
        actived_conv = tf.nn.relu(bias)

    在卷积神经网络中,卷积层之间往往会加上一个池化层(pooling layer)。池化层可以非常有效地缩小矩阵的尺寸,从而减少最后全连接层中的参数。使用池化层既可以加快计算速度也有防止过拟合问题的作用。和卷积层类似,池化层前向传播的过程也是通过移动一个类似过滤器的结构完成的。不过池化层过滤器中的计算不是节点的加权和,而是采用更加简单的最大值或者平均值运算。使用最大值操作的池化层被称之为最大池化层(max pooling),这是被使用得最多的池化层结构。使用平均值操作的池化层被称之为平均池化层(average pooling)。

        # tf.nn. max_pool实现了最大池化层的前向传播过程,它的参数和tf.nn.conv2d函数类似。
        # ksize提供了过滤器的尺寸,strides提供了步长信息,padding提供了是否使用全0填充。
        pool = tf.nn.max_pool(actived_conv, ksize=[1, 3, 3, 1], 
                                  strides=[1, 2, 2, 1], padding='SAME')

    我们通过一个图像分类问题介绍卷积神经网络是如何工作的。下面是卷积神经网络判断一个图片是否包含“儿童”的过程,包括四个步骤:图像输入(InputImage)→卷积(Convolution)→最大池化(MaxPooling)→全连接神经网络(Fully-ConnectedNeural Network)计算。

    enter image description here
    图3-3 神经网络判断一个图片是否包含“儿童”的过程

    首先将图片分割成如下图的重叠的独立小块。接下来将每一个独立小块输入小的神经网络;这个小的神经网络已经被训练用来判断一个图片是否属于“儿童”类别,它输出的是一个特征数组。 标准的数码相机有红、绿、蓝三个通道(Channels),每一种颜色的像素值在0-255之间,构成三个堆叠的二维矩阵;灰度图像则只有一个通道,可以用一个二维矩阵来表示。

    将所有的独立小块输入小的神经网络后,再将每一个输出的特征数组按照第一步时77个独立小块的相对位置做排布,得到一个新数组。

    第二步中,这个小的神经网络对这77张大小相同的小图片都进行同样的计算,也称权重共享(SharedWeights)。这样做是因为,第一,对图像等数组数据来说,局部数组的值经常是高度相关的,可以形成容易被探测到的独特的局部特征;第二,图像和其它信号的局部统计特征与其位置是不太相关的,如果特征图能在图片的一个部分出现,也能出现在任何地方。所以不同位置的单元共享同样的权重,并在数组的不同部分探测相同的模式。数学上,这种由一个特征图执行的过滤操作是一个离散的卷积,卷积神经网络由此得名。

    卷积步骤完成后,再使用MaxPooling算法来缩减像素采样数组,按照2×2来分割特征矩阵,分出的每一个网格中只保留最大值数组,丢弃其它数组,得到最大池化数组(Max-PooledArray)。 接下来将最大池化数组作为另一个神经网络的输入,这个全连接神经网络会最终计算出此图是否符合预期的判断。

    在实际应用时,卷积、最大池化和全连接神经网络计算,这几步中的每一步都可以多次重复进行,总思路是将大图片不断压缩,直到输出单一的值。使用更多卷积步骤,神经网络就可以处理和学习更多的特征。

    四、胃癌病理切片的识别

    在医学影像领域,病理图片向来是医疗领域的“金标准”,病理诊断是对疾病下最终判断的环节。人工读片会有:主观性高、重复性低、定量及信息利用度不足、耗时及劳动强度和知识经验的传承困难等问题。而人工智能病理切片识别系统的优势在于能自动分析、分割、检测感兴趣区域、能够定量地评估病变区域的变异程度,结果具有可重复性。

    enter image description here
    图4-1 胃癌病理切片

    图4-1被橙色曲线所标注的区域是为此图中可见的部分癌巢(细胞发生癌变的区域);癌巢与正常区域看起来十分不同,几个蓝色方框选取的区域即是正常区域的示例。这些不同主要是由于癌细胞的形态学特征和相互间的排列分布,与正常区域的细胞截然不同而造成的。

    胃癌病理切片识别的目标是利于深度卷积神经网络技术,使计算机能够自动地将胃癌数字组织病理切片的局部视野中的癌巢快速精准地标识出来。

    选取胃癌病理切片,为常规HE染色,放大倍数20×,图片大小为2048×2048像素,tiff 格式。选取200个病人案例(80%癌症、20%非癌症),共计2000张病理切片图片,训练集数量1500张,测试集数量500张。

    数据标注:

    病理专家将数据标记(双盲评估+验证)为有无癌症,并用线条画出肿瘤区域轮廓,提供知识图谱说明。

    关于胃癌病理切片AI识别其实是2017中国大数据人工智能创新创业大赛的一个赛题。大赛官网:http://www.datadreams.org/race-race-3.html 我是2016年上海BOT大赛聊天机器人的参赛者,这里算是免费给他们打个广告,有兴趣的同学可以找我组团打比赛。

    五、AI 技术在医疗领域的前景分析

    人工智能的最大特点就是高效的计算和精准的分析与决策,这一点刚好击中现在的医疗痛点,或能从根本上解决医疗资源供不应求的局面。医学影像的识别是人工智能切入医疗行业的一个切入点,因为病理科,放射科医生读片是医疗领域的一个明显的痛点。未来医疗一定是向精准个性化医疗的方向发展,但是发展路途上也有很多障碍,比如电子病历数据分散在各家医院,数据的收集整理工作是一个漫长而艰难的任务。分析病历文本的NLP技术目前也不是很成熟,在构建医疗知识图谱的过程中,需要大量专业医生的参与等等。人工智能+医疗,一定是需要人工智能人才+医生通力合作才能研发出适合医生的智能辅助诊断系统。


    实录:《王晓明:肿瘤医疗影像 AI 识别技术实战解析》


    这里写图片描述

    展开全文
  • 医学影像与人工智能的结合,是数字医疗领域较新的分支和产业热点。...大数据与人工智能等前沿技术在医疗领域应用已经成为一种趋势,将大数据驱动的人工智能应用于癌症诊断中,无疑为患者僻出一线生机,不仅可...

    医学影像与人工智能的结合,是数字医疗领域较新的分支和产业热点。医学影像的解读需要长时间专业经验的积累,医生的培养周期相对较长,很多程度上,深度学习和医生的学习过程是一样的,通过海量知识的学习理解和应用,而人工智能在对图像的检测效率和精度两个方面,可以做得比专业医生更快。

    大数据与人工智能等前沿技术在医疗领域应用已经成为一种趋势,将大数据驱动的人工智能应用于癌症诊断中,无疑为患者僻出一线生机,不仅可以挽救无数患者的生命,而且对于缓解医疗资源和医患矛盾也有重大意义。本场 Chat 主要包含以下内容:

    1. 医疗影像的简要介绍
    2. 用 Python 进行图像处理的基础
    3. 用于图像识别的神经网络
    4. 胃癌病理切片的识别
    5. AI 技术在医疗领域的前景分析

    阅读全文: http://gitbook.cn/gitchat/activity/597072921fa32c5d9e839d7c

    您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。

    FtooAtPSkEJwnW-9xkCLqSTRpBKX

    展开全文
  • 人工智能 语音识别技术
  • 人脸识别 | Java 实现 AI人工智能技术 - 人脸识别 -拉入及用 spring boot项目 前端+后端
  • 人工智能AI技术在保护压板状态识别的应用.pdf
  • E主要内容 1重指纹识别技术简介 指纹识别技术的基本原理 3基于 Beagle Board-xm的指纹提取识别小软件 s 指纹识别技术简介 1.1.什么是指纹识别 1.2指纹识别技术的优势 1.3指纹识别技术当前应用状况 E11么是指纹识别 ...
  • 人工智能Ai-刷脸技术实战课程 打造人工神经网络实战 人脸识别与一键美颜技术实战
  • 人工智能 语音识别技术 1 2 什么是语音识别技术 ? 与机器进行语音交流让机器明白你说什么这是 人们长期以来梦寐以求的事情语音识别技术就是让 机器通过识别和理解过程把语音信号转变为相应的文 本或命令的高技术语音...
  • 模式识别技术人工智能的基础技术,21世纪是智能化、信息化、计算化、网络化的世纪,在这个以数字计算为特征的世纪里,作为人工智能技术基础学科的模式识别技术,必将获得巨大的发展空间。在国际上,各大权威研究...

    模式识别技术是人工智能的基础技术,21世纪是智能化、信息化、计算化、网络化的世纪,在这个以数字计算为特征的世纪里,作为人工智能技术基础学科的模式识别技术,必将获得巨大的发展空间。在国际上,各大权威研究机构,各大公司都纷纷开始将模式识别技术作为公司的战略研发重点加以重视。

    1、语音识别技术

    语音识别技术正逐步成为信息技术中人机接口的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。中国互联网中心的市场预测:未来5年,中文语音技术领域将会有超过400亿人民币的市场容量,然后每年以超过30%的速度增长。

    2、生物认证技术

    生物认证技术本世纪最受关注的安全认证技术,它的发展是大势所趋。人们愿意忘掉所有的密码、扔掉所有的磁卡,凭借自身的唯一性来标识身份与保密。国际数据集团(IDC)预测:作为未来的必然发展方向的移动电子商务基础核心技术的生物识别技术在未来10年的时间里将达到100亿美元的市场规模。

    3、数字水印技术

    90年代以来才在国际上开始发展起来的数字水印技术是最具发展潜力与优势的数字媒体版权保护技术。IDC预测,数字水印技术在未来的5年内全球市场容量超过80亿美元。

    模式识别从20世纪20年代发展至今,人们的一种普遍看法是不存在对所有模式识别问题都适用的单一模型和解决识别问题的单一技术,我们现在拥有的只是一个工具袋,所要做的是结合具体问题把统计的和句法的识别结合起来,把统计模式识别或句法模式识别与人工智能中的启发式搜索结合起来,把统计模式识别或句法模式识别与支持向量机的机器学习结合起来,把人工神经元网络与各种已有技术以及人工智能中的专家系统、不确定推理方法结合起来,深入掌握各种工具的效能和应有的可能性,互相取长补短,开创模式识别应用的新局面。

    对于识别二维模式的能力,存在各种理论解释。模板说认为,我们所知的每一个模式,在长时记忆中都有一个相应的模板或微缩副本。模式识别就是与视觉刺激最合适的模板进行匹配。特征说认为,视觉刺激由各种特征组成,模式识别是比较呈现刺激的特征和储存在长时记忆中的模式特征。特征说解释了模式识别中的一些自下而上过程,但它不强调基于环境的信息和期待的自上而下加工。基于结构描述的理论可能比模板说或特征说更为合适。
    人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
    干货:深度学习 vs 机器学习 vs 模式识别三种技术对比
    http://www.duozhishidai.com/article-15119-1.html
    计算机视觉与图像处理、模式识别和机器学习,之间有什么关系?
    http://www.duozhishidai.com/article-4119-1.html
    模式识别具体是怎么定义的,主要研究方向是什么?
    http://www.duozhishidai.com/article-1697-1.html


    多智时代-人工智能大数据学习入门网站|人工智能、大数据、物联网云计算的学习交流网站

    多智时代-人工智能大数据学习入门网站|人工智能、大数据、云计算、物联网的学习服务的好平台
    展开全文
  • 本课程是针对腾讯人工智能云平台的人脸识别技术的应用开发的项目实战视频课程,主要有人脸拍照,头像上传,人脸登录,新增个体,删除个体,新增人脸,删除人脸,自动抓拍,自动识别等功能,系统采用jsp,ajax,mysql...
  • 人工智能语音识别技术在铁路系统应用.pdf
  • 随着计算机人工智能技术的不断发展, 基于人工智能的各种应用层出不穷, 其中图像识别技术便是生活中应用最为广泛的一种。图 像识别是指利用计算机系统来完成图像匹配识别, 从而适配各种应用的技术,与人类识别...
  • 如果下载不能使用请评论您的联系方式~我会在第一时间联系您的~~~人脸识别 | Java 实现 AI人工智能技术 - 人脸识别 -拉入及用 spring boot项目 前端+后端
  • 基于人工智能的图像识别技术分析.pdf
  • 随着计算机技术的不断发展, 人工智能开始应用在人类社会生活的方方面面。...本文将介绍人工智能中人脸识别技术的概念, 起源发展, 研究历程和实际应用。同时对于人脸识别的未来发展提 出了一些看法。
  • 人工智能】语音识别技术

    千次阅读 2019-04-22 11:36:22
    了解关于语音识别技术的内容:人工智能智能语音交互技术与应用 (课程主要讲解人工智能 智能语音相关技术,包括语音识别、人机交互、语音合成等) 语音识别技术,也被称为自动语音识别Automatic Speech ...

    了解关于语音识别技术的内容:
    人工智能智能语音交互技术与应用

    (课程主要讲解人工智能 智能语音相关技术,包括语音识别、人机交互、语音合成等)

    语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。

    简介:

    语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。

    语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

    历史:

    早在计算机发明之前,自动语音识别的设想就已经被提上了议事日程,早期的声码器可被视作语音识别及合成的雏形。而1920年代生产的"Radio Rex"玩具狗可能是最早的语音识别器,当这只狗的名字被呼唤的时候,它能够从底座上弹出来。最早的基于电子计算机的语音识别系统是由AT&T贝尔实验室开发的Audrey语音识别系统,它能够识别10个英文数字。其识别方法是跟踪语音中的共振峰。该系统得到了98%的正确率。到1950年代末,伦敦学院(College of London)的Denes已经将语法概率加入语音识别中。

    1960年代,人工神经网络被引入了语音识别。这一时代的两大突破是线性预测编码Linear Predictive Coding (LPC), 及动态时间规整Dynamic Time Warp技术。

    语音识别技术的最重大突破是隐马尔科夫模型Hidden Markov Model的应用。从Baum提出相关数学推理,经过Labiner等人的研究,卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx。。此后严格来说语音识别技术并没有脱离HMM框架。
    尽管多年来研究人员一直尝试将“听写机”推广,语音识别技术在目前还无法支持无限领域,无限说话人的听写机应用。

    原理:

    语音识别系统提示客户在新的场合使用新的口令密码,这样使用者不需要记住固定的口令,系统也不会被录音欺骗。文本相关的声音识别方法可以分为动态时间伸缩或隐马尔可夫模型方法。文本无关声音识别已经被研究很长时间了,不一致环境造成的性能下降是应用中的一个很大的障碍。

    其工作原理:

    动态时间伸缩方法使用瞬间的、变动倒频。1963年Bogert et al出版了《回声的时序倒频分析》。通过交换字母顺序,他们用一个含义广泛的词汇定义了一个新的信号处理技术,倒频谱的计算通常使用快速傅立叶变换。
    从1975年起,隐马尔可夫模型变得很流行。运用隐马尔可夫模型的方法,频谱特征的统计变差得以测量。文本无关语音识别方法的例子有平均频谱法、矢量量化法和多变量自回归法。
    平均频谱法使用有利的倒频距离,语音频谱中的音位影响被平均频谱去除。使用矢量量化法,语者的一套短期训练的特征向量可以直接用来描绘语者的本质特征。但是,当训练向量的数量很大时,这种直接的描绘是不切实际的,因为存储和计算的量变得离奇的大。所以尝试用矢量量化法去寻找有效的方法来压缩训练数据。Montacie et al在倒频向量的时序中应用多变量自回归模式来确定语者特征,取得了很好的效果。
    想骗过语音识别系统要有高质量的录音机,那不是很容易买到的。一般的录音机不能记录声音的完整频谱,录音系统的质量损失也必须是非常低的。对于大多数的语音识别系统,模仿的声音都不会成功。用语音识别来辨认身份是非常复杂的,所以语音识别系统会结合个人身份号码识别或芯片卡。
    语音识别系统得益于廉价的硬件设备,大多数的计算机都有声卡和麦克风,也很容易使用。但语音识别还是有一些缺点的。语音随时间而变化,所以必须使用生物识别模板。语音也会由于伤风、嗓音沙哑、情绪压力或是青春期而变化。语音识别系统比指纹识别系统有着较高的误识率,因为人们的声音不像指纹那样独特和唯一。对快速傅立叶变换计算来说,系统需要协同处理器和比指纹系统更多的效能。目前语音识别系统不适合移动应用或以电池为电源的系统。

    更多精品课程:

    阿里云大学官网(阿里云大学 - 官方网站,云生态下的创新人才工场

    展开全文
  • 在其迅猛发展的背景下,也遇到了亟待解决的技术问题,主要是因为计算机还未能实现全智能化的技术控制,这为人工智能领域识别技术的创新和发展造成了一定制约。在人工智能领域发展识别技术,要想真正实现全智能化操作...
  • 人工智能 语音识别技术;什么是语音识别技术;两款语音机器人;语音识别的实现1;语音识别的实现2;语音识别的实现3;语音识别的实现4;语音识别的实现5;语音识别的实现6;语音识别的实现7;语音识别的实现8;12;声学模型;传统...
  • I-DO-讨论人工智能中的图像识别技术. I-DO-讨论人工智能中的图像识别技术
  • 根据用户上传的包含身份证正反面照片,识别并且获取证件姓名、性别、民族、出生日期、地址、身份证号、证件有效期、发证机关等详细的身份证信息,并且可以返回精确剪裁对齐后的身份证正反面图片。 2. 请求参数 ...
  • 本文围绕这一课题领域,重点研究了输电线路本体装置及通道巡视对象基于人工智能图像识别技术的隐患排查与故障定位技术,并结合先验知识提出输电线路立体巡视模式,以应用模式研究为基础,设计研发了一套输电线路影像数据...
  • 一种基于人工智能技术的围棋盘面识别方法 用于摄像头识别围棋棋盘
  • 1. 语音识别技术的重要性 各种终端设备的智能化和集成化程度越来越高,传统的信息检索和菜单操作方式已经越来越无法满足需求。迫切需要一种更加便捷的信息检索和命令方式来替代传统的按键操作。 语音识别技术的基本...
  • 变电站人工智能图像识别技术研 究与应用 韩睿 国网浙江省电力有限公司电力科学研究院 2019年11月21 日 目 录 目C o n t e n t s 录 01 背景及需求 02 技术框架及关键技术 03 问题及展望 背景及需求 随着大电网建设的...
  • 本课程是针对腾讯人工智能云平台的身份证识别技术的应用,开发的项目实战视频课程,主要有身份证正反面拍照识别,上传图片识别,网页调用摄像头等功能,系统采用jsp,ajax,myBatis,mysql数据...
  • 本课程是针对腾讯人工智能云平台的人脸识别技术的应用,开发的项目实战视频课程,主要有人脸拍照,头像上传,人脸登录,新增个体,删除个体,新增人脸,删除人脸,自动抓拍,自动识别等功能,系统采用jsp,ajax,...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 171,862
精华内容 68,744
关键字:

人工智能识别技术