精华内容
下载资源
问答
  • 国际嵌入式系统创新论坛 嵌入式人工智能技术 技术开发及应用 华南理工大学 计算机科学与工程学院 毕盛 2019年3月21 日 13:39 嵌入式与人工智能技术 云服务 更低延时 可靠性高 物联网 安全合规 灵活部署 终端设备 ...
  • 文章分析了现有可以部署AI算法、深度学习算法模型的多个平台的基本情况,包括ARM、FPGA、K210、AI芯片
  • 嵌入式人工智能技术开发及应用.pdf
  • 嵌入式人工智能

    千次阅读 2019-07-12 09:30:55
    嵌入式 AI」这个概念在当下非常火。不过,它到底是什么?...在人工智能迅猛发展的当下,几乎每一家企业都在探索行业的切入点,试图在人工智能大潮中分一杯羹。 而在追寻 AI 商业化的道路上,人们逐...

    「嵌入式 AI」这个概念在当下非常火。不过,它到底是什么?更适合应用到哪些场景里?还有什么是它做不到的?我们应该来听听业内做这一行的专家们的意见。

    本文引用地址: http://www.21ic.com/news/computer/201711/743355.htm

    在人工智能迅猛发展的当下,几乎每一家企业都在探索行业的切入点,试图在人工智能大潮中分一杯羹。

    而在追寻 AI 商业化的道路上,人们逐渐发现,要实现技术的落地,不仅需要性能优越的算法模型以及可靠的硬件支持,还需要把 AI 技术和硬件环境进行有机结合,再应用到具体的实际场景中,进而满足用户的需求。

    而「嵌入式 AI」就是当前最热门的 AI 商业化途径之一。

    「通过观察市场我们发现,在 AI 领域主要有两拨人。一方是高大上的算法团队,一方则是以深圳老板为代表的实体出货商。有趣的是这两拨人是完全不沟通的,就像一帮人看爱奇艺,一帮人看快手一样。」Perceptln 公司联合创始人刘少山根据算法与硬件之间存在的壁垒,举了一个有意思的例子。

    Perceptln 于 2016 年成立于硅谷,旨在提供机器人整体软硬件解决方案。创始人刘少山先后就职于 LinkedIn、英特尔、微软研究院,曾担任百度无人车高级架构师,对于嵌入式 AI 有一些独到的见解。

    「我们做的就是把 AI 技术带给那些应用厂商,推动整个市场发展。」据刘少山介绍,Perceptln 已针对高、中、低端等不同场景的应用推出三条产品线,分别将 AI 技术嵌入到智能玩具、服务类机器人以及自动驾驶等应用中。

    事实上,嵌入式并非是一个新鲜或者「高大上」的概念。

    所谓嵌入式,就是指一种可被内置于设备或装置的专用计算机系统。通常来说,具有数字接口的设备都具有嵌入式系统,如手机、车载电脑、智能手表等等。

    而嵌入式 AI,则是一种让 AI 算法可以在终端设备上运行的技术概念。很简单,换句话说,它的作用就是能让音箱、手机、机器人等智能硬件在不联网的情况下实时完成环境感知、人机交互、决策控制等功能。

    而一位资深算法工程师告诉机器之能,通常来讲他把程序编完了扔给公司里的嵌入式工程师,后者再负责把它嵌入到板子里。其实传统做嵌入也是这个思路,两端都要考虑,俗称「两头堵」:

    「按照我的理解,那些专注做嵌入式 AI 的可能是在针对 AI 模型做一些优化或是板子的优化,让算法更高效地跑在板子上。」

    那么嵌入式 AI 到底能做到什么?与云端 AI 相比,更适合应用到哪些场景里?还有什么是它做不到的?我们来听听更多业内做这一行的专家们的意见:

    什么样的垂直场景更需要嵌入式 AI?

    众所周知,神经网络包括模型训练和推断两个过程。而一提训练,就必定会涉及海量的数据输入,计算规模也会根据场景复杂性的递增而变得愈加庞大。

    因此,受到计算资源的限制,嵌入式端很难实现模型训练的过程,也是我们下面要说的「几个挑战之一」。

    而在推断环节,云端推断和嵌入式推断,二者诉求不同,因此也在不同的应用场景能够发挥自己的优势:

    前者的好处是,能够承受高吞吐量并满足复杂计算对资源的要求,因此多用于深度学习模型和计算较复杂的情况;而后者,则更多的应用于对「实时处理」有更高要求的场景中。

    什么是「实时处理」?我们来举个最实际的例子。无人驾驶汽车需要实时监测周围环境,但是如果无人车突然进入隧道,或者进入某个连不了网的环境中呢?

    是的,驾驶场景复杂多变,并不能保证时刻都能有一个百分之百可用的网络。因此,嵌入式 AI 凭借其实时性优势及脱机运行的能力得以自动驾驶领域展现实力。

    国内自动驾驶卡车技术研发公司图森未来 COO 郝佳男就曾在接受机器之能采访时表示:「从理论上讲,在云端处理传感器信号并不可行,存在延迟和可用性问题。」

    因此,信号的本地处理也是整个自动驾驶领域的一大诉求,因为设备端采集到数据后上传到计算完成返回终端的过程会不可避免地带来一定的延时,驾驶的危险系数也随之提升。

    而中科创达副总裁孙力在前天举办的嵌入式人工智能技术论坛上也提到了这一问题:「自动驾驶汽车每秒钟可以产生 1G 的数据,必须及时的、迅速的在本地来处理决策,不可能移到云端。」

    除了无人驾驶,在智能家居方面,试想一下如果用户家中安装了一个监控摄像头,那么把数据传到云端很可能会增加个人隐私泄露的风险。而由于嵌入式 AI 是在本地处理数据,数据没有上云的过程,就可以保证用户的信息安全,免除不必要的麻烦。

    除了这些特定的应用场景,一些 AI 技术公司对嵌入式 AI 也有着广泛的需求。而近来因巨额融资引起广泛热议的 Face++就是其中的一员。

    「虽然我们主攻金融、安防以及手机智能这三个垂直领域。」公司 CTO 唐文斌向机器之能表示,「但是我们在手机端遇到了第一个问题。」他解释道。

    他们在手机端做实名认证及人脸解锁的时候发现,算法会不断「吃」计算力。也就是说,即便计算力不断增长,算法对计算力也总是处于「欲求不满」的状态。

    其次是在摄像机端。他谈到算法研发人员希望在做人脸识别的时候,可以让人脸在视频中的检测、抓拍环节在相机端实现。这样一来,就可以只传输有价值的信息,而非原始的大容量视频,能够有效减少传输带宽以及后端部署服务器的计算量及存储量,让系统的整体架构变得更加轻便。

    「那么,本来信息可以存 3 个月,现在可以存 3 年,这会带来非常大的价值。」唐文斌补充道。

    嵌入式 AI 挑战也很多,AI 公司都是如何选择的?

    在把 AI 技术部署于终端设备的过程中,嵌入式技术至关重要。简单来说,这一过程需要对芯片进行全方位考量以评估芯片的性能,然后根据神经网络算法做特殊化处理,「无缝对接」嵌入式设备的能力。「既没有浪费运算单元,又最大程度地体现算法的精度,这是一个艺术活,也是技术活。」孙力如是说。

    然而,把嵌入式 AI 从云端迁移到终端却并非易事。孙力表示,目前嵌入式 AI 面临三大挑战,分别为运算能力、功耗及散热。这些也是经典嵌入式设备所面临的问题。

    此外,你还需要考虑算法新增的神经网络处理单元与原有 DSP、GPU 计算架构的算法精度二者之间的平衡问题,以及如何对传统运算力较低的智能硬件设备进行升级,或者怎样为传统硬件添加 SoC 以实现智能化转型等等问题。

    而这些也基本都与成本挂钩(一提钱现场都笑了)。如何让嵌入式 AI 展现出应有的商业价值,也是真实存在且亟待解决的问题。

    因此,孙力表示,在具体操作上,技术人员不仅需要剪裁优化出最佳的计算模型并集成到移动设备上,还要保证操作系统向下驱动底层硬件,向上支持软件算法,而且对于终端设备他们必须有深入的理解。

    「只有这样,才能保证整个嵌入式 AI 算法模型经济、高效的运算。」他强调。

    又根据刘少山回忆,在创业初期,团队以为算法会是最大的门槛,结果发现整合能力的需求才是最高的。

    「这也是美国有许多算法技术很强的初创公司都被谷歌、苹果这类大公司收购的原因。」他解释道,「因为,从算法到落地产品还有一个很远的距离。」

    为了解决这些问题,业内目前主要采取三种实现路径,分别是「压缩算法模型」,「不断挖掘硬件潜力」,以及「在压缩模型的同时针对现有芯片进行优化」。

    刘少山表示,目前看来,第三种路径是能够最快落地的。但是无论如何,优化到一定程度还会遇到瓶颈,还是需要你转过头去提高硬件性能。

    那么一些明星公司们都是如何选择的呢?

    上个月刚完成 A+轮融资的深鉴科技与寒武纪就选择设计开发专用芯片。而中科创达则明确表示不做芯片,只在中间层发力,根据下游行业层出不穷的新需求做定制化工作,帮助寒武纪、高通这样的上游芯片企业发挥自己的价值。

    但刘少山认为:「业界有许多公司瞄准了视觉方向的芯片加速,但除此之外,针对定位导航和语音交互等技术的芯片行业还相对空白,整个市场仍存在较大发展空间。」

    云和端,你选择哪一个?

    唐文斌认为,「端+云」的未来发展趋势已经非常明确。一些需要移动端提供快速响应能力的场景可以选择在移动端进行计算,而需要把海量数据汇聚在一起,实现大规模数据挖掘与处理的情况可以放在云端进行。对此,中科创达 CEO 耿增强也持有相同的观点。

    「不过,具体哪些放在云端,哪些放在移动端,还没有一条统一的分界线,这也是留给我们的一个问题。」孙力补充道。

    「这里面存在较多的组合方式,」刘少山也认为,抓取数据、理解数据、根据理解做出行为决策等等环节可以全部在硬件执行,当然也可以部分给软件、部分给硬件。

    「很多感知计算涉及深度学习网络,各家公司对这方面的硬件加速也有很深的理解。不过在决策阶段,很多算法还没有定型,以无人车为例,业界主要还是基于规则的方法来做决策。」

    而耿增强则表示,我们无需担心算法定型后,嵌入式 AI 的价值会减弱。「算法是没有完美的,当这个算法趋于完美之时,大家会产生更多的需求,也会不断有新的算法出现,你总会发现自己还有很多技术工作要做。因为技术是没有穷尽的。」

    不过,云和端既然还没有统一的应用分界线,那么你是怎样考虑的呢?在下方留言,说说你对嵌入式 AI 的意见和见解吧。

    展开全文
  • 嵌入式与人工智能关系_嵌入式人工智能的发展趋势

    万次阅读 多人点赞 2019-04-09 17:00:43
    嵌入式与人工智能关系_嵌入式人工智能的发展趋势  所谓嵌入式人工智能,就是设备无须联网通过云端数据中心进行大规模计算去实现人工智能,而是在本地计算,在不联网的情况下就可以做实时的环境感知、人机交互、...

    嵌入式与人工智能关系_嵌入式人工智能的发展趋势

     

      所谓嵌入式人工智能,就是设备无须联网通过云端数据中心进行大规模计算去实现人工智能,而是在本地计算,在不联网的情况下就可以做实时的环境感知、人机交互、决策控制。那么嵌入式与人工智能关系是什么?嵌入式人工智能的发展趋势你知道吗?本文主要详细嵌入式与人工智能,具体的跟随小编一起来了解一下。

      嵌入式与人工智能关系

      人工智能不可能没有嵌入式,人工智能的领域庞大涵盖学科众多,应用范围也很多。人工智能与嵌入式系统的关系,可用苏轼《题西林壁》的诗句来形容,即“横看成岭侧成峰,远近高低各不同。不识庐山真面目,只缘身在此山中”。长期以来,形形色色的人工智能就在我的周围,我们却视而不见。可以说嵌入式开启了人工智能的进程,人工智能的终极目的是实现人类智力的替代,人的智力有“思维”和“行为”两种方式,思维是大脑独立的思考,行为是个体与客观世界的交互。

      现在的人工智能大多属于前者,siri、阿尔法狗都是典型代表。要实现人工智能的行为,必须使用嵌入式系统,这就是现在所说的强人工智能与弱人工智能。具有行为能力的“弱人工智能”就是智能化工具,即MCU基础上的嵌入式应用系统,已有40多年历史。可以骄傲地说,单片机、嵌入式系统开启了人工智能的历史进程,我们所做的一切都是人工智能的那些事儿。人工智能是基础的技术资源,它有着改变人们的思维与生活方式、变革社会的巨大潜力。从更大的格局看,万物智联时代正在到来,未来将从“以设备为中心”进步为“以用户为中心”、“以数据为中心”。

      业界普遍认为人工智能的三个发展阶段包括感知智能、认知智能和通用人工智能(AGI)。感知指语音、语言、图像、手势等;认知指理解、记忆、知识、推理、规划、决策、创造等;通用人工智能指类似人类的思维。其中,感知是人机交互中最重要的一环,为人工智能提供数据基础。这三个阶段需要循序渐进。目前阶段,人工智能的目标并不是让机器模拟人的全部行为,而是在某些特定领域超过人类专家的水平、有能力高效地解决专业问题,从而对人类提供实用的服务。

      小编觉得在人工智能时代,强大的算法也不会拘泥于PC机实现,需要落地的话,就要依赖嵌入式承载。嵌入式在智能手机上的应用已经足以证明,未来出现的机器人一定会使用嵌入式的技术,所以说对于嵌入式系统的需求已经非常迫切,期待能够出现颠覆智能手机的嵌入式便携移动终端。

      嵌入式与人工智能关系_嵌入式人工智能的发展趋势

      嵌入式系统开启人工智能的历史进程

      人工智能与嵌入式系统的关系,可用苏轼《题西林壁》的诗句来形容,即“横看成岭侧成峰,远近高低各不同。不识庐山真面目,只缘身在此山中”。长期以来,形形色色的人工智能就在我的周围,我们却视而不见。为什么会出现这种现象?则要从两个领域的人工智能说起。

      所说的人工智能,就是以人工方式实现人类智力的替代。人类智力有“思维”与“行为”两种方式。“思维”是大脑的独立思考,“行为”是人类个体与客观世界的交互状态,除了思考还要有对外部世界的感知与控制。AlphaGo属于前者,它与李世石、柯洁对决,还要有代理人将它的思维能力转化成对决的下棋行为。实现人工智能的行为方式,则非嵌入式系统莫属。对此,人工智能领域人士,普遍将这两种人工智能定义成“强人工智能”与“弱人工智能”。

      AlphaGo之父哈萨比斯在剑桥大学演讲中则用“通用人工智能”与“狭义人工智能”来区分。总之,所有专家都认可具有行为能力的“弱人工智能”。

      具有行为能力的“弱人工智能”就是智能化工具,即MCU基础上的嵌入式应用系统,已有40多年历史。无怪乎约翰•麦卡锡这位50年代提出人工智能概念的学者,感叹于我们日常生活中每天都在使用人工智能,抱怨于“一旦一样东西用人工智能实现了,人们就不再叫它人工智能了”。

      可以骄傲地说,单片机、嵌入式系统开启了人工智能的历史进程,我们所做的一切都是人工智能的那些事儿。

      嵌入式与人工智能关系_嵌入式人工智能的发展趋势

      嵌入式人工智能的的发展趋势

      1、嵌入式人工智能于各行业垂直领域应用具有巨大的潜力

      嵌入式人工智能市场在零售、交通运输和自动化、制造业及农业等各行业垂直领域具有巨大的潜力。而驱动市场的主要因素,是嵌入式人工智能技术在各种终端用户垂直领域的应用数量不断增加,尤其是改善对终端消费者服务。当然嵌入式人工智能市场要起来也受到IT基础设施完善、智能手机及智能穿戴式设备的普及。其中,以自然语言处理(NLP)应用市场占嵌入式人工智能市场很大部分。随着自然语言处理的技术不断精进而驱动消费者服务的成长,还有:汽车信息通讯娱乐系统、嵌入式人工智能机器人及支持嵌入式人工智能的智能手机等领域。

      2、嵌入式人工智能导入医疗保健行业维持高速成长

      由于医疗保健行业大量使用大数据及嵌入式人工智能,进而精准改善疾病诊断、医疗人员与患者之间人力的不平衡、降低医疗成本、促进跨行业合作关系。此外嵌入式人工智能还广泛应用于临床试验、大型医疗计划、医疗咨询与宣传推广和销售开发。嵌入式人工智能导入医疗保健行业从2016年到2022年维持很高成长,预计从2016年的6.671亿美元达到2022年的79.888亿美元年均复合增长率为52.68%。

      3、嵌入式人工智能取代屏幕成为新UI / UX接口

      过去从PC到手机时代以来,用户接口都是透过屏幕或键盘来互动。随着智能喇叭(Smart Speaker)、虚拟/增强现实(VR/AR)与自动驾驶车系统陆续进入人类生活环境,加速在不需要屏幕的情况下,人们也能够很轻松自在与运算系统沟通。这表示着嵌入式人工智能透过自然语言处理与机器学习让技术变得更为直观,也变得较易操控,未来将可以取代屏幕在用户接口与用户体验的地位。嵌入式人工智能除了在企业后端扮演重要角色外,在技术接口也可承担更复杂角色。例如:使用视觉图形的自动驾驶车,透过人工神经网络以实现实时翻译,也就是说,嵌入式人工智能让接口变得更为简单且更有智能,也因此设定了未来互动的高标准模式。

      嵌入式与人工智能关系_嵌入式人工智能的发展趋势

      4、未来手机芯片一定内建嵌入式人工智能运算核心

      现阶段主流的ARM架构处理器速度不够快,若要进行大量的图像运算仍嫌不足,所以未来的手机芯片一定会内建嵌入式人工智能运算核心。正如,苹果将3D感测技术带入iPhone之后,Android阵营智能手机将在明年(2017)跟进导入3D感测相关应用。

      5、嵌入式人工智能芯片关键在于成功整合软硬件

      嵌入式人工智能芯片的核心是半导体及算法。嵌入式人工智能硬件主要是要求更快指令周期与低功耗,包括GPU、DSP、ASIC、FPGA和神经元芯片,且须与深度学习算法相结合,而成功相结合的关键在于先进的封装技术。总体来说GPU比FPGA快,而在功率效能方面FPGA比GPU好,所以嵌入式人工智能硬件选择就看产品供货商的需求考虑而定。例如,苹果的Face ID脸部辨识就是3D深度感测芯片加上神经引擎运算功能,整合高达8个组件进行分析,分别是红外线镜头、泛光感应组件、距离传感器、环境光传感器、前端相机、点阵投影器、喇叭与麦克风。苹果强调用户的生物识别数据,包含:指纹或脸部辨识都以加密形式储存在iPhone内部,所以不易被窃取。

      6、嵌入式人工智能自主学习是终极目标

      嵌入式人工智能“大脑”变聪明是分阶段进行,从机器学习进化到深度学习,再进化至自主学习。目前,仍处于机器学习及深度学习的阶段,若要达到自主学习需要解决四大关键问题。首先,是为自主机器打造一个嵌入式人工智能平台;还要提供一个能够让自主机器进行自主学习的虚拟环境,必须符合物理法则,碰撞,压力,效果都要与现实世界一样;然后再将嵌入式人工智能的“大脑”放到自主机器的框架中;最后建立虚拟世界入口(VR)。目前,NVIDIA推出自主机器处理器Xavier,就在为自主机器的商用和普及做准备工作。

      7、最完美的架构是把CPU和GPU(或其他处理器)结合起来

      未来,还会推出许多专门的领域所需的超强性能的处理器,但是CPU是通用于各种设备,什么场景都可以适用。所以,最完美的架构是把CPU和GPU(或其他处理器)结合起来。例如,NVIDIA推出CUDA计算架构,将专用功能ASIC与通用编程模型相结合,使开发人员实现多种算法。

      8、AR成为嵌入式人工智能的眼睛,两者是互补、不可或缺

      未来的嵌入式人工智能需要AR,未来的AR也需要嵌入式人工智能,可以将AR比喻成嵌入式人工智能的眼睛。为了机器人学习而创造的在虚拟世界,本身就是虚拟现实。还有,如果要让人进入到虚拟环境去对机器人进行训练,还需要更多其它的技术。展望未来,随着嵌入式人工智能、物联网、VR/AR、5G等技术成熟,将带动新一波半导体产业的30年荣景,包括:内存、中央处理器、通讯与传感器四大芯片,各种新产品应用芯片需求不断增加,以中国在半导体的庞大市场优势将会在全球扮演关键的角色

    展开全文
  • 智东西公开课-嵌入式AI合辑第3讲课件-嵌入式AI应用开发对操作系统的要求与挑战-RT-Thread人工智能总监杨武.pdf
  • 嵌入式AI平台介绍

    千次阅读 2020-10-13 08:49:06
    1.1.3 AI芯片 1 1.1.4 树莓派 1 1.2 挑战与解决 1 1.2.1 挑战 1 1.2.2 修剪神经网络 2 1.2.3 嵌入式终端优化 2 1.3 GPU 2 1.4 ARM 3 1.5 FPGA结构的并行计算 4 1.5.1 介绍 4 1.5.2 流水线计算 4 1.5.3 ...

    CSDN下载链接:

    https://download.csdn.net/download/qq_38649386/12920732

     

    目录

    1  技术方案 1

    1.1  可选方案 1

    1.1.1  ARM 1

    1.1.2  CPU+FPGA 1

    1.1.3  AI芯片 1

    1.1.4  树莓派 1

    1.2  挑战与解决 1

    1.2.1  挑战 1

    1.2.2  修剪神经网络 2

    1.2.3  嵌入式终端优化 2

    1.3  GPU 2

    1.4  ARM 3

    1.5  FPGA结构的并行计算 4

    1.5.1  介绍 4

    1.5.2  流水线计算 4

    1.5.3  分布式流水线计算 5

    1.5.4  交替计算 5

    1.5.5  混合型计算 6

    1.6  云计算 6

    1.7  边缘计算 7

    2  ARM平台 ST官方解决方案 8

    2.1  STM32L476 8

    2.1.1  购买 8

    2.1.2  应用 8

    2.1.3  STM32Cube.AI 8

    2.1.4  部署步骤 8

    2.2  STM32H747 8

    2.2.1  购买 8

    2.2.2 应用 9

    2.3  STM32MP1 9

    2.3.1  购买 9

    2.3.2  应用 9

    2.3.3  X-LinuX-AI-CV工具包 9

    2.4  模型转换方案 10

    2.4.1  Tensor flow 解释器方案 10

    2.4.2  生成优化C语言方案 10

    2.5  ARM Cortex-M 32bit MCU性能图 11

    2.6  OpenMV 11

    2.6.1  介绍 11

    2.6.2  购买 12

    2.6.3  重要参数 12

    3  ARM平台 高性能嵌入式AI开发板 13

    3.1  EAIDK-310开发板 13

    3.1.1  购买 13

    3.1.2  介绍 13

    3.1.3  开发板参数 13

    3.2  瑞芯微TB-RK3399Pro开发板 14

    3.2.1  购买 14

    3.2.2  介绍 14

    3.2.3  主要参数 15

    3.3  Hi3559A开发板 16

    3.3.1  购买 16

    3.3.2  介绍和重要参数 16

    3.3.3  Hi3519A开发板 16

    4  FPGA平台 17

    4.1  FPGA介绍 17

    4.2  米尔 MYD-Y7Z010/20开发板 17

    4.2.1  介绍 17

    4.3  ZynqUltraScale+MPSoC ZU3EG 开发板 17

    5  AI芯片 19

    5.1  K210 (KPU核心神经网络加速器) 19

    5.1.1 K210 芯片参数 19

    5.2  基于K210芯片的开发板 19

    5.2.1  开发板型号 19

    5.2.2  重要参数 20

    5.3  勘智KD233开发板 21

    5.3.1  重要参数 21

    5.3  开发板支持摄像头 21

    5.3.1  采用型号 21

    5.3.2  分析 21

    5.4  英特尔Movidius神经计算棒 21

    5.4.1  购买详情 21

    5.4.2  介绍 22

    5.4.3  重要参数 22

    6  树莓派 23

    6.1  树莓派4b Raspberry Pi 4B AI开发板套件 23

    7  英伟达 24

    7.1  jetson TX2 24

    7.1.1  购买 24

    7.1.2  介绍 24

    7.1.3  参数 24

    7.2  jetson NANO 25

    7.2.1  购买 25

    7.2.2  介绍 25

    7.2.3  参数 25

    8  AI芯片公司 26

    8.1  各公司情况 26

     

    1  技术方案

    1.1  可选方案

    1.1.1  ARM

    一种方案是按照ST官方案例选择STM32L4系列、STM32H747系列、STM32MP1系列芯片,使用STM32Cube.AI和X-LinuX-AI-CV工具包进行深度学习环境搭建和模型代码的移植与优化。

    另一种,使用高端ARM嵌入式人工智能开发板进行开发测试。检索到的开发板有:EAIDK-310开发板、瑞芯微TB-RK3399Pro开发板和海思系列开发板。是高性能的ARM嵌入式开发平台,可面向边缘计算的人工智能开发,支持主流深度学习开发框架。

    1.1.2  CPU+FPGA

    FPGA不适合做主控芯片,一般搭配CPU处理器进行计算加速任务。一般可搭配ARM芯片用FPGA做神经网络加速器,或者做相应FPGA视频图像加速处理。

    1.1.3  AI芯片

    可选用的AI芯片目前有K210。先单独使用AI芯片作为主控芯片的开发板做开发,并测试其效果。如果其总线能力不强可搭配CPU进行设计方案;如果视频处理能力不强可搭配FPGA进行设计。

    1.1.4  树莓派

     

    1.2  挑战与解决

    1.2.1  挑战

    面临挑战:1.模型大,参数多;2.训练缓慢;3.功耗;4.成本;

    在这种情况下,在资源受限的设备上运行神经网络需要数据工程和数据科学方面的整体解决方案,这些方案有时候会被称为“算法和硬件协同设计”。

     

     

     
      

    图 1.1

    1.2.2  修剪神经网络

    针对网络模型大、参数多等特点可对神经网络进行修剪处理,以减少网络参数,使其能够在有限硬件资源的嵌入式设备上运行。论文《Learning both Weights and Connections for Efficient Neural Networks》提出,训练一个神经网络,然后修剪其权值低于预设阈值的连接,最后重新训练稀疏网络,以学习剩余连接的最终权值。

    1.2.3  嵌入式终端优化

    根据边缘设备终端的特点做相应优化。

    1.3  GPU

    GPU在处理图形的时候,从最初的设计就能够执行并行指令,从一个GPU核心收到一组多边形数据,到完成所有处理并输出图像可以做到完全独立。由于最初GPU就采用了大量的执行单元,这些执行单元可以轻松的加载并行处理,而不像CPU那样的单线程处理。另外,现代的GPU也可以在每个指令周期执行更多的单一指令。所以GPU比CPU更适合深度学习的大量矩阵、卷积运算的需求。深度学习的应用与其原先的应用需求颇为类似。

     

     

     
      

    图 1.2

    英伟达以其大规模的并行GPU和专用GPU编程框架CUDA主导着当前的深度学习市场。但是越来越多的公司开发出了用于深度学习的加速硬件,比如谷歌的张量处理单元(TPU/Tensor Processing Unit)、英特尔的Xeon Phi Knight's Landing,以及高通的神经网络处理器(NNU/Neural Network Processor)。微软在提高其GPU集群的运算能力的同时也在探索使用其它的专用处理器

    1.4  ARM

    ARM最近宣布推出其计算库ACL为ARM Cortex-A系列CPU处理器和ARM Mali系列GPU实现了软件功能的综合集成。具体而言,ACL为CNNs提供了基本的构建模块,包括激活、卷积、全连接和局部连接、规范化、池化和softmax功能。这些功能正是我们建立推理机所需要的。

    相比从头开始手动构建模型,我们需要一种更方便的方式来在物联网设备上提供深度学习能力。一个解决方案是实现一个深度学习的模型编译器,可以将给定的模型经过优化,编译为目标平台上的可执行代码。这种编译器的前端可以从主要的深度学习平台(包括MXNet、Caffe、TensorFlow等)解析模型。然后,优化器可以执行额外的优化,包括模型修剪,量化和异构执行。优化后,由代码生成器生成目标平台上可执行代码,可以是ACL(用于ARM设备),TensorRT(用于Nvidia GPU)或其他ASIC设备。

    1.5  FPGA结构的并行计算

    1.5.1  介绍

    目前来说,GPU贵,功耗高,运行效率比FPGA高,易使用,但是FPGA功耗低,符合嵌入式设备需求。FPGA如果实现深度学习功能,还需要大批量使用,才能实现整体成本的降低,且需要与CPU相结合。

    另外一个问题是,FPGA的大规模开发难度偏高,从业人员少。我们可以通过ARM战胜MIPS、以及STM32的迅速发展可以看到,一个好的生态环境,更多的从业人口,比技术、性价比本身更利于其发展。所以易用性是几个并行技术发展的一个重要考量维度。

    要看设计者的建模方案。GPU的一个缺点是,他的组件模块是乘法器、加法器。虽然深度学习的参数都是数学模型,需要对RTL级别的变化,但是GPU的硬件资源是以乘法器、加法器这样量级的硬件单元组成的。如果GPU的预先配置与使用者的模型相差甚远。例如:加法器配置15个,乘法器配置15个。但实际使用的时候,乘法器使用量是15个,但是加法器只需要2个。这就浪费了13个加法器的资源。而FPGA是以查找表和触发器子单元,组合成任意配置运算单元。

    在FPGA中,逻辑是并行地运行的,各个状态机同时都在工作,状态机之间可能会有信号交互,也可能毫无关系、各管各地工作。

    1.5.2  流水线计算

     

    图 1.3

    从流水线计算的举例中可以看出,FPGA设计的加法器和乘法器,将本来B=A*2+1的运算拆分成C=A*2和B=C+1这两个部分,其中C为缓存器。然后,从本来需要三个时钟周期才能完成的运算任务,到现在每个时钟周期都有一个结果B计算完成,其中结果B与前两个时钟周期之前输入的A相对应。

    1.5.3  分布式流水线计算

     

     
      

    图 1.4

    从分布式流水线计算的例子中,FPGA将C=A*2=B*3的计算任务分为D=A*2和E=B*3两个计算任务,先A和B各自乘法运算,然后在缓存器中进行加法运算,缩短计算的时钟周期。

    1.5.4  交替计算

    交替计算任务是FPGA要执行C=A+B的计算任务,但是加法器的执行时钟周期最高为100MHz,而寄存器最高可以达到300MHz。在A和B的输入更新频率在300MHz而加法器只有100MHz的情况下,需要考虑交替计算。

    交替计算的基本结构如下图所示:

     

    图 1.5

    交替计算的基本思想是:

    将计算单元复制若干份,交替地将输入的参数分配给各个计算单元,并且交替地将各个计算单元的计算结果输出,从而实现"以N倍的计算单元换取N倍的计算速度"。

    模块的时序如下图所示:

     

     
      

    图 1.6

    可见,我们利用3个最高工作频率100MHz的加法器,等效地实现了1个最高工作频率300MHz的加法器。

    1.5.5  混合型计算

    在实际的FPGA并行计算中,常常将流水线计算、交替计算混合使用,来满足计算需求。这就是所谓的"混合型并行计算"。

    1.6  云计算

    对于低功耗的嵌入式设备,问题在于是否存在一个可靠的解决方案,能够将深度学习部署在云端,这样可以同时满足功耗和性能的要求。

    然而,迁移到云端可能存在的问题是会导致至少2秒的延迟,甚至可能高达5秒,这不能满足我们实时性的要求。此外,延迟的剧烈抖动使得服务非常不稳定。将实时性深度学习任务迁移到云端是仍是一个需通过实际测试才可真正实施的解决方案。

    1.7  边缘计算

    深度学习的硬件加速器需要具备数据级别和流程化的并行性、多线程和高内存带宽等特性。另外,由于数据的训练时间很长,所以硬件架构必须低功耗。因此,效能功耗比是硬件架构的评估标准之一。

    MCU嵌入式系统的特点:功耗低、成本低、开发周期短、实时性、响应性。

    相对于HPC和云计算来说,边缘计算是一种算力的下沉。边缘计算是指靠近数据源头的一侧,采用网络、计算、存储、应用核心能力为一体的开放平台。网络边缘是可以从数据源到云计算中心之间的任意功能实体,这些实体搭载这融合网络、算力、存储、应用核心能力的边缘计算平台,为终端用户提供实时和智能的计算服务。和云计算相比的主要差异在于对数据处理和算法决策的不同,边缘计算更贴近数据源,而云计算是在云端进行计算,主要的差异体现在:多源异构计算、带宽负载、资源配置、安全防护和隐私保护等方面。

    总体来说,边缘计算具有低延时、高带宽、高可靠、海量链接、异构协同处理和本地安全隐私保护等特点,在许多场景下存在突出的优势。

     

    2  ARM平台 ST官方解决方案

    2.1  STM32L476

    2.1.1  购买

    链接:

    https://item.taobao.com/item.htm?spm=a230r.1.14.48.75cf28c7X6CLGY&id=548833190912&ns=1&abbucket=17#detail

    STM32L476开发板 价格 100-200人民币

    STM32L476芯片价格:30-40

    2.1.2  应用

    在STM32微控制器上映射与运行与训练的人工神经网络(ANN)。过程中使用STM32Cube.AI拓展包提高生产力。

    2.1.3  STM32Cube.AI

    STM32Cube.AI拓展包全面支持超低功耗STM32MCU,是ST提供的使用STM32CubeMX配置和代码生成的工具包,可与多个流行深度学习框架配合操作,并允许单个STM32 MCU上运行多个人工神经网络。

    2.1.4  部署步骤

    该方案主要部署神经网络的主要步骤分为:采集数据、标记数据、训练模型、移植并优化代码、应用模型分析新数据

    2.2  STM32H747

    2.2.1  购买

    https://s.taobao.com/search?q=STM32H747%E5%BC%80%E5%8F%91%E6%9D%BF&imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20200829&ie=utf8

     STM32H747开发板 价格780-850人民币

     STM32H747芯片价格:100-150人民币

    2.2.2 应用

    在案例图像分类的项目中,使用STM32H747为主控芯片做图像分类任务。该案例输入244*244 RGB 图像数据。根据案例在应用时按照自己数据集优化内存和网络模型参数,提升网络运行能力。

    2.3  STM32MP1

    2.3.1  购买

    https://detail.tmall.com/item.htm?spm=a230r.1.14.16.67ce4813mOtFrQ&id=611576166992&ns=1&abbucket=17&skuId=4543697150224

    STM32MP1开发板 价格:350-450人民币

    2.3.2  应用

    ST提供STM32MP1的计算机视觉应用方案,1000个种类的目标分类任务和90个种类的多目标检测任务。

    STM32MP1系列由两部分组成,其一是STM32Cube.AI拓展包内含Cortex-4M、支持实时OS和STM32CubeMX工具。另一个是支持Tensor flowLite和OpenCV。

    2.3.3  X-LinuX-AI-CV工具包

    应用中可以支持C/C++和python、CV框架的Pillow和OpenCV、AI框架的Tensor FlowLite、LinuxOS。

     

     
      

    图 2.1

    2.4  模型转换方案

    2.4.1  Tensor flow 解释器方案

     

     
      

    图 2.2

    2.4.2  生成优化C语言方案

    利用STM32Cube.AI拓展包生成优化C语言方案如图:

     

     

     
      

    图 2.3

     

    2.5  ARM Cortex-M 32bit MCU性能图

     

     

     
      

    图 2.4

    2.6  OpenMV

    2.6.1  介绍

    简单的来说,openmv是一个可编程的摄像头,通过MicroPython语言,可以实现算法的逻辑。而且摄像头本身内置了一些图像处理算法,很容易使用。

    Openmv适合与DIY相关的项目制作,比如追踪小球的车,云台,或者解魔方的机器人。对成本要求很高的嵌入式工业方案,比如流水线物品的分拣。

    但是不适合做复杂的算法:比如OCR识别,车牌识别,猫狗分类,深度学习之类的。

    2.6.2  购买

    链接:

    https://item.taobao.com/item.htm?spm=a230r.1.14.32.105b59a9ts16kB&id=614199490408&ns=1&abbucket=18#detail

    OpenMV4主板+OV7725 价格:519人民币

    OpenMV4主板+MT9V034 价格:856人民币

    2.6.3  重要参数

    OpenMV4 Cam H7参数:

    处理器STM32H7

    主频:400MHz

    RAM:1MB

    FLASH:2MB

    支持图像格式:Grayscale、RGB565

    最大像素支持:Grayscale:640*480

    RGB565:320*240

    功耗:90mA@3.3V---150mA@3.3V

    应用场景包括:物体识别、工业故障检测、热成像等。

     

    3  ARM平台 高性能嵌入式AI开发板

    3.1  EAIDK-310开发板

    3.1.1  购买

    https://item.taobao.com/item.htm?id=606688424522&ali_refid=a3_430582_1006:1123749552:N:kbBNWgVRbVKMh7OFkdWqHv4Yz4yJHKlW:7800729bd865e7e3d64109227e47ac5d&ali_trackid=1_7800729bd865e7e3d64109227e47ac5d&spm=a230r.1.14.11#detail

    EAIDK-310开发板 价格:320人民币

    3.1.2  介绍

    EAIDK-310开发板是一个ARM嵌入式人工智能开发平台,支持Linux/Android兼容树莓派,面向边缘计算的人工智能开发套件。该硬件平台具备视觉传感器数据采集能力,支持图像处理与分析。

    3.1.3  开发板参数

     

     
      

    如图:

    图 3.1

     

     

     
      

    图 3.2

    3.2  瑞芯微TB-RK3399Pro开发板

    3.2.1  购买

    链接:

    https://item.taobao.com/item.htm?spm=a1z10.5-c-s.w4002-22674469377.11.2cff261fq8qA22&id=587153253310

    https://item.taobao.com/item.htm?id=570501511799&ali_refid=a3_430582_1006:1102502747:N:4JINNIXlx37PlTcZHs1VGQ%3D%3D:f4dd9cec0fbc86832b99b63614058d91&ali_trackid=1_f4dd9cec0fbc86832b99b63614058d91&spm=a230r.1.14.6#detail

    标配+USB摄像头+6G内存+32G闪条 价格:2078人民币

    基础套餐+7寸屏幕 价格:1279人民币

    RK3399Pro芯片:350人民币

    3.2.2  介绍

    RK3399Pro是可量产的AI智能硬件芯片,内置NPU神经单元,支持AI硬件加速,运算能力高达3.0TOPs,同情况下NPU进行AI运算功耗不到GPU的1%,支持各大深度学习模型,可训练,支持TensorFlow、Caffe、TF Lifi、ONNX等模型,提供丰富的AI应用接口,提供神经网络跨平台API

    开发板提供Android&Linux系统开发教程、 驱动开发教程,提供SDK源代码、升级工具、固件、硬件资料。

    针对RK3399开发板的Python实例源码、人脸识别OpenCV实例源码、OpenCV Qt高清摄像头监控实例源码移植成功,提供源码+项目视频,

    3.2.3  主要参数

     

     
      

    图 3.3

     
      

    图 3.4

    3.3  Hi3559A开发板

    3.3.1  购买

    链接:

    https://detail.tmall.com/item.htm?spm=a230r.1.14.16.2abd6cc0E9T9f8&id=624525455023&ns=1&abbucket=17&skuId=4589591959689

    单路摄像头200W像素,1080P,价格:550人民币

    单路摄像头800W像素,4K,价格:850人民币

    HI3559A芯片 价格:450-600人民币

    3.3.2  介绍和重要参数

    EVM3559A开发板是以华为海思Hi3559AV100处理器为黑犀牛的嵌入式开发板。

    核心处理器由双核ARM Cortex-A76@106GHz组成,性能强悍。

    双核 ARM Mali G71 GPU@900MHz

    双核 NNIE@840MHz神经网络加速引擎

    具备4T算力神经网络单元

    可拓展4K摄像头或者双4K视频流输入,最大支持8K视频解码能力。

    满足超清分辨率下的复杂智能视频/图像分析需求,并提供OpenCL 1.1/1.2/2.0支持。

    3.3.3  Hi3519A开发板

    EMA Hi3519A开发板与EVM3559A开发板类似,但是其性能比EVM3559A开发板略差一点。

    链接:

    https://detail.tmall.com/item.htm?spm=a230r.1.14.16.2f7066adcbOtk9&id=623958445581&ns=1&abbucket=17&skuId=4605210919869

    4  FPGA平台

    4.1  FPGA介绍

    FPGA提供除了GPU外的另一种解决方案。FPGA架构灵活,并且其设计工具逐渐对对主流深度学习框架的兼容性更强,使得FPGA更容易为模型搭建和部署者所用。同时,FPGA在单位能耗下性能更强,这对大规模服务器部署或资源有限的嵌入式应用的开发而言至关重要。

    FPGA与GPU不同之处在于硬件配置灵活,且FPGA在运行深入学习中关键的子程序(例如对滑动窗口的计算)时,单位能耗下通常能比GPU提供更好的表现。其次FPGA适合做加法器和乘法器等运算。

    不过,设置FPGA需要具体硬件的知识,许多研究者和应用科学家并不具备,正因如此,FPGA经常被看作一种行家专属的架构。最近,FPGA工具开始采用包括OpenCL在内的软件级编程模型,使其越来越受经主流软件开发训练的用户青睐。

    4.2  米尔 MYD-Y7Z010/20开发板

    4.2.1  介绍

    MYD-Y7Z010/20开发板是一款ARM+FPGA的嵌入式开发板,高性能低功耗,应用场景多。

    详情见链接:

    https://detail.tmall.com/item.htm?spm=a230r.1.14.20.139367581EEdQi&id=622357094627&ns=1&abbucket=5

     

    4.3  ZynqUltraScale+MPSoC ZU3EG 开发板 

     

    https://item.taobao.com/item.htm?spm=a230r.1.14.53.11ac6758ucxcb8&id=614531561982&ns=1&abbucket=19#detail

     

     

     

     

    5  AI芯片

    5.1  K210 (KPU核心神经网络加速器)

    5.1.1 K210 芯片参数

    处理器架构:RISC-V  Dual Core 64bit,with FPU

    主频:400MHz(可超频至600MHz)

    图像识别:  QVGA@60fps/VGA@30fps

    语音识别:  麦克风阵列8 mics

    操作系统    Free RTOS

    深度学习框架:Tensor flow/Keras/Darknet/Caff

    算力:1TOPS

    案例:人脸检测:60帧/秒

    应用场景:人脸检测和识别、YOLOv3、图像识别与分类、机器视觉

    功耗:主控芯片300mW(设备1W)

     

    5.2  基于K210芯片的开发板

    5.2.1  开发板型号

    Sipeed MAIX Dock K210开发板

    Sipeed MAIX Bit K210开发板

    Sipeed Maix go K210开发板

    Sipeed Maixduino K210开发板

    pyAI- K210开发板

     

     

     

     

    5.2.2  重要参数

     

     

    图 5.1

     

     

    图 5.2

    5.3  勘智KD233开发板

    5.3.1  重要参数

    320*240像素LCD

    OV5640 图像传感器 500W

    16MiB SPI NandFlash存储芯片

    操作系统:Free RTOS

    开源SDK/HDK

    5.3  开发板支持摄像头

    5.3.1  采用型号

    大部分K210开发板支持摄像头像素200W,OV2640

    嘉楠勘智官方:KD233开发板 500W,OV5640

    5.3.2  分析

    但是K210核心芯片最高支持640*480分辨率,在考虑OV2640的200W像素下,因其产品成熟、资料丰富和分辨率高等因素,故众多K210开发板采用OV2640摄像头。

    K510(2020年底发布)

    支持连接5G,速度性能比K210提升5-10倍

    5.4  英特尔Movidius神经计算棒

    5.4.1  购买详情

    价格:550-600人民币

    链接:

    https://item.taobao.com/item.htm?id=590048768401&ali_refid=a3_430582_1006:1186210115:N:PinYdCtxGdoXw61RT%2FNu2g%3D%3D:04f292b9bc46456e9b1b5145ad4b0e53&ali_trackid=1_04f292b9bc46456e9b1b5145ad4b0e53&spm=a230r.1.14.1#detail

    5.4.2  介绍

    英特尔推出了Movidius神经计算棒,这是一个基于USB模式的深度学习推理工具和独立的人工智能加速器,为广泛的边缘主机设备提供专用深度神经网络处理功能。外形小巧的Movidius神经计算棒专为产品开发者、研究人员和创客设计,提供专用高性能深度神经网络处理性能,从而减少开发、调优和部署人工智能应用的障碍。

    支持卷积神经网络CNN,如 Caffe 绘制、原型设计和调整工作流程

    5.4.3  重要参数

     

     

     

    6  树莓派

    6.1  树莓派4b Raspberry Pi 4B AI开发板套件

    https://item.taobao.com/item.htm?spm=a1z0d.6639537.1997196601.4.280a7484MagH2b&id=597048000256

     

    图 6.1

     

     

    7  英伟达

    7.1  jetson TX2

    7.1.1  购买

    https://detail.tmall.com/item.htm?spm=a230r.1.14.1.7a6336aaXhur8N&id=610778190595&ns=1&abbucket=5&skuId=4468593207490

    https://item.taobao.com/item.htm?spm=a230r.1.14.29.7a6336aaXhur8N&id=573357463850&ns=1&abbucket=5#detail

    jetson TX2开发套件价格:2000-3200人民币

    7.1.2  介绍

    NVIDIA推出新一代Jetson TX2开发平台,这是一款“嵌入式领域的AI超级电脑”。集成Linux系统,使用6核Tegra处理器(与Drive PX2同款),256核Pascal架构核心GPU ,16纳米工艺,具备极强的AI运算能力,比上一代TX1有更大进步,而且整机功耗低于7.5W,专为无人机、智能机器人、无人驾驶、智慧城市以及医疗工业设备等打造。支持jetpack3.0(嵌入式AI计算机的SDK),囊括:BSP、深度学习、计算机视觉、GPU计算、多媒体处理等。

    7.1.3  参数

     

     
      

    图 7.1

     

    7.2  jetson NANO

    7.2.1  购买

    https://detail.tmall.com/item.htm?spm=a230r.1.14.23.67f91b241MoHPy&id=592354487895&ns=1&abbucket=5&skuId=4172599169800

    https://detail.tmall.com/item.htm?id=607189338842&ali_refid=a3_430582_1006:1254760046:N:v2O66a8DU7qKn6EYlH26bTps63UxR1gU:f815fbfdc2d6559423a691a7c72cb32c&ali_trackid=1_f815fbfdc2d6559423a691a7c72cb32c&spm=a230r.1.14.1

    jetson NANO套件价格:700-3200人民币

    7.2.2  介绍

    NVIDIA JETSON NANO是个外型小巧但是功能强大的AI终端设备,就恶意并行运行多个神经网络、目标检测、图像分割和语音处理的应用程序。

    JETSON NANO搭载四核ARM@A57处理器,128核MAXWELL GPU以及4GB LPD-DR内存,拥有足够的AI算力,为实现AI项目提供便捷。

    7.2.3  参数

     

    图 7.2

     

    展开全文
  • 什么是嵌入式人工智能,它的实际应用 百度大脑、语音搜索、图像、广告跟搜索排序及自动驾驶,用一句简单的话来概括就是在云端基于大数据、大计算做人工智能,这看起来是人工智能的主流。 什么叫嵌入式人工智能?它...

    什么是嵌入式人工智能,它的实际应用

    百度大脑、语音搜索、图像、广告跟搜索排序及自动驾驶,用一句简单的话来概括就是在云端基于大数据、大计算做人工智能,这看起来是人工智能的主流。
    什么叫嵌入式人工智能?它不是说在云端通过联网,在数据中心的大规模的计算去实现人工智能,而是说在本地计算,在不联网的情况下面实时的做环境感知,做人机交互,做决策控制。
    大家想想看,尤其是在自动驾驶这样一个场景下面,如果突然一个小朋友横穿马路,我们还要把信号传到云端做处理做决策,这可能会有灾难性的,如果网络条件不稳定怎么办?所以说在这样的场景下面,实际上嵌入式人工智能就是完全低功耗的本地化的计算,实际上是成为一个必须。
    同样在很多场景下面我们都需要这种嵌入式人工智能的解决方案。这里面包括从软件、从硬件甚至从处理器的架构重新定义怎么去实现低功耗、高性能的计算。主要应用的场景毫无疑问第一个是自动驾驶;第二个叫smart live。
    下一个能够影响世界影响人们的变革,最大的产业机会在什么地方?我个人是非常认可这样一个观点,这是麦肯锡跟布隆伯格的报告说2030年基本上每十辆车里面其中有四辆是有一定程度上的自动驾驶,这里面当然包括有可能是辅助驾驶,甚至2030年应该可以实现高速上的全自动驾驶甚至非高速的自动驾驶。
    当然在中国我们面临一个非常大的产业机会是因为我们有庞大的市场,我们的汽车市场已经是世界第一大了。但是还有一个令人比较尴尬的数据是说,在全世界范围内每十万人的交通事故的死亡率,我们同时也是世界最高的,这一点让我觉得很尴尬,我以为我们会比墨西哥、印度好一些,但其实不是。怎么样通过技术变革使得交通出行首先是更加安全,其次是更加便捷,然后才是更加有趣,这是在这里我想跟大家探讨的话题。
    大家回想一下在70年代80年代的时候,打电话是什么状况?那时候打电话通常是有个接线员,接线员大概记住了200-300个地址,这个地址就是插孔,帮你插上去,很像今天的出租车司机,你告诉他中国大饭店,他记住了大饭店的地址带你过来。后来发生了什么事情?发生了程控交换机,这样的变化就是从人工到自动变化实际上带来一个庞大的产业,它实际上让电信行业完全的被重构,比如今天我们看到有网络设备商、运营商、终端设备的制造商都被庞大。比如我们可以看提供基础设施的网络设备商,从爱立信到今天中国的华为。华为已经成为产业界的巨无霸。

    展开全文
  • 产教融合下的高职院校嵌入式人工智能校内实训基地的建设探索与实践.pdf
  • 嵌入式人工智能-简要了解

    千次阅读 2019-05-11 15:04:01
    嵌入式人工智能-简要了解OPEN AI LAB嵌入式人工智能开发套件(EAIDK)AIoT OPEN AI LAB 官网地址:http://www.openailab.com/ 最开始听到这个名字,以为是一家国外的公司或者是一个开源社区,登录官网之后发现是国内...
  • 嵌入式人工智能----最热门的人工智能商业化技术之一 “嵌入式人工智能是当前最热门的人工智能商业化技术之一。所谓嵌入式人工智能,就是设备无须通过云端数据中心进行大规模计算,而是在本地、不联网的情况下就可以...
  • 什么是嵌入式人工智能

    千次阅读 2020-04-12 17:19:26
    嵌入式系统的AI选项通过使用人工智能嵌入式开发人员可以寻求提供最智能的解决方案。如今,人工智能AI)被视为发展物联网(IoT)和诸如机器人和自动驾驶汽车之类的网络物理系统的重要技术。智能扬声器通过识别...
  • 嵌入式人工智能研究.pdf
  • 一、嵌入式AI概述 大部分神经网络计算都在卷积层,基本上99%都在卷积层, 二、模型加速 2-1.权值量化 tengine量化后的准确率之下降了1.5%。 2-2.网络剪枝 2-3.知识蒸馏 大网络是一个老师,小网络是...
  • 嵌入式AI的介绍

    千次阅读 2018-05-17 16:48:52
    本文引用地址: http://www.21ic.com/news/computer/201711/743355.htm在人工智能迅猛发展的当下,几乎每一家企业都在探索行业的切入点,试图在人工智能大潮中分一杯羹。而在追寻 AI 商业化的道路上,人们逐渐发现.....
  • 在追寻 AI 商业化的道路上,人们逐渐发现,要实现技术的落地,不仅需要性能优越的算法模型以及可靠的硬件支持,还...通常来说,具有数字接口的设备都具有嵌入式系统,如手机、车载电脑、智能手表等等。 而嵌入式 ...
  • 基于O-RAN架构的无线网络嵌入式人工智能探索.pdf
  • 嵌入式人工智能教学科研平台

    千次阅读 2021-01-29 08:34:09
    ZN-AI-BC01型 嵌入式人工智能教学科研平台 一、产品特点 VS-AI-BC01型 嵌入式人工智能教学科研平台采用目前市场上*主流的i.MX6工业级处理器,具有图像硬件加速器与原生千兆以太网; 基于Ubuntu 18.04系统,支持...
  • 嵌入式人工智能的关系和趋势

    千次阅读 2020-01-11 21:56:30
    所谓嵌入式人工智能,就是设备无须联网通过云端数据中心进行大规模计算去实现人工智能,而是在本地计算,在不联网的情况下就可以做实时的环境感知、人机交互、决策控制。那么嵌入式与人工智能关系是什么?嵌入式人工...
  • 随着 AI 技术的不断成熟和发展,人工智能正成为推动经济社会发展的新引擎,被广泛应用于各行业。随着深度学习等人工智能理论与技术的发展,越来越多的人工智能学习与推理从云端开始向终端进行迁移,...
  • 地平线机器人CEO说他们做的事情是一个听起来比较非主流、反主流的事情,尽管反主流,但是他们还是致力于要做嵌入式人工智能的领导者。什么叫嵌入式人工智能?不是说在云端通过联网,在数据中心的大规模的计算去实现...
  • 的半导体解决方案供应商瑞萨电子株式会社(TSE:6723)今日宣布,扩展其嵌入式人工智能(e-AI)解决方案,将AI整合到嵌入式系统,从而实现终端设备的智能化。10多个国家的约150家公司正在基于这项技术开展包括工具等...
  • 嵌入式Ai方案介绍

    千次阅读 2019-07-01 16:30:37
    公司玩了大半年的嵌入式AI平台,现在产品进入量产模式,也接触了很多嵌入式方案,有了一些心得体会,本人不才,在这里介绍一下一款简单易用的嵌入式AI方案——Movidius Myriad 2 VPU(MA2450) 和 Myriad X VPU(MA2485...
  • EAIDK( Embedded Artificial Intelligence Development Kit),是全球首个采用Arm架构的人工智能开发平台,专为 AI 开发者精心打造,面向边缘计算的人工智能开发套件。 硬件平台具备语音、视觉等传感器数据采集能力...
  • 有粉丝问我:“当前乃至未来5-10年,嵌入式开发者还有哪些风口?”画外音:风口的本质,其实就是一段时间的人才供需不平衡。说白了就是由于行业突变,敏锐的资本快速进入,导致短时间内行业大量扩张...
  • 如何做嵌入式人工智能.pdf
  • 近几年,“AIoT”一词便频频出现,成为人工智能及物联网行业的热门词汇。硬件变得智能化的趋势已不可逆,人与物、物与物之间的连接...AIoT(人工智能物联网)=AI人工智能)+IoT(物联网)。AIoT融合AI技术和IoT技术..
  • 嵌入式系统与人工智能

    千次阅读 2019-02-28 09:57:35
    工业4.0(又名工业物联网)和智能工厂等当前的技术趋势正在深刻地改变工业价值创造过程,其特点是更高程度的数字化,连通性和自动化。 所有涉及的组件,包括机器,机器人,传输和处理系统,传感器和图像采集设备,...
  • 模块化嵌入式人工智能软件的开发.pdf
  • 课程:《嵌入式Linux工程师实战进阶人工智能

    千次阅读 热门讨论 2019-07-24 13:48:14
    课程背景人工智能似乎一直上在云端的高高在上的概念,但是随着5G、IoT、边缘计算等概念和技术广泛深入地推进,人工智能嵌入式Linux的关系逐步拉近。时下火遍全宇宙的概念...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 35,146
精华内容 14,058
关键字:

嵌入式人工智能