订阅云计算RSS CSDN首页> 云计算

2015年微软亚洲研究院的惊艳项目,人工智能抢眼

发表于2015-12-01 14:20| 次阅读| 来源CSDN| 0 条评论| 作者钱曙光

摘要:日前,2015微软亚洲研究院“合作创•研”年会在微软亚洲研究院成功举行,本文总结了今年几个重点项目:智能花卉识别知识系统、智慧校园、支持实时卷积神经网络的智能摄像头等。

日前,2015微软亚洲研究院 “合作创•研”年会(原微软亚洲研究院联合实验室研讨会)在微软亚洲研究院成功举行。据悉,联合实验室在过去十六年间做出了大量卓有成效的工作,到2015年为止,联合实验室共汇聚计算机各研究领域的60余位学术带头人,开展了480多个合作项目,此外,微软亚洲研究院在多个研究领域中赞助了880个科研合作项目,与52所高校的1200多位教授保持密切的科研合作关系。

下面就让我们来认识下,今年微软亚洲研究院的几个重点项目,但发现都和人工智能相关,该领域即将迎来井喷?

1. 智能花卉识别知识系统

你是一个植物学家吗?如果不是的话,你一定会遇到在户外看到一些鲜花却叫不出它们的名字的情况,更不用说鲜花背后的故事了。不要着急,拍一张照片发给我们的Project Blossom系统,它会告诉你想知道的花卉知识。

植物分类是植物科学研究领域和农林业生产经营中重要的基础性工作,分类依据包括花、叶、果、茎等。花卉分类是植物分类学的重要组成部分,用计算机对花卉进行识别和分类是近来植物学家、农林专家和计算机科学家正在联合攻关的课题,其价值不仅仅在于专业领域,更是对公众科普有着重要意义。

植物的分类系统是十分复杂的,界、门、纲、目、科、属、种。对一张花卉图片,区分不同种类花卉的信息往往在于局部细微处,如何从纷繁的分类中进行定位呢?微软亚洲研究院多媒体搜索研究组和中国科学院植物所合作,利用深度学习算法和视觉注意算法,运用260万张花卉照片训练深度模型,研发出了智能花卉的识别和知识系统。计算机专家和植物专家在项目中的合作,可以发挥各自的强项,将系统的准确度不断提升。

此次“智能花卉识别”项目合作中,微软亚洲研究院多媒体搜索组的研究员结合深度学习算法和视觉注意模型,借助中科院植物所提供的260万花卉数据库,让机器自动关注图像中关键区域,同时自动学习鉴别花卉的区分特征,最终研发出了智能花卉识别和知识系统。该系统拓展了计算机在花卉领域的感知能力,并能够延展普通用户对于花卉的认知深度。


研究组从海量花卉图片中提取各类花卉特征要素形成数据库

2. 深度学习在健康、医疗监测中的应用

人一生中三分之一的时间都在睡眠中度过,睡眠质量无疑是衡量生活质量的重要指标。正常睡眠状态的标准化分期包括清醒期、非快速眼动1期(N1)、非快速眼动2期(N2)、非快速眼动3期(N3)和快速眼动期(REM)。睡眠分析的研究对于睡眠的分析具有重要的意义。

中国用的分期标注是美国加州大学根据美国人的睡眠信号划分出来的。用此分类标准,在多导睡眠仪中自动的分期算法,美国人的准确率为84%,中国人的准确率为50%。而且目前,中国医院所有的多导睡眠分期的结果都为人工产生,耗费了大量的人力和财力。因此,急需一套基于中国人睡眠数据产生的正常睡眠状态的标准化分期。智能手环作为简单方便的可穿戴设备,可以基于内置传感器监测数据对病人整晚睡眠分期,并给出睡眠建议。但目前手环等产品因算法正确率低,预测的结果与真实的预测结果相差很大。

 本项目将医生的标准检测结果和手环采集得到的数据进行整合,通过机器深度学习自动将训练数据分期,最终可替代人工分期的工作。通过多导睡眠监测仪和智能手环采集得到的各方面睡眠数据,将手环采集得到的心率信号作为特征(feature),医生人工判读睡眠分期作为标准(label),通过多层反馈神经网络(RNN)算法进行机器学习,最终得到的算法结果可以只需要心率数据等生物信号即可判断被试者的睡眠分期,从而代替了繁琐的人工环节。同时,算法的复杂程度和正确率相比于市场上同类水平的其他手环配套软件有了很大的提升,针对快速眼动期,正确率为83%。本项目结果可应用于手环内部的睡眠算法设计,未来研究还可以从睡眠分期的结果入手让机器自动判断受试者当晚的睡眠状况。

目前,该项目已经取得一系列成果,项目论文“智能手环的临床有效性评估”在《世界睡眠医学杂志》发表,并且在第六届睡眠医学学术年会上进行了报告。该项目由微软亚洲研究院和北京航空航天大学合作完成,作为项目负责人的许燕老师表示“作为高校青年教师,来微软亚洲研究院和这边的研究员合作,真的能碰撞出很多意想不到的火花!”

该项目是微软亚洲研究院青年学者访问项目“铸星计划”的一部分,该计划旨在为优秀的青年学者提供在微软亚洲研究院参与项目合作的机会。他们有机会加入不同的研究团队,与微软的顶级研究员进行半年的合作。该项目的最终目的在于帮助青年学者明确其长期研究目标。研究员与学者一对一的合作模式确保了访问学者与其指导研究员之间的密切联系,以帮助其明确长期的研究方向。同时,该项目还可以为访问学者提供国际一流的研究氛围和指导。经过八年发展,到目前为止全国共有超过100名学者参与这一项目。调查显示,大部分访问学者对该项目体验评价很高,且在结束访问之后仍然与微软亚洲研究院保持密切联系。

3. 智慧校园

早上7时,手机客户端准时提醒校园大巴到站时间,催促你准时上课;下午3时,系统推送三项你可能感兴趣的体育活动;晚上10时,手机为你呈现明日的课程安排及自习方案……在云计算、物联网等新一代信息技术蓬勃兴起的今天,智慧校园的建设已经在许多高校火热地开展起来。借助大数据驱动的虚拟化和云计算平台,中国科技大学正致力于打造一体化的数字化智慧校园服务系统,将教学、科研、管理、社交网络和校园生活充分融合。例如,基于社交网络信息、校园邮箱数据、图书借阅记录等,该系统能够精准地记录并再现每个学生的生活方式,如入睡时间、饮食规律等,并通过网页端呈现个人生活数据,针对每个学生的生活习惯给出具体性建议。此外,该项目还开发出一系列跨平台的移动应用,如通过 “大巴时刻表”和校园地图来帮助大一新生快速融入大学生活。

随着项目建设的不断完善,用户行为数据日渐丰富,为研究者提供了良好的数据分析支持。通过密切合作,目前已经完成并投入使用的项目有 “掌上科大校园移动应用平台”、“学生数据画像系统”等。

在“智慧校园”平台合作中,微软亚洲研究院向研究组提供了强大性能的Azure云平台等基础设施支持。Azure满足了数以万计的全校师生每日行为活动数据的计算需求。微软亚洲研究院谢幸研究员和中国科大计算机学院老师对于相关问题的研究成果已经发表在了KDD, SBDMV, PDCAT等国际会议上。

同时,基于此项目,双方联合培养的多名研究生、本科生,通过微软亚洲研究院进行实习,他们在数据挖掘、机器学习、人工智能等领域的能力有了锻炼与提高。


智慧校园平台界面



智慧校园系统将根据学生最近借阅书目推荐相关书目

4. A-Eye: 支持实时卷积神经网络的智能摄像头

人类获得信息的主要渠道是视觉。基于卷积神经网络(CNN)的深度学习算法在视觉识别领域的一系列应用中取得了巨大的成功,在有些领域甚至超越了人类。但是典型的深度神经网络参数多计算量大,所以图像识别主要在数据中心或者“云”里面进行。在没有网络支持差或者仅靠电池供电的情况下,“端”无法获得实时的高质量图像识别能力。 

A-Eye项目关注如何让 “端” (比如手机或者机器人)获得可媲美人类的视觉理解能力。为此,研究团队研发了高性能智能视觉芯片,可以广泛应用在智能安防,婴儿和老人看护,战场机器人,汽车和无人机等各种需要视觉智能的领域。目前的摄像头,主要完成记录、存储等功能。在摄像头上加入A-Eye视觉芯片,就可以让摄像头具有视觉理解能力。比如,现在城市可能有成千上万个安防摄像头,如果这些摄像头配备了A-Eye芯片,你就可以告诉所有的摄像头同时寻找一个 “穿黄上衣背黑背包的人” ,并且这个智能识别是可以不漏过每一帧图像的。这在反恐形势日益严峻的今天,是非常有意义的。再比如现在非常火的智能家用机器人,可以用A-Eye芯片,来理解周围的环境和物体,主动提醒异常行为的发生,如及时发现老人跌倒并采取行动,或者帮你寻找忘记的钥匙。

该项目核心技术主要是模型压缩技术以及针对深度神经网络定制的芯片架构。A-Eye项目在模型压缩技术上面获得了突破,把一个典型的模型压缩了将近五倍,而且这个压缩技术可以广泛应用在基于深度神经网络的一大类模型上。定制的芯片架构,可以把卷积神经网络的性能发挥到极致。

微软亚洲研究院硬件计算组和清华电子工程系一直在硬件加速领域保持合作。去年双方一起开始研究怎样把DNN做的更快。该项目的主要工作由清华团队完成,微软亚洲研究院的研究员在算法及FPGA平台和芯片结构方面提出了指导建议。

而A-Eye项目里的姚颂和郭开元既是微软亚洲研究院的实习生,同时也是清华大学电子工程系党委副书记汪玉教授的研究生。值得一提的是,项目合作的论文 “Going Deeper with Embedded FPGA Platform for Convolutional Neural Network”,最近被可重构计算领域的顶级会议FPGA全文接收并将于2016年2月份在美国蒙特雷市(Monterrey)进行宣讲。

5. 博物馆文物数字化与展示关键技术

文物作为传统文化的重要物质载体,蕴含着传统文化的思想精华和道德精髓,是不可再生的珍贵资源。随着中国智慧博物馆建设的推动,文物遗产的科学保护成为博物馆的重点工作对象。然而现有的文物遗产展示应用多受限于文物数字化采集技术的不足且展示手段的单一,因此亟需探索更为切实可行的方案。

本项目涉及文物数字化采集、编辑和可视化呈现三个方面。文物数字化采集侧重于针对不同种类的文物材质,例如丝绸、青铜器等,进行材质物理属性的数字化建模。文物的数字化编辑包括提取文物自身的代表性元素,如整体几何造型、局部几何造型等,以及基于文物的模型样式提取和传递。文物的可视化呈现则侧重于设计喜闻乐见的交互展览方式,更好的将原本的静态文物呈现给大众。

文物的数字化和可视化具备广阔的应用前途,除了文物本身的高保真展示外,基于文物要素的提取和编辑将为文化创意产品提供大量素材,大力促进文化产业的发展。此外,基于新型人机交互技术的文物展示将向游客提供一种全新的观览文博的体验,让游客能穿越千年,真正做到和文物“零距离对话”。

该项目由微软亚洲研究院和天津大学合作开展,项目成果中的两篇论文发表在ACM Transactions on Graphics上。此次科研合作中,微软亚洲研究院首席研究员童欣为课题提供了关键技术指导,项目成员中陈国军、李亮还是微软亚洲研究院和天津大学的联合培养博士。微软亚洲研究院和天津大学这样跨领域、跨专业的合作,不仅为研究项目提供了新思路,同时拓宽了高校人才培养渠道。


空间变化双向反射材质的渲染效果


半透明玉器文物的数字化


对于文物,提取其局部几何要素和全局结构信息

(责编/钱曙光)

0
0
  • CSDN官方微信
  • 扫描二维码,向CSDN吐槽
  • 微信号:CSDNnews
程序员移动端订阅下载

微博关注

相关热门文章