阿里斩获16项CVPR冠军,达摩院AI EARTH包揽农业遥感影像2项冠军
发表于 2021-06-28 18:31:51

  6月28日,计算机视觉领域顶级会议CVPR 2021竞赛结果已全部揭晓,阿里巴巴视觉算法团队成绩领跑全球,共斩获16项世界冠军,覆盖图像及视频内容理解、遥感影像分析、视觉问答等场景,多项研究可帮助盲人感知物理世界、识别农业领域灾害等。

1624870156806771.jpg

  CVPR是AI领域最顶级的学术会议之一,会议每年都会吸引全球顶级高校及Google、微软、Facebook等科技企业参加,近几年,该会议的主题逐渐从单纯的学术交流延伸至学术与应用结合的探索,而中国企业也迎来了高光时刻,在论文数量级竞赛冠军数上均有不俗表现。

  据悉,阿里巴巴达摩院视觉实验室、手淘算法等团队此次参与了多项高难度视觉任务竞赛,最终在16项竞赛中击败国内外科技公司及高校,斩获16项世界冠军。

1624870176157624.jpg

AI基于视频生成前后连贯的句子描述

  在ActivityNet Dense Video Captioning竞赛中,参赛团队算法需要基于一段视频生成前后连贯的句子描述,以帮助盲人理解视频内容。在该竞赛中,达摩院创新性采用SOTA视频网络及多模态特征融合,同时解决了事件序列描述的问题,可高效AI理解视频内容,最终以METEOR score 10.33的成绩获得第一名。在另外两项竞赛中,达摩院AI算法还准确识别了盲人拍摄的低清晰度照片,帮助盲人看清图片内容。

1624870189251962.jpg

  达摩院AI Earth精准识别农作物生长过程中的干旱、洪涝等农业灾害

  视觉技术在农业场景的探索是近两年的热门话题,在本届CVPR中,达摩院包揽了AGRICULTURE-VISION CHALLENGE监督和半监督两大赛道冠军。竞赛需要参赛团队基于遥感航拍影像来识别农业灾害,例如农作物生长过程中的干旱、洪涝等农业灾害类型。达摩院AI Earth采用了对抗学习、颜色语义引导、域归一化和双表征网络等方法,有效解决弱纹理、样本不平衡、颜色敏感、跨域等难题。未来,该算法可应用于精准农业、农业资产盘点、农业灾害定损等领域。

  视频行为理解是一直都被认为是一项非常具有挑战性的任务,达摩院针对该问题研发了技术框架EMC2,解决了视频背景复杂、视频人物相互遮挡及视频分辨率不足等干扰问题,最终在ActivityNet、AVA-Kinetics、Epic-Kitchens、HACS等视频理解竞赛中获得5项冠军。据介绍,该技术体系已在视频搜索、版权保护、视频交互等场景使用。

1624870201608611.jpg

基于达摩院EMC2技术体系的算法斩获5项冠军

  达摩院参赛团队表示,“计算机视觉领域的研究热点每年都在变化,AI算法需要面临的任务场景也越来越复杂,单纯的算法创新很难在实际问题中有好的表现,我们的算法融合了多项创新技术,并且在视频会议、农业、电商等领域大规模使用。”

  据介绍,达摩院在CVPR期间还主办了第二届大规模商品图像识别竞赛,最终共有623支队伍报名注册,冠军模型识别准确率超去年10%。

【免责声明:CSDN本栏目发布信息,目的在于传播更多信息,丰富网络文化,稿件仅代表作者个人观点,与CSDN无关。其原创性以及中文陈述文字和文字内容未经本网证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。凡注明为其他媒体来源的信息,均为转载自其他媒体,转载并不代表本网赞同其观点,也不代表本网对其真实性负责。您若对该稿件由任何怀疑或质疑,请即与CSDN联系,我们将迅速给您回应并做处理。】

CSDN官方微信
扫描二维码,向CSDN吐槽
微信号:CSDNnews
微博关注
【免责声明:CSDN本栏目发布信息,目的在于传播更多信息,丰富网络文化,稿件仅代表作者个人观点,与CSDN无关。其原创性以及文中陈述文字和文字内容未经本网证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。您若对该稿件有任何怀疑或质疑,请立即与CSDN联系,我们将迅速给您回应并做处理。】