精华内容
下载资源
问答
  • 在过去的十年里,由于大量的新兴多媒体应用和服务的出现,产生了大量的多媒体数据,用于进一步的多媒体研究。此外,多媒体研究在图像/视频内容分析、多媒体搜索与推荐、多媒体流媒体、多媒体内容发布等方面也取得了...
  • 人工智能 多媒体

    2017-10-21 09:23:15
    人工智能 机器学习
  • 基于人工智能多媒体数据库在线整合系统设计.pdf
  • 基于人工智能的分布式多媒体数据库资源整合系统设计.pdf
  • 人工智能多媒体技术发展报告 Report of ArtificialIntelligence Development 目录 1. 多媒体技术 3 1.1. 多媒体概念 3 1.2. 多媒体技术发展历史 4 1.3. 人才概况 6 1.4. 论文解读 9 1.5. 多媒体技术进展 215 多媒体...
  • 本文详细介绍了嵌入大数据和预测网络攻击的人工智能AI)引擎的整个平台的用例。 该平台已经过Tree Ensemble算法的测试,可以对可能的攻击的异常服务器日志进行分类和预测。 数据日志收集在启用AI培训模型的...
  • 基于人工智能多媒体教案制作方法和系统.pdf
  • 点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达腾讯广告多媒体AI中心招聘图像生成方向实习生广告多媒体AI中心负责腾讯体系流量上的多媒体广告相关的理解、智能创意等,提升...

    点击下方卡片,关注“CVer”公众号

    AI/CV重磅干货,第一时间送达

    腾讯广告多媒体AI中心招聘图像生成方向实习生

    广告多媒体AI中心负责腾讯体系流量上的多媒体广告相关的理解、智能创意等,提升多媒体广告投放效果以及广告主的投放体验。我们的目标是用前沿AI技术在广告领域创造价值。

    联系:wenhaojiang@tencent.com

    邮箱主题/简历命名格式:实习申请+姓名+CVer推荐

    岗位职责:

    1. 负责计算机视觉相关技术研究。研究内容包括为图像生成、强化学习;

    2. 跟进计算机视觉、深度学习、强化学习方向最新进展,负责相关技术的研发与工程实现,加速前沿AI技术在业务场景(尤其是广告领域)的落地与优化;

    岗位要求:

    1. 机器学习/计算机视觉/图像处理/模式识别/人工智能/计算机等相关专业硕士、博士,博士优先;

    2. 在机器学习、计算机视觉、图像处理、深度学习、强化学习方面有一定研究经验,3. 熟悉主流模型和算法,关注领域内的最新进展,能够跟进和实现新的算法能力;

    有高质量论文发表者优先;

    4. 较强的工程实现能力,熟练掌握Python,熟练使用至少一种深度学习框架(如tensorflow,pytorch等),熟悉OpenCV等基础库;

    5. 有大规模项目实践经验者优先;

    6. 有较强的学术比赛经验、在重要数据集的Leaderboard上排名靠前、或在开源社区有较大影响力等优先;

    7. 具备激情,好学,良好的团队合作和沟通能力。

    8. 工作地为深圳

    2022校招启动!欢迎加入AI算法岗求职群

    本星球不仅面向2021届、2022届找工作和找实习的学生(研一/研二/大三/大四等),还面向刚入学或已工作的人群。目前已有超过3100+位同学加入星球旨在分享AI算法岗的秋招准备攻略(含刷题)、面试经验和校招/社招/实习的内推机会(含提前批)、学习路线、知识题库和Offer如何选择等

    • 希望这个星球可以让你少走一些弯路

      扫码进星球

    • 如果喜欢招聘/面经/内推,请给个在看

    ▲点击上方卡片,关注CVer公众号

    展开全文
  •  · 可提供7X24小时不间断的自助式服务,大大缓解各营业窗口的人工压力; · 可提高银行在行业内的地位和品牌; · 可提供个人客户的使用积极性,并借此提高银行卡含金量和个人客户的满意度; · 可提供丰富的...
  • AI多媒体处理】

    2020-10-15 08:30:00
    AI正在渗透在多媒体应用的方方面面,并在其中扮演着重要的角色,为视频编码、处理、传输、内容生产、用户体验提升...提供更多新的思路。扫描图中二维码或点击【阅读原文】了解更多演讲嘉宾以及话...

    AI正在渗透在多媒体应用的方方面面,并在其中扮演着重要的角色,为视频编码、处理、传输、内容生产、用户体验提升...提供更多新的思路。

    扫描图中二维码或点击【阅读原文】了解更多演讲嘉宾以及话题信息。

    展开全文
  • 多媒体教室管理系统的人工智能化探析.pdf
  • (19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 111310859 A (43)申请公布日 2020.06.19 (21)申请号 202010224018.5 (22)申请日 2020.03.26 (71)申请人 上海景和国际展览有限公司 地址 ...
  • AI 1 人工智能概述.ppt

    2020-04-25 21:07:51
    31 今天的 I 2 计算 机智 能化技术的主攻方向体现在 : ? ? ? ? ? ? ? ? ? ?... 功能的感知技术包括对语音文字图形与图像等 信号的获取识别压缩与转化以及多媒体...32 今天的 I 3 当前人工智能的研究热点 分布式处理如云
  • 人工智能多媒体设备巡检中的应用研究.pdf
  • 多媒体技术演进看AI技术

    千次阅读 2019-10-09 15:32:03
    网易易盾 资深算法专家李雨珂——音视频内容审核中的人工智能 相芯科技 资深图形引擎开发经理蔡锐涛——AI驱动的沉浸体验新玩法 学而思网校技术总监李金瑞——学而思网校QoE优化实践   了解更多讲师信息可点击 阅读...
    640?wx_fmt=jpeg
    (图片付费下载自视觉中国)

    文 / LiveVideoStack主编 包研

    在8月的LiveVideoStackCon2019北京开场致辞中,我分享了一组数据——把2019年和2017年两场LiveVideoStackCon上的AI相关的话题做了统计,这是数字从9.3%增长到31%,超过三成的大会演讲内容与AI相关。多媒体技术生态只是真实世界的缩影,反映出AI正在与各行业、各种结束结合。包括CSDN在内,大大小小的机构推出各种AI学习课程、图书正迎合了这一趋势。
    相对而言,AI的学习曲线比较友好,上手相对容易,只要会Python或其他高级语言,掌握1-2个机器学习的框架,可以很快跑出结果。不过学习多媒体就没那么美好了,据说搞多媒体的研究生,先要用1-2年把H.264标准通读并理解,真正的研究还没有开始。我相信,同等水平的学生用同样的时间去搞AI,出几个paper,拿若干大厂的offer是可能的。我记得在4月的LiveVideoStackCon上海大会上,一名北大的教授就感叹:
    你只要想多媒体技术,学编解码,别说是数学专业的,就算是英文专业、历史专业的我也收。

    那么AI与多媒体技术有哪些结合的地方呢?
    内容理解:AI内容理解并不限于生成封面图,精彩剪辑,或者只看某个角色的镜头,这在内容推荐、广告平台有帮助。 此外,内容理解还能帮助更好的处理视频,比如可以针对不同的视频内容选择不同的Codec,以及相关的编码工具。

    图像增强:比如,将SDR转换为HDR视频,视频超分(将720p变成1080p),每秒30帧视频变换为每秒60帧等等。

    AI与ABR:AI的出现可以进一步提升ABR的效果,最著名的要数MIT提出的Pensieve

    语音识别与语音合成:从Siri到小冰,从智能手机到智能音响,语音识别已经无处不在。 而语音合成则是让电脑把文本变成语音,比如Google开源的Tacotron 已经可以实现99%的人声还原。

    回声消除:在一些低端的Android设备上,如果只有一个麦克风就需要利用AI来帮助消除回声,效果非常不错。

    声纹——人声识别与音乐识别:DNN可以掌握更多的声音特征,从而降低风险。 而在音乐识别方面则没有那么高风险,各大音乐App都集成了相关的功能。
     
    在LiveVideoStackCon 2019深圳上,自然少不了AI相关的话题:
    • 香港城市大学计算机科学系助理教授王诗淇——基于视觉感知特性的视频编码

    • 51talk高级技术总监陈靖——深度学习在语音降噪中的应用

    • 网易易盾 资深算法专家李雨珂——音视频内容审核中的人工智能

    • 相芯科技 资深图形引擎开发经理蔡锐涛——AI驱动的沉浸体验新玩法

    • 学而思网校技术总监李金瑞——学而思网校QoE优化实践

     
    了解更多讲师信息可点击 阅读原文 ,使用邀请码【CSDN】购票更可获得惊喜优惠!
    展开全文
  • 基于人工智能的三维多媒体视觉图像识别研究.pdf
  • 浅谈人工智能时代中小学生多媒体教学使用及影响.pdf
  • day3的论坛主要探讨的是多媒体计算的一些问题,各个研究机构的老师分别介绍了他们近年来的研究成果。图像和视频生成的规则约束学习这个报告主要介绍在图像和视频生成过程中引入规则进行学习的方法和实例。

    day3的论坛主要探讨的是多媒体计算的一些问题,各个研究机构的老师分别介绍了他们近年来的研究成果。

    图像和视频生成的规则约束学习

    这个报告主要介绍在图像和视频生成过程中引入规则进行学习的方法和实例。
    这里写图片描述
    生成对抗网络的基本思路。
    这里写图片描述
    这里写图片描述
    图像与视频智能化生成主要面临以下挑战

    这里写图片描述
    于是乎,报告中引入了规则约束的GAN.

    报告举了两个例子,第一个是风景图像的景深约束。
    这里写图片描述
    目前用GAN生成的图片面临景深效果不明确的问题,所以说我们要在GAN当中加入景深的约束。

    这里写图片描述
    从数据库中我们可以标注得到各构图元素的景深依赖关系,比如sky、sea和beach。

    这里写图片描述
    论文的逻辑是这样的,第一步利用数据库,建立景深关系的概率模型,对模型进行采样,生成图层序列,第二步按照图层序列,生成各层的表观,利用GAN生成整图。

    这里写图片描述
    用Hawkes过程模型对景深进行建模
    用Hawkes过程模型对景深进行建模

    这里写图片描述
    先在层内用DCGAN生成单层图像,然后在层间用lstm使得图像的真实性更强。

    这里写图片描述
    实验结果

    这里写图片描述
    第二篇文章主要讲的是输入运动骨架序列+静态图像如何输入一端动态的任务运动(根据骨架运动)视频,在这个例子中骨架信息辅助,就相当于在运动空间上加上了约束条件。

    这里写图片描述
    使用的还是GAN生成器+判别器的方法。在生成网络的设计中,输入包括骨架信息和图片,采用孪生网络结构,利用CNN Encoder-Decoder结构进行特征学习。

    这里写图片描述
    生成网络的设计。

    这里写图片描述
    总结

    基于锚图的视觉大数据分析

    汪萌教授做的报告是关于锚图的视觉大数据分析。关于锚图概念的引入,首先,图的学习在视觉数据分类、聚类等应用中取得了良好的效果,但是在其构图与优化的过程中的巨大运算量使得其无法运用于大规模数据。而锚图的引入是在原来的图基础上选取一些代表性的锚点,这样使得传统图的方法可以应用于大规模视觉数据分析。
    这里写图片描述

    这里写图片描述

    在构建锚图的基础上,运算量如果依然比较大的话,作者又提出可以通过构建层次话锚图的方法。
    这里写图片描述

    跨媒体分析、理解与应用

    这份报告是北京大学的彭宇新教授做的。个人感觉这是这次论坛最后收获的一份报告,彭老师的报告干货满满,介绍了北大近年来在多媒体数据处理方向的研究进展。

    这里写图片描述
    首先需要介绍的是跨媒体分析的总体思路。对于多媒体数据,我们首先要做的还是要在单模态内容的分析与识别技术上去的突破,然后再来考虑多模态下的分析理解,比如多模态的话题检测与追踪,多模态综合分析与识别。

    细粒度图像分类

    这里写图片描述
    这里写图片描述
    在这里接触到了一些我比较陌生的名次动态扩容增量学习、增量深度学习。可能以后有机会可以阅读以一下paper.

    这里写图片描述
    同时,北大在针对细粒度特征学习上,还提出了物体——局部两级视觉注意的深度模型,利用不同的神经网络,分别关注对象级注意力和部件级注意力。比如对于一张鸟的图像,部件级注意力关注的可能是鸟嘴、鸟头之类的东西。

    这里写图片描述
    paper的名称

    这里写图片描述
    在部件选择的问题上,北大进一步提出了空间约束的显著性部件选择模型,可以进行有效的显著性部件的选择。

    这里写图片描述
    针对细粒度的选择问题,北大又提出了通过引入定位的手段(Faster R-CNN)来进一步提升分类的准确率。

    这里写图片描述
    建立了视觉-文本联合建模的图像细粒度表示方法,实现了多粒度、多角度、多层次的图像描述。

    跨媒体关联与检索

    这里写图片描述
    针对跨媒体的问题,首先是需要将不同模态下的数据转化到同一个语义空间当中,并且建模关联关系和高层语义。北大采用的是基于稀疏和半监督规约的统一表征方法。
    这里写图片描述

    这里写图片描述
    基于跨媒体语义单元的统一表征方法

    这里写图片描述
    这里写图片描述
    基于跨媒体多深度网络结构的统一表征方法

    这里写图片描述
    基于多粒度层级网络的跨媒体关联学习方法

    这里写图片描述
    针对跨媒体训练样本不足的问题,提出了跨媒体混合迁移网络方法,混合了单媒体迁移和跨媒体迁移。

    这里写图片描述
    跨媒体关联传递算法

    这里写图片描述
    这里写图片描述
    数据集和源码下载地址

    这里写图片描述
    综述论文

    这里写图片描述
    研究室网址

    层次记忆网络:面向跨媒体推理的视频问答方法

    这里写图片描述
    韩亚洪教授分享的是针对视频问答的研究。视频数据由于增加了时间维度而更加复杂。本篇报告主要提出了新的层次记忆网络模型。

    这里写图片描述
    在处理视频的时候,一个方向是在video caption的时候找到时序兴趣区域,比如ppt上的图,我们可以检测出代表不同事物几个块,但在此时,我们最关心的是奔跑着的运动员。

    这里写图片描述
    文章的主要结构是这样的:首先用一个ROI选择器生成ROI,然后利用DMRM对ROI进行译码处理,然后用LSTM生成句子。
    (值得一提的是,这篇论文是ACM MM2017的最佳论文候选之一,毕竟是浙大的老学长,牛逼)

    这里写图片描述
    https://ziweiyang.github.io/ 代码地址

    这里写图片描述
    visual QA的流程,将图像用CNN提取特征,问题用词向量+LSTM的方法处理,然后将两者merge,并且预测回答。

    这里写图片描述
    在处理视频的时候,同时处理视频和字幕,得到最终的结果。

    展开全文
  • 01 引言 网络广告是腾讯公司重要的商业模式之一,在广告...在此背景下,团队系统性地研发了广告多媒体AI技术平台,为整个广告链路提供完善的、精准的、高效的广告多媒体AI技术。当前,该平台已经成为腾讯广告的基础A
  • 人工智能多媒体技术发展报告.pdf
  • 人工智能多媒体技术发展报告.docx
  • 端云一体人工智能开发平台整体架构 引言 当前人工智能(Artificial Intelligence)技术发展迅猛,在机器视觉、语音识别以及自然语言处理等多个技术领域取得了卓越的进展,带来了更高的精确度和泛化能力,因此...
  • 嵌入式AI平台介绍

    千次阅读 2020-10-13 08:49:06
    1.1.3 AI芯片 1 1.1.4 树莓派 1 1.2 挑战与解决 1 1.2.1 挑战 1 1.2.2 修剪神经网络 2 1.2.3 嵌入式终端优化 2 1.3 GPU 2 1.4 ARM 3 1.5 FPGA结构的并行计算 4 1.5.1 介绍 4 1.5.2 流水线计算 4 1.5.3 ...
  • 行业分类-物理装置-基于人工智能多媒体教案制作方法和系统.zip
  • 海康威视 AI Cloud 软硬件平台

    千次阅读 2019-05-31 08:44:47
    AI Cloud软件产品 ...2018 年,海康威视基于 AI Cloud 架构,深刻践行“云边融合”的计算架构,全面发布了“两池一库四平台”软件产品,并在实践中不断深化落实“物信融合”的数据架构,将“两池一库四...
  • 网络多媒体技术及应用;多媒体关键技术;1 数据压缩概述;数据压缩方法 无损压缩 利用数据的统计冗余进行压缩可完全恢复原始数据而不引入任何失真但压缩率受到统计冗余度理论限制一般为21到51 无损压缩所使用的编码技术...
  • 2020 无疑是特殊的一年,而 AI 在开年的这场”战疫“中表现出了惊人的力量。站在“新十年”的起点上,CSDN【百万人学AI】评选活动正式启动。本届评选活动在前两届的基础上再度升级,设立了「AI优秀案例奖Top 30」、...
  • 欢迎大家前往腾讯云社区,获取...本文整理了四个重磅演讲的干货内容,包括腾讯AI的发展路线图、游戏AI研究的挑战与应对、多媒体AI从图片到视频的演进,及惊艳全场的同声传译产品,以飨读者。完整文章可到官网阅读。...
  • (19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 111178343 A (43)申请公布日 2020.05.19 (21)申请号 202010285092.8 (22)申请日 2020.04.13 (71)申请人 腾讯科技深圳有限公司 地址 518057 ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 22,527
精华内容 9,010
关键字:

多媒体ai平台