阿里人工智能设计鲁班_阿里ai鲁班怎样使用 - CSDN
  • 此平台原理是通过人工智能算法和大量数据训练机器学习设计。通过一段时间的学习,鲁班从去年“双十一”前就已经在阿里内部大规模投入使用,目前其设计水平已经非常接近专业设计设计的效果。 ...

    4月27日,UCAN2017用户体验设计论坛在杭州阿里巴巴西溪园区举行。大会开场,阿里巴巴集团UED委员会委员长杨光发布了智能设计平台——鲁班。此平台原理是通过人工智能算法和大量数据训练机器学习设计。通过一段时间的学习,鲁班从去年“双十一”前就已经在阿里内部大规模投入使用,目前其设计水平已经非常接近专业设计师设计的效果。




    据阿里智能设计实验室负责人吴春松表示,基于阿里商业生态上中蕴含的真正大数据,强大的算法能力和计算能力,早在2016年7月份就已经开始组建阿里智能设计实验室,致力于开发人工智能设计平台——鲁班。通过一段时间的积累,鲁班设计平台已经具备了可大规模设计、可自我学习成长、可开放接入三大特性。




     2016年双11期间,鲁班把双11站内投放广告形式呈现为千人千面。以前的“双十一”每个分会场只需根据主题投放1张图片素材,2016年的“双十一”分会场需要根据主题和消费者特征进行个性化呈现,平均每个分会场需要投放3万张图片素材,整个双11期间累计生产了1.7亿素材,满打满算需要100个设计师不吃不喝连续做300年。这在1年前是很难想象的,但是鲁班系统除了个别模板还需人工设计以外,基本承接了此项目全部的工作量。从商业效果来看这种模式让资源位点击率翻了一倍多。设计效能得到大幅提升。


    鲁班平台是一套可以通过自学习达到设计认知层面的机器,它与人类学习设计的过程非常相似。开发人员为他设计了一套可以快速学习设计风格并且不断成长的闭环系统,包括“风格学习-行动器-评估网络”三大核心模块。机器从大量设计文件中学到设计风格后,由行动器根据设计需求生成设计结果,生成结果好不好由“评估网络”来给予反馈。评估器的工作原理是输入大量的设计图片和评分数据,经过训练最终让机器学会判断设计的好坏。


    此系统将于今年双十一前开放给阿里生态上百万的设计师使用,届时广大中小商家企业就可以使用鲁班智能设计能力,低成本生成高质量的设计。而部分有自主品牌设计风格的品牌大商家,将设计风格输入给机器,由机器协助生成大批量统一风格的设计结果。从而让商家享受阿里平台的设计和技术能力,做到设计赋能全网商家。


    智能设计时代已经到来,设计师将何去何从。杨光认为,“以后美工的工作将会被人工智能所取代,但设计不会被取代,内容创意设计和全链路设计会成为设计师未来发展的方向。”

    在新的商业模式和背景下,杨光表示,对于设计行业要通过以下三点提前布局:


    一、从产品设计到设计产品


    目前消费者的购买模式已经从需求升级到现在的消费升级。在此情况下消费者对于审美、创意、个性化的需求与日俱增。因此设计的范围已经不能局限于狭义的产品设计,而是需要洞察消费者内心设计出其喜爱的产品。这一点在淘宝造物节当中有充分的体现,在此活动中很多设计师品牌大放异彩,设计师的价值也随之被放大。这个现象不仅仅会出现在互联网行业,而是方方面面。


    二、从体验设计到设计体验


    消费者在互联网上购买的不仅仅是一件商品,还有整套购物体验。现在随着技术的发展,消费者通过指尖和屏幕的交互已经可以无限延伸,达到虚拟设定场景(AR、VR)的使用。这就要求设计师掌握更多的技能,考虑更多形式和维度的交互。以达到人机交互的过程更加自然亲近,无限趋近于人人交互。


    三、从技术升级到设计升级


    大数据的积累和鲁班系统的全面应用,使我们可以了解每一位消费者,并对他们进行个性化的产品呈现。这种能力开放出去不仅可以赋能给全平台的商家,还将赋能整个设计生态。


    阿里的鲁班系统通过大数据和智能学习,产出设计投放到市场,服务于用户。用户使用的过程中产生了更多的数据反馈到大数据库中,更多更精准的数据使鲁班不断学习并应继续应用于设计当中,从而使新技术赋能新设计,新设计赋能新商业,最终进入良性的工作循环。


    UCAN用户体验设计论坛


    这是由阿里巴巴集团 UED 发起,社会各界广泛参与的用户体验设计论坛。阿里UED一直以设计赋能商业为使命。本届 UCAN 继续围绕赋能并提出新商业模式下的发展方向,和技术突破。在行业内重新定义用户体验在新商业环境中的蜕变和价值,不断把设计领域、设计概念向外延展,赋能新技术、新能源和新商业。


    展开全文
  • 前阵子在京东做了一场分享,分享的标题是《设计师能利用AI做什么?》。今天把分享内容分享给大家。如果说大部分设计师的产出都和图形有关,例如图片编辑、插画、交互稿、视觉稿、那么AI能不能完成以上内容呢?我先举...
    前阵子在京东做了一场分享,分享的标题是《设计师能利用AI做什么?》。今天把分享内容分享给大家。
    640?wx_fmt=png

    如果说大部分设计师的产出都和图形有关,例如图片编辑、插画、交互稿、视觉稿、那么AI能不能完成以上内容呢?我先举些例子:

    640?wx_fmt=png
    2016年日本的早稻田大学公开了一项自动描线的技术,这项技术能够自动识别图像并确定图像的具体轮廓,然后完成描线的工作。即便是衣物线条很复杂的草稿也可以完美地转化成线稿。这项技术在后面的介绍中有一款免费产品可以体验到。

    640?wx_fmt=png
    我还记得2016年图片编辑软件Prisma风靡了全世界,那么,去年一款名叫FastPhotoStyle的工具更为惊艳。FastPhotoStyle是英伟达发布的一款开源图片风格转换工具,它能把照片变为各种艺术风格。只要给出风格照片和目标照片,那么FastPhotoStyle就能将风格照片上的风格特点迁移到目标照片上,图上的效果简直是以假乱真。

    640?wx_fmt=png
    去年,有一个名叫Crypko的区块链游戏震撼了整个二次元圈,这游戏的玩法跟以前流行的“以太猫”类似,就是利用GAN,生成式对抗网络将两张不同风格的插画融合成一张新的插画作品。用户可以通过租赁或者购买的方式获取插画后,然后和自己的插画进行融合,生成新的插画。质量好的插画具备较高的收藏和观赏价值,例如上图中的插画租赁价为7以太币,2018年10月一个以太币约为1000元人民币。

    640?wx_fmt=png
    由AI创作的油画作品《埃德蒙·贝拉米画像》在世界著名艺术品拍卖行上拍出了43.25万美元的价格。该作者还创造了整个贝拉米家族,以下是埃德蒙·贝拉米的曾祖父和曾祖母。
    640?wx_fmt=jpeg

    好了,看了这么多案例,现在的AI究竟是什么?其实,以前也有各种AI技术,它们更多是基于统计学去实现的,它们通过算法获来预判事件或者取事件的准确率。现在的AI在本质上和前者没有什么区别,其实都是一种预测能力。
    640?wx_fmt=png
    简单点说,以前的AI是主要是分类、聚类、回归、决策树等等统计方法,例如垃圾邮件处理、文章自动分类都是用了以上的方法。现在的AI更多是一种名叫深度学习的方法。我们可以认为深度学习是一个黑盒子,只要我们输入数据,它就能在一个多层的神经网络里自动训练,找到相关特征后形成模型,然后再将结果输出出来。
    640?wx_fmt=png
    既然我们把深度神经网络当做黑盒子,那么我们就不要在意黑盒子里的是什么,只要我们寻找准确率高的深度学习模型就好了。现在有哪些现成的AI资源可供我们使用呢?

    640?wx_fmt=png
    对很多没有绘画经验的人来说,绘画是非常困难的,更困难的是为绘画选择和谐的色彩,即使是相似的颜色,其中的差异也会对绘画结果产生巨大的影响。在漫画线稿上色AI这个领域,PaintsChainer几乎可以算是标杆。PaintsChainer操作非常简单,用户选好线稿上传,自行选择颜色并涂在相应区域,PaintsChainer会根据图像和提示的颜色实时自动为新图像上色。PaintsChainer还有自动提取草图里线稿的功能,大家可以尝试一下。

    640?wx_fmt=png
    BigJPG是一个很神奇的免费网站,它能将图片清晰度放到2-16倍。左侧这小图是我在网上随便找的图片,分辨率只有200*254像素,放大4倍后就是第二张图的效果,非常模糊。使用了BigJPG后整体的线条变得非常清晰,它的线条甚至比原图还清晰。整张插画可以直接使用。

    640?wx_fmt=png
    相信大家都听过这个笑话,我们如何画一匹马呢?首先我们画两个圆,再画几笔,在脸上画几笔,再画上鬃毛和尾巴就完成一幅栩栩如生的作品了。在以前,这可能是一个笑话,但现在,这肯定是一件很正常的事情。

    640?wx_fmt=png
    这8张图如果是由一名设计师来画,大概要画多久?有谁能给个答案?如果是我,我是不会去画的,说实话估计我一个月也画不出来,因为我没什么耐心长时间画一幅画,而且对光线处理等完全不熟悉。大家有没有发现这几张图里有几张图是类似的?大家可以观看一下,其实5和6以及4和8的布局是一样的,那么它们是怎么生成的呢?

    640?wx_fmt=png
    以上这个是英伟达最新的发明:GauGan,它能通过几笔就能自动生成一张“风景照片”。这个就是我今天花了20秒画的图,它十几秒内给我生成了右侧这张图片。如果以后没有风景素材,不妨可以考虑一下这个网站。

    640?wx_fmt=png
    以上这个是借鉴了小米官网的案例,6种天空滤镜内置于你的相册滤镜中,一键换天。

    640?wx_fmt=png
    640?wx_fmt=png
    人物照片是我们常用素材之一,肖像权和版权成为我们最烦恼的问题之一。generated.photos也是一款免费产品,它号称通过AI技术自动生成10万张肖像照片。这个网站拥有不同种族、年龄、皮肤、性别、眼睛、心情等数据,可以通过排列组合的形式创造出10万张肖像照片,这些照片里的人物在现实生活中都是不存在的,所以不存在肖像权问题。
     
    除了通过AI解决素材的问题,我们还能如何了解更多AI相关的实践?

    640?wx_fmt=png
    Google在AI上做了很多贡献,例如开源了深度学习框架TensorFlow、研发了基于深度学习的芯片TPU等等。Experiments with Google这个网站收集了36个AI案例,这些案例包含了各行各业对AI的探索,包括Android、Web VR、AR、艺术、声音等方面。大家感兴趣可以上网看一下相关内容。

    640?wx_fmt=png
    在这里我要强烈推荐Runway ML这个产品。简单介绍一下Runway ML相关背景。Runway ML最早只是纽约大学Tisch艺术学院一位名叫Cristal Valenzuela的学生的论文项目,结果这个项目得到人工智能艺术界的热情反馈,Valenzuela决定创业并在今年1月份把Runway ML测试版实现了出来。

    640?wx_fmt=png
    Runway ML是一款收费产品,你只需要下载安装注册就可以直接使用,里面的模型包含了图片生成、动作捕捉、自然语言处理、物体识别和图片处理等类型,如果使用的模型需要在云端GPU上运行,那么每分钟只需要消耗5美分,但每一个新注册账号都拥有10美元也就是200分钟的免费时间来玩转整个Runway ML。

    640?wx_fmt=png
    以上是我随便找的图片,在Runway ML上可以通过简单的步骤就能把它识别出来。

    还有这个把黑白照片还原彩色,在Runway上都是非常简单的。以下我来简单演示一下:
    1.打开软件
    640?wx_fmt=png

    2.选择模型
    640?wx_fmt=png

    3.选择输入内容
    640?wx_fmt=png

    4.选择输出内容
    640?wx_fmt=png

    5.点击开始
    640?wx_fmt=png

    等待几秒钟,好的,上色完成了,是不是超级简单!
    640?wx_fmt=png

    听了这次分享,相信大家应该觉得人工智能离我们设计师并不是很遥远。虽然我们可以不懂它的原理,但这不妨碍我们去使用它。今天分享的到此结束,谢谢大家。

    相关阅读

     
    640?wx_fmt=png

    11月活动
    展开全文
  • 现在他们甚至还能取代了一些设计师的工作,在双十一正式到来之前,淘宝的宣传已经铺天盖地,然而很多人都没想到,我们打开淘宝首页看到的很多海报其实是由人工智能机器人“鲁班设计的。 今年的双十一共有4亿张...

    相比较去年,“鲁班”的设计技艺有所提升。

    人工智能很大程度上便利了我们的生活,现在他们甚至还能取代了一些设计师的工作,在双十一正式到来之前,淘宝的宣传已经铺天盖地,然而很多人都没想到,我们打开淘宝首页看到的很多海报其实是由人工智能机器人“鲁班”设计的。

    双十一到来之前,阿里AI设计师鲁班1天能做4000万张海报

    今年的双十一共有4亿张人工智能海报是“鲁班”完成的,在去年的双十一,鲁班就已经制作了1.7亿张商品展示广告,提高了一倍的商品点击率。如果这些内容完全由设计师完成的,按照1张图需要耗时20分钟,一共需要 100个设计师连续做300年。

    据了解,AI设计师“鲁班”由学习网络,行动器,评估网络三部分组成,通过人工智能算法和大量数据训练,学会设计并且输出设计好的海报内容。而且相比较去年,“鲁班”的技艺有所提升,目前已经学会了百万级的设计师创意内容,能在一天制作4000万张海报。

    在设计方面,AI不仅仅是能够个性化制作海报,而且还能够帮助设计师解决配色问题,比如一款名为Khroma的工具,通过分析设计师选择的颜色,可以快速生成实用性非常高的调色板的配色工具。

    双十一到来之前,阿里AI设计师鲁班1天能做4000万张海报

    可以预见在不久的将来,人工智能在设计行业发挥出更大的作用。


    原文发布时间:2017-11-04 09:02
    本文作者:巫盼
    本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
    展开全文
  • 你的双11,买买买。 阿里海报设计师的双11,在一个名为“资源位小组”的小黑屋连续通宵加班。 做海报、改文字、换商品、调设计、换...这是一个名为“鲁班”的AI设计师,没错,它将担纲今年双11的banner海报设计

    你的双11,买买买。

    阿里海报设计师的双11,在一个名为“资源位小组”的小黑屋连续通宵加班。

    做海报、改文字、换商品、调设计、换banner,每个设计师对接几个运营人员,富士康流水线一样的重复性工作。一年双11下来,完成上亿张海报。

    然而,这一切正在成为过去。。。。

    AI改变了围棋,现在也在改变海报设计。

    这是一个名为“鲁班”的AI设计师,没错,它将担纲今年双11的banner海报设计,数量高达4亿张。

    但考虑到鲁班平均1秒钟就能完成8000张海报设计,一天可以制作4000万张,4亿只能算一个小小小小目标。




    鲁班

    这个海报设计AI“鲁班”,诞生也与双11有关。

    每年双11,都是阿里设计师的大考:海量的设计需求,需要保证所有人都统一规范,遇到紧急设计需求,还要快速出稿,对每一个设计师都是脑力、体力双重考验。



    于是,2015年双11后,阿里内部开始萌生想法,当年阿里正式在商品推荐上实现“千人千面”,所以希望强营销导向的广告资源位的设计也能实现“千人千面”。

    因此“鲁班”项目正式成立,并不断发展至现今的“阿里智能设计实验室”。

    当时正值AlphaGo摧枯拉朽,将深度学习和AI传播开来,阿里内部也决定进一步把鲁班打造成一个AlphaGo一样的AI设计师。

    进而开始搭建神经网络,让鲁班学习人类设计师的成果和经验,不断进化,到今年双11,鲁班的水平已经达到了阿里内部P6水准。

    鲁班的学习进化,主要有三大技术原理。



    三大核心模块

    鲁班从0到P6,自学设计能力主要看三大模块:风格学习(规划+元素)、行动器,以及评估网络。


    首先是风格学习模块。


    鲁班先将大量设计素材的设计数据进行结构化标注,最后经过一系列的神经网络学习,输出空间+视觉的设计框架。

    框架设计中,首先通过人工标注的方式,让机器理解该幅设计有哪些元素组成,比如它的商品主体,花的背景,蒙版。

    往上一层,还需要通过设计的经验知识,定义一些设计的手法和风格。手法指的是这些元素为什么可以这么构成。

    最上面这一层是风格,当这些元素构成之后,它从美学或者视觉角度看是一个什么感受,让机器知道它是用什么组成。

    下一步是准备设计的原始文件,比如一系列花朵和设计方法,输入到深度学习网络中。该网络具备一定记忆功能,可以记住设计步骤中复杂的过程。

    经过这层神经网络学习之后,会得到一个设计框架。从技术上理解,它是一堆空间特征和视觉特征构成的模型。从设计师的视角来看,它相当于设计师脑里在做一组设计之前那个大概的框架印象。



    在设计框架的同时,元素中心也在批量输入元素(如底图,主产品图、修饰元素等),由元素分类器进行学习,按照视觉特征和类型分类。

    具体来说,鲁班团队会提前收集一些版权图库,以及自己造设计元素的方式,输入到元素分类器中。这个分类器会把这些元素分布到各个类型里,比如背景、主体、修饰,也会完成图片库的提取。


    其次是行动器。


    行动器的主要作用,是根据需求从风格学习模块中选择设计原型,并从元素中心中选取元素,规划出多个最优生成路径,完成图片设计。

    这与设计师实际工作过程非常相似,如设计师要设计一朵花,也会在软件里会不断去调每个位置、每个像素、每个角度。同时,整个过程也是一个强化学习的过程,行动器会在不断试错中更聪明、更智能。

    此过程完成后,将输出多个设计图,并最终交给“评估网络”对输出产品进行评分。


    最后是评估网络。


    评估网络的工作原理是输入大量的设计图片和评分数据,经过训练后,让机器学会判断设计的好坏。

    鲁班的基础是来源于设计师的设计模板素材和元素素材,因此会有两个设计师角色每天去训练鲁班,一个负责帮助鲁班完成最新的风格学习(风格学习),让鲁班不断进化,不断掌握更好的设计技巧。

    另一个的角色则是对鲁班设计出来的成果进行评估(评估网络),告诉鲁班什么样的设计才是最好的。

    设计师的核心职责,在于把设计变成数据化。目前,鲁班已经学习了百万级的设计稿,拥有了演变出上亿级的海报设计能力。

    实际上,你应该也看出来了,与AlphaGo最初设计一样,鲁班从0到P6,也是设计师+算法工程师的合作成果。

    这背后,阿里的设计师和算法工程师做了三大功课。


    三大功课

    第一,领域研究。找到该领域专家深入研究该领域的经验知识,构建一套机器可以学习的数据模型。视觉设计专家把设计问题抽象成“风格-手法-模板-元素”这样一套数据模型,即把多年视觉设计经验变成机器可学习的“数据”。

    第二,数据链路。定义好数据模型后,抓取和标注数据,并对数据集进行分类和管理。在这个过程汇总,如果处理数据给算法训练的更新频次,用什么数据去验证模型,如何评估模型效果,离线模型与在线数据在产品端如何打通?这一系列的数据问题就需要一套清晰的数据链路设计。

    第三,算法框架。算法框架由算法科学家来制定,数据和算法的关系就像汽油和发动机,两者密不可分。产品设计师需要与算法讨论,把业务场景和数据问题输入给算法。

    这也是阿里内部让产品设计师学习机器学习的原因,因为搞懂算法框架和技术原理,才能更好理解工作原理。

    但三方面功课背后,也不是没有具体挑战。

    整个鲁班打造过程中,遭遇了三方面技术挑战。


    技术挑战

    首先是缺少标注数据。今天所有的人工智能都基于大规模结构化标注数据,设计这件事情连数据都没有完成在线化,更别说标准化、结构化的数据。

    其次是设计的不确定性。设计是个很不确定的东西,设计需求把握和结果评估都存在人类主观意识。比如你无法给机器输入“高端大气的海报”这样的指令。

    最后是无先例可循。整个行业中没有一些现成的技术或者框架可以参考,这和AlphaGo带来的福利不同。

    当时AlphaGo团队公布论文后,全世界围棋AI都照此提升了战力,比如腾讯绝艺,很快就做到了世界水平。

    但对于鲁班来说,并无先前经验可以参考,一切全凭自己摸索。不过也并非完全没有收获,在探索中的一年,阿里鲁班团队对AI产品有了更为清晰的定义。

    他们内部认为,鲁班做的AI是可控的视觉生成。可控,指的是根据商业的需求、业务的需求,智能地进行控制;视觉生成,则表明鲁班解决的是视觉从无到有的问题。


    牛刀小试

    那么海报设计AI鲁班,效果怎么样?

    在2016年双11,鲁班首次登场。它最终制作了1.7亿张广告banner,点击率提升100%。

    与人类对比的话,假设每张图,人类设计师需要耗时20分钟,满打满算也需要100个设计师连续做300年。

    ……

    已经不用计算节省的成本了。

    而今年,鲁班也被进行了进一步迭代。设计水平显著提升,最新的数据情况是:

    鲁班已经学习了百万级的设计稿,拥有演变出上亿级的海报设计能力。

    今年双11,鲁班已经可以实现一天制作4000万张海报,平均每秒可实现设计8000张海报,并且每张海报会根据商品图像特征专门设计,换句话说说,鲁班设计出的海报,没有一张会完全一样的。


    设计师的未来

    毫无疑问,是时候可以谈谈设计师群体的未来了。

    按照当前阿里内部对技术岗位的评判体系,海报设计AI鲁班,已经达到了P6水准,后续进阶也只会越来越快。

    那设计师会就此被AI替代吗?

    会,在阿里体系内,P4左右的设计师都会受到来自机器的“威胁”。

    但也不全会,除了“创意”部分让机器无可奈何,人类设计师与机器的竞合中,也会产生“训机师”一样的新职业。

    训机师是阿里内部对转型设计师的称呼,这些训机师是鲁班数据中心的核心人员,他们需要为鲁班的进化提供规模更大、更丰富的数据,并且对于很多风格相关的事情实现“结构化数据”的转换。

    阿里智能设计实验室告诉量子位,现在的阿里设计师,变成要去学习鲁班系统,学习如何训练机器,同时在美学方面做把控。

    “鲁班今年花了半个月时间学会双11设计风格,目前已经开始产出一部分人类没教过它的设计了。但是最具创新意义的创造类设计,目前只能通过“人-机”协同的方式完成。”鲁班负责人乐剩介绍说。

    展开全文
  • ... 近期,央视《机智过人》的舞台上来了位“三超设计师”——设计能力超强;出图能力超快;抗压能力超强,成功迷惑嘉宾和现场观众,更让撒贝宁出错三连。 节目一开场,这位“设计师”就...
        

    近期,央视《机智过人》的舞台上来了位“三超设计师”——设计能力超强;出图能力超快;抗压能力超强,成功迷惑嘉宾和现场观众,更让撒贝宁出错三连。

     

    节目一开场,这位“设计师”就为现场嘉宾:主持人撒贝宁、演员韩雪、神经科学家鲁白生成了三张独具特色的海报。几乎是说话的瞬间,海报立即生成,出图速度之快让撒贝宁惊呼“秒完”。

     

    640?wx_fmt=jpeg

    鹿班为现场嘉宾设计的海报

     

    这位设计师正是阿里巴巴研制的AI设计师——鹿班。鹿班是为解放人类平面设计师而生,它学习了五百万张人类设计作品,现在它每秒能做八千次设计。自从2016年上线至今,鹿班已经完成了十亿次海报制作,是全球首位大规模投入使用的人工智能平面设计师。

     

    节目中,鹿班将接受设计领域的两轮检验,如果鹿班的作品被现场观众成功找出,则认为鹿班通过检验。究竟AI能否在设计领域达到人类水平?接下来,我们一起走进检验场。

     

    第一轮挑战中,鹿班与一次成稿率在80%以上的设计师、从业十二年的资深设计师等三位同台竞技,各自设计一张以“汽车卓越加速性能”为主题的商业海报。下图即四位设计师的设计成图,大家不妨来猜一猜哪幅是鹿班的作品。

     

    640?wx_fmt=jpeg


    根据现场观众投票,多数观众认为4号作品出自鹿班之手。让观众出乎意料的是2号才是鹿班的创作,这个结果让神经学家鲁白大呼“不服气”。


    不信?眼见为实!



    接下来,战况升级。中央美术学院院长范迪安教授带来画家与服装设计师来和鹿班同台创作,为《孙子兵法》这本书设计封面。

     

    面对设计难度升级,鹿班能否成功应对?我们马上揭晓鹿班和两位人类设计师为《孙子兵法》设计的封面的作品:

     

    640?wx_fmt=png


    以上图片中有三幅作品,其中哪一张是鹿班的设计?到底观众们有没有猜对?不急,我们先请阿里巴巴资深技术专家星瞳为我们揭秘鹿班背后的技术。

     

    使用场景


    视觉生成引擎的使用场景大致可抽象成下图。以显式输入而言,用户可以输入标签需要的风格、色彩、构图等,或者输入一个例子,或者进行一些交互的输入。除显式输入之外还可以有隐式输入,比如人群信息、场景信息、上下文信息等。总的来说,输入可以是千变万化的,但通过规范化之后就会减少变化,使得生成过程可控,输出质量可控。

     

    640?wx_fmt=png


    对视觉生成引擎来说,它要求输入是规范化的。但在输入前,可以加入各种交互方式,如自然语言处理,语音识别等,将其转化成规范化输入。最后输出结构化信息或可视成图。

     

    640?wx_fmt=jpeg

    技术框架和生产流程

     

    其技术框架如下图左侧。首先对视觉内容进行结构化理解,如分类、量化、特征化。其次通过一系列学习、决策变成满足用户需求的结构化信息即数据,最后将数据转化成可视的图像或视频。这一框架依赖于大量的现有数据。其核心是一个设计内核。同时,引入效用循环,利用使用后的反馈来不断迭代和改进系统。

     

    其生产流程分成六个步骤,如下图右侧所示。首先用户提出需求,将需求特征化转变成系统可以理解的结构化信息。其次将信息进行规划得到草图。有了粗略的草图后再将其转变成相对更精确的图,然后调整细节,最后通过数据可视化形成最终的图。当然其中还有很多的trick,以及各部分的优化。

     

    640?wx_fmt=png


    关键算法

     

    下面介绍一些关键算法。我们希望基于下图最左的耐克鞋生成最右的图。先通过规划器得到草图,再通过强化学习获得相对细致的结果,再通过对抗学习及渲染算法得到图片,再通过评估器进行评估,最后形成业务闭环,其中还会有一些基础的能力,包含更强的联合特征(非普通 CNN特征)及多维度检索算法等。

     

    640?wx_fmt=jpeg

     

    基本上,处理的第一步是将图片中的信息结构化,这也是与现有的识别理解技术结合最紧密的地方。其中的难点和重点包括,对图像中多目标的识别、遮挡和互包含情况如何得到分割的信息等,下图只是个简单的示例。

     

    640?wx_fmt=png


    有了结构化信息之后,需要对信息进行量化。可以量化成特征或量化图。量化过程中会包含很多信息,比如主题风格、布局配色、元素种类、量化空间等。有了这些信息后可以在主题、种类、风格、视觉特征大小位置上,量化成各种码,用相对有限的特征来表达无限的图。


    640?wx_fmt=jpeg

     

    下一步是通过用户的输入,得到一个相对粗略的结果即草图。目前主要使用的是深度序列学习。从图像角度,首先选定一个点的像素颜色再选择位置,再迭代进行操作,最后形成一张图。规划器模拟的就是这个过程。本质上预测过程是一棵树,当然也可以拆成一条条路径。为了简化,可以分成几步进行,比如空间序列,视觉序列。最后形成量化特征模型,主要应用的是LSTM模型。它把设计的过程转化成基于递归、循环的过程。

     

    640?wx_fmt=png

     

    得到草图后,利用行动器将草图细化。如果将图中的每个元素看作一个Agent,那么它将有若干个可选的行动空间。

     

    640?wx_fmt=png

     

    假设一张图中有20个元素,每个元素在视觉上有多种可选的行动空间,由其组合成的可选行动空间非常庞大。我们有很多trick可以解决这一问题,比如在空间上,只允许在有限范围内进行变动,且行动方向有序,即状态有序,行动有限。


    640?wx_fmt=png


    下一步是如何衡量结果的好坏。图像的评估相对比较主观,主要可以从美学和效果两方面来评估。美学角度可以包括是否对齐、色系搭配是否合理、有无遮挡这些较低级别的判断标准,以及较高级的,比如风格是否一致,是否切合主题。从效果上,产品投放后是否会在点击率等方面实现提升。最后将多个指标形成对应权重并形成多个DeepLR联合模型。

     

    640?wx_fmt=png

     

    但在衡量结果之前,需要形成像素级别可见的图。这里有以下几种构造器分类,包括临摹、迁移、创造、搭配与生成。

     

    640?wx_fmt=png

     

    前面介绍了,如何通过用户的需求形成可见的图。后续还需要进行投放和反馈并进行优化,形成效用外循环。这样才能使得系统效用不断得到提升,形成一个在线闭环,这也是智能设计相对设计师的一大优势。

     

    640?wx_fmt=png

     

    从技术角度来说,鹿班可以满足海量无选择客户的需求。相信在未来,可以做到“所想,即所见”。节目的最后,撒贝宁、韩雪、鲁白纷纷为鹿班站台,鹿班也因此成功入选 “2018智能先锋”。


    看到这里,不知道你是否已经猜出鹿班的封面设计?关注“阿里巴巴机器智能”,回复“鹿班”,答案马上为你揭晓。


    640?wx_fmt=jpeg

     ↑ 关注并回复“鹿班”,揭晓答案



    640?wx_fmt=gif

    你可能还喜欢

    点击下方图片即可阅读


    640?wx_fmt=jpeg

    双11背后的全球数字经济“操作系统”


    640?wx_fmt=jpeg

    首次公开!2018双11技术数字全记录


    640?wx_fmt=jpeg

    双11大队长霜波:

    从手忙脚乱到胸有成竹,我们如何走过这十年?


    640?wx_fmt=jpeg

    关注「阿里技术」

    把握前沿技术脉搏

    展开全文
  • 在过去,每年双11,设计师们都会开启狂加班模式:做海报、改文字、换商品、调设计、换 banner,每个设计师对接几个...这是一个名为 " 鲁班 " 的 AI 设计师,它将担纲今年双 11 的 banner 海报设计,数量高达 4 亿张。
  • 来源:ATYUN AI平台 你的“双11”,买买买! 一年一度的双十一购物狂欢节即将来临,不知你有没有留意到,当你打开手机淘宝的时候,几乎每次你看到的海报banner都...阿里名为“鲁班”的AI设计师,今年将继续为你服...
  • 阿里AI鲁班”上岗:每秒做 8000 张海报 还不知道鲁班是什么的话,先看看视频脑补一下:
  • 分解海报元素,从“背景+修饰元素+框架+配色+商品图”五个基础方面,以及“设计手法”、“风格”等上层维度,训练神经网络模型。 模型的评估包括”美学+商业“两个方面,”美学“由人工评估海报质量,”商业“是海报...
  • 此平台原理是通过人工智能算法和大量数据训练机器学习设计。通过一段时间的学习,此平台从去年“双十一”前就已经在阿里内部大规模投入使用,目前其设计水平已经非常接近专业设计设计的效果。据阿里智能设计实验室...
  • 4月21日,阿里巴巴第七届UCAN用户体验设计论坛上,一系列重磅消息接连抛出:内部孵化两年后,阿里设计机器人鲁班更名为“鹿班”,并首度开始向外输送服务能力;同时,阿里还诞生了首款“懂感情”的视频生成机器人...
  • 看了其他设计老师们的回答,给了我一些启发,于是更新一波。 设计本质上是产品和服务的一部分,如果只站在设计师角度看这问题,免不了会有一种被取代的危机感。 但如果站在整个产品和服务的角度,我想做一款产品,...
  • 阿里云云栖大会,阿里做足了噱头,系列预热“重磅”、“史无前例”等形容词吸引眼球,本次大会诞生了一个新词:产业...阿里人工智能项目“ET大脑”也升级为开放的AI生态,还启动“千里马计划”,通过赛事来招募合作
  • 4月21日,阿里巴巴第七届UCAN用户体验设计论坛上,一系列重磅消息接连抛出:内部孵化两年后,阿里设计机器人鲁班更名为“鹿班”,并首度开始向外输送服务能力;同时,阿里还诞生了首款“懂感情”的视频生成机器人...
  • 人工智能正在离我们越来越...我的好朋友、阿里智能设计实验室的负责人乐乘和他的团队,之前就利用人工智能来做淘宝的 Banner 广告图,实现千人千面。我曾经在朋友圈里和他聊过千人千面的话题。他们做出了鲁班这样的 Ban
  • 2018 年即将结束,十大网络热词已经出炉,而如果用一个词概括今年的设计领域,人工智能设计当之无愧。 这一年,1秒能完成8000张海报设计阿里鲁班正式改名为鹿班,还上了《最强大脑》节目,一时风头无两。 设计师们...
1 2 3 4 5 ... 17
收藏数 321
精华内容 128
关键字:

阿里人工智能设计鲁班