精华内容
下载资源
问答
  • 我的理解是:机器学习属于人工智能,深度学习是机器学习的子集,数据驱动应该属于大数据。但他们都属于人工智能领域。 有人说通过自动化手段实时收集数据,在线分析...在我们身边的数据驱动的例子就是:1、电子购物软

    我的理解是:机器学习属于人工智能,深度学习是机器学习的子集,数据驱动应该属于大数据。但他们都属于人工智能领域。
    有人说通过自动化手段实时收集数据,在线分析相关信息,总结规律,形成数据建模,当用户搜索时自动根据模型对价格进行调整。即进行了“数据采集——数据分析——得到模型——根据模型去分析并调整价格”这样的一个过程,但我认为不是数据驱动,而是模型驱动,根据原有数据生成的模型是不变的,数据经过模型得到结果。而数据驱动是模型去适应数据,模型是根据不同的数据而改变的。
    在我们身边的数据驱动的例子就是:1、电子购物软件中的定制推送,每个人的推送内容都是不同的,会根据你平时的浏览的数据生成,当你第一次登陆的时候,系统就男生推送电子商品,女生推送化妆品。2、每当晚高峰或者周六日打车高峰,打车软件会根据用户定位所在的紧张程度提醒溢价倍数,用户再决定是否使用打车。打车结束后,系统会自动结算,如果有优惠券,系统也会帮你使用,一切无需人工参与。在新情况出后,系统会以AI方式进行决策。
    由此可见,数据驱动是通过移动互联网或者其他的相关软件为手段采集海量的数据,将数据进行组织形成信息,之后对相关的信息进行整合和提炼,在数据的基础上经过训练和拟合形成自动化的决策模型。因此,数据驱动的过程是非常复杂的,需要有数据和不断的输入,然后需要模型根据比对决策结果和现实数据把偏差信息反馈给机器学习,在其后不断的机器学习迭代过程中自我完善,流程图如下:
    在这里插入图片描述

    展开全文
  • 1深度学习介绍 深度学习DL又称深层神经网络可理解为含有多个隐藏层神经网络 深度学习算法思想 第一步是预训练阶段其中深度网络先通过无标签的数据进行无监督预训练并将训练权值作为深度网络初始化权值 第二...
  • 面向玩具物联网的数据驱动CDN性能评估模型与深度学习
  • 主要分享了智能助理产品发展,以及深度学习在智能助理中应用。下面是本次分享详细内容。 什么是智能助理 随着智能手机和移动互联网普及,越来越多原来发生在线下交互场景,逐渐从线下转移到线上。人们...

    本文根据胡一川在神策 2017 数据驱动大会人工智能论坛演讲整理所得。主要分享了智能助理产品的发展,以及深度学习在智能助理中的应用。下面是本次分享的详细内容。

    什么是智能助理

    随着智能手机和移动互联网的普及,越来越多原来发生在线下的交互场景,逐渐从线下转移到线上。人们也开始习惯通过在线沟通的方式来获取各种服务,让秘书安排出差的机票和酒店、向英语老师咨询学习中的问题、找旅行达人制定旅游计划等等。今天,类似这样的场景逐渐从面对面或电话沟通转移到线上沟通。因为沟通从线下变为线上,大量的数据能够被沉淀下来,基于数据我们可以通过机器学习等方法来提升人工效率,甚至在某些场景下替代人,从而实现智能助理。

    我们给智能助理的定义是:基于人工智能技术,通过理解语音或文本形式的自然语言来满足用户需求的软件应用或平台。

    640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

    那么智能助理是不是就是智能客服呢?我们认为智能客服是智能助理的一种形态,但智能助理比智能客服有更深层次的意义和更广泛的应用。与智能客服不同,智能助理有以下 3 个特点:

    1.更主动的双向交互:在客服场景下,通常是用户主动联系客服,客服被动响应。而在助理场景下,助理和用户的交互是双向的,助理可以主动联系用户,在适合的时候主动为用户提供合适的服务。

    2.更长期的伙伴关系:在助理场景下,用户和助理的关系是长期,用户可以在长时间内通过同一个助理持续获得专属化的服务。相反,在客服场景下,用户和客服之间的关系往往是短暂的,双方的连接只在服务的那一刻建立,服务完成后即断开。

    3.更丰富的价值场景:因为双向的沟通与长期的关系,助理能够为用户提供更丰富和更有价值的服务。这些服务不仅仅限于售后,还包括售前咨询,甚至一些专业化的服务也可以通过在线助理的方式来完成。

    通过智能助理来获得信息、商品和服务将成为趋势。那么,这个趋势会首先发生在哪些行业中?我们通过两个维度来思考这个问题。第一个维度是在线交互需求度,即该行业中在线交互的需求强不强,场景多不多。第二个维度是领域知识专业度,即这个行业的领域知识是否比较复杂,用户的决策过程是否需要借助外部知识。只有当这两个维度都比较强的时候,以自然语言对话为主要交互方式的助理产品才能给用户带来比较高的价值。

    在线秘书是一个非常典型的例子。今天,如果我有一个秘书,大部分时候我不需要和秘书见面,通过在线沟通的方式就可以把我想让他做的事情交代清楚了。再比如说,母婴、教育、旅游等行业都是非常典型的在线交互需求度较强和领域知识专业度较高的领域,适合智能助理的落地。可以预见,随着越来越多线下交互场景迁移到线上,智能助理会在更多的行业中成为一种主流的产品形态。

    0?wx_fmt=jpeg

    基于深度学习的自然语言处理框架

    在线交互的场景会产生大量自然语言对话数据,基于这些数据我们可以训练机器学习模型,让机器具备一定自然语言处理和理解的能力,从而打造智能助理。自然语言处理在智能助理产品的各个环节中都有应用,从分词、词性标注,到意图识别、实体抽取,再到问答、对话等。过去两年,学术界和工业界开始将深度学习应用在自然语言处理任务上,取得了很多不错的进展。在某些特定任务下,基于深度学习的方法明显优于基于传统机器学习模型的方法。因此,本节我们主要介绍深度学习技术在智能助理中的应用。

    0?wx_fmt=jpeg

    上面提到自然语言处理中有很多种不同的任务,但从机器学习模型的角度来说这些任务都有相同之处:模型的输入都是自然语言文本,输出都是某些预测结果,只不过在不同任务下模型需要预测的东西不一样。比如,在意图识别中,模型需要预测的是一段文本表达的用户意图;在实体抽取中,模型需要预测的是一段文本中的每个字或词所对应的实体;在问答或对话中,模型需要预测的是用户的问题和机器的回答的匹配度。虽然预测的内容不同,基于深度学习的自然语言处理框架可以总结为以下 4 步:

    1.Embed。这一步所做的事情是将待处理文本中词或字用分布式向量的方式表示,作为下面步骤的输入。这些向量又称为词向量或字向量,可以事先训练得到,也可以先初始化成随机向量,然后在训练当前任务的过程中调整。当然,这一步中也可以将其他对实现当前任务有价值的信息作为输入,如用户行为等。

    2.Encode。当我们把一句话用词向量表示后,这些词向量并不能表示这句话的语义,因为一句话的意思并不等于其包含的词的意思的简单组合。因此,Encode 这一步所做的主要工作是对整段文本进行编码,编码的过程考虑到每个词和它上下文之间的关系。 我们通常使用卷积神经网络(CNN)或者循环神经网络(RNN)对文本进行编码,这样可以充分利用词与词之间的关系。编码的输出是一个新的向量或矩阵,能更好地表征整段文本。

    3.Attend。这个步骤又称为注意力机制(Attention Mechanism), 其主要思想是通过训练让模型关注在文本中能够解决当前任务的最重要的部分。用通俗的话来说,注意力机制就是给文本“划重点”,从而提升模型预测的效果。

    4.Predict。这一步目标非常清晰,即将上一步中的输出通过一个网络完成当前的预测任务,通常使用到的网络模型是全连接的前馈神经网络。根据预测任务的不同,预测结果可以是一个标签的概率,一个实数值或者一个向量等。

    下面我们来看一下,基于上述框架使用深度学习能够应用在智能助理的哪些场景中,解决哪些具体问题。

    深度学习的应用:意图识别

    第一个场景是意图识别。意图识别的作用是根据自然语言判断用户的意图。例如,在助理来也的场景里,当用户通过自然语言发起一个需求时,用户的意图是问天气、订机票还是其他,是意图识别模型需要解决的问题。上面介绍的框架能够非常好的应用在解决意图识别问题上。

    0?wx_fmt=jpeg

    首先,意图识别模型的底层是一个双向的 LSTM 网络,即一种特殊的循环神经网络,该网络的输入是经过向量化表示(Embed)的用户消息,该网络的作用是对用户的消息进行编码(Encode),输出是若干个隐向量。编码后的结果经过一个注意力层(Attend),使模型学习到不同词对应的隐向量对于预测结果的权重。最终,经过注意力层加权后的隐向量经过 Softmax 层来预测(Predict)用户消息对应意图的概率。

    和基于传统机器学习模型的方法相比,该方案最大的优点是完全靠数据驱动,无需人工进行特征工程,能最大化的利用数据本身蕴含的信息来进行意图预测。同时,基于深度学习的方法效果也明显优于传统的方法。

    在助理来也的产品中,我们在 20 多类的意图识别问题上对不同的方法进行了对比。最初,在缺乏数据的情况下,我们使用传统基于规则的方法,准确率只有 70% 左右。随着数据的积累,我们切换到基于传统机器学习的方法,准确率迅速提升到 90%。但是,当传统机器学习模型准确率到达 90% 之后,我们发现很难进一步提升,因为传统的方法依赖于特征提取,怎么选择和构造特征直接决定了模型的效果。随着特征数的增加,构造新的特征变得更难,而增加新的特征对模型效果的影响也越小。

    为了解决这些问题,我们切换到基于深度学习的模型上,不依赖特征提取,完全靠数据驱动,效果明显比传统方法好,准确率达到 96% 以上。当然,在实际使用过程中还会遇到很多其他的挑战,比如用户的意图不仅仅和当前用户消息有关,可能和用户的历史消息甚至历史行为有关。基于此,我们可以在模型中引入更多的输入,如历史消息、历史行为等,来进一步提升意图识别的准确率。

    深度学习的应用:知识挖掘

    接下来介绍深度学习在知识挖掘上的应用。在智能助理的场景中,用户会问各种各样和该领域相关的问题,每个问题都有特定的答案,我们把这些问题和答案称为领域知识。要让智能助理具备自动问答的能力,首先需要把这些知识从非结构化的对话语料中挖掘出来,作为自动问答模型的训练数据。具体而言,知识挖掘的目标是从自然语言对话语料中将用户问题挖掘出来,并将相同语义的问题归到同一个知识点下。下面是母婴助理场景中两个例子。

    表达方式不同,但属于同一个知识点:

    • 刚出生 1 个多月的小孩能晒太阳吗?

    • 新生儿是不是要满月才可以晒太阳?

    表达方式接近,但属于不同的知识点:

    • 新生儿晒太阳,每次多久比较合适?

    • 新生儿晒太阳,多大开始比较合适?

    在上面的两个例子中,知识挖掘需要将第一个例子中的两句话归为同一个知识点(宝宝多大可以晒太阳),而将第二个例子中的两句话归为不同的知识点(宝宝每次晒太阳时间 vs 宝宝多大可以晒太阳)。因此,知识挖掘的主要难点是对文本进行语义表示,然后进行聚类。

    传统的知识挖掘方法使用基于词向量的无监督聚类。具体的做法是,对于任意两句文本,使用它们包含的词和词向量来计算文本间的距离,再基于文本间的距离来实现无监督的聚类。这种方法有两个比较明显的缺陷:1)基于词向量来计算文本间的距离,不能很好的反映文本的语义相似度;2)使用无监督的聚类,很难确定类的数目,导致结果聚类结果不可控。

    0?wx_fmt=jpeg

    针对这两个问题,我们采用基于深度学习的方法,在词向量的基础上训练句向量,将无监督的方法和有监督的方法结合起来。

    具体而言,我们首先通过传统的方法挖掘出一部分知识点,人工审核后进入知识库,我们称之为种子知识库。在种子知识库的基础上,我们能够构造训练数据:同一知识点下的问题对作为正样本,不同知识点下的问题对作为负样本。基于上述训练数据,我们能训练出一个针对问题对的语义匹配的模型。这个模型和上面提到的框架完全一致,也包括 Embed、Encode、Attend、Predict 这 4 个步骤。模型训练好之后,我们将其中的编码器(Encoder)单独拿出来使用,对语料中的其他问题进行编码,编码结果可以认为是句向量,能够表征句子的语义。基于句向量,我们再做基于聚类,效果和效率比基于词向量的方法都会有很大的提升。

    深度学习的应用:自动问答

    最后再来看一看深度学习在自动问答中的应用。自动问答模型的主要目标是针对一个用户的问题,返回知识库中最适合回答该问题的知识点。传统的自动问答使用基于检索的方法,将用户问题作为输入去检索知识库,并返回相关性最高的若干个结果。基于检索的方法存在两个问题:1)检索是基于关键词的,检索相关性不能代表语义相关性;2)实际场景中的问答通常和上下文有关,在这种情况下仅基于单句用户消息的检索无法返回合适的结果。针对这个问题,我们采用基于上下文检索加深度学习匹配排序的方法。下面详细介绍。

    0?wx_fmt=jpeg

    首先,我们从用户当前消息和上文中抽取关键词,去知识库或历史语料中进行检索,返回若干个候选回复。因为检索关键词不仅来自于当前用户消息,也来自当前对话的上文,检索结果会既包含和当前消息相关的回复,也包含和上文历史消息相关的回复。

    接下来,这些候选回复逐一输入到一个基于深度学习的文本匹配模型中,模型返回每个候选回复和当前对话上文的语义匹配度。

    最后,根据匹配模型返回的分数,系统返回分数最高的若干个候选回复。深度匹配模型使用 CNN 对一个候选回复与当前用户消息以及历史消息序列进行匹配,最终计算出候选回复和整个对话上文的匹配分数。模型的训练数据来自于历史语料,将历史对话切割成若干个“上文”和“真实回复”的配对作为正样本,将“上文”和“随机回复”配对作为负样本。

    基于此,该匹配模型能够充分利用历史数据,同时考虑到上下文关系,实现候选回复和上文历史消息的匹配。这个模型也完全符合我们前面介绍到的框架:候选回复和若干条上文消息的匹配可以看作是 Encode 步骤,而若干个匹配后的向量进行池化等操作可以认为是 Attend步骤,最终输出语义匹配度则是 Predict 步骤。

    智能助理在行业中的落地

    前面提到,不同行业的在线交互需求度和领域知识专业度都有所不同,靠数据驱动的智能助理产品更适合在不同行业中以行业助理的形态落地,而不是以通用助理的形态落地。当我们聚焦行业后,能够积累足够多的领域对话数据,打造更加智能、用户体验更好的智能助理产品。

    基于这个思路,我们首先针对在线秘书行业打造了一款助理产品“助理来也”。用户可以通过自然语言的方式获取 20 多项和工作、生活相关的服务,包括日程提醒、打车、咖啡、跑腿等等。目前,“助理来也”是微信平台上深受欢迎的助理产品,为超过 300 万用户提供一站式的在线助理服务。在这个过程中,我们积累了大量的交互数据,将深度学习技术成功的应用在意图识别、实体抽取、问答、对话等各环节中,提升模型的效果和产品的体验。除此之外,我们也通过“吾来”输出语义、问答、对话等技术,帮助各领域企业客户打造行业助理。目前已经在母婴、商旅、汽车等行业的标杆企业实现商业化落地。

    结束语

    最后我们进行总结。首先,随着移动互联网的普及和物联网时代的来临,基于自然交互的智能助理产品将逐渐成为主流。不同于智能客服,智能助理更加强调双向的沟通,长期的关系和个性化的服务。在这个场景下,基于数据驱动我们可以使用深度学习等技术提升语义理解、问答、对话等模型的效果。

    参考文献:

    1,Honnibal M. Embed, Encode, Attend, Predict: The NewDeep Learning Formula for State-of-the-art NLP Models. Available at https://explsion.ai/blog/deep-learning-formula-nlp, 2017.

    2,Conneau A, Kiela D, Schwenk H, et al.Supervised Learning of Universal Sentence Representations from Natural LanguageInference Data. In Proc. EMNLP, 2017.

    3,Wu Y, Wu W, Xing C, et al. SequentialMatching Network: A New Architecture for Multi-turn Response Selection inRetrieval-Based Chatbots. In Proc. ACL, 2017.

    作者简介:

    胡一川,来也联合创始人 & CTO,前"今晚看啥"联合创始人,于清华大学硕士毕业,之后前往宾夕法尼亚大学并拿到电子与系统工程系博士学位。回国开始创业,作为联合创始人创立了影视推荐引擎"今晚看啥",并被百度收购。后加入百度任资深架构师。2015年合伙创立来也,专注于智能对话技术。

    640?wx_fmt=png



    人工智能赛博物理操作系统

    AI-CPS OS

    人工智能赛博物理操作系统新一代技术+商业操作系统“AI-CPS OS:云计算+大数据+物联网+区块链+人工智能)分支用来的今天,企业领导者必须了解如何将“技术”全面渗入整个公司、产品等“商业”场景中,利用AI-CPS OS形成数字化+智能化力量,实现行业的重新布局、企业的重新构建和自我的焕然新生。


    AI-CPS OS的真正价值并不来自构成技术或功能,而是要以一种传递独特竞争优势的方式将自动化+信息化、智造+产品+服务数据+分析一体化,这种整合方式能够释放新的业务和运营模式。如果不能实现跨功能的更大规模融合,没有颠覆现状的意愿,这些将不可能实现。


    领导者无法依靠某种单一战略方法来应对多维度的数字化变革。面对新一代技术+商业操作系统AI-CPS OS颠覆性的数字化+智能化力量,领导者必须在行业、企业与个人这三个层面都保持领先地位:

    1. 重新行业布局:你的世界观要怎样改变才算足够?你必须对行业典范进行怎样的反思?

    2. 重新构建企业:你的企业需要做出什么样的变化?你准备如何重新定义你的公司?

    3. 重新打造自己:你需要成为怎样的人?要重塑自己并在数字化+智能化时代保有领先地位,你必须如何去做?

    AI-CPS OS是数字化智能化创新平台,设计思路是将大数据、物联网、区块链和人工智能等无缝整合在云端,可以帮助企业将创新成果融入自身业务体系,实现各个前沿技术在云端的优势协同。AI-CPS OS形成的字化+智能化力量与行业、企业及个人三个层面的交叉,形成了领导力模式,使数字化融入到领导者所在企业与领导方式的核心位置:

    1. 精细种力量能够使人在更加真实、细致的层面观察与感知现实世界和数字化世界正在发生的一切,进而理解和更加精细地进行产品个性化控制、微观业务场景事件和结果控制。

    2. 智能:模型随着时间(数据)的变化而变化,整个系统就具备了智能(自学习)的能力。

    3. 高效:企业需要建立实时或者准实时的数据采集传输、模型预测和响应决策能力,这样智能就从批量性、阶段性的行为变成一个可以实时触达的行为。

    4. 不确定性:数字化变更颠覆和改变了领导者曾经仰仗的思维方式、结构和实践经验,其结果就是形成了复合不确定性这种颠覆性力量。主要的不确定性蕴含于三个领域:技术、文化、制度。

    5. 边界模糊:数字世界与现实世界的不断融合成CPS不仅让人们所知行业的核心产品、经济学定理和可能性都产生了变化,还模糊了不同行业间的界限。这种效应正在向生态系统、企业、客户、产品快速蔓延。

    AI-CPS OS形成的数字化+智能化力量通过三个方式激发经济增长:

    1. 创造虚拟劳动力,承担需要适应性和敏捷性的复杂任务,即“智能自动化”,以区别于传统的自动化解决方案;

    2. 对现有劳动力和实物资产进行有利的补充和提升,提高资本效率

    3. 人工智能的普及,将推动多行业的相关创新,开辟崭新的经济增长空间


    给决策制定者和商业领袖的建议:

    1. 超越自动化,开启新创新模式:利用具有自主学习和自我控制能力的动态机器智能,为企业创造新商机;

    2. 迎接新一代信息技术,迎接人工智能:无缝整合人类智慧与机器智能,重新

      评估未来的知识和技能类型;

    3. 制定道德规范:切实为人工智能生态系统制定道德准则,并在智能机器的开

      发过程中确定更加明晰的标准和最佳实践;

    4. 重视再分配效应:对人工智能可能带来的冲击做好准备,制定战略帮助面临

      较高失业风险的人群;

    5. 开发数字化+智能化企业所需新能力:员工团队需要积极掌握判断、沟通及想象力和创造力等人类所特有的重要能力。对于中国企业来说,创造兼具包容性和多样性的文化也非常重要。


    子曰:“君子和而不同,小人同而不和。”  《论语·子路》云计算、大数据、物联网、区块链和 人工智能,像君子一般融合,一起体现科技就是生产力。


    如果说上一次哥伦布地理大发现,拓展的是人类的物理空间。那么这一次地理大发现,拓展的就是人们的数字空间。在数学空间,建立新的商业文明,从而发现新的创富模式,为人类社会带来新的财富空间。云计算,大数据、物联网和区块链,是进入这个数字空间的船,而人工智能就是那船上的帆,哥伦布之帆!


    新一代技术+商业的人工智能赛博物理操作系统AI-CPS OS作为新一轮产业变革的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎。重构生产、分配、交换、消费等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生新技术、新产品、新产业、新业态、新模式。引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。





    产业智能官  AI-CPS



    用“人工智能赛博物理操作系统新一代技术+商业操作系统“AI-CPS OS:云计算+大数据+物联网+区块链+人工智能)在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的认知计算和机器智能;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链





    640?wx_fmt=png

    640?wx_fmt=png


    长按上方二维码关注微信公众号: AI-CPS,更多信息回复:


    新技术“云计算”、“大数据”、“物联网”、“区块链”、“人工智能新产业:智能制造”、“智能农业”、“智能金融”、“智能零售”、“智能城市、“智能驾驶”新模式:“财富空间、“特色小镇”、“赛博物理”、“供应链金融”


    点击“阅读原文”,访问AI-CPS OS官网




    本文系“产业智能官”(公众号ID:AI-CPS)收集整理,转载请注明出处!



    版权声明产业智能官(公众号ID:AI-CPS推荐的文章,除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,与您共同协商解决。联系、投稿邮箱:erp_vip@hotmail.com





    展开全文
  • 为了与谷歌推动其创新的努力保持一致,该公司在云计算大会NEXT 2017上发布了一系列与人工智能(AI)相关的公告,同时以“让人们能够在世界上最强大的深度学习系统中实现民主化”为主题。 近年来,谷歌及其姊妹公司...


    最近几年,深度学习已经成为越来越热门的技术,但很少有公司能像谷歌及其母公司Alphabet那样,利用深度学习技术在如此多的领域取得巨大进展,并将其完全融入到操作业务中去。为了与谷歌推动其创新的努力保持一致,该公司在云计算大会NEXT 2017上发布了一系列与人工智能(AI)相关的公告,同时以“让人们能够在世界上最强大的深度学习系统中实现民主化”为主题。

    近年来,谷歌及其姊妹公司已经成为“以疯狂速度推进AI革命”的代名词,并在整个公司的服务中引入深度学习。其中最著名的例子是,Alphabet子公司Deep Mind的AI程序AlphaGo成为了第一个击败顶级围棋选手的机器,而Waymo的无人驾驶汽车也已经成为自动驾驶革命的象征。但是,这是一场静悄悄的AI革命,它塑造了从谷歌翻译到谷歌搜索的所有东西,对谷歌本身产生了最大的影响。同时,它还带来了自动推理的力量,几乎可以影响到公司所做的每一件事情。

    由于谷歌已经建立起庞大的基础设施来训练和运行这些AI系统,谷歌现在正将这些工具带给大众。有些公司已经建立了自己的AI研究部门,需要为特定的应用程序建立高度定制的模型。然而,在这样做的过程中,他们很快就遭遇了构建大型深度学习模式的艰巨硬件要求,通常需要整个加速器农场进行快速的迭代。

    在谷歌的案例中,它提供了一个名为“云机器学习引擎(Cloud Machine Learning Engine)”的深度学习托管平台,负责提供深度学习开发所需的硬件,让企业可以专注于构建自己的模型,并将计算需求转移到谷歌。毕竟,很少有公司在AI领域投入如此多的资金以建立自己的自定义加速器硬件,就像谷歌的张量处理单元(TPU)那样。

    当然,尽管算法和硬件的进步在AI革命中发挥了重要作用,但在没有数据的情况下,很难在这一领域取得真正的进展。目前的AI系统需要海量的数据来学习一个新概念。人类可以看到一个新物体的单一图像,并能立即识别出它,但类似的AI系统需要大量的图像从多个角度描绘这个物体,从而建立正确的内部图像。这意味着,像谷歌这样的公司能够收集到数亿张照片,从而为地理位置等应用程序构建一个可视化的地球图像,这是一个巨大的优势。

    简而言之,深度学习革命是由数据驱动的,但很少有公司能像谷歌那样拥有如此多的数据。这意味着,当涉及到深度学习系统时,你很容易找到工具,但很难找到你真正可以使用的预先训练过的模型。我本人曾希望找到足够强大的系统以便对全球新闻图片进行分类。在过去的几年里,我尝试了无数的系统,我发现许多系统提供了令人不可思议的技术,但是没有任何系统能够提供丰富的预先构建的目录,它们没有成千上万的标签,也未能很好地利用来自非西方世界的图像,直到我偶然发现了谷歌的 Cloud Vision系统。

    事实上,这是许多公司的共同需求:他们有兴趣为客户建立服务,而不是进行AI研究。随着外部化趋势的发展,谷歌已经通过发布许多内部AI系统作为公共云的API来应对这样的挑战。Cloud Vision接受任意图片,并对物体、活动以及文本分类。它能识别图片中所描述的位置、估算人脸的情感,甚至还会标记图片中是否描绘了暴力。所有这些都有API调用,结果会在几秒钟内反回馈来,而且可无限扩展。

    Cloud Speech可用80多种语言进行现场演讲,不像传统的语音转录系统,它不需要任何训练。Cloud Natural Language接受英语、西班牙语和日语中的任意文本,并输出独立的解析树,识别关键实体,甚至执行情绪分析。在NEXT 2017大会上,谷歌以其最新的工具 Cloud Video Intelligence扩展了这个阵容,它将视频和短片分割成场景,并在每个场景中识别出主要的主题和活动,让人们可以获取一个庞大的视频档案,并即时编辑索引,使其可以被按照题目尽心搜索。

    这些API之所以如此强大,是因为它们是作为简单的API而被公开的。你只需用你的数据做一个API调用,几秒钟后就能得到世界上顶尖AI研究人员建立的、经过预先训练过的算法给出的结果。深度学习的巨大复杂性隐藏在一个简单的API调用背后,你甚至可以将API调用串在一起,用几行代码构建难以想象的复杂工作流程。

    Teowaki的贾维尔拉米雷斯(Javier Ramirez)让我们得以窥视,如何利用这些API快速构建一个完整的工作流程,只需几分钟的时间和几行代码。在他的教程中,他以英国首相特里萨梅(Theresa May)就职演讲的YouTube视频为例,并通过Cloud Speech API为其提供了一个高质量的文本文字记录。然后,他通过Cloud Natural Language来获取这些文本,以提取其中提到的重要实体(以及维基百科页面上的链接以获取更多信息),并计算出演讲的一般情绪。

    只需要几行代码就可以制作几个API调用,然后用YouTube上的视频转录,并提取关键实体和情感。更令人惊讶的是,整个工作流程都可以被放大,可以在数百万个视频中运行,而无需进行任何改动。这就是云计算的力量。

    就在谷歌将其服务和安全模式具体化的同时,它也为其不可思议的AI技术进步打开了大门,并为想要打造自己模型的公司提供了AI托管环境,以及不断增加的预先训练模型,这些模型允许公司通过简单的API调用来构建复杂的应用程序。

    在NEXT 2017大会的几次会议中,可以清楚地看到,AI以及其在主题演讲中的大量存在表明,谷歌押注于将AI投入到企业中。最后,谷歌实际上是通过让用户容易使用来实现对世界上最先进AI算法的访问,以至于即使是最小的企业也可以利用深度学习的全部力量来彻底改变他们做生意的方式。

    、、、

    展开全文
  • 当当1024大促爱读书我们又可以屯书啦每满100减50!满200减100!胡同学搞来一批可与满减叠加使用“满200减40”图书优惠码相当于满160元买400元硬核技术书!?这个优惠券可以转给亲朋好友~?优惠码JHSCSB(注意要...

    当当1024大促

    爱读书的我们又可以屯书啦

    每满100减50满200减100

    胡同学搞来一批可与满减叠加使用的“满20040”的图书优惠码

    相当于满160元买400元的硬核技术书!

    ce78a8d1-cc14-eb11-8da9-e4434bdf6706.png

    ?这个优惠券可以转给亲朋好友~?

    优惠码JHSCSB(注意要大写)

    使用渠道:当当小程序或当当APP

    步骤一,挑选心仪的图书至购物车点击结算

    步骤二,点击优惠券/码处

    步骤三,输入优惠码JHSCSB(注意要大写)

    d278a8d1-cc14-eb11-8da9-e4434bdf6706.png

    d378a8d1-cc14-eb11-8da9-e4434bdf6706.jpeg

    胡同学精选书单:Python、爬虫、数据分析、机器学习、深度学习方向都有,推荐给大家,感兴趣的同学可以趁活动买来看看。

    其他书单

    每个 Python 程序员都读过这 10 本书!

    Python、数据分析、机器学习实战(书单)

    撒 币 了 撒 币 了,暗 号 1024!

    欢迎三连 在看留言分享至朋友圈 ↓↓↓

    展开全文
  • 模型驱动的深度学习(ADMM-net)

    千次阅读 2019-09-24 13:52:07
    深度学习 模型族:模型中含有超参数,给予不同参数对应不同模型,就形成了模型族 算法族:每一个模型对应一个完整算法,整个模型族对应了一个算法族 将算法族展开成一个深度网络,网络层数代表迭代次数,模型...
  • 使用方法:基于keras和pytorch框架TCN(时态卷积网络)模型,类似于时间序列处理 数据:NASA公开数据集 论文已发 有刚入门或者感兴趣可以私信互相学习
  • 本文将简要讨论图像识别问题挑战以及为了应对这些挑战而使用的数据驱动过程. 1. 图像分类问题挑战 虽然从图像中识别一个对象对人类来说非常简单, 但图像识别对计算机来说是一项极具挑战性...
  • 深度学习是近年来发展的人工智能技术。相比于传统浅层学习模型,深度...然后,介绍了4类广泛使用的深度学习模型以及它们在流程工业过程数据建模中的应用;最后,在流程工业过程数据建模领域对深度学习进行了简要总结。
  • - 背景杂斑数据驱动 收集数据 用机器学习的方法训练数据 用得到模型进行预测 近邻分类器待分类对象类别可以通过在它附近训练数据类别来确定,所以采取策略就是找到离待分类对象最近邻居进行分析。如何...
  • 作者 |深度传送门来源 |深度传送门【导读】本文是“深度推荐系统”专栏第九篇文章,这个系列将介绍在深度学习的强力驱动下,给推荐系统工业界所带来最前沿变化。本文简...
  • 机器学习数据驱动的科学

    千次阅读 2017-05-27 09:38:15
    传统上,计算机会按照我们输入指令一步步执行。而机器学习却是通过输入数据而不是指令来进行各种工作。 本文选自《深入浅出深度学习:原理剖析与Python实践》。
  • 我们还会分享我们的用户是如何在他们的深度学习应用(如图像识别、物体检测和自然语言处理等)中采用BigDL的案例。这些案例显示了用户可以使用他们的大数据平台(例如使用Apache Hadoop和Spark)作为一个统一的数据...
  • 笔记:【智驾深谈】深度学习驱动的自动驾驶新主流框架盘点(附3篇论文)提纲 Nvidia DRIVE深度学习解决方案 Mobileye深度学习方案 Comma.ai深度学习方案 Nvidia DRIVE深度学习解决方案 DGX-1 Training Platform ...
  • 数据驱动的深度学习技术可以发现大数据集中复杂的结构,并从数据中提取关键特征。 一.综述 文章:Deep learning for vibrational spectral analysis: Recent progress and a practical guide(2019) 自2017年...
  • 好像之前听过类似这个课了,连PPT都是一样,只不过是中文,哈哈哈,算啦,不看了,有空再补剩下18h视频 先占个坑
  • 深度强化学习的两个不太被重视问题是(1)缺乏对新目标泛化能力,以及(2)数据效率低,即模型需要几个(并且通常是昂贵)反复试验才能收敛,这使得它不适用于现实世界场景。在本文中,我们解决了这两个问题,并将...
  • 建立这样一个免费的数据集将消除主要的障碍,并促进土木工程领域的深度学习研究,我们希望这项工作将促使研究人员,工程师,政府机构甚至计算机科学家共同努力,以开始建立这样的数据集。 已经为拟议的数据库开发了...
  • 受监管的深度神经网络,可以学习在视频游戏中驾驶。 该项目的主要目的是实现一个可以在侠盗猎车手5中驾驶的模型。该模型不会按照交通法规驾驶,而是模仿人类在此游戏中的驾驶方式:全速行驶,避开其他汽车驶过城市...
  • 【简介】自然语言处理(NLP)能够帮助智能型机器更好地理解人类的语言,实现基于语言的人机交流。...本综述对NLP领域中所应用的深度学习进行了分类和讨论。它涵盖了NLP的核心任务和应用领域,并对深度学习...
  • 深度学习之:数据增强总结与实战

    千次阅读 2020-07-06 21:23:54
    当下以数据驱动的AI,在实际场景中,我们很难有大量带标签的训练样本,当我们使用深度学习神经网络训练一个模型时,数以百万计的模型参数需要训练,数据量太小的话,很容易产生过拟合,训练出的模型也很难具备良好的...
  • 本文来源于联盟成员翻译笔记 昨日(4月25日)刚更新的文章 ... 摘要: 本文提出了一种在自由移动的场景中预测...在本文中采用数据驱动的方法,从一个新的数据源中学习人类的深度先验信息:成千上万的模仿人体模型...
  • 1.本文主要分析了在智能制造背景下数据驱动的深度学习的模型和应用。 2.模型:CNN(Convolutional neural network),RBM(Restricted Boltzmann machine,基于能量的模型)及变体(DBN,DBM),AE(Auto Encoder)及...
  • 数据驱动?什么是数据驱动??

    万次阅读 热门讨论 2018-12-09 20:57:44
    目前个人理解是:深度学习是机器学习子集,数据驱动是大数据?可能各有各说法,但是都是属于人工智能领域。 让我们通过一个小例子来简单理解一下什么是数据驱动 假设有A和B两家订票网站: A公司将从网...
  • 在当前AI这个数据驱动的时代,没有数据几乎是万万不能的。 你的数据太少? 别怕,我们有数据增强技术!   当前流行的数据增强技 1.翻转(Flip) 可以对图片进行水平和垂直翻转。一些框架不提供垂直翻转功能。...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 806
精华内容 322
关键字:

数据驱动的深度学习