精华内容
下载资源
问答
  • 人工智能实践报告
    千次阅读
    2022-03-04 15:19:31

    近日,国内知名数字化市场研究咨询机构爱分析发布《2022爱分析·人工智能应用实践报告》。 报告面向金融、消费品与零售、医疗与医药、工业与能源、政府与公共服务等行业,基于第三方专业视角,研究总结目前企业界人工智能实践中的最佳案例,树立引领未来人工智能发展的标杆,推动中国企业数字化进程。

    人工智能在产业中落地挑战重重

    在国家政策、产业需求、数据和技术体系趋于完备三重因素的推动下,自2019年起,人工智能的发展进入与产业加速融合的阶段。经过近几年的发展,人工智能已经广泛渗透进金融、零售、工业、能源、医疗、城市管理等多个行业和领域,各种创新性的应用场景层出不穷。尤其在金融、智能制造等领域,一些头部企业已经在各个业务和职能部门中引入了大量的人工智能应用,并且已经构建起了较完善的面向智能化运营的技术能力、组织架构和创新机制。

    然而,由于可获取和参考的建设经验有限,加上企业所处行业、发展阶段的不同,自身需求以及拥有的资源禀赋各异等因素,人工智能在产业落地仍然充满挑战。

    基于对多个国内领先企业的智能化转型和人工智能应用实践案例的深度调研分析,以及过往对产业数字化与智能化的持续跟踪研究,爱分析认为,当下人工智能在产业落地中主要会面临20个挑战,涉及战略、数据、场景规划、应用解决方案开发、技术基础设施、组织和人才六个维度。

    表1:人工智能在产业中落地的20大挑战

    评估AI应用成熟度,因地制宜推进智能化

    智能化转型没有统一的路径和方法,不同企业在不同阶段可能面临的问题通常也各不相同。爱分析认为,企业在实施智能化转型之前需要首先建立一套企业智能化转型的能力框架,对框架内的多个能力维度进行评估,确认企业自身的AI应用成熟度状况。在此基础上,企业可以明确智能化转型的关键能力要素,以及各维度的能力在不同成熟度阶段需要重点提升的方向,从而制定下一步实施计划,高效的推进智能化转型和AI落地。

    基于本次调研和过往研究积累,报告将AI应用成熟度从低到高依次分为早期实验、初步投入、多维布局、深度应用、全面融合五个阶段,并且从战略、数据、场景规划、应用解决方案开发、技术基础设施、组织与人才六个维度列举出了每个成熟度阶段主要的能力特征。此外,爱分析也将目前国内主要行业企业AI应用成熟度各阶段数量占比情况做了展示。

    表2:企业AI应用成熟度及其评估框架

    智能化转型方法论帮助企业应对挑战

    针对企业在应对智能化转型的多种挑战,爱分析从战略、数据、场景规划、应用解决方案开发、技术基础设施、组织与人才六个维度提供了系统可行的方法论,并从本次调研的案例中选取相关实践经验为企业提供参考说明。

    同时,爱分析还对本次调研的企业智能化转型和AI应用实践案例做了详细梳理,包括企业AI战略、面向AI开发的数据采集与管理方法、应用场景规划、解决方案开发、AI中台建设等多方面的典型案例。

    除此之外,报告还对处于不同成熟度阶段的企业在上述六个维度中需要阶段性提升的重点能力分别给出建议。欲了解更多信息,可通过链接获取《2022爱分析·人工智能应用实践报告》:https://www.ifenxi.com/research/content/6032;或关注爱分析公众号:爱分析ifenxi。

    趋势展望:企业将走向全面智能化转型

    人工智能在为企业创新产品服务、优化经营决策、提升管理效率等方面已经取得了广泛的效果,并展现出了更加巨大的潜力。爱分析认为,所有的企业未来想要在市场中保持竞争力,一定都需要全面拥抱智能化。预计在接下来的3至5年,国内大量的企业对AI的应用将从单点的AI建设走向全面的智能化转型,企业因此需要针对智能化转型规划完善的路径和方法,同时结合自身AI应用的成熟度,制定符合自身状况的行动计划。

    人工智能在产业中的落地正在如火如荼地推进,也还有很多未知的领域有待企业去探索,进一步释放AI的价值。随着企业智能化进程的推进,AI在产业中落地仍然会面临许多新产生的问题。作为专注数字化市场的研究咨询机构,爱分析表示,将持续对该领域进行跟踪研究,对前沿的案例保持关注,为企业智能化转型提供更多的决策参考。

    更多相关内容
  • 2022爱分析・人工智能应用实践报告

    千次阅读 2022-02-28 17:53:45
    经过近几年的发展,人工智能已经广泛渗透进金融、零售、工业、能源、医疗、城市管理等多个行业和领域,并且一些行业头部企业已经全面拥抱了智能化转型。 由于可获取和参考的建设经验有限,加上企业所处行业、发展...

    img

    报告编委

    img

    特别鸣谢(按拼音排序)

    img

    报告摘要

    人工智能在产业中落地的20大挑战

    自2019年起,人工智能的发展进入与产业加速融合的阶段。经过近几年的发展,人工智能已经广泛渗透进金融、零售、工业、能源、医疗、城市管理等多个行业和领域,并且一些行业头部企业已经全面拥抱了智能化转型。

    由于可获取和参考的建设经验有限,加上企业所处行业、发展阶段的不同,自身需求以及拥有的资源禀赋各异等因素,人工智能在产业中落地充满挑战。在本报告中,爱分析基于大量调研和过往研究积累,从战略、数据、场景规划、应用解决方案开发、技术基础设施、组织和人才六个维度梳理出了目前人工智能在产业中落地面临的20个主要挑战。

    评估AI应用成熟度,因地制宜推进智能化

    智能化转型没有统一的路径和方法,不同企业在不同阶段面临的问题通常也各不相同。因此,企业在实施智能化转型之前需要对自身的AI应用成熟度状况进行评估,明确在不同成熟度阶段需要重点提升的能力,从而制定下一步实施计划,高效的推进智能化转型。

    在本报告中,爱分析将AI应用成熟度从低到高依次分为早期实验、初步投入、多维布局、深度应用、全面融合五个阶段,并从多个维度列举了每个成熟度阶段企业具备的主要能力特征。此外,爱分析也将目前国内主要行业企业AI应用成熟度各阶段数量占比情况做了展示。

    企业智能化转型的方法论

    在本章,爱分析从战略、数据、场景规划、应用解决方案开发、技术基础设施、组织与人才六个维度论述企业在应对智能化转型的多种挑战时,可以采取的方法和措施,并从本次调研的案例中选取相关实践经验为企业提供参考说明。同时,本章还对处于不同成熟度阶段的企业在上述六个维度中需要阶段性提升的重点能力分别了给出建议。

    同时,爱分析对本次调研的企业智能化转型和AI应用实践案例做了详细梳理,并将案例内容呈现在本章中,其中以字母命名的案例为针对某个特定问题案例,具体包括:

    • 案例1:中新天津生态城构建智慧城市产业大脑,用AI挖掘数据价值
    • 案例2:AI数据管理平台助力上汽安吉物流批量化迭代AI模型,让物流管理更智慧
    • 案例3:美宜佳打造商业智能决策管理平台,实现线下零售的智能化运营
    • 案例4:依托计算机视觉技术,某餐饮连锁企业为饺子品控安上智慧之“眼”
    • 案例5:中宏保险构建营销员智能助理,通过保险知识的共享和复用赋能销售
    • 案例6:AI算法支撑下,AR虚拟试戴让安克创新用户获得更优的线上互动体验
    • 案例7:某银行搭建智能消费者保护中台,助力消费者权益保护监控和预警
    • 案例8:海信集团引入AI平台,构建独立自主的AI开发能力
    • 案例9:某大型集团搭建AI中台,支撑数智化升级
    • 案例A:某大型保险集团制定平台、应用、技术“三个领先”战略和“四个关键举措”推动智能化建设
    • 案例B:虚拟数字人助力江南农商银行为客户提供创新性的远程视频柜员服务
    • 案例C:某全球头部日用消费品公司在华公司以费用支出为导向规划AI应用场景
    • 案例D:某大型国有商业银行构建MLOps体系,实现敏捷的模型迭代,高效的模型交付
    • 案例E:某头部家电集团建立面向AI开发和管理的组织架构,全面支持产品的智能化创新

    企业智能化趋势展望

    爱分析认为,所有的企业未来想要在市场中保持竞争力,一定都需要全面拥抱智能化。预计在接下来的3至5年,国内大量的企业对AI的应用将从单点的AI建设走向全面的智能化转型,企业因此需要针对智能化转型规划完善的路径和方法,同时结合自身AI应用的成熟度,制定符合自身状况的行动计划。

    相信随着企业智能化进程的推进,AI在产业中落地仍然会面临许多新产生的问题,爱分析将对这个领域保持持续跟踪研究,对前沿的案例保持关注,为企业智能化转型提供更多的决策参考

    目录

    \1. 人工智能在产业中落地的20大挑战

    \2. 评估AI应用成熟度,因地制宜推进智能化

    \3. 企业智能化转型的方法论

    \4. 企业智能化趋势展望

    关于爱分析

    研究咨询服务

    法律声明

    1. 人工智能在产业中落地的20大挑战

    在国家政策、产业需求、数据和技术体系趋于完备三重因素的推动下,人工智能的发展自2019年起进入与产业加快融合的阶段。经过近几年的发展,人工智能已经广泛渗透进金融、零售、工业、能源、医疗、城市管理等多个行业和领域,各种创新性的应用场景层出不穷。尤其在金融、智能制造等领域,一些头部企业已经在各个业务和职能部门中引入了大量的人工智能应用,并且已经构建起了较完善的面向智能化运营的技术能力、组织架构和创新机制。

    行业大势叠加头部企业的示范效应,吸引了众多企业纷纷跟进智能化转型。然而,智能化转型仍是一片虽已有众多人涉足,但鲜有人真正实现深耕的新大陆,企业可获取和参考的建设经验有限,加上企业所处行业、发展阶段的不同,自身需求以及拥有的资源禀赋各异,需要针对性地开展人工智能的规划和建设等因素,导致了人工智能在产业中落地充满挑战。

    爱分析基于多个国内领先企业的智能化转型和人工智能应用实践案例的深度调研分析,以及过往对产业数字化与智能化的持续跟踪研究,梳理出了当下人工智能在产业落地中会面临的20个主要挑战,这些挑战涉及战略、数据、场景规划、应用解决方案开发、技术基础设施、组织与人才六个维度,具体如下表:

    表 1: 人工智能在产业中落地的20大挑战
    img2. 评估AI应用成熟度,因地制宜推进智能化

    智能化转型没有统一的路径和方法,不同企业在不同阶段可能面临的问题通常也各不相同。因此,企业在实施智能化转型之前需要首先建立一套企业智能化转型的能力框架,对框架内的多个能力维度进行评估,确认企业自身的AI应用成熟度状况。在此基础上,企业可以明确智能化转型的关键能力要素,以及各维度的能力在不同成熟度阶段需要重点提升的方向,从而制定下一步实施计划,高效的推进智能化转型和AI落地。

    基于本次调研和过往研究积累,爱分析将AI应用成熟度从低到高依次分为早期实验、初步投入、多维布局、深度应用、全面融合五个阶段,并且从战略、数据、场景规划、应用解决方案开发、技术基础设施、组织与人才六个维度列举出了每个成熟度阶段主要的能力特征,具体如下表:

    表2:企业AI应用成熟度及其评估框架
    img

    同时,爱分析综合IDC、红杉的相关数据以及本次调研结果发现,国内金融、零售、工业、医疗等主要行业开展过智能化建设的企业中,约30%处于早期实验阶段,约40%处于初步投入阶段,约20%处于多维布局阶段,约9%处于深度应用阶段,处于全面融合阶段企业不足1%,仅有少数行业超头部公司达到这一水平。

    图 1: 主要行业企业AI应用成熟度各阶段数量占比

    img

    考虑到处于早期实验阶段的企业内部对AI规划与建设尚无实质性的进展,该阶段的企业要推进智能化转型可以参照初步投入阶段的方法和实践经验;同时,处于全面融合阶段的企业一方面国内的样本量非常少,另一方面该阶段的企业已基本完成智能化转型,需要更多地关注和解决智能化运营方面的问题。因此,本报告将只对处于初步投入、多维布局和深度应用三个阶段的企业如何开展智能化转型进行详细讨论,并分别提供建议。

    3.企业智能化转型的方法论

    在本章,爱分析将从战略、数据、场景规划、应用解决方案开发、技术基础设施、组织与人才六个维度论述企业在应对智能化转型的多种挑战时,可以采取的方法和措施,并从本次调研的案例中选取相关实践经验为企业提供参考说明。同时,本章还会对处于不同成熟度阶段的企业在上述六个维度中需要阶段性提升的重点能力分别给出建议。

    3.1 战略层面

    3.1.1 方法论

    3.1.1.1. 明确智能化的目标和路径,并在组织内达成统一

    全面的智能化转型需要从顶层开始设计,避免因依靠局部业务需求驱动的AI能力和应用散点建设造成后期难以统一管理和资源浪费。因此,企业应该首先明确智能化转型的关键目标,以及明确为了达到相关目标的建设思路和路径,针对这些问题对智能化转型进行具备前瞻性和系统性的规划。同时,企业需要在组织、治理结构和制度流程等方面达成统一,才能高效地推动智能化建设,达成相应目标。

    例如在案例A中,某大型保险集团制定了平台、应用、技术“三个领先”战略,并成立专门大数据和人工智能部门,从项目管理机制、前沿技术研究、国产化方案替代、应用成果孵化等方面开展建设,从而推动智能化转型。

    3.1.1.2. 建立将新技术用于业务创新的机制,并提供相应的资源支持

    AI应用本质上具有实验性和创新性,因此也天然地会伴随着一定的不确定性和失败风险。为了实现AI应用的落地,企业需要首先建立鼓励创新,容忍失败的工作氛围,其次,建立业务创新机制,在内部密切关注AI技术的发展趋势,及时识别将AI技术用于业务创新的机会,以及不断强化组织内的AI开发能力,并推动应用的落地。

    3.1.2 给不同成熟度的企业的建议

    初步投入阶段:企业在该阶段应明确当前需要开发的具体应用,并考虑采取怎样的方式实现落地。

    多维布局阶段:企业在该阶段应首先在组织内广泛地鼓励创新,明确智能化转型短期的目标和路径。同时需要对中长期的目标有所考虑和规划。

    深度应用阶段:企业在该阶段应建立完善的智能化转型中长期目标和规划,在组织内就智能化转型的方法、流程、创新机制达成了统一,并给予全方位支持。

    案例A:某大型保险集团制定平台、应用、技术“三个领先”战略和“四个关键举措”推动智能化建设

    某大型保险集团于2019年成立了集团科技中心大数据和人工智能部,由此开启了人工智能技术发展之路。该保险集团拟在人工智能建设方面实现“三个领先”的战略目标。一是领先的平台:持续打造涵盖NLP、语音、OCR、人脸识别、大数据应用子平台的集团统一人工智能技术平台,各项技术指标居于行业领先水平。二是领先的应用:聚焦客服、管理、销售三类机器人突破,机器人研究和应用水平居于行业领先水平。三是领先的技术:核心算法全部自研,关键技术和硬件具备国产化替代方案。 在建设思路方面,为了实现“三个领先”的战略目标,该保险集团实施了如下关键举措: 1)制定长期规划,营造创新氛围。集团制定了长期人工智能发展规划,和适合科技创新的项目管理机制,营造鼓励创新、容忍失败的工作氛围。 2)钻研前沿技术,加快技术落地。密切跟踪人工智能技术的演进趋势,并适当开展前沿技术的研究,缩短前沿技术落地的周期;重点加强多模态AI应用落地的能力,加强大数据和AI深度协同的能力,加强研发人员对业务的理解。 3)探索国产化替代方案,实现技术的提前储备和自主可控。探索PaddlePaddle等国产深度学习基础框架,验证国产GPU的实际性能,形成备用方案,确保极端情况下仍然可以开展人工智能的应用和研究。 4)加快机器人突破工程成果孵化,探索研发通用机器人。利用机器人研发成果,进行销售和管理机器人嵌入式研发,重点突破人机混合运营下的机器学习;依托各类私域流量和公域流量,实现纯线上化的销售模式和销售管理模式;由小规模、人机协作向全覆盖、无人化演进,并探索研发通用机器人。

    3.2 数据层面

    3.2.1 方法论

    3.2.1.1. 重视数据治理与数据平台建设工作

    良好的数据基础是支撑智能化转型的前提,针对数据孤岛、数据质量低、数据广度与深度不足、数据架构老旧等企业数据基础中的问题,企业需要重视数据治理与数据平台建设工作。

    在数据治理方面,企业应该组织专门的数据治理工作,制定数据标准和数据治理体系,提高数据质量。如在案例1中,中新天津生态城在利用内部外数据,构建智慧城市产业大脑之前,首先成立专门的数据治理小组,开展相关工作以提高数据的质量。

    在数据平台建设方面,企业需要构建统一的大数据平台或数据智能平台,打通各部门、各系统的数据,丰富数据的来源,提高数据的广度和深度。同时,设计面向AI应用的数据架构,方便AI应用开发和运营中对数据的调用。例如在案例7中,某银行为了构建智能消费者保护中台,其首先建设了全口径的投诉管理大数据平台,整合行内10多类异构多模态数据,以打破多业务部门、各区域、各系统数据壁垒。关于数据平台的详细构建方法可参考爱分析于2021年11月发布的《2021爱分析・数据智能平台实践报告》。

    3.2.1.2. 建立面向AI开发的数据采集、数据处理和数据管理等方面的标准化方法和自动化能力

    为了高效地给AI开发提供匹配的数据,支撑AI应用的规模化落地,企业内部需要建立一套面向AI开发的自动化的数据采集、数据处理和数据管理的方法与能力。具体而言,可以在数据采集端如摄像头、传感器内置相应算法自动采集所需数据;采集的数据上传至云端或本地后,设置相应条件,自动触发数据标注任务,交由业务专家标注数据,在某些情况下还需要自动将新标注的数据与原先的数据集进行合并;当平台监测到新的数据版本后,再自动对模型进行训练,并对新的模型进行评估和上线。

    例如在案例2中,上汽安吉物流在研发其视觉智能管理系统时,采用了这套标准化和自动化的从数据采集,到数据标注,到模型训练的流程和方法,支撑了平台功能高效和批量化地迭代更新。

    3.2.2 给不同成熟度的企业的建议

    初步投入阶段:企业在该阶段应首先解决的数据基础较差的问题,因此需要积极开展数据治理工作,提高数据治理;并建立统一的数据平台,打破数据孤岛,丰富数据来源。

    多维布局阶段:企业在该阶段应已经解决了数据基础较差的问题,同时对于AI开发和运营对数据的要求较明确,初步建立面向AI开发的数据采集、数据处理相关的标准化方法,并考虑如何提高整个流程的自动化能力。

    深度应用阶段:企业在该阶段应建立起完善的数据治理机制,并常态化的执行,建立能够支撑AI应用的数据智能平台;同时,企业还应建立起面向AI开发的数据采集、数据处理和数据管理等方面的标准化方法和高度自动化的能力。

    案例1:中新天津生态城构建智慧城市产业大脑,用AI挖掘数据价值

    中新天津生态城(以下简称“生态城”)是中国与新加坡两国政府战略性合作开发的生态城市,于2008年9月开工建设,总规划面积为150平方公里,旨在打造产城融合、绿色发展、智慧城市、国际合作的示范区。 为了构建智慧城市产业,生态城当前重点发展5G创新应用、大数据交易生态、传统产业融合创新应用三大交互应用产业,希望打造从数字生产资料挖掘、到智能产业研发孵化、再到龙头企业牵引的产业链。然而,生态城在产业发展中,其产业规划、招商引资、企业服务工作都面临着一些痛点问题,这些问题包括: 产业规划与分析缺乏数据支撑。生态城在做产业规划时,没有每个产业链细分领域的信息和数据支撑;或者有总体数据,但缺乏产业深度分析能力。 招商引资方式粗放、单薄。生态城在确定产业招商方向后,由于没有产业链信息,导致招商缺乏针对性的标的;或者有明确的招商标的,但对待招商企业进行评估时缺乏支撑数据和智能评估方法。 产业扶持与企业服务缺乏主动能力。生态城在服务园区内的企业时,无法为企业准确匹配合适的扶持政策,也无法主动为企业提供全面、个性化服务。 从根本上而言,上述问题都在于生态城在开展产业发展工作的过程中,缺乏以数据为支撑的产业分析工具。事实上,生态城经过多年发展,已经积累了大量的智慧城市公共数据,包括了区域经济运行、内部工商、财税、政策扶持等数据。与此同时,大量公开的数据,如企业工商、业务、专利、招投标、投融资、舆情、风险等数据也能够为生态城的产业发展规划所用。 因此,生态城要解决产业规划、招商引资、企业服务工作中面临的问题,就需要首先借助一系列的工具和方法,从海量的结构化和非结构化数据中挖掘出有用的信息,并以体系化的形式呈现出来,为生态的产业规划和发展提供数据支撑和科学的指导。 基于知识图谱、NLP等AI技术,构建智慧城市产业大脑解决方案 针对上述挑战,中新天津生态城希望通过引入大数据和人工智能技术来构建解决方案。在对厂商的产品、技术和服务能力进行综合评估后,生态城选择与爱数合作共建解决方案。爱数成立于2006年,是一家大数据基础设施提供商,提供结构化数据、非结构化数据、机器数据、知识图谱数据等全域数据能力,为政府、公共事业及企业的数字化转型赋能,帮助各行各业的客户释放数据价值,实现即时、随时、实时的数据服务。 爱数为中新天津生态城提供的智慧城市产业大脑解决方案,包含了一个产业知识网络、三个能力平台、N个应用模块的“1+3+N“架构,为智慧城市产业发展中的“产业-招商-服务”全环节提供数据服务。 产业知识网络即底层的知识图谱数据湖,其将海量的外部网络数据和智能城市内部数据进行汇总,形成数据湖,为产业大脑提供能力底座。 三个平台包括企业主动服务平台、经济运行分析平台和产业精准招商平台。通过三个平台连接政府与企业,为产业大脑提供应用基础。 N个应用模块是将产业发展和智慧营商环境分为若干个应用模块,实现产业大脑的实用性和应用性。

    图 2: 中新天津生态城智慧城市产业大脑架构图 img 如前文所述,整个解决方案的核心在于如何从海量数据中提取出有用信息,并构建以产业链、企业图谱为中心的大规模知识网络。为了解决这一问题,爱数项目团队重点开展了如下工作: 1)数据治理。生态城内外部大量数据的数据质量状况较低,因此爱数为该项目成立了数据治理小组,制定数据标准和数据治理体系,提高数据质量。 2)知识抽取。在构建知识网络前,需要对数据尤其是大量非结构化数据中的知识进行抽取。对此,爱数使用其AnyDATA产品内置的语言模型,同时也为生态城定制了一些自然语言处理模型,比如产业政策、企业基础画像、招投标、投融资等模型,从数据中精准地抽取关键要素或属性。在此基础上,为这些属性设立匹配规则,从而构建知识间的关系。 3)构建知识网络。爱数基于AnyDATA产品内置的知识图谱、决策树等技术为生态城构建产业知识网络。同时,提供AnyDATA意图理解、规则、推理、图计算等引擎,可以实现精准的知识搜索、关联分析和辅助决策。 最终建成的知识网络主要包含如下类型: 产业链图谱:以产品上下游、上下层为关系构建的5000多个产品价值链图谱,并与国民经济、战略新兴产业实现有机对接,可以实现对产业链精准分类和关联分析; 企业图谱:基于工商、知识产权等公开数据,构建企业集团关系链、市场布局、产品业务链,实现企业链的精准定位和分析; 产品竞争图谱:基于企业产品标签集相似度构建竞争网络,寻找细分领域隐形冠军; 政策图谱与规则知识库:省市区多级政策要素自动抽取,形成分类、分级的政策要素与政策适用规则库,以便政策的自动精准匹配推荐; 产业及经济运行预测分析:基于产业链、企业链及其他产业要素动态事件的可视化推理及关联分析预测; 投融资雷达:基于投融资事件知识与企业链、产业链的匹配,实现焦点招商、以商招商(园区关联企业的投融资线索)。 智慧城市产业大脑落地后的价值和效果 智慧城市产业大脑在中新天津生态城的招商引资、产业经济、企业服务中产生显著的应用价值和效果。 1)招商引资更加精准。产业大脑汇聚了生态内外部的工商、产业等数据,结合知识图谱技术,深度研究行业、企业业务,基于产品标签集相似度,可以寻找到同类企业,然后利用企业画像工具对企业实力进行评估,寻找行业隐形冠军,从而更加精准地进行招商引资。 2)产业与经济运行状况了解更及时。产业大脑根据企业产业标签管理,了解生态城产业结构,生态城因此能够紧跟国家发展战略目标;同时,通过多维度分析,生态城可以了解各产业发展情况,掌握产业增长与下降趋势,以及影响产业发展走势的主要企业;并收集宏观经济与区域经济数据,并进行对比,掌握经济发展差距,为宏观调控提供支持。 3)企业服务更主动。借助产业大脑,生态城可以从从企业入驻起对企业进行全生命周期管理。对标同行上市企业画像,判断企业发展方向、可能遇到的问题,进行主动培育服务。同时,基于政策试算器,向政策管理用户提供政策匹配企业列表、企业兑现情况清单。 智慧城市产业大脑项目经验总结 对于企业和政府部门而言,其在业务发展过程中会积累大量的文档和内容数据,这些数据中存在着大量有价值的信息,通过构建知识网络整合这些数据,能够为企业和政府部门的管理、业务发展提供有效的决策支撑。而从数据中挖掘价值,需要借助一系列方法和人工智能技术:首先要收集好各类型的内外部数据,并做好数据治理工作;然后借助NLP技术从数据中精准地抽取知识,建立知识间的关系,并且在此过程中,需要适当根据具体业务需求定制开发NLP模型。最后在此基础上构建知识网络,并利用规则、推理、图计算等引擎从知识网络中获取有效信息。

    案例2:AI数据管理平台助力上汽安吉物流批量化迭代AI模型,让物流管理更智慧

    安吉智能是上汽安吉物流旗下专注于智能物流解决方案的服务商,服务于上汽安吉物流内部的同时,也向汽车制造、机械电子、医药、冷链、日化、服装等行业企业提供相关技术服务。 物流行业向来注重安全管理工作。以上汽安吉物流为例,其业务范围涵盖汽车零部件、整车、港口、快运四个物流业务板块,包括上汽、特斯拉等主要汽车公司的整车仓储与进出口业务,其在全国范围内管理10个港口、300多个网点、5万多名员工。为了保障如此庞大的物流系统能够安全有序地运转,上汽安吉物流每年花费上亿元用于雇佣安保人员。但随着业务规模的增长,过度依赖人力的传统安全管理模式已经无法满足其发展需求。 针对物流行业安全管理中的痛点问题,安吉智能自主研发了“安眸智能视觉管理系统”,利用计算机视觉技术对港口、园区、仓库等物流业务场景中的核心元素“人员、货物、设备”进行识别和分析,并对出现的违反安全管理规范的问题及时提醒和采取相应措施,主动化解潜在危险。以仓库场景为例,安眸系统能够对仓库内的叉车超速、禁区出现人员、员工危险动作、着装不规范等行为作出精准识别,并进行管理。 由于计算机视觉模型通常只能对预先训练过的场景和物体进行识别,为了满足上汽安吉物流管理的10个港口、300多个网点,以及其对外服务的200多个客户不断提出的各异的功能需求,在安眸系统中不断上线新的识别功能,安吉智能的研发团队就需要不断获取新的样本数据,并在不改变边缘算力的前提下,对AI模型进行不断的更新和运维。 因此,安吉智能需要解决AI模型频繁迭代过程中的多个工程化难题。例如,针对迁移学习时模型会产生旧数据遗忘的问题,安吉智能已经通过自研知识蒸馏、混合学习等技术让模型在学习新的数据特征后获得新的识别能力的同时,也保留原先的识别能力。但安吉智能仍然需要应对以下两点主要的问题: 1)缺少能对非结构化数据进行精细管理的工具。安吉智能有大的图像数据集,但每个网点或客户提出新的功能需求时,其提供的图像数据的采集时间、采集目标、标注类别等信息都不一致,安吉智能需要将这些数据增补进原先的数据集中,记录数据集的层次结构,并形成不同的数据版本,从而用于模型误差分析和模型反复迭代。然而之前基于文件夹的手动管理方式,不仅很难追踪过去版本的模型和数据集的对应关系,在上百甚至更多个网点和客户都提出需求时,其数据版本就很难以文件夹的形式进行管理。 2)算法团队需要深度介入数据处理工作,手动执行效率较低。由于模型开发中数据的收集、标注,以及模型训练等流程存在大量需要算法团队介入的数据处理工作,安吉智能需要依靠算法开发人员对数据处理工作进行层层把控,手动执行各种操作。当模型的迭代更新变得非常频繁时,算法和数据团队的深度绑定会使得模型迭代流程非常耗时耗力,甚至无法完成。 依托非结构化数据平台,保障模型迭代中的高质量数据供给和流程自动化 面对模型频繁迭代,以及由此带来的大幅增长的数据管理需求,安吉智能选择与格物钛智能科技进行合作,将格物钛的AI数据管理平台作为安眸系统研发中的AI基础设施组件之一,以解决其痛点需求。格物钛智能科技是一家人工智能基础设施提供商,其核心产品非结构化数据管理平台向各类创新企业及团队提供AI数据管理解决方案,以数据引擎为核心技术,解决非结构化数据的发现、管理、利用等难题,实现对海量复杂数据的灵活存取用,从而推动企业的数据资产化和AI工程化落地。 针对非结构化数据集管理中的难题,格物钛为安吉智能提供了如下解决方案: 第一,在云端对数据进行统一托管。安吉智能各个网点的数据都存储在云端,格物钛的数据平台全面托管了安吉智能的原始数据、标注数据和元信息。在平台的权限管理功能保障数据访问安全的前提下,安吉智能的团队可以在平台上方便地访问数据和进行团队协作。 第二,数据版本可追溯。安吉智能每月或每周会在数据集内新增图片和物品类数据,通过格物钛数据平台,安吉智能在新增的数据上做标注,然后合并进原有数据集,并打上标签,从而形成新的标准化的数据集版本。算法工程师只需要根据标签就能找到需要的数据集版本,并比较各个数据集之间的差异。 第三,数据集分布特征可视化。格物钛数据平台的可视化组件能让算法工程师从宏观层面查看数据集的特征分布,以及从微观层面查看单个文件和标注数据。安吉智能的算法工程师因此能够在模型训练前直接查看数据标注信息,也可以在模型训练后将预测结果作为一个数据版本,与人工标注的数据版本进行比较,从而判断模型效果和数据标注质量。 针对算法和数据团队的深度绑定,手动执行数据处理工作效率低的问题,安吉智能通过使用格物钛数据平台的Action功能,并结合了一些自研算法,对数据收集、数据标注、模型训练等关键流程设置任务自动触发机制,并让整个流程实现自动化。在数据收集阶段,安吉智能通过自研图像相似度和质量分析的算法,当发现符合要求的图像后自动在摄像头中进行抽帧并将图像上传至云端;在数据标注阶段,通过使用格物钛数据平台,当符合需要的图片数据达到一定量级后,平台自动触发数据标注任务,然后通过签约的数据标注公司在平台上对数据进行标注,再与原先的数据集进行合并。在模型训练阶段,当平台监测到数据标注完成形成新的数据版本后,会自动先进行模型训练,然后对更新后的模型的预测结果进行评估,识别预测效果不好的图片,并在平台上对数据标注实时地进行调整。

    图 3: 安吉智能AI模型开发关键流程 img 非结构化数据平台给安吉智能带来的价值和效果 首先,格物钛非结构化数据平台为安吉智能实现了模型开发中的高质量数据供给。借助平台的云端托管、版本管理、数据集分布可视化等功能,安吉智能解决了模型迭代中的多种数据痛点,减少了数据收集、数据准备和模型评估中大量手工操作,让算法工程师可以专注于用AI模型去解决业务问题,模型精度能因此能提高30%以上。 其次,平台的自动化能力大幅缩短了安吉智能模型迭代的周期,节约单模型训练的人工成本。安吉智能预期因此可以实现每周对模型进行一次迭代更新,从而上线新的识别功能,最终全年能上线50个识别功能,并且单次模型训练能节约25%的成本。 安吉智能AI模型开发和迭代经验总结 以AI应用的复杂性,其在产业中落地的一大瓶颈通常在于数据的质量和匹配度。对于大部分传统企业而言,其数据量有限,研发能力也相对不足,如果把AI应用开发的重心放在改进算法上,效果往往并不如意。因此,传统企业在AI应用开发中应该把重点放在获得质量更好、匹配度更高的数据上,帮助提高模型效果,让AI应用更好地落地。 企业在AI模型开发或迭代频次较低时,其数据管理可以通过文件夹形式手动管理,但随着AI应用的加速落地,企业每年需要开发几十甚至更多个模型的时候,手动管理的方式将难以为继。此时企业应该选择标准化的工具对模型开发中需要的数据进行高效地管理,从而保障模型的持续迭代和更新。同时考虑在流程中引入自动化能力,进一步缩短模型迭代周期。

    3.3 场景规划层面

    3.3.1 方法论

    3.3.1.1. 确定场景规划的流程和方法

    通常,企业在确定和规划AI应用的落地场景时有业务需求导向和资金投入导向两种方式。

    对于需要快速推进智能化转型,追求AI落地的时间和成本效益的企业,可以考虑业务需求导向的方式。具体而言,企业可以首先由专门的协调管理部门或技术部门联合各业务部门确认业务需求较强的应用场景,而业务需求强的判断标准包括了人员投入大、重复性劳动多、人工操作效率不高或效果不理想等;其次,需要考虑开发该应用所需的数据是否容易获取,如果内部数据不充分,可以考虑是否能从外部厂商引入相应的数据;最后,需要业内已经有针对该应用场景的较成熟的解决方案,降低开发新应用的时间和资金成本。

    在上述判断的基础上,企业可以将强业务需求、所需数据能够获取、有较成熟解决方案的场景规划为需要实现AI落地的场景。例如案例3中的美宜佳和案例8中的海信集团都采用该种方式规划和落地AI应用的场景,其中,美宜佳前期根据业务需求确认了门店选址、门店运营和营销优化三类应用场景,并从外部引入了实现这些AI应用所需的时空数据,以及这些领域成熟的AI模型和应用解决方案。

    对于需要持续做深智能化转型,且资金和研发实力较强的企业,可以考虑资金投入导向的方式。具体而言,企业可以由专门的协调管理部门或技术部门协同业务部门或相关管理部门确认费用支持较大的业务场景:其次,需要考虑开发该应用所需的数据是否充分和是否容易获取;最后,需要判断在该业务场景中是否能用算法找到数据中的规律,或者是否能用相关AI技术解决解决这一问题。

    在上述判断的基础上,企业可以将费用支出大、所需数据能够获取、且能用算法或相关AI技术解决的业务问题规划为需要实现AI落地的场景。例如案例C中,某全球头部日用消费品公司在华公司由其数据科学与人工智能团队对品牌建设、销售管理中费用支出较高的业务场景进行筛选,结合数据和算法能力,最终在媒体规划、广告定位、会员活动设计、促销优化、供应链管理等场景中落地了多个AI应用。

    3.3.1.2. 定位高价值度应用场景

    对于任何类型的企业而言,其在实施智能化转型时都需要考虑AI应用场景落地的先后顺序,集中资源在高价值度场景中优先构建AI应用,因此需要对应用场景的价值度做排序,并对单个AI场景的ROI做事前预估和事后评估。

    关于应用场景的价值度,一般从高到低可以分为三类。第一类是能够对业务模式或业务流程进行创新,从而为客户提供创新性的产品或服务的应用场景,这类应用场景价值度通常最高。例如在案例B中,江南农商银行将虚拟数字人嵌入多个业务系统中,从而能够在无人场景中为客户提供多种业务咨询和业务办理;在案例6中,在先进的AI算法的支撑下,安克创新利用AR虚拟试戴解决方案,为其用户提供真实度非常高的线上眼镜试戴功能,不仅为用户提供了创新性的体验方式,也大幅提升了购买转化率;第二类是能够为企业大幅提高运营效率和降低成本的应用场景,通常该应用可以为企业带来数倍甚至更多地运营效率的提升或成本的降低。例如在案例4中,某餐饮连锁企业用计算机视觉对饺子品质做检测,完全代替了原先用大量人工去抽查的方式,为企业大幅提高了运营效率和节约了成本;第三类是能够一定程度提升运营效率和降低成本的应用场景,通常其对运营效率的升和成本的降低在100%以内,这类应用场景可以在企业资源充足的情况下去考虑智能化。

    关于ROI的评估,企业主要需要关注在特定业务场景中,投入某项AI应用前后,在该场景中企业的费用成本是否有降低,以及降低的比例。除了在事后评估ROI,事先也可以借助可参考的案例对ROI做预估,确定场景的价值度。例如,在供应链管理中,企业可以评估引入AI应用前后,供应链相关成本是否有得到优化。

    3.3.2 给不同成熟度的企业的建议

    初步投入阶段:该阶段的企业应主要参考高价值度应用场景定位的方法,优先选取价值度最高,且较容易落地的场景去落地。

    多维布局阶段:该阶段的企业应先在多个主要的业务部门落地价值度较高的场景,同时要探索并初步建立场景落地的流程和方法。

    深度应用阶段:该阶段的企业应建立并常态化执行场景落地的流程和方法,并且做好计划,每年在各主要部门批量化落地一定数量的场景。

    案例3:美宜佳打造商业智能决策管理平台,实现线下零售的智能化运营
    美宜佳控股有限公司是国内第二大连锁便利店集团。自成立以来,美宜佳以广东为中心,并逐步在全国范围进行业务布局。目前,集团拥有美宜佳品牌门店两万多家,每日门店总客流量达2500多万。 线下零售的核心逻辑是以“场”为中心去对接“人”和“货”, 而“人货场”各自的特征要素以及它们之间的关系都在不同程度上影响着门店经营策略和结果。对于正加快在华东、华北等地区扩张门店的美宜佳而言,经过早期信息化建设,其已建有ERP、PIM、BI等业务系统,在内部积累了较丰富的“人货场”数据。现阶段,美宜佳希望用智能化的方法对人、货、场的特征要素及其关联进行分析和优化,支撑门店的稳步扩张和精细化运营。 结合业务需求、智能化可行性等因素,美宜佳决定在门店选址、门店运营、营销优化三类重要场景中引入智能化解决方案。在门店选址方面,美宜佳需要用智能化的方法在城市中确定合适的拓店区域、该区域消费者习惯以及自身定位等情况;在门店运营方面,具体包含门店评估、品店匹配、销量预测、竞品分析等应用场景,帮助美宜佳更好的制定经营策略、提高门店业绩;在营销优化方面,则需要结合人群定向,对广告投放策略做优化。 为了在上述场景中实现智能化决策,美宜佳决定打造商业智能决策管理平台。但美宜佳在相关数据的完备性、以及AI算法能力上存在不足,具体如下: 1)数据层面,美宜佳仅掌握店内经营数据和自有供应链体系的后端数据,但缺乏外部的地理位置、周边人群、周边竞品相关的数据。同时,在与外部厂商共同探索解决方案时,美宜佳需要分享内部数据时保证其数据的隐私和安全。 2)AI算法层面,选址、选品、消费者画像、营销的智能化分析需要大量AI模型支撑来实现,美宜佳需要外部厂商提供相关的AI模型,并用模型解决业务问题。此外,不同地区的数据分布会有较大区别,通用的模型很多时候不能直接适用,需要根据区域、环境等因素对模型做调整和迁移。 以时空数据为基础,AI模型为支撑,美宜佳为门店经营各环节提供智能化决策 在对厂商的数据、AI算法、应用解决方案等方面的能力进行评估后,美宜佳选择与维智科技合作,建设商业智能决策管理平台。维智科技是一家时空人工智能平台提供商,专注于线下场景的数字化和线上线下的时空融合,通过时空AI技术打造数字孪生体,为城市、交通、金融、地产、零售和品牌等提供精细化场景服务和智能解决方案。 基于维智Phy-gital飞吉特时空智能平台,美宜佳构建了商业智能决策管理平台,其架构上分三层:底层是联合数据仓库,包含维智科技提供的时空数据和美宜佳提供的门店数据;中间是技术服务层,包括AI模型、时空知识图谱、业务计算逻辑等;上层是各类分析应用,包括门店选址评分、门店绩效评级、归因分析、人群画像、销量预测、价格预测、竞品分析等。

    图 4: 美宜佳商业智能决策管理平台架构 img 针对数据层面的问题,平台通过联合数仓的形式整合了维智科技的营销智能基础数据与美宜佳的门店数据。维智科技的营销智能基础数据包含客流、画像、人群流动偏好、周边生态、交通情况、商业环境、竞合关系等类别的数据,具体包括了路网、交通、AOI(区块),POI(点位)等静态数据,以及测绘相关的人流、画像、场景、企业、经济等动态数据。在此基础上,通过梳理“人、货、场”之间的特征管理,形成时空知识图谱。为了保护美宜佳的数据隐私,维智科技将其时空数据、模型服务与美宜佳的内部数据结合,以一体机的形式部署在美宜佳的受限环境中,模型的构建、训练、管理和发布均在一体机完成,确保美宜佳的数据不出库。

    图 5: 商业智能决策管理平台预训练模型仓库逻辑 img 针对AI算法层面的问题,平台基于分类、排序、聚类、异常发现、回归预测、溯因推理分析等技术模型,结合特征工程、自动特征计算等服务,形成画像、选址、选品、营销等方面的预测分析模型。同时,对于通用模型需要针对区域数据特征有变化进行适配的问题,维智科技通过匹配可适配的用例或特征来做模型迁移,并通过数据增强或者小样本学习来解决数据量少和样本稀疏的问题。 商业智能决策管理平台落地的价值与效果 美宜佳落地商业智能决策管理平台,用数据智能赋能门店开拓与运营,实现了以下业务价值。 1)门店选址方面,平台为美宜佳在广东、以及华东地区选址拓店,提供了数据支持和智能化的决策依据。具体而言,通过分析当前地区用户的习惯、常驻和流动人员的习惯、场本身的特性(是周边是医院、社区、商业中心等)、周边竞争态势(供需饱和度)、交通便利性等数据,判断某个地点是否适合开店,并给出关于在该地店的评分,以及影响评分的因子。这比传统的依靠调研和专家经验的方式大幅提高了决策效率和准确率,可以支持美宜佳每年3000家门店的开店合关店决策。 2)门店运营方面,该平台有效帮助美宜佳品牌门店和加盟门店总计4w+门店,进行数字化智能化运营。在门店评级、销售预测、归因分析、运营优化和营销优化等方面,提供线下大数据和智能预测结果辅助决策,有效指导门店运营优化。 商业智能决策管理平台的项目经验总结 第一,线下零售业涉及的数据量大、维度多、动态更新也相对频繁,在选址选品、供应链配货以及营销等业务中需要依据这些数据做出相对实时的决策,因此复杂度和难度很大。但零售数据核心上还是围绕人货场及其关联,面对复杂的数据场景,可以考虑运用知识图谱技术,将各维度数据按人、货、场梳理,再形成场与场、人与场、货与场的关联;同时考虑运用AI模型来刻画复杂的变化规律、分析思路和决策经验。 第二,只有店内数据无法在线下零售场景中实现智能化,因此还需要引入店外的时空数据,将地理位置、周边人群、周边竞品等外部数据与内部数据结合,才能实现1+1>2的效果。并且,在将内外部数据进行结合时,需要考虑通过相应的技术或产品设计方式保障数据的隐私安全。

    案例B:虚拟数字人助力江南农商银行为客户提供创新性的远程视频柜员服务

    在银行业积极探索更丰富、更精细化的客户服务方式,消费者对银行服务的效率和便捷性也有了更明确的需求,以及疫情常态化对银行远程服务能力要求更高等因素的推动下,江南农商银行于2021年12月与京东科技合作推出的国内首个业务办理类数字人“言犀VTM数字员工”。 区别于以往咨询问答式机器人,VTM数字员工的创新之处在于,其采用拟人化的形象与用户进行对话交互,为用户提供了良好的沉浸式体验;同时,VTM数字员工与江南农商行的业务系统深度耦合,从而支持VTM数字员工从业务系统中调用数据支撑用户问答与交互,并代替业务人员在各类交易场景中帮用户闭环完成咨询、查询、导览,以及取款、开户、密码重置等业务。而支撑虚拟数字人与银行的业务交易场景打通,为银行实现创新性业务模式的是京东科技在NLP、TTS、ASR、虚拟形象、图像识别等多种自研AI技术上深厚的积累,通过将这些AI技术有机结合,VTM数字员工具备了音唇精准同步、表情丰富逼真、交互流畅自然等高度拟人化的特征,以及高准确率的语音语义识别能力,并能精准识别数字连读和方言,也为适老化能力的建设和乡村金融服务的街乡级渗透提供新路径。 VTM数字员工的投入使用,不仅大幅提升了江南农商银行远程银行的接待能力与服务效率,降低了运营成本,还勾勒出银行服务的未来发展的新形态:即通过运用人工智能等先进科技,银行可以构建无人场景下的服务能力,重塑服务模式与体验,为客户提供更便捷的服务。这将成为未来银行业甚至整个服务产业的发展趋势,具备大规模推广的潜力。

    案例C:某全球头部日用消费品公司在华公司以费用支出为导向规划AI应用场景

    某全球头部日用消费品公司在华公司为保持其市场领先地位,需要在品牌建设、销售管理优化等方面实现全面的智能化。因此,其数据科学与人工智能团队采用了资金投入导向的方式对AI应用进行了规划。具体而言,该团队筛选应用场景的标准有三个:第一,优先考虑费用支持较大的场景;第二,重点考虑数据层面的问题,包括数据的充足度、数据获取的难易程度、数据的有效度;第三,能够用算法从数据中找到规律,从而解决该业务问题。 基于上述方法,该公司如下五类方向落地了多个AI应用,显著降低了公司的费用支出。 第一,媒体规划,即将媒体预算以最优的方式分配投入给不同的媒体形式,如视频、站内、电视、户外广告等。 第二,精准广告定位,即把广告投向更精准、更有可能产生购买行为的用户。 第三,会员活动设计,即针对会员的过往的表现设计合理的会员活动。 第四,促销优化,即根据历史数据来优化未来促销活动的规划,减少促销费用的投入。 第五,供应链管理,包括仓库的分布、送货路线的规划、库存的管理等。

    3.4 应用解决方案开发层面

    3.4.1 方法论

    3.4.1.1. 明确自研和引入外部能力的条件

    对于处于早期投入阶段,尚无AI应用构建能力和经验的企业而言,企业构建AI应用应该主要考虑外采。

    对于处于多维布局或者成熟度更高阶段的企业,其已经具备了一定技术能力、专业人员和AI应用开发经验,此时企业构建AI应用应该以自研为主。但是当企业在构建AI应用时,面临以下一个或多个问题时,需要考虑和外部厂商合作联合开发或者完全外采解决方案。这些问题包括:(1)应用解决方案复杂度较高,需要多种底层AI技术的支撑,自研难度大、成本高、时间长;(2)企业内部缺乏应用开发所需的数据;(3)企业自身不具备特定应用场景的业务知识或AI应用开发实践经验。

    例如在案例9中,某集团科技公司由于在搭建供应链管理相关的AI应用时面临智能调度、仓配算法开发难度大,搭建智能营销应用时缺乏市场客户数据,搭建园区安全时缺乏实践经验,便选择与京东云合作在这些领域联合开发AI应用。

    3.4.1.2. 在AI开发团队中引入业务专家,提供业务知识方面的专业指导

    AI应用最终需要解决的是业务的问题,而精通技术的算法工程师或数据科学家往往对业务问题缺少了解,因此在AI应用开发中,AI开发团队需要寻求业务专家的帮助和指导。

    在开发应用解决方案之前,要协调内部资源,对精通业务的人员进行深入调研,针对具体场景梳理业务流程,理清每个环节的业务需求。如在案例5中,中宏保险在搭建营销员智能助理解决方案之前,首先对保险营销员的需求进行了充分调研,了解营销员需要询问哪些保险知识,对知识的呈现有哪些要求,在问法上有哪些独到的习惯等问题。

    在开发应用解决方案过程中,企业需要业务专家协助,确定业务的标准。具体而言,包括了在计算机视觉相关的应用开发中,由业务专家帮助确定图像的分类、图像是否符合要求的标准;在自然语言处理相关的应用开发中,由业务专家对词性、词语分割、情感等进行标注,提高语义理解的准确度。例如在案例4中,某餐饮连锁企业为了在饺子质检应用中确定饺子是否合格的标准,便由其业务专家与开发人员一起确定了饺子“白鼓”、“偏皮”等维度判断标准,并在图片中做相应的标记用于模型训练。

    3.4.1.3. 依靠经验丰富的AI开发人员将业务问题转化为算法可解决的问题

    企业在探索性的AI应用开发中经常会受困于如何将业务问题转化为算法可解决的问题,通常这类问题的只能借助精通技术的同时能对业务也非常了解的数据科学家或算法工程师来解决。比如,需要经验丰富的数据科学家或算法工程师能够判断某个业务问题是属于分类问题,还是回归问题;特征工程的特征和目标是否有因果关系等。在此基础上,企业在具体执行中,还可以进一步参考案例4中明略科技在帮某餐饮连锁企业开发饺子质检解决方案时的做法,即通过多种可能的业务标准标注多个数据集,再对照多个算法不断测试,最终得出效果较好的模型。

    3.4.1.4. 提高小数据集的数据质量以支撑AI应用开发

    传统企业在开发AI应用时,通常会面临样本数据量较小的问题,比如,制造企业想开发针对某个零部件的智能质检应用,其样本数据可能不足100个,或者医疗机构想要构建一个罕见病的疾病预测模型,其样本数据可能只有几十个。此时,企业一种方式是可以考虑采用较前沿的小样本学习技术开发此类AI应用,另一种方式是提高样本数据的数据质量,不仅是前期做数据采集时要考虑通过用一些定制化的方法让采集到的样本数据与需求尽量高度匹配,同时也要借助业务专家提高数据标注的准确度,从而能够以较小的样本数据集开发出AI模型。

    3.4.1.5. 采取先以最少的数据让AI应用可用即上线,后续再维护更新的策略

    为了让AI应用能早日上线发挥价值,企业可以在开发AI模型或AI系统时先用最少的数据量去训练模型或系统使其达到初步可用的状态即在业务中部署,后续在运营过程中再针对新收集的数据,对模型进行增量学习,或对系统进行更新,从而使AI应用更加聪明,功能更完善。例如在案例5中宏保险智能助理案例中,由于保险行业知识体系庞杂,为了让智能助理能够早日上线发挥价值,中宏保险采取了在知识库中先加入营销员最关心的问题,后续再利用平台的AI自学习能力从新的数据中学习新的知识,并逐渐丰富知识库的策略。

    3.4.1.6. 综合考虑算力、带宽等需求,设计合理的“云边端”协同部署方式

    针对在业务系统中部署AI应用会面临各种场景化适配的问题,如果应用解决方案对计算实时性、数据安全的要求都不高,数据量相对有限,以及追求更低的计算成本,可以主要考虑在边缘端通过算法控制采集所需数据,在云端部署解决方案的方式。例如在案例4某餐饮连锁企业的饺子质检解决方案中,其在摄像头中内置过线检测算法采集到每一盘经过出餐口的水饺图片数据,这些图片数据的数据量相对有限,对带宽、存储和计算要求都不高,然后将图片数据上传至云端,通过定制的质检算法判断饺子的品质。

    而如果解决方案需要实时生效,且数据量大,上传云端对带宽、存储和计算资源要求都很高时,企业需要考虑将解决方案部署在边缘或设备端,同时要对算法和SDK包体积的大小以及边缘或设备端的算力资源进行优化,以保证算法能够在边缘或设备端有效运行,并产生实时的计算结果。例如在案例6中,火山引擎在其AR虚拟试穿试戴解决方案中内置了3D关键点识别、惯性检测、人脸属性等多种AI算法,以保障用户的试戴体验的真实性,而为了让这些算法能够在移动终端运行和实时生效,火山引擎在保证模型精度不降低的前提下,对模型大小进行了压缩,对移动终端的算力资源也做了相应优化。

    3.4.2 给不同成熟度的企业的建议

    初步投入阶段:由于企业自身研发实力暂时有限,建议主要考虑跟有成熟解决方案的厂商合作,构建相关应用。同时,企业需要对上述问题,如协调业务人员参与、开发部署中的重点问题有知晓,在过程中给予应用开发项目组资源支持。

    多维布局阶段:明确企业自身的能力和资源,对应用是否自研、合作开发、外采,设立明确的标准;重视内部业务专家对应用开发的作用,建立业务和技术人员的协作机制;参照上述方法,加快应用开发到部署的效率。

    深度应用阶段:建立较完善的自研能力,尤其重视技术人才队伍和技术基础设施的建设;在应用开发团队中常态化地引入业务专家资源,由统一的部门进行协调管理;建立标准的解决方案开发、部署和后续运营的方法和流程。

    案例4:依托计算机视觉技术,某餐饮连锁企业为饺子品控安上智慧之“眼”

    某餐饮连锁企业是国内知名的水饺餐饮连锁公司,总部管理机构设于辽宁大连。目前,该餐饮企业在全国40多个城市拥有700多家连锁门店,员工8000多人。 发展至今,该餐饮企业所有门店都为直营,为的是能够控制水饺出品的品质。而当该餐饮企业在往南方扩展后,由于南方鲜有吃饺子的饮食习惯,出现了南方门店的饺子品质和北方门店有较明显差距的状况。为了严格统一不同地域门店出品的水饺的质量,该餐饮企业最初采取了神秘访客的方式对门店进行抽查。但由于其门店众多,该餐饮企业只能不断加大神秘访客的抽查密度,最终付出了高昂的时间和人力成本,但收效并未达到预期。 在此背景下,该餐饮企业决定引入数字化技术对水饺品质进行管理。具体而言,该餐饮企业希望对每一份经过出餐口的饺子都进行拍照,并利用计算机视觉技术对饺子图像进行分析,判断和管理水饺的品质。然而,不同于常规的工业质检,“饺子质检”是一个创新性的应用场景,业内尚无成熟的解决方案。要产生实际的效果,就需要重点解决以下问题: 1)稳定地获取高质量的饺子图像。通常,饺子在被服务员端到顾客餐桌之前,会被统一放置在出餐口下停留1秒左右。因此,摄像头需要在1秒钟内完成高清装盘饺子照片的抓拍,同时要克服出餐口下方空间狭小、光线不足,以及饺子热气蒸腾模糊镜头等困难。 2)将业务问题转换成算法可以执行的客观任务。视觉检测通常用到的是目标检测算法,包括了位置检测以及对检测内容的分类。饺子质检场景中要对检测内容进行分类,就需要首先确定饺子好坏的客观标准,通过数据标注,让算法能依据这个标准去学习对饺子的分类。然而饺子好坏的标准包含了很多行业知识,且其描述通常非常主观和抽象,难以统一。 3)样本数据要覆盖尽量全面的情形,并兼顾控制冷启动成本。在该饺子质检场景中,由于场景很固定,训练模型所需的数据量未必要很大,但样本数据要覆盖尽量全面的情形,以保证模型能够识别各种特殊情况。同时,初期要用少量的数据让模型可用,尽快上线,后续再对模型进行优化。

    打造集定制相机、云端视觉识别、品质管理系统的整体解决方案

    基于对明略科技数字化技术和服务能力的认可,该餐饮企业选择与明略科技合作,为其定制开发“饺子质检”解决方案。明略科技是一家企业级数据分析和组织智能服务提供商,为政府、金融、零售、工业等行业企业提供基于大数据和人工智能技术的产品与解决方案。 经过和该餐饮企业的深度沟通,明略科技智能硬件和深度学习算法团队为其定制了一套端云协同的综合解决方案,在出餐口下安装定制相机,通过这一边缘设备获取饺子的实时图片数据,上传至云端对图片进行深度学习算法的识别分析,对每盘出餐的饺子给出优秀、合格、不合格的评级,最后在品质管理系统中生成统计分析报告,供管理者及时全面地掌握出品情况。 为了稳定地获取高质量的饺子图像,明略科技项目组为该解决方案定制了摄像头。镜头、补光灯等都做了个性化的定制,从硬件上解决出餐口下方空间狭小、光线不足,以及热气蒸腾模糊镜头等问题。同时,摄像头内置了过线检测算法,当区域内有物体移动,且移动区域超过一定界限,摄像头会快速抓拍物体,从而获得清晰的饺子图像。 为了确定判断饺子好坏的客观标准,明略科技项目组与该餐饮企业的业务专家合作,分批引入了外观上的白鼓、偏皮、饱管,以及摆放上的是否顺等判断饺子品质好坏的维度。而其中每一个维度的判断标准,例如白鼓,项目组排除了图像的角度、光线、饺子馅等干扰因素,筛选出了多个相对客观的白鼓标准,让不同的人标注同一批数据,结果能够统一,并依次用不同算法测试这些标准是否能区分饺子好坏,最终确定了分类方法和所用的模型。 针对样本数据量以及冷启动成本的问题。项目组在前期主要考虑了样本数据能够覆盖更多的情形。比如,样本数据尽可能包含多几种出餐口拍的饺子,光线也有更多变化等。而由于该场景比较固定,样本数据量选择在上百左右,这样可以用最少量的数据标注就能让模型达到可用状态,上线达到初步效果后,再用一定时间收集长尾情况的数据并优化模型,从而降低了冷启动的成本。

    饺子质检落地后的价值与效果

    第一,通过饺子质检解决方案,该餐饮企业的管理人员能够在管理系统中查看实时生成的饺子品质统计分析报告,了解每家店每天甚至每个时间段的饺子的品质情况,具体到合格与不合格的饺子的数量,从而提高了该餐饮企业对饺子品质管理的效率。 第二,该方案目前已在该餐饮企业大部分门店推广使用,有效识别了水饺饱满、摆盘等问题,识别准确率在90%以上,其门店的菜品优秀率因此提高了20%。

    饺子质检项目经验总结

    用计算机视觉技术感知现实世界中各种情形,并将其数字化,为企业解决各种业务问题提供了有效的技术手段。随着人工智能在产业中的加速落地,计算机视觉也将被应用在更广泛的场景中,甚至无所不在。而在用计算机视觉技术解决具体的业务问题时,企业要重点考虑数据、算法和冷启动成本三方面的问题: 1)数据方面的问题主要涉及数据采集和数据标注。在数据采集阶段,由于视觉场景通常差别很大,因此图像数据的采集往往需要针对特定场景定制相应的相机以确保图像数据采集的效果,并且要保证采集的数据包含尽量全面的情形。而在数据标注阶段,企业首先借助业务专家的经验,确认统一的标准,确保不同的人标注结果能够一致,并且算法能够识别和区分这些标准。 2)对于算法的选择,企业可以结合标注数据的各种标准,选择不同算法多做测试,根据测试结果选择有效的标准的同时,也确认效果更优的算法。 3)初期为了降低冷启动成本,企业可以用少量数据让模型达到可用状态即上线,后续再收集更多长尾情况的数据,对模型进行更新和优化。

    案例5:中宏保险构建营销员智能助理,通过保险知识的共享和复用赋能销售

    中宏人寿保险有限公司(以下简称“中宏保险”)是国内首家中外合资人寿保险公司,由加拿大宏利旗下的宏利人寿保险(国际)有限公司和中国中化核心成员——中化集团财务有限责任公司合资组建于1996年11月,现已拥有逾2000名员工和17000名营销员,为240万客户提供金融保险服务。 保险产品作为专业的金融产品,客户对其通常缺乏了解,这导致在选购保险产品时,客户需要考虑很多需求和因素,整个决策周期也很长。因此,保险行业为了提高业绩,就需要保险营销员能够向客户持续输出产品、条款规则、政策等专业知识,基于复杂信息,以最快的方式有效处理客户的实际问题,展示出专业性和解决问题的能力,才能将潜在客户最终转变成为现实客户。 多年来,中宏保险一直注重对营销员的咨询支持和培训管理工作,然而随着其业务范围的扩展,营销员的咨询支持和培训管理工作变得越来越来繁重,消耗了大量内部资源,并且实际效果也不够理想。一方面,中宏保险营销员原先主要依赖向主管领导和营业网点服务台的工作人员咨询关于保险产品的问题,然而这些问题有约50%都是较常见的问题,对常见问题重复的询问不仅消耗了主管大量的时间,也占用了营业网点宝贵的客户服务资源。另一方面,保险业的营销员人员更替较频繁,新的营销员入职后也需要对一些常见问题进行询问和学习,人员不停地轮转也进一步增加了内部培训的压力。 基于上述原因,中宏保险希望利用自然语言处理、知识库、对话机器人等技术,打造一个线上的保险营销员智能助理,用于解答营销员的常见问题,并具备对新员工的培训能力。中宏保险对于营销员智能助理解决方案有如下两点最重要的要求: 1)保险行业涵盖的知识体系很庞杂,不同的专业知识有11大类,因此在构建智能助理的知识库时,需要尽量全面地覆盖营销员会咨询和学习的知识类型,并且知识库上线后也要方便持续地维护更新; 2)准确理解营销员的问题是给出正确答案的前提,因此需要对话机器人内置丰富的AI能力模块,使其具备出色的自然语义理解能力,能够与营销员进行流畅对话。同时,需要底层的机器学习平台具备良好的扩展能力,让普通业务人员也能以可视化的方式对特定业务场景进行算法模型的调优调参,以达到更高的语义理解准确度。

    打造以智能知识库为核心,智能交互为途径的营销员智能助理解决方案 在对多家厂商的语音语义、知识管理产品,以及建设和运维方案做了较长时间的评估后,中宏保险选择与竹间智能合作来搭建营销员智能助理解决方案。竹间智能成立于2015年,公司以自然语言处理、深度学习、知识工程、文本处理、情感计算等人工智能技术为基础,将AI能力整合到企业业务中,为金融、制造、政务、智能终端等行业提供端到端解决方案。 基于对中宏保险需求的理解,竹间智能为其提供了营销员智能助理解决方案。从用户使用方式的角度,智能助理内置在中宏保险的内部营销工具中,营销员咨询产品或进行业务培训都可以点击进入智能助理界面,通过文字或语音输入问题,从而获取所需信息。从解决方案架构的角度来看,其底层包含了机器人建设、运营工具、机器学习平台等解决方案的开发和运营工具,构成对话机器人的多个AI模块,以及丰富的自然语言处理基础技术,最上层则是与营销员进行直接交互的界面。

    图 6: 中宏保险营销员智能助理解决方案架构 img 中宏保险与竹间智能联合搭建的智能知识库涵盖了丰富的信息,包括:运营规则(包括新单投保、保单服务、保单理赔等)、营销员基本法、保险热销产品、营销员荣誉竞赛、客户活动与增值服务、数字化工具使用等信息类型。而为了使知识库覆盖尽量全面的知识类型,保障后续的迭代更新,双方组建起项目组,在中宏保险的领导下,重点开展了如下工作: 1)在项目前期充分调研营销员需求。了解一线营销员需要了解哪些知识,对知识的呈现有哪些要求,在问法上有哪些独到的习惯等问题。 2)高度自动化的知识图谱构建。基于竹间智能的Gemini知识工程平台,项目组从中宏保险的保险条款、产品文档等非结构化数据中自动解析和抽取保险产品名称、以及与之相关联的犹豫期、等待期、保险责任等产品属性。在此基础上,在Gemini平台上将抽取的知识进行自动关联,形成保险产品的知识图谱,从而实现知识推理、产品检索等功能。比如将知识推理用于回答产品的保障内容、产品的比较、符合要求的产品有哪些等问题。 3)利用自动化的自然语言学习技术,在智能助理上线前后进行高频问题识别和更新。通过竹间智能Bot Factory A+H人机协同平台的自监督学习能力,项目组一方面在智能助理上线前对中宏保险的客服录音和聊天记录做聚类分析,自动识别出已知的客户高频问题及其对应语料,视需要由人工核对,从而为营销员应对高频的产品和业务问题提供标准答案。另一方面,在智能助理上线后,通过自监督学习从营销员新提问的众多未得到回复的问题中识别出高频问题,中宏保险的业务专家随后对这些问题给出标准答案,自动加入知识库,从而实现对知识库的持续更新。平台的AI自学习能力使之能够以较低的运营成本不断提升机器人的模型与会话能力。 为了让智能助理能够准确地理解语义,实现与营销员的流畅对话。竹间智能在对话机器人中内置了多个AI功能模块,包括语义解析、FAQ、多轮对话、意图识别、情感识别、知识推理、智能话术等。例如,多轮对话引擎通过向营销员连续反向提问获得确认具体问题所需的全面信息;意图识别引擎内置50多类、3000多种开箱即用的意图模型,用于识别营销员的询问意图;情感识别引擎能识别25种情绪,从而使对话更有同理心和温度。同时,平台内置了一个对话管理框架,当营销员向智能助理提出问题时,对话管理框架会结合业务场景,对不同AI模块的优先级、权重、分流策略进行调整,从而在其中选择最匹配的模块对营销员的问题进行准确应答。 为了让中宏保险能够对智能助理进行二次开发,使智能助理具备针对特定业务场景的扩展能力,竹间智能在对话机器人底层提供了自动机器学习平台,平台内置了多种前沿算法,当上层的AI模型对特定场景的语义识别不够准确时,开发人员可以在自动机器学习平台上以可视化的方式对算法模型进行自动化测试、自动调参、算法融合,让语义理解准确度在复合式算法、仅需要少量数据的条件下,自动迭代学习。 保险营销员智能助理落地后的价值与效果 营销员智能助理落地以后,中宏保险在营销员的咨询支持和培训管理上实现了以下显著的效果: 第一,在对营销员的咨询支持方面。首先,智能助理能够7x24小时不间断且秒级响应营销咨询需求,对营销员常用问题实时给出正确回复,高解决率有效减轻了主管和营业网点服务台客服的咨询服务压力。自智能助理上线以来,平均回复准确率保持在95%以上,得到了一线销售人员普遍认可。其次,智能助理上线后也作为运营平台,可直观了解未知问题和营销员关心的热门问题,帮助丰富智能助理知识库和填补营销员业务未知领域,未来结合智能化的培训练习,帮助营销员提升技能,增长业绩。 第二,在对新营销员的培训方面。实时智能助理能帮助新营销员快速且全方位地掌握产品、服务、规则、政策等全量信息与内容,缩短了新人成长过程中知识储备的周期,让新人能快速开展业务。 保险营销员智能助理项目经验总结 第一,在金融、制造等专业知识密集的行业,保障知识的高效学习与传承是提高其生产和服务质量的关键。而如果只能依靠行业“老师傅”去传授企业在长期业务发展过程中沉淀的大量专业知识,不仅耗费大量时间精力,也很难保证质量。因此,金融、制造等行业的企业可以考虑应用人工智能技术解决专业知识管理与共享的问题。 第二,在用AI对知识进行管理并以问答形式对外输出的过程中,企业需要重点考虑构建智能知识库以及具备高度语义理解能力的对话机器人。对知识库的构建需要采用自动化的知识解析和知识图谱构建工具,以及用无监督学习从海量语料中自动学习新知识,从而提高知识库构建和后续运营维护的效率;对于对话机器人则需要其内置丰富的AI功能模块,完善的对话管理框架,以及方便二次开发的自动机器学习平台,使机器人能准确理解语义,实现与用户的流畅对话。

    案例6:AI算法支撑下,AR虚拟试戴让安克创新用户获得更优的线上互动体验

    安克创新科技股份有限公司(以下称“安克创新”) 是一家全球化的消费电子品牌企业,主要从事智能配件和智能硬件的设计、研发和销售,为消费者提供充电、无线音频和智能创新等品类的消费电子产品。安克创新的销售渠道覆盖国内外各大主要的电商平台和一些线下合作伙伴,在Amazon、Ebay等境外电商平台上占据行业领先的市场份额。 安克创新旗下的音频品牌Soundcore声阔,于2021年末推出了新产品“声阔智能眼镜”,并计划重点在欧美市场对该产品做市场营销和线上产品推广,但安克创新此时需要应对较复杂的市场环境。一方面,在购物线上化和海外疫情常态化的大环境下,品牌商在线上推广产品普遍会面临营销手段单一,业绩增长乏力的问题。另一方面,年轻群体是消费电子的主力用户人群,为了吸引这类用户群体,品牌商需要通过不断的业务和场景创新提升消费体验,让消费者感受到品牌的活力和创新力。 在此背景下,安克创新决定引入AR虚拟试戴解决方案来推广其智能眼镜产品,让用户能足不出户进行眼镜试戴,模拟真实穿戴智能眼镜的效果。对于AR虚拟试戴解决方案的要求,安克创新有如下具体考量: 1)AR试戴的效果要足够好,以保证用户获得较真实的试戴体验,包括:眼镜的质感、材质、光泽度等产品细节的还原度要高;试戴时,眼镜要能够跟随人脸的运动与面部正确位置高度贴合;所有试戴效果要能够实时生效。 2)在保证试戴效果良好的前提下,解决方案要能够同时支持在移动端和Web端使用,从而满足不同偏好的用户使用习惯,获得范围更广的社交传播效果。 3)需要厂商具备完整的解决方案的交付能力,提供从商品建模到交付上线全链路的产品服务,让安克创新能快速上线有效的解决方案。 先进的AI算法和实时渲染引擎助力实现多端一致、效果真实的虚拟试戴效果 在对比了国内外多家厂商的AR试戴解决方案的技术水平、使用效果和落地方案后,安克创新选择与火山引擎合作,为其提供能满足上述要求的AR眼镜试戴解决方案。火山引擎是字节跳动旗下的企业级技术服务平台,将字节跳动快速发展过程中积累的增长方法、技术工具和能力开放给外部企业,提供云、AI、大数据技术等系列产品和服务,帮助企业在数字化升级中实现持续增长。 基于自研技术,火山引擎为眼镜、美妆、鞋帽、手表、首饰、美甲等行业客户提供AR虚拟体验场景建设,可应用于品牌营销、新零售、电商购物等场景。在线上,其解决方案可提供SDK/API,快速进行商城(Web)、APP、小程序等第三方集成上线,为消费者实现从浏览商品-线上试穿/试戴-购买的线上购物体验闭环。在线下,可将虚拟体验产品应用于实体店,通过创新的互动手段吸引消费者进店,提升消费者的购物体验,进而促进消费行为的发生。通过线上线下体验和流程的打通,辅助客户解决传统零售行业面临的高库存、高销售成本、低转化等诸多棘手问题。 为了保障安克创新的用户能够获得较真实的试戴体验,火山引擎从3D素材制作、人脸关键点识别算法、实时渲染三方面着手为安克创新提供解决方案。 火山引擎基于其自研的3D引擎为安克创新定制了10款声阔智能眼镜和8款预热款眼镜的3D素材,在对原始素材做基础建模后,对材质的诸多细节如高光、反光、半透明等做进一步优化。例如,对于镜片透明度的处理,传统的素材处理只考虑透明度效果,而火山引擎进一步针对镜片在半透的情况下与欧美不同人群的肤色相融合的效果做了优化,使效果更自然和真实。 为了让眼镜在用户试戴过程中能紧贴面部轮廓,获得很高的跟随度。火山引擎在解决方案中采用了自研的人脸关键点识别算法对人脸的3D关键点进行识别,精细化定位五官和面部轮廓,并用3D拟合算法实时生成人脸的3D模型,从而使眼镜模型能够很好地跟随和贴合人的面部。同时,解决方案中还采用了运动补偿和运动估计等惯性检测算法,保证在连续运动和极端角度下试戴效果的稳定性。 火山引擎的3D引擎具备实时渲染的能力,并且对图形渲染的性能做了优化,保障了为安克创新定制的细节度很高的3D素材也能够实时生效。 针对安克创新需要同时支持移动端和Web端的需求,火山引擎通过对算法和算力进行优化,实现解决方案多端运行的稳定性和效果一致性。在移动端,火山引擎根据手机硬件性能做了算法适配和硬件加速,保证在多算法并行的情况下的真实效果和超低延迟。在Web端,火山引擎也通过相应的优化能够应对浏览器资源调用、算力需求诸多限制。同时,火山引擎对算法本身进行优化,使得达到同样的模型精度,其模型大小比业内平均水平低几十倍,从而降低了包体大小方便多端适配,也更节省了算力。 针对完整的解决方案的交付能力要求,火山引擎提供了包括体验设计、技术解决方案建立、项目管理、数据检测、市场进入的端到端解决方案,让AR眼镜试戴解决方案能够在安克创新快速落地和有效应用。

    图 7: 火山引擎AR虚拟试戴解决方案交付链路 img AR虚拟试戴解决方案落地后的价值与效果 从用户试戴效果的角度,安克创新通过采用AR眼镜虚拟试戴解决方案,让用户能够不用到店接触实物,在线上就能获得很真实的眼镜试戴效果,并且了解商品的外观、特点等诸多细节的信息,更好的帮助购买决策。 从业务价值的角度,虚拟试戴解决方案提升了安克创新用户的线上消费体验,从而促进商品的购买转化。该功能在安克创新官网上线4周就吸引超100万海外用户体验了该功能,对安克创新的品牌推广及购买转化都产生了很明显的实际效果。因此,安克创新在中国区推出智能眼镜后,也同样选择了火山引擎研发的AR虚拟试戴解决方案。 AR虚拟试戴解决方案的借鉴意义 AR虚拟体验带来的交互、场景、终端体验正在催生体验式消费的新升级,而为了保证更真实和稳定的虚拟体验,需要用人工智能技术从两个层面发挥作用,解决相应的问题。 第一,先进的计算机视觉算法是提升虚拟体验效果真实性的关键。要让虚拟体验达到更加真实的效果,就需要通过采用更加先进的计算机视觉算法对现实中的物体和环境进行感知、识别和重建,从多个层面还原和模拟现实中的情形。 第二,人工智能在实际落地过程中需要重点突破算力的瓶颈。开发出先进的算法通常只解决了问题的一半,要让算法能够实际运行,尤其是在消费者终端运行,就需要对其算力消耗、硬件资源进行大量的优化,保证算法在生产环境中可用。

    案例7:某银行搭建智能消费者保护中台,助力消费者权益保护监控和预警

    某股份制商业银行(以下简称“M行”)是国内金融零售业头部银行,该行注重对消费者的全流程陪伴和打造最佳用户体验,践行消费者权益保护工作。 在金融产品与服务体系日益丰富且复杂的背景下,我国政府与金融监管部门愈发重视金融消费者合法权益的保护,陆续出台了《中国人民银行金融消费者权益保护实施办法》等各类监管文件,要求各大银行建设或加强消保全流程管控机制,从产品开发设计、定价管理、合同协议、营销宣传、纠纷解决等各方面保护金融消费者合法权益。 此前,M行已使用传统的IT系统实现消保审查和投诉处理线上化,例如消保审查系统是由业务部门提交申请、各级消保专职部门审批,完成各项消保审查;投诉管理系统是包含客服接听电话-记录-分类-转办-处理等环节的工作流系统。但此类系统由分行或业务部门各自建设和使用,且没有覆盖全渠道投诉、反馈和跟踪情况。总行没有统一的投诉处理风险反馈机制,导致投诉风险主要依靠各层级消保部门进行人工分析,信息流转过慢,管理层无法对消保工作进行全过程的监控和管理。 出于在全流程业务中有效保护消费者合法权益的需求,M行希望通过建设智能消费者保护中台,运用语义理解、语音识别、机器学习等技术增强对消保业务全过程管控,智能排查潜在的投诉风险,以数字化手段提升工作质效。M行对智能消保中台解决方案有三点核心需求: 1)现有的消保审查、投诉管理、服务监督检查和舆情监测等系统存在数据孤岛问题。需要通过中台建设打破多业务部门、各区域、各系统数据壁垒,拉通“事前审查-事中管控-事后监督”全周期消保数据。 2)各项业务系统产生海量的非结构化文本数据,全人工处理和分析的效率低。需要借助OCR、NLP等智能技术进行信息挖掘,用于辅助投诉处理和进一步的风险智能分析。 3)管理层缺少对全行消费者投诉、处理反馈和跟踪情况进行实时掌握和风险排查的有效手段。智能消保中台应提供针对潜在投诉风险的智能排查工具,形成适配消保业务的知识图谱和标签体系,输出较为准确的风险研判结果。 基于认知智能技术,打造银行智能消费者保护中台解决方案 M行经过对解决方案公开比选,基于对拓尔思认知智能技术和客户服务经验的认可,选择与拓尔思合作建设智能消费者保护中台。拓尔思是一家人工智能和大数据技术及数据服务提供商,核心技术是语义智能,即基于语义理解的认知智能,为客户提供从数据洞察到智慧决策的解决方案。 拓尔思为M行提供的智能消保中台解决方案,覆盖消保业务的事前审查、事中预警、事后督办的消保全生命周期智能管理,提供投诉升级预警、重大投诉推送提醒、外部舆论分析等功能,实现潜在风险由人工排查向系统自动排查转型。 解决方案有三个核心要点:一是拉通各业务系统的数据;二是对非结构化数据进行处理和信息提取;三是多维度的知识挖掘和分析应用。 针对数据孤岛问题,M行通过建设全口径的投诉管理大数据平台,整合行内10多类异构多模态数据,包括全渠道的消保审查、客户投诉、服务监督检查、舆情、政策数据等。 针对海量非结构化数据处理问题,运用OCR、NLP等智能技术从文本中提炼出具有概括性和精确性的字段,再根据字段的意义和内容,结合标签体系生成信息挖掘结果。标签体系包含客户特征、投诉原因、投诉诉求、投诉渠道等近20个维度3000个标签,在消保审查、投诉处理等需要分析大量文本的场景中,能够有效提高工作效率;并且,平台可以进一步对标签化分析结果进行统计,为消保工作常态化监管提供数据支撑。 针对风险智能排查需求,一方面,拓尔思基于情感分析、机构识别、语义识别、标签提取、观点抽取、行为分析等核心算法,根据M行消保业务需求封装了行业区域分析引擎、动态追踪引擎、产品分析引擎、聚类分析引擎、归因分析引擎、投诉用户画像引擎等多维度分析模型,支撑投诉预警、舆论监测等前端应用;另一方面,运用知识图谱技术进行关联分析,辅助消保全过程的监督审查工作。以消保审查中的营销内容审查为例,平台将经过整合的产品图谱、服务图谱和相关投诉数据可视化展示,为营销内容审查提供更全面的参考信息,提高审查质效。

    图 8: M行智能消费者保护中台架构 img 智能消保中台落地后的价值与效果 基于认知智能技术的智能消费者保护中台上线以后,对M行的消费者权益保护监控和预警工作带来以下了显著价值和成效。 第一,通过建设大数据平台消除了M行内数据孤岛,实现全口径、多渠道消保大数据整合,每月自动化处理的消保数据超10万条。 第二,完整的数据为消保工作全环节线上跟踪管理和统计、整改、考核评价、责任追究提供基础依据,保障统一的消保审查工作体系在全行持续落地,有助于实现消保工作规范化标准化的科学管理,有助于落实监管要求。 第三,充分挖掘消保数据价值,采用六大客服分析因子,覆盖超3000个标签,消保数据处理分析效率较过去提升20倍,每年节约500万人力成本。基于自然语言理解技术,消保专家知识库积累超5000个知识点,适配超两万个意见模板,提升20倍审查效率。实现潜在投诉风险的智能化自动排查,有效提高工作质效,降低因投诉、诉讼或舆情事件造成的声誉损失,也让消费者权益保护更加及时有效。 智能消保中台项目经验总结 随着人工智能在产业中的深入,企业内部出现了大量需要对分文、专业知识进行深度分析以解决业务问题的AI应用场景,而这类应用场景只靠计算机视觉、智能语音等感知智能技术已无法解决,此时就需要引入认知智能技术,让业务系统具体思考能力。而要实现认知智能需要重点解决多个方面的问题:首先,数据,尤其是相关非结构化数据要足够丰富,并且整合完备;其次,认知智能的实现要结合多种技术手段,包括OCR、智能语音对信息的提取,NLP对文本的解析、知识图谱对知识的挖掘和分析、机器学习对数据的分析等;此外,在不同的专业领域需要引入标签体系以便对信息进行高效的分类和调用。

    3.5 技术基础设施层面

    3.5.1 方法论

    3.5.1.1. 实现AI系统与不同业务和IT系统的融合

    为了弥合老旧的业务和IT系统架构与AI开发和部署之间的缺口,企业需要构建新的技术体系以支撑智能化的实施。具体而言,企业需要在业务和IT系统中引入智能应用编排、业务指标监控、数据存储和处理系统、创新实验系统、各类中间件或产品等,为企业智能化应用提供基础技术能力。同时,企业需要考虑在IT系统中引入基于云的微服务架构,实现更加敏捷和灵活的应用构建方式,最大限度地利用智能技术。

    3.5.1.2. 使用低门槛的平台化工具赋能企业内AI应用的开发

    大中型企业的AI开发需求较广泛,如果仅依赖数据科学家和算法工程师等专业人员开发应用,不仅成本高,且很多业务部门发起的需求不能得到很好的满足,因此企业需要引入低门槛的AI开发平台赋能企业内的业务和普通IT人员,使其具备一定AI开发能力。具体而言,对于专业能力较弱的业务人员,需要开发平台具备自动化的数据准备、模型训练等功能,业务用户只需选择场景和相应的数据集即可对模型进行自动训练;对于具备一定专业能力的业务和IT人员,需要平台能够将算法模型封装成算子,用图形化的方式将算子组合成工作流,从而完成模型训练过程。并且,这种方式也让企业内部人员可以更方便地复用其他人员在开发过程中沉淀的模型和经验,从而进一步降低AI开发的门槛。在案例8和案例9中,海信集团和某集团科技子公司都引入了低门槛的AI开发平台让企业内的业务和IT人员具备了一定的AI开发能力。

    3.5.1.3. 通过引入成熟模型,以及提高模型泛化能力等方式降低大规模AI应用开发的成本

    AI应用开发的时间和资金成本都很高,为了提高AI应用落地的效率、降低大规模AI应用开发的成本,企业可以在AI开发平台上引入相关的能力应对这一问题。

    第一,在构建AI开发平台时,尽量选择与在自己的业务领域有大量成熟AI模型和应用实践积累的厂商合作,在AI平台中内置相关只需适当配置即可使用的AI模型,加速AI落地,减少自研成本。例如在案例9中,某集团科技子公司需要快速推进智能化转型,在考虑到有外部厂商在工业质检、园区安全、供应链管理等领域有成熟AI模型后,便选择与该厂商合作,引入其智能中台产品。

    第二,在构建AI开发平台时,尽量在平台中引入算子和“白盒”的模式,将模型的工作流沉淀下来,使得开发人员后续能够针对相似场景对模型做适当修改,实现模型的泛化能力,企业因此能将模型快速迁移至相似场景,避免从头重新开发,从而降低了模型的开发成本。例如在案例8中,海信集团在AI平台中引入该模式,成功将原先只能识别大尺寸冰箱四条成剪刀形的打包带的质检模型,通过增加类似场景的标注数据,对原模型的算子做了适当修改,成功让模型扩展到3条类似产线。

    3.5.1.4. 建立统一的模型开发和模型管理能力,提高AI资源的利用率

    大型企业在智能化建设早期,各个部门通常会独立地建设AI能力,这会造成AI开发工具、AI模型的重复建设和不能复用,这种“烟囱式”开发的状况到了企业智能化建设的深入阶段会造成大量的资源浪费,并阻碍智能化的推进。因此,企业需要引入统一的模型开发和模型管理工具供相关人员共同使用,尤其要重视对AI模型和服务的统一管理,提供如模型版本维护、模型更新、模型发布服务、对模型服务调用情况查看等能力,通过平台实现AI能力的复用,提高资源利用率。

    例如在案例9中,某集团科技子公司通过智能中台构建了统一的模型开发和模型管理能力,使得集团的管理人员可以对平台上的所有模型进行统一管控,简化运维工作,提高管理效率。业务和IT等人员也可以通过平台查看集团现有的模型资产和AI能力,并根据需要直接调用。

    3.5.1.5. 构建覆盖模型全生命周期MLOps体系,缩短模型迭代周期,并持续地保障模型质量

    当AI建模进入需要大规模生产和交付的阶段,其运营和用例扩展对于大部分公司来说都是一个巨大挑战。此时,企业可以考虑在机器学习和AI系统中,借鉴软件工程领域DevOps相关框架、工具链和流程,以及持续集成、持续交付、持续部署的理念,为机器学习和AI开发提供MLOps体系和相关工具,即提供系统化的协作工具将AI开发和部署中的业务、数据、算法、运维等角色连接起来,建立一个标准化的数据准备、模型开发、部署与运维流程,解决机器学习模型生命周期各环节的工程化问题,从而实现其核心目标:缩短模型开发部署的迭代周期,并持续地保障模型质量。MLOps的主要功能和优势包括:统一发布、自动测试、敏捷迭代、自动化的模型和数据集管理、降低建模门槛、流水线式管理、资源集成监测、组织高效协作。

    例如在案例D中,某大型国有商业银行AI应用实践中构建了MLOps体系,一方面,通过一站式的AI开发平台降低开发门槛,另一方面,建立了“信息统一管理、实体统一流转、管理信息与实体流转保持一致”的AI全生命周期管理机制,从而实现了敏捷的模型迭代,高效的模型交付。

    3.5.2 给不同成熟度的企业的建议

    初步投入阶段:该阶段的企业当前仅有少数几个AI应用落地,因此需要重点解决如何将AI应用在现有IT系统中的部署和运营的问题。

    多维布局阶段:该阶段的企业需首先构建适应智能化要求的IT系统架构;其次,建立统一的AI开发平台,让组织初步构建独立自主的AI开发能力,并对AI开发能力进行统一管理。

    深度应用阶段:持续完善面向智能化运营的IT系统,并在AI开发平台中建立一站式的从数据准备、数据标注,到模型训练、部署和运营的能力,并降低AI开发的门槛。同时,需要考虑构建覆盖模型全生命周期MLOps管理体系,缩短模型迭代周期,并持续地保障模型质量。

    案例8:海信集团引入AI平台,构建独立自主的AI开发能力
    海信集团是知名的大型电子信息产业集团,旗下有海信、东芝电视、科龙、容声、ASKO、Vidda等品牌,业务涵盖多媒体、家电、IT智能信息系统和现代服务业等多个领域,并且在全球拥有13个厂区。 近年来,在面对国内人口红利锐减以及国际上欧美国家挤压的双重挑战下,海信集团实施了数字化转型战略,希望实现降本增效,并重塑海信在全球制造业领域竞争优势。具体而言,海信集团自2019年全面建设了5G网络和工业互联网平台,涉及云、边、端协同,并集成了现有的IT系统、OT系统、大数据平台等系统,平台建成后产生和汇聚了海量的工业数据。 而为了充分挖掘和发挥这些工业数据的潜在价值,海信集团需要进一步实施智能化升级战略,推动人工智能在集团业务中的广泛应用,从而提升运营效率、创新业务模式。由此,海信集团需要从应用场景、技术平台、组织AI素养三个层面构建人工智能能力: 1)在应用场景层面。首先,海信集团希望在智能制造、营销、研发、财务等多个业务领域集成智能化应用,但集团内部尚未建立AI应用场景落地的评估机制。其次,海信集团需要首先选取几个高价值度的场景落地AI应用,解决业务问题的同时,探索并验证集团内AI应用落地的方法和能力。 2)在技术平台层面。海信集团此前只有少数外部采购的AI应用解决方案,几乎没有自主的AI建模能力,因此需要搭建统一的AI技术平台,并且平台需要满足易于使用、功能完备、方便协作等要求,使集团内部人员可以在该平台上自主搭建AI应用。 3)在组织AI素养层面。海信集团的业务和IT人员之前的AI能力较薄弱,不具备开发复杂的计算机视觉、机器学习模型的能力,因此需要针对性地提高其AI能力素养。 从场景规划、技术平台、人员培训着手,全面提升海信集团的AI能力 在经过前期充分的调研论证后,海信集团选择与九章云极DataCanvas进行合作,为其提供人工智能相关产品和服务。九章云极DataCanvas是一家人工智能基础技术服务公司,其核心产品自动化数据科学平台,能够帮助业务分析师和数据科学家快速协同开发,实现自动化模型创建、管理和应用支持,为政府和企业智能化升级提供配套服务。 基于海信集团在智能化升级中的需求,九章云极DataCanvas为海信提供的解决方案包括了应用场景规划、三个应用场景的模型定制开发、信智AI平台建设以及平台的推广和培训。 针对应用场景层面的问题,海信集团在九章云极DataCanvas的协助下建立了一套AI应用场景筛选的评估标准,并定制了三个较复杂的AI应用。 1)基于九章云极DataCanvas在客户服务过程中总结的最佳实践方法论,以及海信集团的实际情况,双方建立的应用场景筛选的评估标准包括以下三点: 应用场景需要是强业务需求,解决的是最痛点的问题; 应用开发所需的数据要比较容易获取,最好具备现成的数据; 用AI解决该业务问题的方法要相对成熟,能直接调用模型的相关代码更佳。 2)在考虑海信集团的业务需求、应用代表性等因素后,海信集团合和九章云极DataCanvas合作定制开发了如下三个AI应用场景: 冰箱打包带检测,检测打包带是否存在多打、少打或歪斜超出工艺质量规定范围; 电视机铭牌检测,检测铭牌是否存在错贴、漏贴、倒贴等问题; 遥控器图案检测,检测按键字符/图案/颜色、丝印、底部Logo/型号是否有印错。 为了构建自主的AI开发能力,海信集团在九章云极DataCanvas的协助下搭建了信智AI平台。信智AI平台是以九章云极DataCanvas自动机器学习平台APS为基础,结合了海信集团定制的一些功能和算子,而构建的AI技术平台。该平台满足了海信集团对AI平台的易用、功能完备、方便协作等要求,具体如下: 1)平台将模型开发全流程的功能都封装成算子,并支持用图形化、拖拉拽的形式将算子组合成工作流,从而降低了建模门槛。而平台上包含的算子有200多个九章云极DataCanvas的标准化算子,以及数十个根据海信集团的需求定制的数据处理、NLP算子。同时,平台采用“白盒”模式,所有内置以及后续场景开发中(包括三个定制场景)沉淀的算子,其代码都可以被查看和修改,以便组织内成员学习、复用,或做一定修改后迁移至其它场景。 2)针对模型上线过程复杂的问题,九章云极DataCanvas将数据预处理、深度学习模型、以及模型后处理都打包成Pipeline,并提供在生产环境中调用的接口,从而简化了海信集团的模型推理工作。 3)为了满足海信集团的应用开发协作需求,平台支持业务人员、算法工程师、数据科学家等人员登陆平台并各自完成自动建模、数据处理、算子调整、搭建工作流、模型上线等工作。同时,根据海信集团的需求,九章云极DataCanvas为该平台定制了单点登录、标注平台、以及能够显示检测后产品合格率的报表平台等不同人员所需要的功能。 针对组织AI素养较薄弱的问题,海信集团首先通过和九章云极DataCanvas合作定制开发三个高价值应用场景的形式,让海信集团的业务和IT人员熟悉平台的功能以及建模流程,并且将三个场景的工作流沉淀在平台中供海信集团的人员学习和复用。其次,九章云极DataCanvas对海信集团的相关人员进行了约20次培训,包括针对三个定制的应用的使用和后续运维、工业检测、平台的使用方法等方面的专题培训。 信智AI平台落地后的价值与效果 信智AI平台落地后产生的价值包括对业务场景的价值、对构建自主的AI开发能力的价值和对降低建模成本的价值三个层面。 1)在对业务场景的价值层面。双方基于AI平台定制开发的三个应用场景都产生了明显的效果:三个场景都因为智能质检应用的上线,将不良率降低了95%以上。 2)在对构建自主的AI开发能力的价值层面。通过搭建易于使用、功能完备和方便协作的信智AI平台,以及相应的培训推广,海信集团具备了自主开发AI应用的能力。在平台上线后一年内,海信集团基于该平台自主开发了电路板测试优化、门店地址相似度评估以及一些智能质检等多个应用。 3)在对降低建模成本的价值层面。由于信智AI平台采用算子、工作流以及“白盒”模式,用户可以通过修改算子,将模型迁移至高度相似的场景中,解决模型不易泛化的问题,从而将模型的建设成本降低60%。例如,九章云极DataCanvas定制的冰箱打包带检测模型,该模型原先识别的是大尺寸冰箱的四条成剪刀形的打包带的问题,海信集团通过增加类似场景的标注数据,对原模型的算子做了适当修改,成功让模型扩展到3条类似产线。 信智AI平台的项目经验总结 第一,企业的智能化升级是项系统工程,除了AI战略、数据基础外,企业还需要重点考虑场景规划、技术平台建设和组织AI素养提升等方面的问题。在场景规划层面,需要首先建立标准化的场景筛选流程和方法,其次,企业在智能化升级早期,可以考虑跟外部厂商合作开发几个高价值场景的应用,为企业后续的应用开发提供借鉴经验。在技术平台建设层面,企业要充分结合内部现状,搭建能在组织内广泛使用的平台,重点考虑平台的易用性、功能完备性、协作便利性等。在组织AI素养层面,除了外部人才的引进,也要重视人员的培训工作,包括模型开发、模型使用、模型运维等方面的培训。 第二,模型的泛化能力是企业AI开发中需要重点关注和解决的问题。通过模型的泛化,企业能将模型快速迁移至相似场景,避免从头重新开发,从而降低了模型开发成本。而在AI开发平台中引入算子和“白盒”的模式,将模型的工作流沉淀下来,使得开发人员后续能够针对相似场景对模型做适当修改,从而快速实现模型的泛化。

    案例9:助力某大型集团搭建AI数据智能平台,支撑数智化升级 某大型集团旗下科技公司为行业及集团提供数字化转型整体服务,通过构建物联网、大数据和AI平台等数字基础设施,将生产、流通和消费等环节的数据、算法和应用打通,更高效地赋能业务。 在本次合作中,该集团希望通过建设AI平台解决以下三点AI开发和管理中的难题: 1)“烟囱式”开发建设造成的资源浪费。该集团在以往的AI建设中,各个工厂和部门都有独立开发或采购一些AI应用,因此带来了集团内数据不能共享,AI开发工具重复建设,以及模型不能复用等问题。这种数据、开发工具、模型的“烟囱式”开发建设浪费了集团的AI资源,也阻碍了数智化的推进。 2)AI模型开发门槛高。该集团以往的单点AI应用多由数据科学家、算法工程师开发,但此类人力成本高,当要在全集团广泛地落地AI应用时,就需要提供平台工具降低AI开发的门槛,让业务和IT人员也具备一定的AI开发能力。 3)大规模的AI应用开发技术难度大、成本高昂。为了尽快建设完善的AI数智平台,该集团需要在园区安全、供应链管理、智能营销等领域同时推进多个AI应用的开发,如果都从零开发如此大量的AI应用,成本高昂,统一管理较为困难。因此该集团科技公司希望借助在上述领域有成熟AI模型积累的厂商,以较低的成本快速落地多个AI应用。 搭建智能中台,提供统一的AI开发、AI管理和成熟的AI模型服务能力 在对多家厂商的产品成熟度、客户案例、合作深度、团队配置等方面情况进行考察后,该集团科技公司选择与京东云合作,为集团搭建智能中台并共建应用。京东云是京东集团旗下专注于产业数字化服务的业务板块,依托人工智能、大数据、云计算、物联网等技术能力,为各行业企业和政府部门提供全链路的产品与解决方案。 该集团的智能中台是基于京东云Foundry智能中台产品而构建,智能中台提供了一站式的AI开发平台、统一的AI模型管理平台、以及大量预置的标准化AI模型。同时,京东云也在智能中台搭建过程中为该集团提供了场景共建、算法定制、人员培训等服务。 为了解决AI应用“烟囱式”开发的问题,该集团借助智能中台,从数据、开发工具、模型管理三个层面对其进行统一建设和管理。 在数据层面。该集团科技公司联合京东云搭建的大数据平台对集团的数据进行统一的存储和处理,打破了数据孤岛。同时,智能中台提供了统一的数据标注和数据集管理工具,使得AI开发中所需的数据能够在不同的AI开发人员间共享和协作。 在开发工具层面。智能中台提供了一整套包含数据标注-模型开发-模型训练-服务发布等全链条的AI开发工具,算法工程师及应用开发等人员都可以统一基于该平台进行AI模型的开发。 在模型管理层面。智能中台提供了模型仓库功能以便集团对模型服务进行统一管理,如模型版本维护、模型更新、模型发布服务、对模型服务调用情况查看等。因此,集团的管理人员可以对平台上的所有模型进行统一管控,简化运维工作,提高管理效率。业务和IT等人员也可以通过平台查看集团现有的模型资产和AI能力,并根据需要直接调用。 为了降低AI开发的门槛,使得集团的业务和IT人员也具备AI开发能力,智能中台将算法代码封装为组件,因此具备一定开发能力的用户能够通过拖拉拽快速构建工作流的方式开发模型,实现对前人经验的复用。同时,智能中台也提供更简单的自动化模型训练功能,业务用户只需选择场景和相应的数据集即可对模型进行自动化训练。 针对大规模的AI应用开发技术难度大、成本高昂的问题,智能中台内置了京东集团在长期业务发展过程中积累的大量成熟的AI算法,包含语音语义、图像及视频理解、文字识别、机器学习等类别,该集团在接受京东云适当的培训后,能够自行选择算法组件,并做好数据准备,即可在工业质检、园区安全、供应链管理、智能营销等领域快速构建AI应用。 图 9: Foundry智能中台框架 img 智能中台落地后的价值与效果 智能中台为该集团带来的价值包括业务价值和管理价值两方面。 从业务价值的角度,智能中台提供的低门槛开发工具和AI模型服务让该集团的业务和IT人员也能够开发一定的AI模型,从而提升了应用开发效率,降低开发成本。该集团因此能够充分利用了自身沉淀的数据资产,在智能中台上线半年内,即在园区安全、智能营销等领域构建了多个适配业务需求的AI应用及解决方案,显著提高了集团的数智化水平以及业务创新能力。 从管理价值的角度,该集团通过智能中台对AI模型和服务的统一管理,实现了AI能力自主掌控、运行状况可查可看以及AI服务的精细化运营,从而简化了模型运维工作,提高了管理效率,并且通过AI模型和服务的复用提升了资源利用率。 智能中台项目经验总结 第一,京东云同该集团科技公司合作建设大数据与AI模型训练平台能力,共同为集团带来从数据管理、模型应用等方面的技术工具,从而进一步辅助业务创新和发展。通过引入统一的数据管理、模型开发和模型管理工具供相关人员共同使用,利用平台实现AI能力的复用,提高资源利用率。 第二,为了提高AI应用落地的效率,加速智能化升级,企业可以选择与自身业务匹配度较高,且在这些业务领域有大量成熟AI模型和应用实践的厂商合作。通过复用这类厂商的模型,及其最佳实践方法论,企业能够以较低的成本在多个关键领域快速构建AI应用,赋能业务。

    案例D:某大型国有商业银行构建MLOps体系,实现敏捷的模型迭代,高效的模型交付 某大型国有商业银行经过近几年的智能化建设,已经搭建了完善的人工智能生态体系,在数据、算法、算力、技术框架等多领域实现了技术领先,并且已在各业务领域落地了500多个AI应用。该银行在AI应用实践中,为协同模型构建团队、业务以及运维团队,建立起一个标准化的模型开发、部署和运维流程,使得组织能更好的利用AI的能力促进业务增长,于近年构建了MLOps体系。 该银行的MLOps体系主要从降低开发门槛和提升模型管理流转效率两个方面出发。在降低开发门槛方面,该银行构建了从需求分析、数据准备、模型构建、模型发布,到模型运营的一站式AI工作站,为建模人员提供可视化、低门槛的流水线建模服务。在提升管理效率方面,该银行建立了“信息统一管理、实体统一流转、管理信息与实体流转保持一致”的AI全生命周期管理机制,以提升模型生命周期管理水平。具体而言,该银行将AI工作站作为统一的模型全生命周期管理平台收集模型的元数据信息,实现全流程管控;同时,构建了涵盖一个模型基础版本库+开发、测试、生产等各套环境的模型调用库,以及模型加密单向同步机制,实现模型实体的统一存储、管理和在各模型库间不落地的安全流转,此外还建立了增存结合的入库管理机制,加强模型入库管控能力。在此基础上,将AI工作站的模型管理信息与DevOps平台的版本交付信息联动,DevOps版本交付机制调用AI工作站的服务,控制模型库间的实体流转,保证账实相符,支持各应用全生命周期模型管理。 图 10: 某国有商业银行MLOps体系 img 该银行通过构建MLOps体系,取得了良好的实施效果,模型研发周期从之前的平均3个月最短压缩到两周,模型部署的周期缩短至1天以内,常规模型后评价和模型更新最快2天即可完成,自学习模型可根据实际效果实时更新。

    3.6 组织与人才层面

    3.6.1 方法论

    3.6.1.1. 建立适应AI开发和管理需求的组织架构,明确部门权责和协同机制

    AI的开发和管理是项复杂的系统性工作,需要组织内各部门和人员能够紧密协作,共同完成。企业在智能化早期通过设立单个项目组推进的方式在智能化深入阶段将不能维继。此时,企业需要在整个组织内部建立统一的AI组织架构,设立核心部门统筹协调各相关部门开展AI开发和管理工作,并明确各部门的权责。

    例如在案例E中,某头部家电集团为保持其AI能力的领先性,构建了以AI技术委员会为核心部门,下辖多个技术研发部门分别负责特定方向的AI能力建设,并统筹协调技术研发部门为产品部门提供应用开发服务。

    3.6.1.2. 内外兼顾,培养AI人才队伍

    智能化转型成败的核心要素之一是人才,企业一方面要注重从外部不断引进优秀的数据科学家、算法工程师等专业人才;另一方面,需要加强组织内的培训,提升业务和IT人员的AI开发能力,以及提升管理人员的AI素养。从而帮助企业构建起能支持智能化转型所需的人才队伍。

    3.6.2 给不同成熟度的企业的建议

    初步投入阶段:该阶段的企业当前以单点应用建设为主,无需在组织架构层面为AI应用做太多调整,但需引进关键的AI人才,指导应用落地和后续维护。

    多维布局阶段:该阶段的企业在核心部门都有建设一定的AI开发和管理团队,建议由公司层面对各部门的AI开发进行统一协调部署,做到信息互通;同时要加大对数据科学家、算法工程师等专业人才的外部引进工作。

    深度应用阶段:该阶段的企业需要构建完善的面向AI开发和管理的组织架构,各部门之间的权责和协同机制要明确;同时,除了专业人才的引进,企业也需要在组织内加大培训力度,提升组织内相关人员的AI素养。

    案例E:某头部家电集团建立面向AI开发和管理的组织架构,全面支持产品的智能化创新 某头部家电集团在AI研发和应用方面处于业内领先的地位。为了保持集团AI技术的领先,保证其家电产品在智能化方向的持续创新能力,集团近两年在AI研发上加大了投入,并对集团的AI组织架构做了调整和统一部署,明确了各部门AI相关的职责与各部门之间的协调机制。 整体而言,该家电集团成立了AI技术委员会,下辖AI创新中心、中央研究院、集团IT、IOT事业部智能研发部、以及空调、冰箱、洗衣机等各产品事业部的技术研发部门。 图 11: 某头部家电集团AI组织架构 img 其中,AI技术委员会的成员为各相关部门负责人,委员会的职责是统筹协调各部门AI建设需求、AI能力输出,并做到各部门之间的信息互通;AI创新中心为集团新成立的部门,集团对该部门的人员和资金做了重点投入,希望在计算机视觉、语音基础算法、家庭服务类机器人等方向做研发并具备自主技术,一是为了降低外采技术的成本,二是为了赋能产品线打造差异化功能;中央研究院主要负责智能制造、工业互连网相关的能力建设;集团IT负责供应链管理和部分智能制造领域的AI能力建设;IOT负责图像、大数据、语音相关的AI应用开发,为家电产品服务。AI创新中心、中央研究院、集团IT、IOT事业部智能研发部的AI能力会赋能空调、冰箱、洗衣机等各产品事业部,并提供应用解决方案,同时各产品事业部也会在一些特定的重要业务领域根据需求独立开发或外采AI应用解决方案。 该集团基于良好的AI研发和应用基础,在扩大AI优势的过程中,重视调整组织架构来适应AI能力发展需求,为集团明确分工、优化协作、降低AI研发成本、提高产品智能化能力提供了机制保障。

    4. 企业智能化趋势展望

    人工智能在为企业创新产品服务、优化经营决策、提升管理效率等方面已经取得了广泛的效果,并展现出了更加巨大的潜力,因此,爱分析认为所有的企业未来想要在市场中保持竞争力,一定都需要走向全面的智能化。但如前文中所述,国内主要行业目前已经开展过智能化建设的企业中约70%仍处AI应用的早期实验或初步投入阶段,仅约30%的企业进入多维布局或深度应用阶段,真正在组织内实现AI应用与业务全面融合的企业不足1%。

    爱分析认为,在接下来的3至5年,国内大量的企业对AI的应用将从单点的AI建设走向全面的智能化转型。在这个过程中,企业将会需要解决智能化建设过程中涉及的战略、数据、场景规划、应用解决方案开发、技术基础设施、组织与人才等多方面的挑战。因此,企业需要针对智能化转型规划完善的路径和方法,具体的措施包括:制定明确的智能化战略;完善数据基础设施,构建面向AI开发的自动化数据采集、数据处理能力;建立场景规划的流程和方法论;提升解决方案的自研能力;建立了标准化的解决方案开发、部署、和后续运营的方法和流程;重构面向智能化运营的IT系统;引入AI平台、AI中台;构建MLOps体系;建立面向AI开发和管理的组织架构;重视AI人才队伍的建设等。同时,企业需要结合自身AI应用的成熟度,对上述举措更细化的方法和步骤,实施时间点等方面问题制定符合自身需求的计划。

    人工智能在产业中的落地正在如火如荼地推进,也还有很多未知的领域有待企业去探索,进一步释放AI的价值。相信随着这个进程的推进,AI在产业中落地仍然会面临许多新产生的问题,爱分析将对这个领域保持持续跟踪研究,对前沿的案例保持关注,为企业智能化转型提供更多的决策参考。

    展开全文
  • 人工智能实践课程项目实验报告
  • 可解释AI概念 可解释AI发展趋势 可解释AI的行业实践 可解释AI未来发展方向
  • 整合人工智能技术的学科教学知识(AI-TPACK):内涵、教学实践与未来议题.pdf
  • 2022人工智能应用实践报告.pdf
  • 基于百度AI平台的人工智能类课程教学实践探索.pdf
  • 与此同时,本报告结合国内外企业最佳实践,详细阐释人工智能赋能网络空间安全(AI+安全)的最新进展。最后,本报告提出,人工智能安全将成为人工智能产业发展最大蓝海,人工智能的本体安全决定安全应用的发展进程,...
  • 重磅,2020-2021 AI人工智能技术领域/行业研究报告大合集,共58份。 2021年中国人工智能基础层行业发展研究报告 2021中国AI商业落地市场研究报告 2021中国新一代人工智能科技产业区域竞争力评价指数 2021中国新一代...
  • 2021人工智能状况分析报告

    千次阅读 2021-10-26 00:53:54
    点击上方“人工智能与算法学习”,选择“星标”公众号人工智能(AI)是一个多学科领域的科学和工程,其目标是创造智能机器。近期,Nathan Benaich 和 Lan Hogarth博士发布...

    点击上方“人工智能与算法学习”,选择“星标”公众号

    人工智能(AI)是一个多学科领域的科学和工程,其目标是创造智能机器。

    近期,Nathan Benaich 和 Lan Hogarth博士发布了《2021人工智能状况报告》

    该报告试图捕捉近期人工智能领域的进展情况。毫无疑问,人工智能将成为我们世界技术进步的力量倍增器,如果我们要驾驭如此巨大的转型,对该领域更广泛的了解至关重要。我们相信,在这个日益数字化、数据驱动的世界里,人工智能将成为技术进步的力量倍增器。该报告涵盖了人工智能研究、人才、产业和政治等领域,以下为对报告的整理分析。

    人工智能(AI):一个以创造智能机器为目标的广泛学科,而不是由人类和动物证明的自然智能。它已经成为一个包涵一切的术语,尽管如此,我们需要抓住该领域的长期雄心,即制造能够模仿并超越人类认知范围的机器。

    机器学习(ML):人工智能的一个子集,它经常使用统计技术,让机器能够从数据中“学习”,而不需要明确地给出如何这样做的指令。这个过程被称为使用学习“算法”对“模型”进行“训练”,逐步提高模型在特定任务中的性能。

    强化学习(RL): ML的一个领域,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题,强化学习不要求预先给定任何数据,而是通过接收环境对动作的奖励(反馈)获得学习信息并更新模型参数。

    深度学习(DL): ML的一个区域,试图模仿大脑神经元层的活动,学习如何识别数据中的复杂模式。深度学习中的“深度”指的是当代ML模型中的大量神经元层,这些神经元层有助于学习丰富的数据表示,以获得更好的性能增益。

    研究领域

    Transformer架构超出NLP的应用范围,正在成为机器学习的通用架构

    Transformer是2017年的一篇论文《Attention is All You Need》提出的一种模型架构,它开创性的思想,颠覆了以往序列建模和RNN划等号的思路,现在被广泛应用于NLP(自然语言处理)的各个领域。目前大热的GPT-3也是基于Transformer模型,几乎可以完成自然语言处理的绝大部分任务,例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。而且,该模型在诸多任务上 表现卓越,例如在法语-英语和德语-英语机器翻译任务上达到当前最佳水平,自动产生的文章几乎让人无法辨别出自人还是机器。

    在计算机视觉中,受NLP成功的启发,许多的尝试将Transformer的Self-Attention机制结合起来,Google提出了ViT(VisionTransformer)模型——一种无卷积的Transformer架构,在公共ImageNet-21k数据集或内部JFT-300M数据集上进行预训练时,ViT在多个图像识别基准上达到或超越了最新水平。

    Transformer也尝试在其他人工智能应用上,如音频和3D点云。Self-Attention是语音辨识达到SOTA的模型基本组成部分,来自牛津大学、和英特尔实验室的团队为点云设计了名为“Point Transformer”的self-Attention网络,在物体分类、物体部分分割和语义场景分割等不同任务上都显著优于之前的工作。

    d563250474bdb9f305b7e543f2b14991.png

    图 | Vision Transformer

    图神经网络:从小众到人工智能研究的最热门领域之一

    图(Graph)数据包含着十分丰富的关键性信息。从文本、图像这些非结构化数据中进行推理学习,例如句子的依赖树、图像的场景图等,都需要图推理模型。图网络(Graph neural networks)是一种链接主义模型,它靠图中节点之间的信息传递来捕捉图中的依赖关系。近年来,图神经网络在众多领域取得了重大的成功。

    图神经网络应用:基于网格的仿真

    物理系统动力学建模通常需要将复杂的连续空间细分为更简单的离散单元,这个过程称为网格生成。基于网格的模拟旨在预测网格如何根据外部因素随时间变化。例如:布料在风的作用下如何移动。网格可以自然地表示为图,其中相邻的单元被连接,每个单元有若干节点和边,由网格选择决定。DeepMind的研究人员使用GNN(图神经网络)来学习网格动力学,并在仿真域的不同区域调整分辨率以满足要求的精度。他们的研究表明,该方法比基于粒子和网格的基线更快,并且可以推广到比那些更复杂的动力学。

    e2bd5be6922fc821f79c9052aa99b639.png

    图 | 图神经网络

    采用人工智能的方法已经席卷了结构生物学

    AlphaFold 2,是DeepMind公司的一个人工智能程序。该人工智能程序在蛋白质结构预测大赛CASP 14中,对大部分蛋白质结构的预测与真实结构只差一个原子的宽度,达到了人类利用冷冻电子显微镜等复杂仪器观察预测的水平,这是蛋白质结构预测史无前例的巨大进步。


    DeepMind公开了AlphaFold 2的源代码,免费开源有关数据集,供全世界科研人员使用。被释放的海量蛋白质结构信息蕴含着生命信息的密码,将有力推动生命科学的发展,大大加速针对癌症、病毒的抗生素、靶向药物和新效率的蛋白酶的研发

    d4d5aafbbf4f9907a1ca67b3fd5382f0.png

    图 | AlphaFold2

    产业应用

    大量IPO,标志着人工智能进入部署阶段

    82家活跃的AI独角兽,合计企业价值1.3万亿美元,在人工智能独角兽的数量上,美国强于其他国家,中国、英国和以色列紧随其后。美国独角兽公司的总市值已超过8000亿欧元。

    美国的人工智能创业公司吸引了最多的资金,但欧盟和英国增长迅速。美国占全球人工智能投资的2 / 3,欧盟和英国有望在2021年将其份额翻一番。

    随着人工智能初创公司在全球范围内的成熟,百万轮投资现已成为普遍现象;其中,企业应用软件是2010-2021年全球投资最多的类别,数据丰富的医疗健康和金融科技领域也是相当受欢迎的投资类别。

    70af5041e39c218671218fc7e3b55688.png

    图 | 独角兽

    以人工智能为先导的药物研发公司首次公开募股

    英国以人工智能为先导的药物研发公司Exscientia推出了世界上首批3种人工智能设计的药物,并进入了第一阶段人体测试;该公司于2021年10月1日在纳斯达克上市,估值为30亿美元。在提高癌症患者的生存率上,人工智能显微镜被用于测量活癌细胞对140种临床批准的第三方抗癌药物在单个细胞水平上的反应,应用计算机视觉识别出最有效的药物。

    总部位于犹他州的递归制药公司(Recursion Pharmaceuticals)是一家以人工智能为基础的公司,利用高通量筛选和计算机视觉驱动显微镜来发现药物。该公司于2021年4月在纳斯达克(NASDAQ)上市,融资4.36亿美元。通过对化合物和疾病细胞类型组合的生物搜索空间进行针对性探索,构建疾病生物学“地图”。

    eeb2ee3be89b3a4252087f292b05e77e.png

    图 | 癌症药物开发

    AI优先产品部署在高风险的用例中

    实时计算机视觉保护员工免受工伤:Intenseye的计算机视觉模型经过培训,可以检测超过35种员工健康与安全(EHS)事件,而人类EHS检查员不可能实时看到这些事件。该系统已在15个国家和30个城市运行,在18个月的时间里已经发现了超过180万个不安全行为。Intenseye创建了一个协作工作流,将人工智能、工作场所分析和行为改变连接起来,从而减少伤害,降低保险费,并全面提高公司生产力。

    利用预测模型提高农场的可持续性和碳效率:奶牛养殖者监测他们的牲畜的健康问题和牛犊的开始。通过使用深度学习分析佩戴在脖子上的传感器的加速度计数据,能够在人类观察前2-3天预测健康问题。它们还可以预测产犊的开始时间,这将使怀孕母牛接受抗生素治疗的天数减少50%。AI系统可以预测未来200天的产奶量,误差小于1%,这同时也可以减少二氧化碳排放量。

    1a48c22065a9571eb067a17d82b984b9.png

    图 | 危险驾驶行为

    军用人工智能投入生产

    以色列在加沙袭击中使用人工智能制导无人机群,以色列国防军使用由单一操作员控制的无人机群,利用未知技术描述的人工智能方法进行协调;以色列军事情报部门宣布加沙战役为世界上“第一次人工智能战争”,声称“人工智能首次成为对抗敌人战争中的关键因素和力量倍增器”。

    美国空军在一架U-2侦察机上驾驶了一名人工智能副驾驶员,U-2给了该系统(ARTUμ)完全的雷达控制,同时“关闭”其他子系统的访问,允许操作人员选择AI不会做什么,以接受它将要做的操作风险。

    美国空军研究实验室测试自主的Skyborg“天空堡先锋”计划旨在将“全任务自主与低成本、高品质的无人系统”整合在一起,使无人驾驶团队成为可能。代替人类飞行员,Skyborg为载人飞机提供态势感知和战斗任务中的生存能力。

    目前,美国在人工智能上以更加协调和紧迫的方式参与竞争,以期望获得决定性的优势;其次,军事领域人工智能的投资——将与其他领域人工智能的增长形成共生关系。

    ae8c1f4c569f27758a3928479ff5c5d2.png

    图 | 飞机

    其他

    社区重新关注影响模型生产性能的数据问题

    机器学习(ML)在生产中由以模型为中心转向以数据为中心:随着ML模型的能力和可用性的增加,模型改进的收益已经变得微不足道。在这种背景下,ML社区越来越意识到更好的数据实践的重要性,更普遍更好的MLOps(机器学习模型运营),以建立可靠的ML产品。

    随着越来越多的模型部署到生产中,持续的数据管理对保持模型性能的关键变得越来越明显。随着ML系统满足更多用户的需求,数据收集和标记程序必须适应分布的变化。

    研究界正在发起多项倡议,以提高人们对以数据为中心的人工智能的认识。组织一场以数据为中心的人工智能竞赛,参与者将得到一个固定的模型,并被要求修改数据,以达到可能的最佳表现。

    人工智能监管始于欧洲

    欧盟于2021年4月提出了《人工智能法》(AI Act)提案。该提案旨在提供必要的法律确定性,以促进创新,同时确保消费者权利的保护。与GDPR一样,拟议中的法律也涉及任何涉及在欧盟放置或使用人工智能系统的个人或组织,甚至包括外国机构。但《人工智能法案》超越了GDPR,旨在直接监管人工智能系统的使用。被禁止的人工智能做法包括扭曲人的行为的“潜意识技术”、针对弱势群体、社会评分和实时远程生物识别应用。高风险系统包括那些用作大型系统安全组件的系统,以及那些可能对基本权利产生影响的系统。它们包括公共基础设施、社会福利、医疗服务、交通系统等。低风险AI系统是指所有不属于上述类别的AI系统

    欧盟《人工智能法》反映出欧盟积极创建面向未来的全球数字治理新规则的雄心。虽然前景未知,但欧盟的立法实践本身就具有积极意义,对相关领域国际规则制定有一定参考价值。

    人工智能的安全是最重要的

    人工智能安全定义为“确保人工智能以不伤害人类的方式部署的努力”;来自康奈尔大学、牛津大学和宾夕法尼亚大学的一个团队调查了524名在顶级ML会议上发表文章的研究人员,并就国际政治和科学组织的信任、人工智能的军事应用等问题将他们的观点与普通公众的观点进行了比较。

    接受调查的人工智能研究人员中,68%的人认为人工智能安全应该比今天更加优先,这一比例高于2016年调查中发现的49%。总体而言,他们不信任政府的军队。大多数人反对或强烈反对研发致命的自主武器(73%)

    在人工智能安全领域,如何确保日益强大的人工智能系统具有与人类一致的目标;如果革命性的人工智能可能在未来30年发生,有多少人正在努力确保它对人类有益呢?

    免责声明

    本文来源:海豚数据科学实验室,版权属于原作者,仅用于学术分享

    f701873750c69f12a4c563fa3496aaaa.gif

    往期精彩必读文章(单击就可查看):

    一个CV算法工程师的小反思

    2022 年秋招算法岗继续卷翻天

    工业界和学术界最大区别是什么?

    北大韦神答辩PPT,最后一页文字被挑剔!

    字节跳动AI Lab 再失大将!大牛王长虎被爆已离职回归学界!

    熬了一晚上,我从零实现了Transformer模型,把代码讲给你听

    NLP新秀prompt跨界出圈,清华刘知远最新论文将它应用到VLM图像端

    70245feb1e09a8965f84510ec8773a97.png

    读者,你好!为了方便大家学习交流,我们建了微信群,欢迎加我的微信邀请你进群。微商和广告无关人员请绕道!

    9bb0429b0a3ea81999d59d714aadc67b.png

    c7b4ac3bcb0108b8ca53013996ea858d.png

    展开全文
  • 钢铁工业智能制造与人工智能实践路径与思考.pdf
  • 人工智能助力产业数字化转型实践报告(2022)(28页).pdf
  • 基于冰壶机器人的人工智能实验教学设计与实践.pdf
  • 2022可解释AI发展报告:打开算法黑箱的理念与实践(53页).pdf
  • 面向新工科的人工智能导论实践教学模式初探.pdf
  • 密码学与隐私计算在人工智能行业中的实践.pdf
  • 人工智能背景下初中化学智慧课堂教学实践研究.pdf
  • 互联网、大数据、人工智能背景下管理会计理论与实践研究.pdf
  • 人工智能实践创新平台建设教学实践问题探讨.pdf
  • 人工智能教育托起教育未来——西安市人工智能教育实践探索.pdf
  • 人工智能-机器学习-每日科学机器人文章汉译实践报告.pdf
  • 人工智能专业学生工程实践能力培养研究与实践.pdf
  • 2020人工智能应用实践报告 2020年2月
  • 交叉融合的“人工智能 ”学科建设探索与实践.pdf
  • 基于人工智能的机械设计制造及其自动化实践分析.pdf
  • 人工智能-机器学习-英汉软件产品说明书中长句翻译的实践报告.pdf
  • 人工智能-机器学习-移动营销每天一小时第12章翻译实践报告.pdf
  • AI加速键:2021上海人工智能创新发展探索与实践案例集(55页).pdf
  • 人工智能培育中国经济发展新动能的理论逻辑与实践路径.pdf

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 36,818
精华内容 14,727
关键字:

人工智能实践报告