边缘AI当前发展状况：开发者的真实用例-CSDN.NET

CSDN首页> 业界

订阅业界RSS

边缘AI当前发展状况：开发者的真实用例

发表于 2025-06-25 15:39:20

核心要点：

当前开发者面临着越来越大的压力，需要在时间紧迫、资源有限、以及对隐私、性能和准确性期望更高的前提下实现智能功能。

本文重点介绍了已经投入生产和主流使用的实际边缘AI应用程序，为在边缘设备构建更加智能、更加迅速、更加高效的AI驱动体验提供了可行的灵感。

边缘AI是创造力、安全性和生产力的放大器

构建人工智能驱动的体验已经成为几乎所有软件垂直领域的基本期望。无论您是在增强微软Office的工作流程，改进Chrome的用户体验，还是为Slack或Zoom等工具实现自动化，AI都在后台工作，以提升效果。

然而，开发者经常被要求用更少的时间、更少的资源和更小的基础设施来实现这些功能。更大的挑战是，目前的许多用户都希望响应性、安全性和隐私性成为默认值，这使得纯粹的云AI管道变得越来越不切实际。

这正是边缘AI的用武之地。

通过利用各种高效模型、经过优化的运行时、配备NPU的硬件，各个团队都可以直接在设备上部署智能，减少延迟，最大限度地减少对云的依赖，并对用户数据保持更严格的控制。

本文探讨了已经在各种熟知的工具中运行的现实应用程序和特征，以帮助启发和挖掘即使采用增量AI也可以产生重大影响的机会。

边缘AI背后的推动因素

边缘AI的实现得益于以下技术的融合：

紧凑、高效、并且可以减少计算和内存需求的模型（例如：蒸馏变压器模型、量化扩散模型）；
通过NPU以及搭载骁龙等平台的混合CPU-GPU-NPU系统实现硬件加速；

生产就绪型开发者框架（例如：ONNX运行时、TensorFlow Lite、机器学习编译大语言模型），以及与FFmpeg、VS Code和Docker等熟知工具的集成。

当这些工具组合在一起时，开发者可以提供快速、安全和功能性的AI功能，同时不需要持续的后端基础设施。

解锁无摩擦创造性表达的工具

下文说明了边缘AI如何帮助创意制作人以更少的人工工作将其想法呈现在观众面前。

通过在设备端实时分离人声、鼓点和贝斯音轨，Djay Pro应用程序实现了将现场音频混音带入生活。利用NPU加速，该应用程序消除了传统上与基于服务器的处理相关的延迟。这种功能增强在Adobe Creative Cloud等创意套件中特别有用，在这些套件中，多个应用程序可能同时用于单项输出。

目前，Blender和GIMP等工具均整合了本地版本的Stable Diffusion，从而确保创作人能够根据提示生成纹理和图像，而无需离开应用程序或上传新数据。这种方式降低了艺术家使用OneDrive或Dropbox等共享驱动器上本地文件的难度。

专业提示：量化扩散模型可以通过API或批处理系统（例如：FFmpeg）与渲染或编辑管道集成。

更加智能的分布式团队协作

目前，微软团队将虚拟背景渲染转移到NPU上，提高了长时间视频通话过程中的帧率和电池使用寿命。Zoom和Slack同样嵌入了实时转录和智能摘要等本地AI功能，即使在带宽受限的情况下，也能最大限度地减少延迟并提高可访问性。

由于在搭载骁龙平台的电脑上实现Copilot+体验，Edge和Teams等工具目前均具有实现Recall等功能的本地大型语言模型，从而可以以智能方式为用户活动编制索引，以进行快速检索，同时无需持久的云连接。

实时翻译应用程序也在迅速发展，帮助分布式团队跨越语言障碍进行实时协作，甚至在离线情况也可进行。

这些技术进步对于跨地域、跨设备的安全、高效协作场景（从托管桌面到自带设备移动工作流）尤为重要。

是否感到好奇？通过骁龙上的DeepSeek了解有关如何运行本地语言模型的更多内容。

一个更加高效的办公室就是一个更具创新性的工作场所

AI不再仅仅是一种性能增强 – 它正成为工作场所生产效率的基础层面。而且，AI越来越多地在本地运行。

目前，Visual Studio和VS代码均通过本地代码生成模型支持AI辅助开发。这些工具可提供实时建议、重构支持，甚至漏洞检测 – 所有这些功能均不需要将源代码上传到外部服务器。对于使用专有IP、受监管数据、或仅本地存储库（例如：GitHub企业版）的开发者来说，这种本地优先的方法可以确保效率和控制。

除了集成开发环境外，像Microsoft Word和Excel这样的传统办公工具也集成了本地大型语言模型，用于文档摘要、财务模型异常检测、和人工智能生成内容。这些功能可以安全地部署在Citrix和tune托管环境中，为信息技术部门提供更大的灵活性，从而实现工作流现代化，同时不会损害管制或合规。

高通技术公司开发者博客中的移植AnythingLLM，以便在Windows on Snapdragon上运行NPU提供了内部知识管理工具如何利用本地大型语言模型提高企业生产效率，从而在员工设备上直接对公司文档和流程进行快速、安全访问的明确示例。

这些功能为企业部署特定领域的大型语言模型提供了新的机会，可以根据内部知识库进行微调，同时无需依赖云基础设施。开发者可以利用这些技术来构建从人工智能支持智能体到内容生成实用程序的所有内容。

作为永恒标准的数据隐私和安全

现代安全软件（包括迈克菲、赛门铁克和VMware Carbon black提供的解决方案）使用本地AI来识别深度伪造和恶意媒体，以防止其传播。这些模型在NPU上高效运行，并且可以跨端点安全平台部署。

数据隐私仍然是最令人担忧的问题。来自Dynamo AI等提供商的轻量级大型语言模型已直接嵌入到企业应用程序中，以便在进入存储或云推理之前扫描和编辑个人身份信息。此功能特别适用于处理机密内容的工具，例如Slack、Outlook或内部客户关系管理系统。

集成提示：此类防护机制可以与虚拟化工具（例如：Citrix或VMware Horizon）配合使用，以实现安全的分布式工作环境。

边缘AI和日常媒体

从优化自适应流媒体的网飞，到实施更智能编码和内容审核系统的Hulu和Instagram，边缘AI在消费者娱乐中扮演着越来越重要的角色。这些功能取决于工具（例如：利用NPU支持计算加速的FFmpeg），并受益于在本地进行推理时减少的往返延迟。

同样，Facebook等平台的移动应用程序越来越多地使用设备端常驻模型来推动个性化、翻译和摄像头效果 – 这些都是边缘AI提高速度和响应能力的领域。

现在需要构建什么内容？

这里突出显示的应用程序反映了现实世界的创新内容，而开发者可以使用正确的工具包复制或迭代这些创新内容。无论您关注的是性能调优、更智能的用户体验、还是更好的隐私控制，边缘AI都为强大的新功能打开了大门。

骁龙平台如何提供帮助：

上述许多用例均搭载了骁龙平台，该平台集成了：

高通Hexagon NPU专门为高效推理而构建
跨CPU、GPU和NPU的均衡计算编排

节能设计，支持轻薄型系统中的持续工作负载

您是否已经在进行激动人心的项目，或对边缘AI的实施有疑问？我们的开发者生态系统提供各类工具、教程和可直接运行的示例，可以帮助团队快速入门。

额外资源

在所发布内容中表达的观点仅为原作者的个人观点，并不代表高通技术公司或其子公司（以下简称为“高通技术公司”）的观点。所提供的内容仅供参考之用，而并不意味着高通技术公司或任何其他方的赞同或表述。本网站同样可以提供非高通技术公司网站和资源的链接或参考。高通技术公司对于可能通过本网站引用、访问、或链接的任何非高通技术公司网站或第三方资源并没有做出任何类型的任何声明、保证、或其他承诺。

骁龙和高通品牌产品均为高通技术公司和/或其子公司的产品。

CSDN官方微信

扫描二维码,向CSDN吐槽

微信号：CSDNnews

程序员移动端【订阅下载】

微博关注