从文字到视觉实现智能跃迁 金山办公首次公开PPT文生图模型
发表于 2025-04-23 15:18:18

4月19日,由CSDN与Boolan联合主办的「2025全球机器学习技术大会」在上海正式开幕。本次大会汇集了近50位国际AI技术领袖与1000余名来自金融、医疗、制造等领域的专业人士,围绕大模型技术演进、智能体、代码大模型、多模态技术等众多前沿话题开启深度洞察与解读,共同探讨人工智能技术落地的前沿实践。

作为AI办公领域前沿的探索者,金山办公也在本次大会上带来了最新研发成果:金山办公AI应用算法负责人张家瑞现场围绕《WPS AI生成PPT,基于LLM的AI办公实践》发表演讲,从技术的角度详细拆解了WPS AI生成PPT的底层逻辑。

WPS AI生成PPT进一步升级,区别于大模型生成PPT,WPS可基于用户上传的文档进行PPT生成。在技术层面,WPS AI对文件进行了文档结构化分析与重建,基于 LLM(Large Language Model)生成大纲,从而用户生成的PPT内容相关度高,也更贴合用户需求。

张家瑞也在现场对PPT文生图模型进行演示,比如输入“生成充满科技感的新能源汽车图片”主题文本,模型可瞬间输出包含新能源汽车及科技感主题配色的多组PPT配图,创作效率提升80%以上,轻松实现从文字到视觉表达的智能跃迁。

此次亮相的PPT文生图模型,也标志着WPS AI在智能办公领域的技术突破。据介绍,该模型背后是语义理解+美学生成两级引擎。

比如语义理解引擎,基于37年中文文档处理经验,能够精准地识别文本中的逻辑结构与核心论点,快速实现「文档结构化」,通过目录大纲将文档中的文字、图片、图表合理的进行归纳组织。借助PPT-RAG(文档检索增强生成)功能,则可以更好地提升逻辑性,强化指令遵循、总结、结构化输出能力,减少幻觉内容的产生。

在此基础上,美学生成引擎则融合主流视觉美学能力和中文自然语言理解能力,针对不同的用户需求自动适配PPT版式风格和高匹配度图片,完成专业级的PPT设计方案,大幅提升用户的办公效率。

作为金山办公基于大语言模型的智能办公助手,WPS AI自2023年11月公测以来,就聚焦AIGC(内容创作)、Copilot(智慧助理)、Insight(知识洞察)三大方向,支持文字、表格、PPT、PDF等组件。2024年7月,升级后的WPS AI 2.0面向个人用户再次新增了4个AI办公助手:AI写作助手、AI阅读助手、AI数据助手、AI设计助手,并提供文字续写、伴写、表格AI分析、复杂函数处理等AI功能。

站在37年技术积淀的基石上,金山办公正将AI办公推向更辽阔的疆域,并转化为每个人触手可及的智能助手。正如金山办公CEO章庆元所说,未来的办公软件将越来越简单,每个人都会拥有自己的办公助理来提高工作效率。


「免责声明」:以上页面展示信息由第三方发布,目的在于传播更多信息,与本网站立场无关。我们不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资建议,据此操作,风险自担,以上网页呈现的图片均为自发上传,如发生图片侵权行为与我们无关,如有请直接微信联系g1002718958。

CSDN官方微信
扫描二维码,向CSDN吐槽
微信号:CSDNnews
微博关注
【免责声明:CSDN本栏目发布信息,目的在于传播更多信息,丰富网络文化,稿件仅代表作者个人观点,与CSDN无关。其原创性以及文中陈述文字和文字内容未经本网证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。您若对该稿件有任何怀疑或质疑,请立即与CSDN联系,我们将迅速给您回应并做处理。】