智象未来发布全新自回归图像编辑框架 VAREdit ，0.7 秒完成高保真图像编辑-CSDN.NET

CSDN首页> 业界

订阅业界RSS

智象未来发布全新自回归图像编辑框架 VAREdit ，0.7 秒完成高保真图像编辑

发表于 2025-08-25 19:06:10

近日，智象未来团队正式推出全新自回归图像编辑框架 VAREdit，作为全球首个纯自回归的图像编辑模型，这也是该领域的又一重大突破。该框架不仅能够精准执行用户指令，避免过度修改，还将编辑速度提升至0.7秒级，为实时交互与高效创作开辟新路径。

长期以来，扩散模型在图像编辑中虽能生成高质量画面，但存在局部修改牵动整体结构、编辑不够精准，以及多步迭代效率低等瓶颈。针对这一问题，VAREdit首次将视觉自回归（VAR）架构引入图像编辑任务。它将编辑定义为“下一尺度预测”，逐层生成多尺度残差特征，实现局部精准修改与整体结构保持的统一。同时，团队创新设计了尺度对齐参考（SAR）模块，有效解决尺度匹配难题，进一步提升编辑质量与效率。

在权威基准 EMU-Edit 与 PIE-Bench 测试中，VAREdit在CLIP与GPT等指标全面领先。其中，VAREdit-8.4B在GPT-Balance指标上较ICEdit和UltraEdit分别提升41.5%和30.8%；轻量版VAREdit-2.2B可在0.7秒内完成512×512图像高保真编辑，实现数倍提速。

目前，VAREdit已在 GitHub 和 Hugging Face 平台全面开源。智象未来团队表示，未来将持续探索视频编辑、多模态生成等应用场景，推动AI图像编辑迈入高效、可控、实时的新纪元。

「免责声明」：以上页面展示信息由第三方发布，目的在于传播更多信息，与本网站立场无关。我们不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实，不对您构成任何投资建议，据此操作，风险自担，以上网页呈现的图片均为自发上传，如发生图片侵权行为与我们无关，如有请直接微信联系g1002718958。

CSDN官方微信

扫描二维码,向CSDN吐槽

微信号：CSDNnews

程序员移动端【订阅下载】

微博关注

【免责声明：CSDN本栏目发布信息，目的在于传播更多信息，丰富网络文化，稿件仅代表作者个人观点，与CSDN无关。其原创性以及文中陈述文字和文字内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺，请读者仅作参考，并请自行核实相关内容。您若对该稿件有任何怀疑或质疑，请立即与CSDN联系，我们将迅速给您回应并做处理。】