智象未来团队研发成果获ICML 2025收录!图像生成更有“全局视野”
智象未来团队提出全新层级自回归生成范式 Hierarchical Masked Autoregressive models (Hi-MAR),有效解决自回归图像生成中结构失真问题。该研究已被 ICML 2025 收录,并在多个图像生成任务中取得领先性能。
现有自回归图像生成模型存在缺乏全局结构建模能力、训练-推理分布不一致、尺度引导缺失等问题。Hi - MAR 借鉴人类绘画过程,采用自顶向下层次化生成范式,还引入多尺度联合训练策略等。实验显示,其在图像质量和语义一致性上优于主流方法,可以显著提升模型的全局感知能力与生成质量。
本次发表的论文《Hierarchical Masked Autoregressive Models with Low-Resolution Token Pivots》,展示了团队在多模态生成式基础架构设计领域的前沿探索。这一全新的层级自回归生成架构 Hi-MAR,为构建具备“全局感知+局部细化”能力的生成基础架构提供了新的范式,同时它也是HiDream系列开源模型家族重要的一员,为下一代多模态生成式基础架构的技术演进带来更多的可能性!
「免责声明」:以上页面展示信息由第三方发布,目的在于传播更多信息,与本网站立场无关。我们不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资建议,据此操作,风险自担,以上网页呈现的图片均为自发上传,如发生图片侵权行为与我们无关,如有请直接微信联系g1002718958。

CSDN官方微信
扫描二维码,向CSDN吐槽
微信号:CSDNnews
程序员移动端【订阅下载】
微博关注
最新文章
值得买科技CTO王云峰出席2025全球数字经济大会:以“AI+”构建消费行业新生态从食材管理到全屋联动,三星AI神 冰箱9系重新定义家的温度技嘉科技 STEALTH Revolution 玩转简约装机美学 力邀创作者打造纯白梦幻桌机多款主流实用工具深度适配鸿蒙电脑,打造高效智能一体化工作流践行“三高四新”打造数字湖南新标杆:“湘易办”政务版成功适配鸿蒙系统解锁电子制造未来,抢占早鸟最后席位——2026慕尼黑上海电子生产设备展助您开拓电子智造新商机存储芯片龙头启动IPO:长鑫科技曾获大基金加持 明星机构抢筹千亿估值赛道报名和作品提交时间延长!2025高通边缘智能创新应用大赛:60万大奖等你解锁,速来挑战!中考语数英三科第一!真正的学霸AI,非它莫属!金山云第三期星云训练营正式开营 百名技术新锐共启
【免责声明:CSDN本栏目发布信息,目的在于传播更多信息,丰富网络文化,稿件仅代表作者个人观点,与CSDN无关。其原创性以及文中陈述文字和文字内容未经本网证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。您若对该稿件有任何怀疑或质疑,请立即与CSDN联系,我们将迅速给您回应并做处理。】