开源项目 9月前 • 155 阅读 • 0 评论

智象未来开源图像编辑模型VAREdit：实现0.7秒高保真编辑！

作者头像

AI中国

AI技术专栏作家 | 发布了 246 篇文章

近日，智象未来团队（HiDream.ai）推出了全新的自回归图像编辑框架VAREdit，这是全球首个纯自回归图像编辑模型，标志着图像编辑领域的一次重大技术飞跃。

该框架能够在0.7秒内完成512×512图像的高保真编辑，较传统扩散模型速度提升数倍，同时保持了出色的编辑精准度和指令遵循能力。

技术突破

VAREdit首次将视觉自回归（VAR）架构引入图像编辑任务，将编辑过程定义为“下一尺度预测”问题。

该框架通过逐层生成多尺度残差特征，实现了局部精准修改与整体结构保持的高度统一。团队创新设计了尺度对齐参考（SAR）模块，有效解决了尺度匹配难题，进一步提升编辑质量与效率。

SAR模块采用混合方案：在第一层提供多尺度对齐参考，后续层仅关注最细尺度特征。这种方法既保障了编辑精度，又保持了计算效率。

性能表现

在性能方面，VAREdit在权威基准测试中表现卓越。在EMU-Edit和PIE-Bench测试中，VAREdit在CLIP和GPT指标上均领先。其中，VAREdit-8.4B在GPT-Balance指标上较ICEdit和UltraEdit分别提升41.5%与30.8%，轻量级VAREdit-2.2B也显著优于竞品。

速度上，VAREdit基于下一尺度预测机制优势明显：8.4B模型在1.2秒内完成512×512图像编辑，比同类扩散模型快2.2倍；2.2B模型仅需0.7秒，实现近实时体验。

编辑效果上，VAREdit适用范围广，在多数编辑类型（如对象替换、风格调整）中保真度高、过度修改少。视觉对比显示编辑结果自然流畅。

引入SAR模块后，模型精准性指标进一步提升，凸显其优化价值。

VAREdit的高速度和高精度为图像编辑带来了全新的应用体验，普通用户也能在短短0.7秒内完成专业级图像编辑，极大地降低了创作门槛。

这种技术突破将为艺术创作、商业广告和社交媒体内容生成带来更多可能性。

技术论文：
https://arxiv.org/pdf/2508.15772

GitHub：https://github.com/HiDream-ai/VAREdit

#AI开源项目推荐##github##AI技术##AI图像编辑

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

北京人形开源最新VLM模型，推动具身智能再迈关键一步 !

北京人形开源最新VLM模型，推动具身智能再迈关键一步 !

6月前 • 开源项目

超大参数量具身VLM开源：首创DPPO训练范式，模型性价比天花板

超大参数量具身VLM开源：首创DPPO训练范式，模型性价比天花板

6月前 • 开源项目

用了Rust，谷歌实测：Android上内存漏洞率比C/C++低1000倍！

用了Rust，谷歌实测：Android上内存漏洞率比C/C++低1000倍！

6月前 • 开源项目

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

6月前 • 开源项目

刚刚，华为AI推理大招开源，时延降90%，吞吐提22倍，上下文10倍级扩展

刚刚，华为AI推理大招开源，时延降90%，吞吐提22倍，上下文10倍级扩展

7月前 • 开源项目

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • 开源项目

开源即爆火！英伟达重磅推出OmniVinci全模态大模型

开源即爆火！英伟达重磅推出OmniVinci全模态大模型

7月前 • 开源项目

国际刑事法院也“踢掉”了微软Office！因邮箱一度“被封”，决定改为开源替代品openDesk

国际刑事法院也“踢掉”了微软Office！因邮箱一度“被封”，决定改为开源替代品openDesk

7月前 • 开源项目

热门标签

中国电子技术标准化研究院科技写作 AI技术开发云端开发欧洲科技初创公司 SecOps声音报告零基础写小说 VI视频公有云大模型 AI市场调研

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝