开源项目 9小时前 169 阅读 0 评论

阿里开源AI图像编辑神器!Qwen-Image-Edit:支持精准文字修改!

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

阿里云近日发布新一代图像编辑模型Qwen-Image-Edit,这是继8月5日开源的千亿参数图像生成模型Qwen-Image的升级版。

该模型以"精准修图+IP创作"为核心能力,号称能让Photoshop迎来最强挑战者。

主要功能

语义编辑:支持在保持原始图像视觉语义一致的前提下,对图像内容进行修改。

外观编辑:支持对图像的局部区域进行精确修改,如添加、删除或修改图像中的元素,同时保持其他区域不变。

精准文字编辑:支持中英文双语文字编辑,在保留原有字体、字号和风格的前提下,对图片中的文字进行增、删、改等操作。

强大的基准性能:在多个公开基准测试中表现出色,具备 SOTA(State-of-the-Art)性能,能高效完成各种复杂的图像编辑任务。

IP创作与编辑:阿里官方公布的一些案例,以Qwen的吉祥物——水豚为例,在输入对应文字后,Qwen-Image-Edit输出了不同场景的水豚图片。

团队还围绕16种MBTI性格类型设计了一系列编辑提示,基于这些提示生成了一套以吉祥物水豚为原型的MBTI主题表情包,这可以用于拓展IP的影响力。

技术创新

Qwen-Image-Edit采用双引擎驱动架构

视觉语义控制器:集成Qwen2.5-VL大模型,确保编辑后内容逻辑自洽

视觉外观编码器:基于VAE架构维持图像底层一致性

训练数据涵盖10万+专业设计素材50万张UGC内容,通过Diffusion技术实现像素级精细化编辑。官方数据显示,在Div2K、Flickr2K等基准测试中,其SSIM指标超越主流商用工具37%。

GitHub地址:
https://github.com/QwenLM/Qwen-Image

#AI开源项目推荐##github##AI技术##AI图像编辑#阿里开源#

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!