AI热点 3小时前 156 阅读 0 评论

面壁智能开源 MiniCPM-V 4.0 AI 模型:手机 App 就能用,图像理解超 GPT-4.1-mini

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

感谢IT之家网友 四文鱼 的线索投递!

IT之家 8 月 6 日消息,面壁智能 8 月 5 日宣布开源 MiniCPM-V 4.0,该模型在图像理解能力上超越了 GPT-4.1-mini-20250414。

该模型不仅继承了 MiniCPM-V 2.6 的众多实用特性,还大幅提升了推理效率。面壁智能还同步开源了适用于 iPhone 和 iPad 的 iOS 应用。

面壁智能介绍称,MiniCPM-V 4.0 是 MiniCPM-V 系列中最新的高效模型,参数总量为 4B。该模型在 OpenCompass 评测中图像理解能力超越了 GPT-4.1-mini-20250414、Qwen2.5-VL-3B-Instruct 和 InternVL2.5-8B。

面壁智能认为,凭借小巧的参数规模和高效的架构,MiniCPM-V 4.0 是“移动端部署的理想选择”(例如,在 iPhone 16 Pro Max 上使用开源 iOS 应用时,首 token 延迟低于 2 秒,解码速度超过 17 token / s)。

IT之家附 MiniCPM-V 4.0 开源地址:

https://huggingface.co/openbmb/MiniCPM-V-4

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!