AI热点 3月前 137 阅读 0 评论

首次实现图像思考 OpenAI重磅发布o3/o4-mini:史上最强、最智能模型

作者头像
快科技

AI技术专栏作家 | 发布了 246 篇文章

快科技4月17日消息,今日,OpenAI新款AI模型o3、o4-mini重磅发布,这是OpenAI迄今最强、最智能的模型。

据了解,OpenAI o3/o4-mini首次具备真正的视觉推理能力,看图识图已经是小菜一碟了,现在还会看图思考。

首次实现图像思考 OpenAI重磅发布o3/o4-mini:史上最强、最智能模型

OpenAI o3/o4-mini能同时处理文本、图像和音频,并且能作为Agent智能体自动调用网络搜索、图像生成、代码解析等工具以及深度思考模式。

通过强化学习,OpenAI训练了o3/o4-mini如何使用工具,不仅知道如何用、何时用,还能以正确格式快速生成可靠答案。

首次实现图像思考 OpenAI重磅发布o3/o4-mini:史上最强、最智能模型

首次实现图像思考 OpenAI重磅发布o3/o4-mini:史上最强、最智能模型

首次实现图像思考 OpenAI重磅发布o3/o4-mini:史上最强、最智能模型

测试结果显示,o3和o4-mini(无工具版本)在AIME 2024数学竞赛题目中的准确率分别达91.6%和93.4%,远超前代o1的74.3%。

首次实现图像思考 OpenAI重磅发布o3/o4-mini:史上最强、最智能模型

在AIME 2025题目中,两者准确率分别达88.9%和92.7%,在Codeforces编程竞赛评分中,支持终端工具的o3和o4-mini分别取得了2706和2719的ELO分数,领先o1的1891和o3-mini的2073。

即日起,ChatGPT的Plus、Pro会员以及Team用户可直接体验o3、o4-mini和o4-mini-high。

(举报)

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!