AI热点 3月前 190 阅读 0 评论

OpenAI发布o3、o4 mini模型,实现“看图说话”,糊图也行!

作者头像

AI技术专栏作家 | 发布了 246 篇文章

OpenAI,ChatGPT,人工智能,AI

“这是OpenAI迄今最强、最智能的模型。”OpenAI 发布了能够识别、分析草图、图表、海报等信息的推理专用AI模型……

站长之家(ChinaZ.com) 4月17日 消息:OpenAI 当天宣布正式推出具备图像识别能力的主力推理专用 AI 模型 “o3” 以及轻量化模型 “o4 mini”。其中,o3 是 OpenAI 去年首次公开的推理模型 o1 的后续产品。在此之前的今年 1 月,OpenAI 率先推出了 o3 系列中的轻量版本 “o3 mini”。

推理模型是指,即便遇到从未学习过的问题,其也能基于已有的知识自行进行推理、从而找出答案的 AI 模型。它会自行验证给出的答案是否正确,若答案错误,就会重新找寻正确答案。正因如此,在数学、科学、计算机编程等需要按步骤进行逻辑思考的领域中,这款 AI 模型特别有优势。

OpenAI 介绍称,“o3 是我们公司最精密的推理模型”,“在衡量数学、编码、推理、科学等理解能力的测试中,它超越了之前的模型”。该公司还解释说,本次公开的模型甚至能够根据图像进行思考。据说由于可以直接对图像进行放大或旋转来进行分析,所以即便图像画质低或时很模糊,它也能理解。

从当天起,ChatGPT 的付费用户可以使用这些模型。OpenAI 暗示,这两个模型可能是最后一批,今后或许不会再单独推出推理型模型。OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)表示:“o3 和 o4 mini 可能会成为 GPT-5 推出之前的最后一批独立 AI 推理模型。”

这意味着从 GPT-5 开始,推理模型和非推理模型很有可能会整合在一起。

(举报)

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!