OpenAI发布o3、o4 mini模型，实现“看图说话”，糊图也行！

AI技术专栏作家 | 发布了 246 篇文章

OpenAI，ChatGPT，人工智能，AI

“这是OpenAI迄今最强、最智能的模型。”OpenAI 发布了能够识别、分析草图、图表、海报等信息的推理专用AI模型……

站长之家(ChinaZ.com) 4月17日消息:OpenAI 当天宣布正式推出具备图像识别能力的主力推理专用 AI 模型 “o3” 以及轻量化模型 “o4 mini”。其中，o3 是 OpenAI 去年首次公开的推理模型 o1 的后续产品。在此之前的今年 1 月，OpenAI 率先推出了 o3 系列中的轻量版本 “o3 mini”。

推理模型是指，即便遇到从未学习过的问题，其也能基于已有的知识自行进行推理、从而找出答案的 AI 模型。它会自行验证给出的答案是否正确，若答案错误，就会重新找寻正确答案。正因如此，在数学、科学、计算机编程等需要按步骤进行逻辑思考的领域中，这款 AI 模型特别有优势。

OpenAI 介绍称，“o3 是我们公司最精密的推理模型”，“在衡量数学、编码、推理、科学等理解能力的测试中，它超越了之前的模型”。该公司还解释说，本次公开的模型甚至能够根据图像进行思考。据说由于可以直接对图像进行放大或旋转来进行分析，所以即便图像画质低或时很模糊，它也能理解。

从当天起，ChatGPT 的付费用户可以使用这些模型。OpenAI 暗示，这两个模型可能是最后一批，今后或许不会再单独推出推理型模型。OpenAI 首席执行官山姆・奥尔特曼（Sam Altman）表示：“o3 和 o4 mini 可能会成为 GPT-5 推出之前的最后一批独立 AI 推理模型。”

这意味着从 GPT-5 开始，推理模型和非推理模型很有可能会整合在一起。

（举报）