OpenAI 推出 O3 与 O4-mini：最聪明的 ChatGPT 模型登场，「图像推理」成新突破

2025-04-17 01:56:54

OpenAI 宣布推出两款 ChatGPT 新模型：o3 和 o4-mini，OpenAI 表示这两者不仅是目前最聪明、最有能力的模型，还加入了前所未有的功能：能真正「思考」图像，不只看图，更能将图像纳入推理过程中。

这两款模型已开放给 ChatGPT Plus、Pro 与 Team 方案用户，并将在一周内提供给 ChatGPT Enterprise 和 Edu 用户。同时，开发者现在也可透过 Chat Completions API 和 Responses API 使用这两款新模型。

o3：全能型选手，推理与视觉理解全面升级

OpenAI 表示，o3 模型在多个领域表现出色，特别是在程式编写、数学运算、科学推理与视觉理解等任务上设定了新的标准。这款模型也支援多种内建工具的整合使用，包括：

网路搜寻

Python 运算工具

图像分析与产生

档案解析功能

这代表用户现在不仅能问问题，还能让 AI 实际动手帮忙分析数据、看图解释、甚至自动生成图片或程式码。

o4-mini：高效率推理机器，适合大量查询需求

与 o3 相比，o4-mini 更专注于成本与速度的优化。虽然模型较小，但它的推理能力仍然非常出色，特别适合需要高频率、高吞吐量的应用场景。

OpenAI 表示，如果你需要一天问上百个问题，o4-mini 绝对是你的最佳选择。而且因为效能出色、运算成本低，用户可以享有更高的使用额度。

思考图像的新能力：从看图到「用图思考」

两款模型最大的亮点之一，是首次具备了「图像推理」（Thinking with images）的能力。

传统的 AI 模型只能看到图片，现在的 o3 与 o4-mini 则可以将图片纳入整个推理过程。这意味着，如果你传了一张图片给模型，它不只是告诉你图片里是什么，而是会把那张图片视为一个推理线索，与文字资料一起分析、整合，进行更深入的回答。

这项突破对教育、医疗、设计与工程等领域来说，都是一大福音。

要求 GPT 推理图片中倒置的笔记中写什么可要求 ChatGPT 对于照片中的港口船只进行辨识，并推理出相关资讯新版模型已上线，ChatGPT 用户可立即体验

从即日起，ChatGPT Plus、Pro、Team 的用户会在模型选择器中看到：

o4-mini

o4-mini-high

它们将取代旧有的 o1、o3-mini 以及 o3-mini-high。Pro 用户虽然目前还可以选择 o1-pro 模型，但 OpenAI 表示，将在接下来几周推出 o3-pro，届时会提供完整的工具支援功能。

开发者工具同步升级，Responses API 增强推理能力

除了 ChatGPT 用户之外，开发者现在也能使用 o3 与 o4-mini，透过 Chat Completions API 与新升级的 Responses API。

Responses API 新增多项功能，包括：

推理摘要（reasoning summaries）

支援保留推理过程的 token（提高性能）

即将支援内建工具如网路搜寻、档案搜寻与程式码解译器

这使得开发者可以打造更智慧、更具推理能力的应用程式。

随着 o3 和 o4-mini 的推出，OpenAI 再次提升了 AI 模型的天花板。不仅推理能力全面升级，还加入了真正懂「看图思考」的能力。无论你是开发者、商业用户还是好奇心旺盛的日常用户，这两款模型都提供了更多选择与可能。

这篇文章 OpenAI 推出 o3 与 o4-mini：最聪明的 ChatGPT 模型登场，「图像推理」成新突破最早出现于链新闻 ABMedia。

O3-2.66%

EDU-0.4%

CHAT-1.22%

查看原文

本页面内容仅供参考，非招揽或要约，也不提供投资、税务或法律咨询。详见声明了解更多风险披露。

0/400

暂无评论