OpenAI 推出 O3 与 O4-mini:最聪明的 ChatGPT 模型登场,「图像推理」成新突破

OpenAI 宣布推出两款 ChatGPT 新模型:o3 和 o4-mini,OpenAI 表示这两者不仅是目前最聪明、最有能力的模型,还加入了前所未有的功能:能真正「思考」图像,不只看图,更能将图像纳入推理过程中。

这两款模型已开放给 ChatGPT Plus、Pro 与 Team 方案用户,并将在一周内提供给 ChatGPT Enterprise 和 Edu 用户。同时,开发者现在也可透过 Chat Completions API 和 Responses API 使用这两款新模型。

o3:全能型选手,推理与视觉理解全面升级

OpenAI 表示,o3 模型在多个领域表现出色,特别是在程式编写、数学运算、科学推理与视觉理解等任务上设定了新的标准。这款模型也支援多种内建工具的整合使用,包括:

网路搜寻

Python 运算工具

图像分析与产生

档案解析功能

这代表用户现在不仅能问问题,还能让 AI 实际动手帮忙分析数据、看图解释、甚至自动生成图片或程式码。

o4-mini:高效率推理机器,适合大量查询需求

与 o3 相比,o4-mini 更专注于成本与速度的优化。虽然模型较小,但它的推理能力仍然非常出色,特别适合需要高频率、高吞吐量的应用场景。

OpenAI 表示,如果你需要一天问上百个问题,o4-mini 绝对是你的最佳选择。而且因为效能出色、运算成本低,用户可以享有更高的使用额度。

思考图像的新能力:从看图到「用图思考」

两款模型最大的亮点之一,是首次具备了「图像推理」(Thinking with images)的能力。

传统的 AI 模型只能看到图片,现在的 o3 与 o4-mini 则可以将图片纳入整个推理过程。这意味着,如果你传了一张图片给模型,它不只是告诉你图片里是什么,而是会把那张图片视为一个推理线索,与文字资料一起分析、整合,进行更深入的回答。

这项突破对教育、医疗、设计与工程等领域来说,都是一大福音。

要求 GPT 推理图片中倒置的笔记中写什么 可要求 ChatGPT 对于照片中的港口船只进行辨识,并推理出相关资讯 新版模型已上线,ChatGPT 用户可立即体验

从即日起,ChatGPT Plus、Pro、Team 的用户会在模型选择器中看到:

o3

o4-mini

o4-mini-high

它们将取代旧有的 o1、o3-mini 以及 o3-mini-high。Pro 用户虽然目前还可以选择 o1-pro 模型,但 OpenAI 表示,将在接下来几周推出 o3-pro,届时会提供完整的工具支援功能。

开发者工具同步升级,Responses API 增强推理能力

除了 ChatGPT 用户之外,开发者现在也能使用 o3 与 o4-mini,透过 Chat Completions API 与新升级的 Responses API。

Responses API 新增多项功能,包括:

推理摘要(reasoning summaries)

支援保留推理过程的 token(提高性能)

即将支援内建工具如网路搜寻、档案搜寻与程式码解译器

这使得开发者可以打造更智慧、更具推理能力的应用程式。

随着 o3 和 o4-mini 的推出,OpenAI 再次提升了 AI 模型的天花板。不仅推理能力全面升级,还加入了真正懂「看图思考」的能力。无论你是开发者、商业用户还是好奇心旺盛的日常用户,这两款模型都提供了更多选择与可能。

这篇文章 OpenAI 推出 o3 与 o4-mini:最聪明的 ChatGPT 模型登场,「图像推理」成新突破 最早出现于 链新闻 ABMedia。

查看原文
本页面内容仅供参考,非招揽或要约,也不提供投资、税务或法律咨询。详见声明了解更多风险披露。
  • 赞赏
  • 评论
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate.io APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)