OpenAI 推出 O3 與 O4-mini:最聰明的 ChatGPT 模型登場,「圖像推理」成新突破

OpenAI 宣布推出兩款 ChatGPT 新模型:o3 和 o4-mini,OpenAI 表示這兩者不僅是目前最聰明、最有能力的模型,還加入了前所未有的功能:能真正「思考」圖像,不只看圖,更能將圖像納入推理過程中。

這兩款模型已開放給 ChatGPT Plus、Pro 與 Team 方案用戶,並將在一週內提供給 ChatGPT Enterprise 和 Edu 用戶。同時,開發者現在也可透過 Chat Completions API 和 Responses API 使用這兩款新模型。

o3:全能型選手,推理與視覺理解全面升級

OpenAI 表示,o3 模型在多個領域表現出色,特別是在程式編寫、數學運算、科學推理與視覺理解等任務上設定了新的標準。這款模型也支援多種內建工具的整合使用,包括:

網路搜尋

Python 運算工具

圖像分析與產生

檔案解析功能

這代表用戶現在不僅能問問題,還能讓 AI 實際動手幫忙分析數據、看圖解釋、甚至自動生成圖片或程式碼。

o4-mini:高效率推理機器,適合大量查詢需求

與 o3 相比,o4-mini 更專注於成本與速度的優化。雖然模型較小,但它的推理能力仍然非常出色,特別適合需要高頻率、高吞吐量的應用場景。

OpenAI 表示,如果你需要一天問上百個問題,o4-mini 絕對是你的最佳選擇。而且因為效能出色、運算成本低,用戶可以享有更高的使用額度。

思考圖像的新能力:從看圖到「用圖思考」

兩款模型最大的亮點之一,是首次具備了「圖像推理」(Thinking with images)的能力。

傳統的 AI 模型只能看到圖片,現在的 o3 與 o4-mini 則可以將圖片納入整個推理過程。這意味著,如果你傳了一張圖片給模型,它不只是告訴你圖片裡是什麼,而是會把那張圖片視為一個推理線索,與文字資料一起分析、整合,進行更深入的回答。

這項突破對教育、醫療、設計與工程等領域來說,都是一大福音。

要求 GPT 推理圖片中倒置的筆記中寫什麼 可要求 ChatGPT 對於照片中的港口船隻進行辨識,並推理出相關資訊 新版模型已上線,ChatGPT 用戶可立即體驗

從即日起,ChatGPT Plus、Pro、Team 的用戶會在模型選擇器中看到:

o3

o4-mini

o4-mini-high

它們將取代舊有的 o1、o3-mini 以及 o3-mini-high。Pro 用戶雖然目前還可以選擇 o1-pro 模型,但 OpenAI 表示,將在接下來幾週推出 o3-pro,屆時會提供完整的工具支援功能。

開發者工具同步升級,Responses API 增強推理能力

除了 ChatGPT 用戶之外,開發者現在也能使用 o3 與 o4-mini,透過 Chat Completions API 與新升級的 Responses API。

Responses API 新增多項功能,包括:

推理摘要(reasoning summaries)

支援保留推理過程的 token(提高性能)

即將支援內建工具如網路搜尋、檔案搜尋與程式碼解譯器

這使得開發者可以打造更智慧、更具推理能力的應用程式。

隨著 o3 和 o4-mini 的推出,OpenAI 再次提升了 AI 模型的天花板。不僅推理能力全面升級,還加入了真正懂「看圖思考」的能力。無論你是開發者、商業用戶還是好奇心旺盛的日常用戶,這兩款模型都提供了更多選擇與可能。

這篇文章 OpenAI 推出 o3 與 o4-mini:最聰明的 ChatGPT 模型登場,「圖像推理」成新突破 最早出現於 鏈新聞 ABMedia。

查看原文
本頁面內容僅供參考,非招攬或要約,也不提供投資、稅務或法律諮詢。詳見聲明了解更多風險披露。
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate.io APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)