OpenAI 推出 O3 與 O4-mini：最聰明的 ChatGPT 模型登場，「圖像推理」成新突破

2025-04-17 01:56:54

OpenAI 宣布推出兩款 ChatGPT 新模型：o3 和 o4-mini，OpenAI 表示這兩者不僅是目前最聰明、最有能力的模型，還加入了前所未有的功能：能真正「思考」圖像，不只看圖，更能將圖像納入推理過程中。

這兩款模型已開放給 ChatGPT Plus、Pro 與 Team 方案用戶，並將在一週內提供給 ChatGPT Enterprise 和 Edu 用戶。同時，開發者現在也可透過 Chat Completions API 和 Responses API 使用這兩款新模型。

o3：全能型選手，推理與視覺理解全面升級

OpenAI 表示，o3 模型在多個領域表現出色，特別是在程式編寫、數學運算、科學推理與視覺理解等任務上設定了新的標準。這款模型也支援多種內建工具的整合使用，包括：

網路搜尋

Python 運算工具

圖像分析與產生

檔案解析功能

這代表用戶現在不僅能問問題，還能讓 AI 實際動手幫忙分析數據、看圖解釋、甚至自動生成圖片或程式碼。

o4-mini：高效率推理機器，適合大量查詢需求

與 o3 相比，o4-mini 更專注於成本與速度的優化。雖然模型較小，但它的推理能力仍然非常出色，特別適合需要高頻率、高吞吐量的應用場景。

OpenAI 表示，如果你需要一天問上百個問題，o4-mini 絕對是你的最佳選擇。而且因為效能出色、運算成本低，用戶可以享有更高的使用額度。

思考圖像的新能力：從看圖到「用圖思考」

兩款模型最大的亮點之一，是首次具備了「圖像推理」（Thinking with images）的能力。

傳統的 AI 模型只能看到圖片，現在的 o3 與 o4-mini 則可以將圖片納入整個推理過程。這意味著，如果你傳了一張圖片給模型，它不只是告訴你圖片裡是什麼，而是會把那張圖片視為一個推理線索，與文字資料一起分析、整合，進行更深入的回答。

這項突破對教育、醫療、設計與工程等領域來說，都是一大福音。

要求 GPT 推理圖片中倒置的筆記中寫什麼可要求 ChatGPT 對於照片中的港口船隻進行辨識，並推理出相關資訊新版模型已上線，ChatGPT 用戶可立即體驗

從即日起，ChatGPT Plus、Pro、Team 的用戶會在模型選擇器中看到：

o4-mini

o4-mini-high

它們將取代舊有的 o1、o3-mini 以及 o3-mini-high。Pro 用戶雖然目前還可以選擇 o1-pro 模型，但 OpenAI 表示，將在接下來幾週推出 o3-pro，屆時會提供完整的工具支援功能。

開發者工具同步升級，Responses API 增強推理能力

除了 ChatGPT 用戶之外，開發者現在也能使用 o3 與 o4-mini，透過 Chat Completions API 與新升級的 Responses API。

Responses API 新增多項功能，包括：

推理摘要（reasoning summaries）

支援保留推理過程的 token（提高性能）

即將支援內建工具如網路搜尋、檔案搜尋與程式碼解譯器

這使得開發者可以打造更智慧、更具推理能力的應用程式。

隨著 o3 和 o4-mini 的推出，OpenAI 再次提升了 AI 模型的天花板。不僅推理能力全面升級，還加入了真正懂「看圖思考」的能力。無論你是開發者、商業用戶還是好奇心旺盛的日常用戶，這兩款模型都提供了更多選擇與可能。

這篇文章 OpenAI 推出 o3 與 o4-mini：最聰明的 ChatGPT 模型登場，「圖像推理」成新突破最早出現於鏈新聞 ABMedia。

EDU0.4%

CHAT5.33%

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

留言

0/400

暫無留言