OpenAI 員工公開指責 xAI 最新 AI 模型 Grok3 的基準測試結果具有誤導性

ChainCatcher

2025-02-23 09:44:47

摘要生成中

ChainCatcher 消息，據金十報道，OpenAI 的一名員工公開指責馬斯克旗下的xAI公司，稱其發佈的最新 AI 模型 Grok3 的基準測試結果具有誤導性。對此，xAI 的聯合創始人伊戈爾・巴布什金（Igor Babushkin）則堅稱公司並無不當。 xAI 的圖表顯示，Grok3 的兩個版本——Grok3 Reasoning Beta 和 Grok3 mini Reasoning——在 AIME 2025 上的表現超過了 OpenAI 當前最強的可用模型 o3-mini-high。然而，OpenAI 的員工很快在 X 平臺上指出，xAI的圖表並未包含 o3-mini-high 在“cons@64”條件下的 AIME 2025 得分。巴布什金在 X 平臺上辯稱，OpenAI 過去也曾發佈過類似的誤導性基準測試圖表。儘管這些圖表是用於比較其自身模型的表現。

XAI-4.59%

GROK-0.18%

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

1人點讚了這條動態

讚賞
1
留言
轉發
分享

留言

0/400

暫無留言

ChainCatcher

熱門話題查看更多
#成長值抽獎贏iPhone17和精美週邊
19.1萬熱度
#十二月降息預測
9.2萬熱度
#反彈幣種推薦
9.21萬熱度
#加密市場回暖
3.31萬熱度
#Gate廣場聖誕送溫暖
11.74萬熱度

熱門 Gate Fun查看更多

1
MHTMuhit
市值:$0.1持有人數:1
0.00%
2
⛧⛧
市值:$3684.63持有人數:2
0.04%
3
$FISHER™$FISHER™
市值:$3631.03持有人數:1
0.00%
4
$FISHER$FISHER
市值:$3634.48持有人數:1
0.00%
5
$COMMUNITY$COMMUNITY
市值:$3634.48持有人數:1
0.00%