✍️ Gate 廣場「創作者認證激勵計劃」優質創作者持續招募中!
Gate 廣場現正面向優質創作者開放認證申請!
立即加入,發布優質內容,參與活動即可瓜分月度 $10,000+ 創作獎勵!
📕 認證申請步驟:
1️⃣ 打開 App 首頁底部【廣場】 → 點擊右上角頭像進入個人主頁
2️⃣ 點擊頭像右下角【申請認證】,提交申請等待審核
注:請確保 App 版本更新至 7.25.0 或以上。
👉 立即報名:https://www.gate.com/questionnaire/7159
豪華代幣獎池、Gate 精美週邊、流量曝光等超 $10,000 豐厚獎勵等你拿!
📅 活動自 11 月 1 日起持續進行
在 Gate 廣場讓優質內容變現,創作賺取獎勵!
活動詳情:https://www.gate.com/announcements/article/47889
蘋果研究人員:主流AI模型仍無法達到AGI期望推理水平
Gate News bot 消息,蘋果研究人員在 6 月份發表的一篇名爲《思考的幻覺》的論文中指出,領先的人工智能 (AGI) 模型在推理方面仍存在困難,因此,開發通用人工智能 (AGI) 的競賽仍任重道遠。
文章指出,主流人工智能大型語言模型 (LLM)(例如 OpenAI 的 ChatGPT 和 Anthropic 的 Claude)的最新更新已包含大型推理模型 (LRM),但其基本功能、擴展特性和局限性“仍未得到充分理解”。
目前的評估主要側重於既定的數學和編碼基準,“強調最終答案的準確性”。然而,研究人員表示,這項評估並未深入了解人工智能模型的推理能力,與通用人工智能僅需幾年就能實現的預期形成了鮮明對比。
研究人員設計了不同的益智遊戲,以超越標準數學基準來測試克勞德·桑奈(Claude Sonnet)、OpenAI 的 o3-mini 和 o1 以及 DeepSeek-R1 和 V3 聊天機器人的“思考”和“非思考”變體。
他們發現,“前沿的邏輯推理模型(LRM)在超過一定復雜度時會面臨準確率的徹底崩潰”,無法有效地泛化推理,而且其優勢會隨着復雜度的上升而消失,這與人們對通用人工智能(AGI)能力的預期相反。
消息來源:Cointelegraph