Google Gemini 拿下數學奧林匹克金牌!「平行思考」成 AI 推理突破點
OpenAI 和 Google DeepMind 最近分別在上週五、本週一宣布,自家 AI 模型獲得 2025 年國際數學奧林匹克競賽(IMO)金牌水準成績。根據 Google DeepMind 說法,其高階版本的 Gemini 模型成功解出 6 道題目中的 5 個,成為第一個獲得官方頒發金牌的 AI 系統。
IMO 是全球歷史最悠久、最具挑戰性的高中數學競賽之一,每個參賽國會選派 6 名菁英數學家角逐 6 道極具難度的數學難題。根據《VentureBeat》報導,歷年通常只有 8% 的人類參賽者能夠奪得金牌。
去年 Google 結合 AlphaProof 和 AlphaGeometry 2 系統組合取得了銀牌;今年則派出升級版的 Gemini Deep Think 取得金牌。Google DeepMind 表示,這代表人類現在可以透過自然語言,請 AI 解決複雜的數學問題,不須專門程式語言。
Gemini Deep Think 為何能超越去年表現?
Google DeepMind 指出,Gemini Deep Think 是專門為複雜問題設計的進階推理模型,融合了最新研究成果如「平行思考(parallel thinking)」技術。這個架構與依序推理的傳統 AI 模型不同,該模型可同時探索多種可能的解決方案,然後得出最終答案。
此外,Google DeepMind 也導入全新的強化學習技術,讓 AI 模型更有效地處理多步驟推理、問題解決與定理證明資料,並學習一套精選高品質數學解題資料庫,並在指令中加入如何應對 IMO 問題的提示和技巧。
Gemini Deep Think 在滿分 42 分中取得 35 分。Google DeepMind 執行長 Demis Hassabis 更在社群平台 X 強調,自家模型以自然語言端到端運行,並在比賽的 4.5 小時標準時間限制內完成了工作。
Google 表示,將先釋出 Gemini Deep Think 模型給部分數學家測試,未來也計畫納入 Google AI Ultra 的訂閱服務。
OpenAI 提前公布成績引發爭議
同樣聲稱具有 IMO 競賽金牌水準的 OpenAI,早於官方揭露自身成績,在社群媒體引發爭議。《VentureBeat》報導,有網友認為 OpenAI 無視 IMO 的請求,是不尊重的行為。
根據《TechCrunch》,IMO 幾個月前曾邀請 OpenAI 參賽,但 OpenAI 拒絕了。而 OpenAI 宣稱奪下 IMO 金牌成績,是源自其聘請第三方評估員──三位熟悉評分系統的前 IMO 獎牌得主,來審核 AI 模型表現。OpenAI 在得知結果後聯繫了 IMO,但 IMO 表示需要等待頒獎典禮結束後再公布結果。
Google DeepMind 資深研究員、IMO 專案負責人 Thang Luong 告訴《TechCrunch》,Google 等待公佈 IMO 成績是為了尊重參加比賽的學生。OpenAI 和 Google 的公告正值 AI 產業在競爭行為和透明度爭議升溫之際,《VentureBeat》觀察 Google DeepMind 謹慎的方式發布研究成果,與 OpenAI 的做法形成對比。
*立即報名 8/15 【AI Agent 知識工作革命論壇】,解析企業如何在各工作場景導入 AI Agent 完成任務
*本文開放合作夥伴轉載,資料來源:Google DeepMind、《TechCrunch》、《VentureBeat》,首圖來源:AI 生成
留言 0