AI棋賽結果出爐!馬斯克Grok決賽接連出包 OpenAI o3直落四完封稱霸
OpenAI與馬斯克(Elon Musk)旗下xAI的人工智慧模型Grok,首次在西洋棋賽場上正面交鋒,最終由OpenAI的o3大型語言模型以4比0擊敗Grok 4,奪下由Google平台Kaggle舉辦的AI Exhibition Tournament冠軍。這場為期三天的比賽於5日至7日舉行,參賽陣容包括Anthropic、Google、DeepSeek、Moonshot AI等多家開發商的模型。
根據《獨立報》報導,Grok 4在決賽中多次出現重大失誤,包括關鍵時刻連續失去皇后,最終被o3以四連勝的方式擊敗。
Chess.com撰稿人平哈塔(Pedro Pinhata)形容,Grok在準決賽前一直被視為奪冠熱門,但最後一天完全失去節奏;反觀o3的平均準確率高達91%,在多數情況下毫不留情地抓住對手失誤。
報導中也提到,這場冠軍對決其實帶有濃厚的個人色彩。OpenAI執行長阿特曼(Sam Altman)與馬斯克十年前共同創辦OpenAI,後者之後離開並成立xAI。
後續阿特曼曾指控馬斯克試圖收購ChatGPT開發公司未果,並稱他是「惡霸」。馬斯克則在X平台發文淡化比賽結果,聲稱xAI幾乎未在西洋棋領域投入資源,並表示Grok 4的棋力僅是「副產品」。
Google的Gemini模型在季軍戰中以3.5比0.5擊敗o4-mini,奪下第三名。DeepSeek與Moonshot AI則在八強賽止步。本次比賽旨在檢驗大型語言模型於複雜策略遊戲中的推理與決策能力,像西洋棋、圍棋等規則嚴謹的遊戲,被視為測試AI學習與完成目標的重要工具。
馬斯克在賽前已對外發表評論,而西洋棋界人士同樣關注這場AI對決。現任世界排名第一的棋手馬卡爾森(Magnus Carlsen)曾於7月的線上賽擊敗ChatGPT,且未損一子。他在賽後評估,Grok的棋力等級分約800,o3約在1200左右,遠低於他巔峰時的2882分。當有X平台用戶詢問時,Grok自評的等級分則在1600至1800之間。
自1997年IBM的深藍(Deep Blue)在六局比賽中擊敗世界冠軍卡斯帕洛夫(Garry Kasparov)以來,電腦戰勝人類頂尖棋手已非新鮮事。後續Google DeepMind等團隊更研發出能以超人水準自我訓練的棋類AI。
這次Kaggle舉辦的比賽,是自2022年ChatGPT問世以來,首次專為通用型大型語言模型舉行的大型西洋棋賽事。Take Take Take公司執行長克里斯蒂安森(Mats André Kristiansen)形容,此類比賽的價值在於深入觀察AI的推理與思考模式。
留言 0