【Google I/O 2025】從 Project Astra 到 Mariner！Google 正打造「世界模型」版本 Gemini AI，能跨裝置幫忙完成任務

Google 在 I/O 2025 發表的 AI 藍圖正悄悄改變人們對數位助理的想像。核心關鍵在於：讓 Gemini 不只是聊天機器人，而是能理解世界、主動協助處理任務的通用 AI 助理。

Google 執行長 Sundar Pichai 指出，Gemini 團隊正在打造一個具備「World Model 世界模型」架構的 AI 系統，這代表它不只學習語言，更能模擬現實世界的狀況，並據此規劃、回應，甚至做出推論與決策。

Gemini 從大型語言模型走向「世界模型」

這個所謂「世界模型」的概念，不是新詞，而是 AI 領域長期追求的目標：讓模型能像人類一樣理解物理環境與複雜情境。Google 表示，新一代 Gemini 2.5 Pro 模型就是朝這個方向打造。

從過去下圍棋的 AlphaGo、玩《星海爭霸》的 AlphaStar，到現在能透過圖片生成 3D 遊戲世界的 Genie 2，Google 不只專注語言處理，也在持續開發 AI 對空間、動態與互動的理解能力。

例如：

這些技術，最終都會整合到未來的 Gemini 應用中，讓 AI 更能「懂場面、會做事」。

Gemini 團隊表示，過去一年來已將 Project Astra 的研究成果整合至 Gemini Live，包括：

Google 也透露，這些功能不只會在手機與電腦上出現，還會擴展到新型裝置，例如「具備鏡頭的眼鏡」，也會開放 API 給開發者導入應用。

同時，一項名為「Search Live」的實驗也在進行中，預計整合即時搜尋與現場感知互動的功能。

另一個進展來自 Google 的代理系統原型 Project Mariner。這個計畫主打多工作業，目前已能同時處理最多 10 種任務，例如：

這些功能目前已開放給美國地區的 Google AI Ultra 訂閱用戶，未來也將進一步整合到 Gemini API 與更多 Google 原生應用中。

Google 將 Gemini 的長期目標定義為「通用 AI 助理」，意思是不只能跟你聊天，還能根據你所在的環境、需求，幫你實際完成事情。不論你使用的是手機、筆電、智慧眼鏡，或任何能連網的裝置，這個助理都能在背景工作。

Google 表示，未來會持續強化 Gemini 模型的「世界感知能力」，並同步強化使用者隱私控管、安全防護與責任開發標準。Google 也啟動了有史以來規模最大的 AI 倫理前瞻計畫，針對通用 AI 助理的潛在風險與設計進行研究。

從搜尋資訊到完成任務，從單一回應到多工處理，Google 正逐步重構 AI 助理的角色定位。而 Gemini 將從語言模型，進化成一個更立體、跨裝置、可操作的智慧夥伴。

這場關於「世界模型」的實驗，或許正是下一波通用 AI 應用變革的起點。

▶ 延伸閱讀

圖片及資料來源：Google