請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

【Google I/O 2025】從 Project Astra 到 Mariner!Google 正打造「世界模型」版本 Gemini AI,能跨裝置幫忙完成任務

三嘻行動哇 Yipee!

發布於 05月21日04:44

Google 在 I/O 2025 發表的 AI 藍圖正悄悄改變人們對數位助理的想像。核心關鍵在於:讓 Gemini 不只是聊天機器人,而是能理解世界、主動協助處理任務的通用 AI 助理。

Google 執行長 Sundar Pichai 指出,Gemini 團隊正在打造一個具備「World Model 世界模型」架構的 AI 系統,這代表它不只學習語言,更能模擬現實世界的狀況,並據此規劃、回應,甚至做出推論與決策。

Gemini 從大型語言模型走向「世界模型」

這個所謂「世界模型」的概念,不是新詞,而是 AI 領域長期追求的目標:讓模型能像人類一樣理解物理環境與複雜情境。Google 表示,新一代 Gemini 2.5 Pro 模型就是朝這個方向打造。

從過去下圍棋的 AlphaGo、玩《星海爭霸》的 AlphaStar,到現在能透過圖片生成 3D 遊戲世界的 Genie 2,Google 不只專注語言處理,也在持續開發 AI 對空間、動態與互動的理解能力。

例如:

  • Veo 模型:具備物理直覺,可產出符合真實邏輯的影片動畫
  • Gemini Robotics:訓練機器人聽懂指令並即時調整行動
  • Gemini 模型本身:已能模擬自然環境與日常情境

這些技術,最終都會整合到未來的 Gemini 應用中,讓 AI 更能「懂場面、會做事」。

Project Astra:即時感知與回應的基礎正在形成

Gemini 團隊表示,過去一年來已將 Project Astra 的研究成果整合至 Gemini Live,包括:

  • 即時語音處理與回覆
  • 影像與影片內容理解
  • 記憶功能(Contextual memory)
  • 電腦操作功能

Google 也透露,這些功能不只會在手機與電腦上出現,還會擴展到新型裝置,例如「具備鏡頭的眼鏡」,也會開放 API 給開發者導入應用。

同時,一項名為「Search Live」的實驗也在進行中,預計整合即時搜尋與現場感知互動的功能。

Project Mariner:讓 AI 一次幫你做 10 件事

另一個進展來自 Google 的代理系統原型 Project Mariner。這個計畫主打多工作業,目前已能同時處理最多 10 種任務,例如:

  • 找資料
  • 幫你預約看房
  • 協助網購
  • 幫忙整理報告
  • 或同時完成上述所有任務

這些功能目前已開放給美國地區的 Google AI Ultra 訂閱用戶,未來也將進一步整合到 Gemini API 與更多 Google 原生應用中。

Google 的目標:讓 AI 不只聽得懂,更能「看懂」、「做得到」

Google 將 Gemini 的長期目標定義為「通用 AI 助理」,意思是不只能跟你聊天,還能根據你所在的環境、需求,幫你實際完成事情。不論你使用的是手機、筆電、智慧眼鏡,或任何能連網的裝置,這個助理都能在背景工作。

Google 表示,未來會持續強化 Gemini 模型的「世界感知能力」,並同步強化使用者隱私控管、安全防護與責任開發標準。Google 也啟動了有史以來規模最大的 AI 倫理前瞻計畫,針對通用 AI 助理的潛在風險與設計進行研究。

AI 助理將不只回應問題,而是陪你做事

從搜尋資訊到完成任務,從單一回應到多工處理,Google 正逐步重構 AI 助理的角色定位。而 Gemini 將從語言模型,進化成一個更立體、跨裝置、可操作的智慧夥伴。

這場關於「世界模型」的實驗,或許正是下一波通用 AI 應用變革的起點。

▶ 延伸閱讀

圖片及資料來源:Google

0 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0