不靠雲端的機器人 AI 來了,Google 全新 Gemini Robotics On-Device 模型亮點整理
Google DeepMind 宣布推出全新裝置端 VLA(視覺語言動作)模型 Gemini Robotics On-Device 來控制機器人,最大亮點在於可在機器人設備上完全離線運作,並強調其具備強大的通用能力。
Google DeepMind 機器人技術主管 Carolina Parada 在官方部落格表示,由於這款模型可在無需連接網路的情況下運作,因此特別適合對延遲敏感的應用場景,並能在網路不穩定甚至完全離線的環境中維持穩定性與韌性。
不靠雲端的通用機器人 AI 模型
在 Google 先前推出的 Gemini Robotics 版本中,系統採用的是混合式架構──機器人上有小型 AI 模型執行即時反應,較複雜的推理則交由雲端大型語言模型處理。然而這種架構仍需網路連線,但這次 Google DeepMind 推出的全新「Gemini Robotics On-Device」,則完全擺脫雲端依賴,效能表現更與仰賴雲端的版本相當。
《Ars Technica》報導,DeepMind 的機器人主管 Vincent Vanhoucke 和工程總監 Parada 表示,這款本地模型與雲端混合模型在準確率上的落差非常小,在許多操作任務上「開箱即用」。
可微調、更通用,快速適應任務與硬體
缺乏穩健的通用/泛化能力(generalization)是機器人大規模部署於家庭和工業應用中的關鍵瓶頸,Google DeepMind 也表示,Gemini Robotics 模型旨在解決這個問題,實現更強大的通用能力,包含快速適應新任務,以及不同的機器人硬體型態。
Gemini Robotics On-Device 為 Google DeepMind 第一個可供微調的 VLA 模型。其配套的 SDK,能讓開發者微調模型,快速為機器人設計新任務或適應新環境,甚至只需 50 到 100 次示範,就能讓模型完成訓練與調校,實現小樣本學習。
Google 也指出,Gemini Robotics On-Device 可以有效適應全新機器人硬體,例如 Apollo 人形機器人和雙臂 Franka 工業機器人,擴大其應用範圍。
在展示範例中,新模型可以讓機器人遵循自然語言指令,處理從未見過的物體和場景,例如完成折疊衣服,或需要精確度和靈巧性的工業組裝任務。
國外機器人技術進展飛快,台灣明年將推動「智慧機器人產業推動方案」,試圖趕上國際趨勢。國科會副主委陳炳宇先前曾在記者會中表示,台灣在半導體、AI 及機器人關節零組件方面具有優勢,但過去較欠缺的是系統整合,希望藉該方案從上游整合,加速投入。
Google 新款機器人模型將 AI 功能帶到終端、從雲端解放出來,有助於機器人在更多元場域普及的做法,為台灣機器人應用與產業研發的提供了一個參考方向。
*本文開放合作夥伴轉載,資料來源:arXiv、《Ars Technica》、《techradar》、行政院,首圖來源:Google DeepMind
留言 0