1X 發表新人形機器人「大腦」Redwood,1.6 億參數搞定未知、開門懂扶牆壁
專攻家用人形機器人的挪威新創 1X Technologies,於 6/10 發表全新 AI 模型 Redwood,賦予自家 NEO Gamma 機器人更高自主性,能在真實居家環境中靈活完成洗衣、開門及空間移動等任務。
Redwood 是 1X 專為人形機器人打造的視覺語言模型(Vision-Language Transformer),能執行端到端的移動操作任務。與許多主打工業環境場景、執行多項任務的人形機器人開發商不同,1X 強調專為家庭環境設計,讓機器人像人類一樣行走和交流。
從扶牆開門到邊走邊操作,1X 六大能力突破
針對這款「機器人大腦」,1X 表示,Redwood 的關鍵特性之一是高度通用性(Generalization),能靈活應對不同任務變化,並與陌生物件互動。
Redwood 是以 1X EVE 與 NEO 機器人累積的資料集訓練而成,能適應家庭中變化多端的物品與場景。舉例來說,即使遇到從未見過的瓶子或新擺設,Redwood 也能自動調整抓取策略,如果初次嘗試失敗,也會修正並重新嘗試。
第二,Redwood 支援全身控制與多接觸操作,打破傳統機器人系統「操控和運動行為分離」的框架。1X 表示,家庭場景中,機器人需如人類般運用腿部、臀部和彎腰來撿起地上的玩具和衣服。
為達到全身控制的目標,Redwood 可以同時預測手臂和手部的指令,以及行走、操控和骨盆姿勢的指令。在示範影片中,NEO 機器人拉開厚重的大門時會自動以手扶牆來穩定身體,撿拾地面物品時會整合腿、腰、手臂協同動作。
第三,Redwood 具備同步行動操作能力,能同時規劃移動與操作策略。Redwood 不只讓機器人能自主導航至目標物位置,還可自動判斷用左手、右手或雙手進行操作,確保安全有效完成任務流程,避免不必要的碰撞或錯誤。為此,Redwood 已在多樣化的居家環境接受大量導航和物件拾取放置操作的訓練。
第四,值得一提的是,Redwood 所有運算和處理都在 NEO 人形機器人的嵌入式 GPU 完成,無須仰賴雲端。1X 強調,這能讓機器人應用於更多樣化的環境,例如地下室、戶外花園,網路訊號不好的室內環境甚至偏遠場域。
第五,Redwood 支援可離線語音控制。1X 認為,語音是與家用機器人互動最直覺的介面。其系統透過一個外部的語音到語音大型語言模型(LLM),從對話語境中擷取出使用者意圖,再將指令轉換為向量,輸入至 Redwood 模型執行。
第六,從成功與失敗資料中學習。1X 指出,與多數只學習成功案例的 AI 模型不同,Redwood 也學習失敗情境,這有助於向模型提供監督訊號,提高人形機器人的適應能力。
AI 模型參數只有 1.6 億,如何做到?
為實現上述功能,Redwood 採用跨形態(Cross-Embodiment)架構,整合語言嵌入、視覺 token 及機器人 proprioception(本體感知)訊號,並透過 diffusion policy 解碼為 NEO 或 EVE 機器人的具體操作指令。
值得關注的是,Redwood 模型僅有 1.6 億參數,之所以能應對家庭複雜場景,關鍵在於除動作預測外,1X 亦導入多種認知任務學習,包含預測手部與物體相對位置,強化視覺-運動協調。
事實上,1X 曾在 NVIDIA GTC 2025 大會亮相,當時 NEO 機器人仍採用遠端操控示範,尚未發表 Redwood 模型。1X 向《The Robot Report》透露,這是有意為之,目的是為其「資料飛輪」策略鋪路,透過真實互動累積高品質訓練資料。
1X 強調,未來具備通用自主能力的人形機器人若能進入家庭場景,將徹底改變一整個世代的生活品質,無論是長者照護、減輕家務負擔,甚至開拓尚未想像到的新應用場景。
*本文部分初稿由 AI 生成,經《TechOrange》編撰,資料來源:1X、《The Robot Report》、NVIDIA,圖片來源:1X
留言 0