輝達搶攻「推理大腦」 新模型Cosmos Reason讓機器人腦袋更靈光
科技頂級年度盛會 SIGGRAPH 上,全球 AI 晶片巨頭輝達 (NVDA-US) 發布一款備受矚目、名為「Cosmos Reason」的開源物理 AI 與機器人視覺推理模型,此模型具備 70 億參數,能讓機器人與 AI 具身代理具備「像人類一樣推理」的能力,並在現實世界中執行複雜任務。
輝達指出,過去的視覺語言模型雖然在物體辨識等任務上表現優異,但面對多步驟的複雜指令或模糊、新穎的現實場景時,往往力有未逮。Cosmos Reason 的推出正是為了解決這一挑戰。藉由其強大的記憶和理解能力,此模型能作為機器人的「大腦」,負責有意識、條理化的決策。它能解釋環境,將複雜的指令分解為具體任務,並運用常識進行執行。
輝達在展示案例中,一具搭載 Cosmos Reason 的機器人手臂,在觀察到「麵包與烤麵包機」的場景後,成功推斷出最合理的下一步動作,是將麵包放入烤麵包機中烘烤,並將其思考邏輯轉化為精確的操作指令。這項「機器人規劃與推理」的功能,意味著機器人自主決策能力的重大躍進。
Cosmos Reason 不僅限於機器人操作,其多功能性也使其能應用於廣泛的 AI 領域。它能自動化整理和標註大規模、多樣化的訓練資料集,並從海量影片資料中提取有價值資訊進行歸因分析。
目前,該模型已投入商業化營運,輝達內部的機器人與自動駕駛團隊已將其用於資料整理、過濾、標註及 VLA(視覺語言動作)後訓練。此外,全球知名叫車服務公司優步(Uber)也正利用此模型為其自動駕駛訓練資料進行標註與說明生成。
除了科技巨頭的應用,Cosmos Reason 也為各產業帶來創新。麥格納國際(Magna International)正利用此模型開發全自動即時配送解決方案「City Delivery」,幫助車輛更快適應新的城市環境。VAST Data 和 Milestone Systems 等公司,也將此模型應用於交通監控自動化和視覺偵測等領域,展現其在多重產業的巨大潛力。
除了 Cosmos Reason,輝達也在 SIGGRAPH 大會上發布了多項重要更新,進一步強化其在機器人開發生態系中的領先地位。在 Cosmos 世界模型方面,新增的「Cosmos Transfer-2」能加速從 3D 模擬場景中產生合成數據,同時也發表了一個速度更優化的「Cosmos Transfers」版本。
此外,輝達也更新了其 Omniverse 軟體開發工具包,並公佈全新的神經重建庫。這其中包括一個先進的渲染技術庫,讓開發者能利用感測器資料在三維空間中模擬現實世界。
這一系列新技術的發布,不僅為機器人開發者提供了更強大的工具,也再次印證輝達將機器人領域視為繼 AI 資料中心之後的下一個關鍵成長引擎。
留言 0