英偉達兩篇論文,帶來了VLA之後具身智能的新範式

英偉達兩篇論文,帶來了VLA之後具身智能的新範式

核心突破:世界動作模型(WAM)新範式

英偉達提出世界動作模型(WAM)新範式,突破當前主流VLA模型在物理泛化上的侷限。WAM通過端到端聯合預測視頻與動作,學習物理規律,實現更強的零樣本與跨機體泛化能力,顯著提升機器人在複雜環境中的適應性。

關鍵論文:DreamZero 與 DreamDojo

英偉達於2026年初發布的兩篇論文《DreamZero》和《DreamDojo》提出了一種新範式,強調從視頻中學習,能夠實現零樣本泛化,打破了數據不足的侷限,為具身智能提供了更高效、更通用的訓練路徑。

技術意義:從“感知”到“世界建模”

世界建模(world modeling)是在給定一個動作的條件下,預測下一個合理的世界狀態(或一段更長時間範圍內的世界演化),使機器人能夠像人一樣“先思後行”,顯著提升在複雜、長時序任務中的可靠性和智能水平。

行業影響與趨勢

  • VLA作為新一代通用機器人基礎模型,開啟了具身智能新的交互與推理範式。
  • 該範式推動機器人從“專用模型”向“通用世界模型”演進,實現更高效、更靈活的物理世界交互。
  • 相關研究已引發全球具身智能領域的廣泛關注,成為技術發展的重要里程碑。

來源:https://36kr.com/p/3678616267874953

返回頂端