LeCun的世界模型單GPU就能跑了
核心進展
LeCun團隊最新推出的「世界模型」(LeWorldModel)基於JEPA架構,實現像素輸入直接預測未來,具備強大的世界建模能力。該模型通過自監督學習獲取常識,能夠實時重建、生成並模擬具有持久性、可交互且物理精確的世界。
技術特點
- 採用JEPA架構,包含兩個編碼器:Context(上下文)與Target(目標),實現高效世界建模。
- 訓練過程僅需62小時的機器人數據,大幅降低數據依賴。
- 模型可在單張GPU上運行,速度極快,完整規劃僅需1秒。
- 支持物理推理與動態世界模擬,具備類人智能潛力。
應用前景
這類世界模型將徹底改變從媒體內容生成到機器人技術等多領域,為具身智能與自主決策提供基礎支持。
