LeCun的世界模型單GPU就能跑了

LeCun的世界模型單GPU就能跑了

核心進展

LeCun團隊最新推出的「世界模型」(LeWorldModel)基於JEPA架構,實現像素輸入直接預測未來,具備強大的世界建模能力。該模型通過自監督學習獲取常識,能夠實時重建、生成並模擬具有持久性、可交互且物理精確的世界。

技術特點

  • 採用JEPA架構,包含兩個編碼器:Context(上下文)與Target(目標),實現高效世界建模。
  • 訓練過程僅需62小時的機器人數據,大幅降低數據依賴。
  • 模型可在單張GPU上運行,速度極快,完整規劃僅需1秒。
  • 支持物理推理與動態世界模擬,具備實際應用潛力。

相關動態

李飛飛亦在近期訪談中強調,世界模型將是未來十年AI發展的關鍵方向,繼ImageNet推動深度學習革命後,具備空間智能的世界模型將引領AI進入新階段。

此外,商湯聯合創始人王曉剛領銜的「大曉機器人」也發佈了全球首個開源商業落地世界模型「開悟3.0」,進一步推動具身智能發展。

Meta團隊亦宣佈推出新世界模型,強調其在理解世界後可補全半張圖,提升AI的常識推理能力。

騰訊開源的FlashWorld模型,也實現了三維場景在單卡上的5~10秒生成,相較傳統方法提速百倍,支持單張圖片或文本輸入,並可在網頁端實時渲染。

來源:https://36kr.com/p/3736478187274500

返回頂端