LeCun的世界模型單GPU就能跑了

核心進展

LeCun團隊最新推出的「世界模型」（LeWorldModel）基於JEPA架構，實現像素輸入直接預測未來，具備強大的世界建模能力。該模型通過自監督學習獲取常識，能夠實時重建、生成並模擬具有持久性、可交互且物理精確的世界。

李飛飛亦在近期訪談中強調，世界模型將是未來十年AI發展的關鍵方向，繼ImageNet推動深度學習革命後，具備空間智能的世界模型將引領AI進入新階段。

此外，商湯聯合創始人王曉剛領銜的「大曉機器人」也發佈了全球首個開源商業落地世界模型「開悟3.0」，進一步推動具身智能發展。

Meta團隊亦宣佈推出新世界模型，強調其在理解世界後可補全半張圖，提升AI的常識推理能力。

騰訊開源的FlashWorld模型，也實現了三維場景在單卡上的5～10秒生成，相較傳統方法提速百倍，支持單張圖片或文本輸入，並可在網頁端實時渲染。