LeCun的世界模型單GPU就能跑了

核心技術與架構

LeCun團隊推出的LeWorldModel，基於JEPA（Joint Embedding and Prediction Architecture）架構，實現像素輸入直接預測未來的目標。該模型透過將常見的JEPA組件拆解為模組化設計，讓研究者能在單塊GPU的規模下複現實驗與進行消融分析。

該世界模型在CIFAR-10數據集上已成功運行，完整訓練流程僅需1秒，速度極快，遠超傳統模型。即使使用較低階的GPU（如3090），也能實現基本運行，僅需稍作調整即可。

世界模型能實時重建、生成並模擬具有持久性、可交互且物理精確的世界，將徹底改變從媒體到機器人技術等各個領域。LeCun團隊近期也發表三篇論文，針對非生成式世界模型在高效自主智能系統（AMI）中的應用，提出正則化目標修正、梯度軌跡優化與輕量化工程實現等解決方案。

Yann LeCun對大語言模型（LLM）持懷疑態度，認為世界模型才是通往通用智能的關鍵。他已為AMI Labs籌集10.3億美元資金。同時，李飛飛的World Labs也融資超過10億美元，專注於推動世界模型發展。