英偉達Jim Fan:「世界建模」是新一代預訓練範式
世界建模的定義與核心理念
Jim Fan指出,「世界建模」是一種新的預訓練範式,其核心是從預測下一個詞,轉向預測下一個世界狀態。在這一範式下,模型需要在給定動作條件下,學習世界將如何合理地演化。
當前AI預訓練範式的演進路徑
目前以大語言模型(LLM)為代表的AI模型主要基於「對下一詞的預測」,這是第一代預訓練範式。儘管取得了巨大成功,但在將其應用於物理世界時,出現了明顯的侷限性。
2026年將成為大世界模型元年
Jim Fan認為,2026年將成為大世界模型(Large World Model)的元年。他指出,Helix、GR00T N1及π0等模型已在2025年推出,而更貼合視頻世界模型預訓練目標的技術方案,將在2026年迎來下一代大型模型的表現。
世界建模的應用場景與挑戰
世界建模旨在解決「物理圖靈測試」(Physical Turing Test)這一AI的終極挑戰。Jim Fan強調,該範式將推動AI在真實物理世界中的行為模擬與決策能力,視頻生成模型是其中的一種實例化體現。
相關技術發展與團隊投入
英偉達已組建30人團隊,專注於世界建模研究。Jim Fan表示,他正全身心投入一個單一使命:為機器人解決「物理圖靈測試」,並認為這一方向是AI的下一個關鍵突破點。
