世界模型五大門派,圍攻光明頂
Meta 科學家定義世界模型競爭格局
Meta 研究科學家 Zhuokai Zhao 在 X 平臺分享了他所定義的世界模型「五大門派」,將當前世界模型的研究競爭格局比喻為金庸小說中的武俠場景。
五大門派具體內容
- OpenAI – Sora 路線:專注於高品質視頻生成的模型路線。
- 視頻生成派:另一類專注於視覺內容生成的技術路線。
- 預測派:專注於時間序列數據預測的模型。
- 規劃派:強調從預測走向可執行規劃的能力。
- 其他路線:涵蓋其他不同側重點的研究方向。
技術突破:V-JEPA 2 的表現
在相關技術討論中,V-JEPA 2 被視為當前路線的代表作。該模型擁有 12 億參數,基於 100 萬小時無標籤視頻進行預訓練。其最驚人的表現在於,僅需 62 小時的機器人數據,即可實現零樣本規劃動作,展現了從單純預測向可執行系統能力演進的趨勢。
研究趨勢:從預測走向規劃
文章分析指出,世界模型研究正從單純的未來預測,向具備可執行系統能力的方向發展。例如 HWM(分層世界模型)通過雙層規劃結構,解決了長時程控制中的誤差累積與搜索空間問題,標誌著該領域技術的進一步成熟。
