分佈式AI實驗室Gradient發布Echo-2分佈式強化學習框架

分佈式AI實驗室Gradient發布Echo-2分佈式強化學習框架

框架目標與技術特色

Gradient 推出 Echo-2 分佈式強化學習框架,旨在打破 AI 研究訓練效率壁壘。該框架透過在架構層實現 Learner 與 Actor 的解耦,有效降低大模型的後訓練成本。

成本與性能優化

官方數據顯示,該框架可將 30B 模型的後訓練成本從 4500 美元降低至 425 美元,降幅顯著。

Echo-2 利用存算分離技術進行異步訓練(Async RL),支持將採樣算力卸載至不穩定顯卡實例與基於 Parallax 的異構顯卡,提升資源利用率與訓練彈性。

技術與未來發展

該框架配合有界陳舊性、實例容錯調度與自研 Lattica 技術,確保訓練過程穩定性與高效性。

Gradient 已計劃推出 RLaaS(強化學習即服務)平臺 Logits,並已面向學生與研究人員開放預約。

來源:https://m.theblockbeats.info/flash/332328

返回頂端