分佈式AI實驗室Gradient發布Echo-2分佈式強化學習框架
框架目標與技術特色
Gradient 推出 Echo-2 分佈式強化學習框架,旨在打破 AI 研究訓練效率壁壘。該框架透過在架構層實現 Learner 與 Actor 的解耦,有效降低大模型的後訓練成本。
訓練成本與算力優化
官方數據顯示,該框架可將 30B 模型的後訓練成本從 4500 美元降低至 425 美元,節省超過 80%。Echo-2 利用存算分離技術進行異步訓練(Async RL),支持將採樣算力卸載至不穩定顯卡實例與基於 Parallax 的異構顯卡。
技術與未來發展
該框架配合有界陳舊性、實例容錯調度與自研 Lattica 技術,提升訓練穩定性與效率。Gradient 亦計劃推出 RLaaS(強化學習即服務)平臺 Logits,目前已面向學生與研究人員開放預約。
