上海AI Lab新研究:SFT能泛化,只要滿足這三個條件
SFT泛化能力的條件性分析
SFT的泛化能力並未缺失,它不是由算法目標本身單一決定,而是受優化過程(Optimization)、數據品質與結構(Data)以及模型基礎能力(Model Capability)共同制約。
三個關鍵條件說明
- 優化過程(Optimization):訓練過程中的優化步數與動力學對SFT的泛化能力有顯著影響。
- 數據品質與結構(Data):訓練數據的品質與結構若不佳,將嚴重限制SFT的跨領域泛化表現。
- 基座模型能力(Model Capability):模型本身的基礎能力是決定SFT能否有效泛化的關鍵因素。
研究意義與影響
該研究打破了關於SFT的單一敘事,指出跨領域泛化能力具有條件性,並從優化動力學、訓練數據與基座模型能力三個維度重新界定了SFT在推理場景下的泛化邊界。
