上海AI Lab新研究：SFT能泛化，只要滿足這三個條件

2026-05-12 15:45:45 / 1 閱讀所需時間

上海AI Lab新研究：SFT能泛化，只要滿足這三個條件

SFT泛化能力的條件性分析

SFT的泛化能力並未缺失，它不是由算法目標本身單一決定，而是受優化過程（Optimization）、數據品質與結構（Data）以及模型基礎能力（Model Capability）共同制約。

三個關鍵條件說明

優化過程（Optimization）：訓練過程中的優化步數與動力學對SFT的泛化能力有顯著影響。
數據品質與結構（Data）：訓練數據的品質與結構若不佳，將嚴重限制SFT的跨領域泛化表現。
基座模型能力（Model Capability）：模型本身的基礎能力是決定SFT能否有效泛化的關鍵因素。

研究意義與影響

該研究打破了關於SFT的單一敘事，指出跨領域泛化能力具有條件性，並從優化動力學、訓練數據與基座模型能力三個維度重新界定了SFT在推理場景下的泛化邊界。

來源：https://36kr.com/p/3805920801594883