OpenAI後訓練工程師翁家翌，提出了AgenticAI時代的下一種範式假設

核心觀點

OpenAI工程師翁家翌最近做的實驗，提出了另一種可能：在明確目標、可運行環境和反饋閉環中，AI 不只可以通過訓練模型變強，也可以通過“自主改代碼”變強。

翁家翌提出了一種名為「Heuristic Learning（啟發式學習）」的強化學習新範式，其核心是當Coding Agent在執行任務時，能夠基於手寫規則系統（Heuristic System）進行持續迭代，從而在不依賴神經網絡的情況下，實現高效任務執行。

翁家翌指出，這種基於手寫規則與持續迭代的範式，可能在未來AI轉型期中，成為替代傳統深度強化學習的可行路徑，尤其在工程化與可解釋性方面具有顯著優勢。