GPT-5.5 全球首破,0 源碼盲寫程序,編程 AI 進入新紀元
突破傳統編程測試地獄級基準
OpenAI 最新推出的 GPT-5.5 模型在編程能力上展現驚人突破,成功攻克了 ProgramBench 地獄級編程基準測試。該測試以往被視為 AI 的「白卷」試題,但 GPT-5.5 不僅全數通過,更展現出極強的自主推理能力。
零碼源盲寫與自主規劃能力
在測試中,GPT-5.5 無需任何程式碼提示(0 源碼盲寫),直接從零開始完成複雜任務。它具備極強的自主性,能夠自行制定計劃、調用工具、核查結果,並在模糊邊界中做出正確判斷。這種能力標誌著編程 AI 正式進入新紀元,傳統依賴人工引導或大量資料的編程測試模式已顯陳舊。
效率提升與科研奇點
在實際應用場景中,GPT-5.5 展現出驚人的效率。例如,一項原本需要博士花費 80 小時熬夜修改的複雜程式碼任務,GPT-5.5 僅用 1 小時 56 分鐘便徹底完成,表面效率提升約 40 倍。這顯示 AI 不僅在測試中表現優異,更在真實科研與開發流程中具備改變產業格局的潛力。
