GPT-5.5 全球首破，0 源碼盲寫程序，編程 AI 進入新紀元

突破傳統編程測試地獄級基準

OpenAI 最新推出的 GPT-5.5 模型在編程能力上展現驚人突破，成功攻克了 ProgramBench 地獄級編程基準測試。該測試以往被視為 AI 的「白卷」試題，但 GPT-5.5 不僅全數通過，更展現出極強的自主推理能力。

在測試中，GPT-5.5 無需任何程式碼提示（0 源碼盲寫），直接從零開始完成複雜任務。它具備極強的自主性，能夠自行制定計劃、調用工具、核查結果，並在模糊邊界中做出正確判斷。這種能力標誌著編程 AI 正式進入新紀元，傳統依賴人工引導或大量資料的編程測試模式已顯陳舊。

在實際應用場景中，GPT-5.5 展現出驚人的效率。例如，一項原本需要博士花費 80 小時熬夜修改的複雜程式碼任務，GPT-5.5 僅用 1 小時 56 分鐘便徹底完成，表面效率提升約 40 倍。這顯示 AI 不僅在測試中表現優異，更在真實科研與開發流程中具備改變產業格局的潛力。