Opus 4.7 在編碼任務中勝出，Codex 致力拓展全能應用

Opus 4.7 編碼能力顯著提升

Anthropic 最新發布的 Opus 4.7 模型在編碼任務中展現出優異表現。根據官方通稿，該模型在 93 道編碼任務基準測試中，相比 Opus 4.6 提升了 13%。此外，Opus 4.7 成功解決了 Opus 4.6 與 Sonnet 4.6 均無法處理的四道高難度題目。

儘管編碼能力獲得了肯定，但 Opus 4.7 並未如預期般引發「編碼之王」的熱烈讚譽。教授 Ethan Mollick 批評其「自適應思考」機制存在偏見，導致在非編碼任務上的質量下降。市場上也有聲音質疑，當模型偶爾出現抽風或錯誤時，其高昂的費用是否值得。

針對 Codex 的表現，OpenAI 同日更新了其定位，強調新口號「Codex for (almost) everything」（適用於幾乎一切）。這顯示 OpenAI 希望 Codex 不僅限於編碼，而是能擴展至更廣泛的應用場景。

隨著 GPT-5.5 等新一代模型的出現，市場競爭日益激烈。GPT-5.5 在智能體編碼、電腦使用、知識工作等領域展現了強大能力，並被認為代表了當前智能體編碼能力的絕對前沿。這意味著 Opus 4.7 與 Codex 等模型仍需面對持續的技術迭代與挑戰。