Opus 4.7 在編碼任務中勝出,Codex 致力拓展全能應用
Opus 4.7 編碼能力顯著提升
Anthropic 最新發布的 Opus 4.7 模型在編碼任務中展現出優異表現。根據官方通稿,該模型在 93 道編碼任務基準測試中,相比 Opus 4.6 提升了 13%。此外,Opus 4.7 成功解決了 Opus 4.6 與 Sonnet 4.6 均無法處理的四道高難度題目。
專家批評與市場反應
儘管編碼能力獲得了肯定,但 Opus 4.7 並未如預期般引發「編碼之王」的熱烈讚譽。教授 Ethan Mollick 批評其「自適應思考」機制存在偏見,導致在非編碼任務上的質量下降。市場上也有聲音質疑,當模型偶爾出現抽風或錯誤時,其高昂的費用是否值得。
Codex 的新定位與目標
針對 Codex 的表現,OpenAI 同日更新了其定位,強調新口號「Codex for (almost) everything」(適用於幾乎一切)。這顯示 OpenAI 希望 Codex 不僅限於編碼,而是能擴展至更廣泛的應用場景。
未來競爭格局
隨著 GPT-5.5 等新一代模型的出現,市場競爭日益激烈。GPT-5.5 在智能體編碼、電腦使用、知識工作等領域展現了強大能力,並被認為代表了當前智能體編碼能力的絕對前沿。這意味著 Opus 4.7 與 Codex 等模型仍需面對持續的技術迭代與挑戰。
