Claude Opus 4.7 深夜炸場,勝任更長任務、自主檢查,視覺能力拉滿

Claude Opus 4.7 更新亮點與能力突破

多模態視覺能力顯著增強

Claude Opus 4.7 在視覺解析能力上實現了重大突破,對高分辨率圖像的支持能力大幅提升。該模型現在可以接受長邊最高 2576 像素(約 375 萬像素)的圖像,此能力是此前 Claude 模型的 3 倍以上。這一改進使得模型在處理複雜的圖表、文檔、設計稿時,準確率可達 98.5%,讓「看圖說話」變得更加可靠。

長任務處理與自主性提升

在處理長週期任務方面,Opus 4.7 展現了更強的自主性。它能夠更嚴格地處理擴展的工作流程,更精確地遵循指令,並在提供最終結果之前進行自我驗證。這種「自我檢查」機制顯著降低了錯誤率,特別適合需要高度精確度的複雜工程任務。

編程與邏輯推理能力躍升

該模型在高級軟體工程領域相比 Opus 4.6 有顯著提升,特別是在處理最複雜的任務時表現出色。在 SWE-bench Verified 測試中,其成績達到 87.6%,而在特定測試中邏輯推理能力提升了 20.4%,編碼修復能力也達到了 64%。這些數據顯示 Opus 4.7 在邏輯推理與程式碼生成方面已具備極高的水準。

返回頂端