編程表現超越Claude和GPT？DeepSeek準備第二次震驚全世界

2026-05-09 01:52:08 / 1 閱讀所需時間

編程表現超越Claude和GPT？DeepSeek準備第二次震驚全世界

核心重點摘要

根據DeepSeek內部的基準測試，其新一代模型V4在編程任務上的表現已超越目前市場上的主流競品，包括Anthropic的Claude與OpenAI的GPT系列。

發布時間與技術背景

DeepSeek-V4預計於2026年農曆新年期間發布，內部測試顯示其編程能力已超越GPT與Claude等主流競品，並解決了多項長期困擾AI發展的技術難題。

技術創新與評價

DeepSeek透過MLA注意力機制、DeepSeekMoE架構、FP8訓練技術及純RL驅動等創新，實現大模型技術突破。
全網觀點顯示，65%認為V4已超越Claude，35%則認為Claude的霸主地位難以撼動。

相關來源與討論

該消息在多個媒體平臺引發熱議，包括36氪、新浪財經、網易、騰訊雲與虎嗅等，均報導DeepSeek-V4在編程能力上的突破。

值得注意的是，部分觀點指出DeepSeek的編程產出存在錯誤，無法編譯，與GPT與Claude相比仍有差距，顯示評價仍存分歧。

對比競品表現

Anthropic推出的Claude 4系列（Opus 4與Sonnet 4）在SWE-bench測試中取得72.5%高分，並能連續自動編程7小時，顯示其在編程領域亦具備強大能力。

來源：https://36kr.com/p/3632848818057736