編程表現超越Claude和GPT?DeepSeek準備第二次震驚全世界
核心重點摘要
根據DeepSeek內部的基準測試,其新一代模型V4在編程任務上的表現已超越目前市場上的主流競品,包括Anthropic的Claude與OpenAI的GPT系列。
發布時間與技術背景
DeepSeek-V4預計於2026年農曆新年期間發布,內部測試顯示其編程能力已超越GPT與Claude等主流競品,並解決了多項長期困擾AI發展的技術難題。
技術創新與評價
- DeepSeek透過MLA注意力機制、DeepSeekMoE架構、FP8訓練技術及純RL驅動等創新,實現大模型技術突破。
- 全網觀點顯示,65%認為V4已超越Claude,35%則認為Claude的霸主地位難以撼動。
相關來源與討論
該消息在多個媒體平臺引發熱議,包括36氪、新浪財經、網易、騰訊雲與虎嗅等,均報導DeepSeek-V4在編程能力上的突破。
值得注意的是,部分觀點指出DeepSeek的編程產出存在錯誤,無法編譯,與GPT與Claude相比仍有差距,顯示評價仍存分歧。
對比競品表現
Anthropic推出的Claude 4系列(Opus 4與Sonnet 4)在SWE-bench測試中取得72.5%高分,並能連續自動編程7小時,顯示其在編程領域亦具備強大能力。
