GLM-5架構細節浮出水面：DeepSeek仍是繞不開的門檻

GLM-5技術架構與競爭力分析

基於社區測試和技術架構推演的結果，GLM-5在代碼生成和邏輯推理兩個場景中展現出顯著優勢和競爭力。其技術架構被證實與DeepSeek存在高度相似性，尤其在稀疏注意力機制方面採用相同設計。

有開發者指出，GLM-5複用DeepSeek的稀疏注意力架構（DSA），使其能夠直接受益於vLLM、SGLang等推理框架的優化，從而降低部署門檻與成本。上下文窗口支持最高可達202K token，大幅提升了長文本處理能力。

多源證據顯示，GLM-5採用DeepSeek的DSA架構，其中最強證據來自vLLM GitHub PR #34124，包含’GlmMoeDsaForCausalLM’的直接代碼實現，技術社區已一致確認該架構複用。

GLM-5的架構曝光引發市場關注，智譜AI在兩日內股價上漲近60%。該事件也反映出AI領域中技術架構的“複用”趨勢，成為行業競爭中的關鍵因素。