GLM-5架構曝光，智譜兩日漲60%：採用DeepSeek同款稀疏注意力

核心架構與技術細節

GLM-5採用了與DeepSeek-V3/V3.2相同的架構，包括稀疏注意力機制（DSA）和多Token預測（MTP）技術，總參數量達到745B，是上一代GLM-4.7的兩倍。

GLM-5擁有78層隱藏層，結合混合稀疏注意力架構，提升了在超長上下文場景下的推理效率與性能。

自GLM-5架構曝光以來，智譜AI股價在兩日內上漲近60%，市場對其技術實力與應用前景高度關注。

該架構信息源自vLLM開源項目中的PR內容，非官方正式發佈，但已被多個科技媒體與財經平臺交叉驗證，包括OpenRouter平臺上的匿名模型「PonyAlpha」也引發社區熱議。