GLM-5架構曝光,智譜兩日漲60%:採用DeepSeek同款稀疏注意力

GLM-5架構曝光,智譜兩日漲60%:採用DeepSeek同款稀疏注意力

核心架構與技術細節

GLM-5採用了與DeepSeek-V3/V3.2相同的架構,包括稀疏注意力機制(DSA)和多Token預測(MTP)技術,總參數量達到745B,是上一代GLM-4.7的兩倍。

模型結構與層數

GLM-5擁有78層隱藏層,結合混合稀疏注意力架構,提升了在超長上下文場景下的推理效率與性能。

市場反應與股價表現

自GLM-5架構曝光以來,智譜AI股價在兩日內上漲近60%,市場對其技術實力與應用前景高度關注。

信息來源與驗證

該架構信息源自vLLM開源項目中的PR內容,非官方正式發佈,但已被多個科技媒體與財經平臺交叉驗證,包括OpenRouter平臺上的匿名模型「PonyAlpha」也引發社區熱議。

來源:https://36kr.com/p/3677387286438530

返回頂端