GLM-5架構曝光,智譜兩日漲60%:採用DeepSeek同款稀疏注意力
核心架構與技術細節
GLM-5採用了與DeepSeek-V3/V3.2相同的架構,包括稀疏注意力機制(DSA)和多Token預測(MTP)技術,總參數量達到745B,是上一代GLM-4.7的兩倍。
模型結構與層數
GLM-5擁有78層隱藏層,結合混合稀疏注意力架構,提升了在超長上下文場景下的推理效率與性能。
市場反應與股價表現
自GLM-5架構曝光以來,智譜AI股價在兩日內上漲近60%,市場對其技術實力與應用前景高度關注。
信息來源與驗證
該架構信息源自vLLM開源項目中的PR內容,非官方正式發佈,但已被多個科技媒體與財經平臺交叉驗證,包括OpenRouter平臺上的匿名模型「PonyAlpha」也引發社區熱議。
