神秘模型「Pony Alpha」火了,被曝是GLM-5
模型背景與發佈信息
OpenRouter於2月6日上線了一個代號為「Pony Alpha」的測試模型,引發廣泛討論。該模型在公開頁面中展示具備20萬上下文長度,前端設計採用one-shot模式,被用戶廣泛測試與評價。
專家與用戶推測
多位科技博主與網友推測,Pony Alpha極有可能是國產大模型GLM-5。其推測依據包括:
- 模型在生成內容中偶爾出現GLM的訓練數據痕跡,例如提及訓練數據截止至2024年中後期。
- 在編碼與agentic能力方面,明顯優於GLM-4,符合智譜AI此前宣傳的GLM-5核心能力。
- 有用戶在測試中發現,模型在生成天氣信息時表現良好,但生成代碼時存在卡頓現象,符合國產模型的典型特徵。
相關技術背景
GLM-5是智譜AI推出的新一代大語言模型,結合了自迴歸與擴散解碼器的混合架構,是首個在國產昇騰Atlas 800T A2芯片上完成全流程訓練的SOTA多模態模型,具備強大的語言理解與生成能力。
