GLM-5真夠頂的:超24小時自己跑代碼,700次工具調用、800次切上下文

GLM-5真夠頂的:超24小時自己跑代碼,700次工具調用、800次切上下文

核心能力展示

GLM-5直接身兼數職,連續運行超過24小時,完成700次工具調用與800次上下文切換,展現了強大的自主運行能力。

實際成果

在長達24小時的運行過程中,GLM-5使用JavaScript從零開始手搓了一個Game Boy Advance(GBA)模擬器,體現了其在複雜系統工程中的實際構建能力。

技術定位

GLM-5是智譜新一代的旗艦基座模型,專為Agentic Engineering(代理工程)設計,能夠在複雜系統工程與長程Agent任務中提供可靠生產力,其在代碼生成與Agent能力上已達到開源SOTA水平。

相關報道

來源:https://36kr.com/p/3680024630112129

返回頂端