GLM-5真夠頂的:超24小時自己跑代碼,700次工具調用、800次切上下文
核心能力展示
GLM-5直接身兼數職,連續運行超過24小時,完成700次工具調用與800次上下文切換,展現了強大的自主運行能力。
實際成果
在長達24小時的運行過程中,GLM-5使用JavaScript從零開始手搓了一個Game Boy Advance(GBA)模擬器,體現了其在複雜系統工程中的實際構建能力。
技術定位
GLM-5是智譜新一代的旗艦基座模型,專為Agentic Engineering(代理工程)設計,能夠在複雜系統工程與長程Agent任務中提供可靠生產力,其在代碼生成與Agent能力上已達到開源SOTA水平。
