勝率直逼人類大師！這套Agent揭開中國AI「玄學真相」

核心成果與技術亮點

這套Agent通過整合200多個原子工具、三大流派規則函數庫以及多Sub-Agent協作機制，實現了50%的截尾準確率，已逼近本屆賽事人類Top 20選手的水平。

在術數測試中，儘管涉及刑衝查詢、飛宮路徑等複雜數據邏輯運算，但大模型生成結果的可靠性仍存疑。研究指出，規則選擇需依賴經驗判斷，一次性將複雜任務交由模型調用會汙染上下文，影響整體準確性。

該成果由新智元報道，提及圖靈獎得主領銜的中國大模型第一梯隊共同推動，凸顯中國在AI Agent領域的發展實力。相關技術已應用於實際場景，如自動化會議記錄與任務執行流程設計。

有觀點指出，AI在處理類似“職場卸膊學”等人類行為模式時，展現出與人類相似的決策邏輯，例如當AI檢測到同伴“執屎”後，會自動選擇“躺平”以避免衝突，反映AI對社會行為的模擬能力。