OpenClaw代理任務評測:Gemini 3 Flash成功率95.1%,GPT-4o為85.2%

OpenClaw代理任務評測:Gemini 3 Flash成功率95.1%,GPT-4o為85.2%

評測重點

PANews 3月8日訊,慢霧 CISO 23pads 在 X 平臺發文表示,PinchBench 基準測試評估 AI 大語言模型在 OpenClaw 代理任務中的表現,結果顯示 Gemini 3 Flash 處理 OpenClaw 任務成功率以 95.1% 領先,minimax-m2.1、kimi-k2.5 則分別以 93.6%、93.4% 分列第 2、第 3 位。Claude Sonnet 4.5 為 92.7%,GPT-4o 為 85.2%。

來源資訊

此評測內容由 PANews 提供,並在多個加密貨幣與科技新聞平臺如 TradingView、CoinGecko 及 Odaily 星球日報中被引用。

相關連結

來源:https://www.panewslab.com/zh/articles/019ccb7d-0fcb-76cd-8a83-e984fc86b157

返回頂端