OpenClaw代理任務評測:Gemini 3 Flash成功率95.1%,GPT-4o為85.2%
評測重點
PANews 3月8日訊,慢霧 CISO 23pads 在 X 平臺發文表示,PinchBench 基準測試評估 AI 大語言模型在 OpenClaw 代理任務中的表現,結果顯示 Gemini 3 Flash 處理 OpenClaw 任務成功率以 95.1% 領先,minimax-m2.1、kimi-k2.5 則分別以 93.6%、93.4% 分列第 2、第 3 位。Claude Sonnet 4.5 為 92.7%,GPT-4o 為 85.2%。
來源資訊
此評測內容由 PANews 提供,並在多個加密貨幣與科技新聞平臺如 TradingView、CoinGecko 及 Odaily 星球日報中被引用。
相關連結
- OpenClaw代理任務評測:Gemini 3 Flash成功率95.1%,GPT-4o為85.2%
- 「麻吉」以太坊多單再遭部分強平,累計虧損已近3000萬美元
- 23pds (山哥) (@im23pds) / Posts / X
- PANews Web3丨加密貨幣丨區塊鏈新聞頻道 – Telegram
- Odaily星球日報
- CoinGecko(幣虎)消息:加密貨幣和區塊鏈的頭版頭條
- 最新加密貨幣市場新聞
- Aster價格ASTER實時價格圖表、市值與今日新聞 – CoinGecko
- 今日市場新聞:股票、加密貨幣、外匯 – TradingView
- Nodepay價格:NC價格圖表、市值與今日新聞 – CoinGecko
來源:https://www.panewslab.com/zh/articles/019ccb7d-0fcb-76cd-8a83-e984fc86b157
