LISABench 2026 開年首測,七大頂尖 AI 模型角逐 Web3 漏洞檢測之王

LISABench 2026 開年首測,七大頂尖 AI 模型角逐 Web3 漏洞檢測之王

概述

根據 PANews 1 月 5 日消息,LISABench 今日宣布啟動 2026 年第一季度評估,透過實戰測試,決定在 Web3 智能合約漏洞檢測領域表現最強的前沿 AI 模型。此外,LISABench 同步開展了社群投票預測的獎勵活動,並在 GitHub 公開評測標準代碼庫,供開發者查閱與重現。

參與模型

目前,評測陣容豪華,集結了以下全球頂尖的 7 大前沿模型(Frontier Models)進行同台競技:KIMI K2(Moonshot AI)、DeepSeek V3.2(深度求索)、QWen 3 30b-a3b(阿里雲)、GLM 4.6(智譜 AI)、GPT-5.2(OpenAI)、Gemini-3-pro-preview(Google)與 Claude 4.5 Sonnet(Anthropic)等。

後續進展

目前,針對 Q1 季度獲勝者的預測投票通道已開啟;另外,評測標準與相關程式庫已在 GitHub 開源,方便開發者查閱與重現測試過程。

來源:https://www.panewslab.com/zh/articles/51813baa-391b-412d-8507-b15188bc3e89

返回頂端