LISABench 2026 開年首測，七大頂尖 AI 模型角逐 Web3 漏洞檢測之王

2026-01-05 11:30:09 / 1 閱讀所需時間

LISABench 2026 開年首測，七大頂尖 AI 模型角逐 Web3 漏洞檢測之王

概述

根據 PANews 1 月 5 日消息，LISABench 今日宣布啟動 2026 年第一季度評估，透過實戰測試，決定在 Web3 智能合約漏洞檢測領域表現最強的前沿 AI 模型。此外，LISABench 同步開展了社群投票預測的獎勵活動，並在 GitHub 公開評測標準代碼庫，供開發者查閱與重現。

參與模型

目前，評測陣容豪華，集結了以下全球頂尖的 7 大前沿模型（Frontier Models）進行同台競技：KIMI K2（Moonshot AI）、DeepSeek V3.2（深度求索）、QWen 3 30b-a3b（阿里雲）、GLM 4.6（智譜 AI）、GPT-5.2（OpenAI）、Gemini-3-pro-preview（Google）與 Claude 4.5 Sonnet（Anthropic）等。

後續進展

目前，針對 Q1 季度獲勝者的預測投票通道已開啟；另外，評測標準與相關程式庫已在 GitHub 開源，方便開發者查閱與重現測試過程。

來源：https://www.panewslab.com/zh/articles/51813baa-391b-412d-8507-b15188bc3e89