取代人類尚遠:BlockSec挑戰EVMBench在AI審計領域
AI審計的價值與人類角色
AI審計確實具有實際價值,但完全取代人類仍遠未實現。正確的方向是人類與AI的協作,而非單純的技術替代。
EVMBench的測試與侷限
EVMBench作為首個針對AI安全代理的嚴謹測試平臺,評估了AI在檢測與利用智慧合約漏洞方面的表現。然而,研究指出AI代理無法取代人類判斷力,僅能處理已知模式與提供上下文回應。
AI代理的價值定位
對於專業審計公司而言,AI代理提供的是補充價值,而非替代方案。它們能有效識別常見漏洞,但無法取代人類在複雜情境下的專業判斷與風險評估。
人類與AI的協作模式
AI的發展重點在於協助人類完成任務,而非取代人類。透過AI工具,人類可以更高效地執行工作,但系統控制權仍掌握在人類手中。
相關研究與論文
- Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security? – https://arxiv.org/html/2603.10795v1
- EVMbench: The First Real Benchmark for AI Security Agents – https://beam.ai/agentic-insights/openai-and-paradigms-evmbench-the-first-serious-test-for-ai-security-agents
- [PDF] Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security? – https://arxiv.org/pdf/2603.10795
