Anthropic的史上最強模型完全不敢公開

模型能力與漏洞發現

Anthropic發佈的Claude Mythos Preview模型，被評估為史上最強AI模型之一，其在網絡安全領域的能力顯著超越現有公開模型。該模型在短短數週內自主發現數千個零日漏洞，覆蓋主流操作系統與瀏覽器，展現出遠超傳統AI的安全漏洞挖掘能力。

發佈策略與白名單機制

Anthropic並未將Claude Mythos Preview公開發布，而是通過Project Glasswing計劃，僅向一份白名單機構發放訪問權限。名單包括AWS、蘋果、谷歌、微軟、英偉達、博通、思科、CrowdStrike、摩根大通、Linux基金會及Palo Alto Networks等關鍵基礎設施單位，共計約50家機構。

該白名單並非隨機分配，而是基於“誰倒了最先牽動所有人”的邏輯設計，確保一旦關鍵系統被攻破，將引發廣泛連鎖反應。名單之外，Anthropic另撥400萬美元支持開源安全組織，用於提升維護團隊人力。

行業影響與未來趨勢

Anthropic明確指出，AI發展速度已遠超防禦能力，因此“這類能力不會長期停留在致力於安全部署的參與者手中”。公司判斷，開放模型的時間表已無法匹配漏洞修復所需的時間，因此選擇“鎖起來”以換取數月到一年的補丁窗口。

此舉標誌著AI領域首次出現“主動不發佈”的案例，打破了過去“發佈即證明”的行業慣例。未來將觀察白名單機構在使用Mythos Preview後，漏洞修復進度與行業是否跟進此模式。

Anthropic同時表示，正與美國政府就Mythos Preview能力進行溝通，並在軍用AI使用範圍上與國防部存在分歧，凸顯其在定義AI使用邊界上的主動立場。

來源：https://m.theblockbeats.info/news/61840

害怕打開魔盒？Anthropic的史上最強模型完全不敢公開

Anthropic的史上最強模型完全不敢公開

模型能力與漏洞發現

發佈策略與白名單機制

行業影響與未來趨勢

訂閱電子報

Company

Categories

聯絡我們

Anthropic的史上最強模型完全不敢公開

模型能力與漏洞發現

發佈策略與白名單機制

行業影響與未來趨勢

相關文章

訂閱電子報

Company

Categories

聯絡我們