害怕打開魔盒?Anthropic的史上最強模型完全不敢公開

Anthropic的史上最強模型完全不敢公開

模型能力與漏洞發現

Anthropic發佈的Claude Mythos Preview模型,被評估為史上最強AI模型之一,其在網絡安全領域的能力顯著超越現有公開模型。該模型在短短數週內自主發現數千個零日漏洞,覆蓋主流操作系統與瀏覽器,展現出遠超傳統AI的安全漏洞挖掘能力。

發佈策略與白名單機制

Anthropic並未將Claude Mythos Preview公開發布,而是通過Project Glasswing計劃,僅向一份白名單機構發放訪問權限。名單包括AWS、蘋果、谷歌、微軟、英偉達、博通、思科、CrowdStrike、摩根大通、Linux基金會及Palo Alto Networks等關鍵基礎設施單位,共計約50家機構。

該白名單並非隨機分配,而是基於“誰倒了最先牽動所有人”的邏輯設計,確保一旦關鍵系統被攻破,將引發廣泛連鎖反應。名單之外,Anthropic另撥400萬美元支持開源安全組織,用於提升維護團隊人力。

行業影響與未來趨勢

Anthropic明確指出,AI發展速度已遠超防禦能力,因此“這類能力不會長期停留在致力於安全部署的參與者手中”。公司判斷,開放模型的時間表已無法匹配漏洞修復所需的時間,因此選擇“鎖起來”以換取數月到一年的補丁窗口。

此舉標誌著AI領域首次出現“主動不發佈”的案例,打破了過去“發佈即證明”的行業慣例。未來將觀察白名單機構在使用Mythos Preview後,漏洞修復進度與行業是否跟進此模式。

Anthropic同時表示,正與美國政府就Mythos Preview能力進行溝通,並在軍用AI使用範圍上與國防部存在分歧,凸顯其在定義AI使用邊界上的主動立場。

來源:https://m.theblockbeats.info/news/61840

返回頂端