Anthropic新產品,強大到能讓AI Agent基礎設施團隊失業?

它是什麼?和 Claude Code 有什麼區別?

產品定位與運行環境

Claude Code 跑在你自己的電腦上,是給開發者個人用的命令行工具。你關了電腦,它就停了。

Claude Managed Agents 跑在 Anthropic 的雲上,是給企業用的 API 服務。它可以 24 小時不間斷運行,斷線了也不丟進度,你的產品可以直接內嵌智能體能力。

典型應用場景

· 事件觸發型:系統發現 bug,自動派智能體修復並提 PR,中間不需要人介入。

· 定時型:每天早上自動生成 GitHub 活動摘要或團隊工作簡報。

· 即發即忘型:在 Slack 裡給智能體派個活,它做完把表格、PPT、App 交回來。

· 長時間任務型:跑幾個小時的深度研究或代碼重構。

與企業自建智能體基礎設施的對比

能自己搭,但很貴很慢。

一個能上線的智能體,需要的東西遠比「調一下 API」多得多:沙盒環境(sandbox,一個隔離的安全空間,AI 在裡面跑代碼、改文件,不管怎麼折騰都不會影響外面的真實系統,相當於給 AI 一臺專用虛擬電腦)、憑證管理、狀態恢復、權限控制、全鏈路追蹤……

很多企業客戶之前需要一整個工程師團隊專門搞這些。現在開箱即用,工程師可以去做產品真正核心的部分。

技術架構演進:大腦與手分離

最早他們把所有東西塞進一個容器:AI 的推理循環、代碼執行環境、會話記錄,全在一起。

好處是簡單,壞處是雞蛋全在一個籃子裡,容器一掛,整個會話就丟了,而且沒法單獨替換某個部分。

後來他們做了一個關鍵拆分:

· 「大腦」是 Claude 和它的調度框架,負責思考和決策。

· 「手」是沙盒和各種工具,負責執行具體操作。

· 「記憶」是獨立的會話日誌,記錄發生的一切。

三者互不依賴,任何一個掛了都不影響其他兩個。

這個拆分帶來幾個實際好處:

不是每個任務都需要啟動完整的沙盒環境,現在只有 AI 真的需要跑代碼時才按需啟動。首次響應延遲中位數降了約 60%,極端情況降了超過 90%。

安全

AI 生成的代碼跑在沙盒裡,而訪問外部系統的憑證存在沙盒外面的安全保險箱裡,兩邊物理隔離。比如訪問 Git 倉庫,系統初始化時就把代碼克隆好了,AI 正常用 git push/pull,但 Token 本身對 AI 不可見。對於 Slack、Jira 這類服務,通過 MCP 協議接入,請求經過代理層,代理層去保險箱取憑證調服務,AI 全程不經手憑證。

靈活

大腦不關心手是什麼。工程博客裡有句話很有意思:調度框架不知道沙盒到底是一個容器、一部手機、還是一個寶可夢模擬器。只要符合「名字和輸入進去,字符串出來」的接口就行。

這也意味著多個大腦可以共享手,一個大腦可以把手交給另一個大腦,為多智能體協作打下了基礎。

侷限性

Managed Agents 並不是萬能的。幾個需要注意的點:

部分功能還在研究預覽階段。多智能體協作、高級記憶工具、自我評估迭代(讓智能體自己判斷任務完成質量並反覆改進)這些能力目前還沒有全面開放,需要申請才能使用。

平臺綁定。選擇 Managed Agents 意味著你的智能體基礎設施綁在了 Anthropic 生態裡。如果未來想換模型或換平臺,遷移成本不可忽視。

上下文管理仍然是難題。雖然會話日誌獨立存儲,但長時間任務中哪些信息該保留、哪些該丟棄,仍然涉及不可逆的決策。這是一個持續挑戰,他們目前的做法是把上下文存儲和上下文管理分開:存儲保證不丟,管理策略隨模型進化調整。

成本可預測性。0.08 美元/會話小時聽起來不多,但智能體跑幾個小時的複雜任務,Token 消耗加上運行時費用,成本可能不低。企業需要做好預算評估。

誰在用?怎麼用的?

Notion 讓用戶在工作區裡直接把編碼、做 PPT、整理表格這些活扔給 Claude,幾十個任務並行跑,整個團隊在同一個輸出上協作。Notion 產品經理 Eric Liu 說,用戶可以把開放式的複雜任務直接委託出去,不用離開 Notion。

Sentry 做了「從發現 bug 到提交修復代碼」的全自動流程。他們的 AI debug 工具 Seer 找到問題根因後,Claude 直接寫補丁、開 PR(代碼提交合並請求)。工程總監 Indragie Karunaratne 說,幾周就上線了,還省掉了持續維護自建基礎設施的運營開銷。

Atlassian 把它接進了 Jira,開發者可以直接在 Jira 裡把任務分配給 Claude 智能體。

Asana 做了 AI Teammates,在項目管理里加入 AI 協作者,能接任務、交付物。

General Legal(法律科技公司)的玩法最有趣:他們的智能體能根據用戶的提問,臨時寫工具來查數據。以前每個用戶問題都得提前預判並開發檢索工具,現在智能體自己按需生成。CTO 說開發時間縮短了 10 倍。

Rakuten 在工程、產品、銷售、市場、財務各部門都部署了專項智能體,每個一週內上線,通過 Slack 和 Teams 接任務,交回來的是表格、PPT、App 這些實際交付物。

市場與行業影響

看起來 Managed Agents 走的是 AWS 當年的老路:先有了計算能力,然後把運行環境也包了。

十年前企業糾結「上不上雲」,現在糾結「Agent 基礎設施自建還是託管」。歷史經驗告訴我們,大多數企業最終會選擇託管,因為基礎設施從來不是核心競爭力。

OpenAI 也推出了自己的 Agent 平臺 Frontier,這個賽道的競爭剛剛開始。

從技術角度看,「大腦和手分離」這個架構思路值得關注。它讓系統的每個部分都可以獨立演進:模型升級了,換大腦;需要新工具,加一雙手;存儲方案改了,替換記憶層。

工程博客裡的類比說得好:操作系統的 read() 命令不關心底下是 1970 年代的磁盤還是現代 SSD,抽象層穩定了,底下的實現隨便換。

從使用角度看,如果你是企業開發者,想在自己的產品裡嵌入 AI 智能體能力,Managed Agents 可能會省掉你幾個月的基礎設施工作。

六種語言(Python、TypeScript、Java、Go、Ruby、PHP)有 SDK 支持。如果你已經在用 Claude Code,更新到最新版,輸入 /claude-api managed-agents-onboarding 就能開始。

如果你是普通 AI 愛好者,短期內最直觀的感受可能是:你用的那些 SaaS 產品裡,會有越來越多的 AI 智能體在後臺幫你幹活,而這些智能體很可能就跑在 Managed Agents 上。

定價參考:Token 費用按 Anthropic API 標準價格,運行時 0.08 美元/會話小時(空閒不計費),網頁搜索 10 美元/千次。

相關鏈接

返回頂端