把 AI 變成個人執行系統,Claude 最新 Managed Agents 實踐手冊

Claude Managed Agents:將 AI 從一次性回應轉化為持續運行的執行系統

產品核心概念

Claude Managed Agents 是一套預構建、可配置的智能體運行框架(agent harness),運行在託管基礎設施之上。與過去依賴 messages API 並需自行構建運行框架(harness)不同,Managed Agents 將智能(模型與運行框架)、執行(工具與沙箱)與過程(會話與日誌)徹底解耦。開發者只需將智能體定義為模板(包含工具、技能、文件/代碼倉庫等),其餘的運行框架和基礎設施均由系統提供。

為什麼需要 Managed Agents

隨著 Claude 能力的快速演進,基於 messages API 構建的智能體面臨兩大挑戰:

  1. 運行框架需持續更新:舊有的運行框架常隱含關於「Claude 做不到什麼」的假設,隨著模型能力提升,這些假設會成為性能瓶頸,迫使框架不斷更新。
  2. 任務週期變長:Claude 能處理的任務時間跨度呈指數級增長(超過 10 小時人類工作量),對基礎設施的安全性、長時間運行的穩定性(應對故障)及可擴展性提出更高要求。

Managed Agents 旨在解決這些問題,讓智能體能像基礎設施單元一樣,在數天、數周甚至數月的時間尺度上持續運行並處理複雜問題。

核心概念解析

使用 Managed Agents 時需理解三個核心概念:

  • Agent(智能體):一個帶版本管理的配置,定義智能體的「身份」,包括模型、system prompt、工具、技能、MCP 伺服器等。創建後可通過 ID 反覆調用。
  • Environment(環境):描述為智能體工具運行所提供的沙箱模板(如運行時類型、網絡策略、依賴包配置等)。
  • Session(會話):一次有狀態的運行實例。基於預先創建的 agent 配置和 environment 啟動,會從環境模板生成新沙箱,掛載所需資源(如文件、GitHub 倉庫),並將認證信息安全存儲。

簡言之:Agent = 配置本身;Environment = 沙箱模板;Session = 具體執行過程。

常見使用模式

Managed Agents 支持多種運行模式,使 AI 具備「持續工作」的能力:

  1. 事件觸發(Event-triggered):由服務觸發執行任務。例如檢測到 Bug 時,自動調用智能體修復並提交 PR,無需人工介入。
  2. 定時執行(Scheduled):設置定時任務。例如生成每日簡報(X 平臺或 GitHub 動態匯總)。
  3. 一次觸發、無需跟進(Fire-and-forget):人類觸發後無需持續參與。例如通過 Slack 或 Teams 分配任務,智能體自動完成並返回結果(表格、幻燈片或應用程序)。
  4. 長週期任務(Long-horizon tasks):長時間運行的任務。例如研究如何將特定庫應用於工程博客內容,或進行多智能體協同。

接入方式與工具

目前提供兩種主要接入方式:

  • SDK(面向代碼):在應用中引入 SDK,在運行時驅動 session。目前支持 Python、TypeScript、Java、Go、Ruby、PHP 等 6 種語言。
  • CLI(面向終端):通過命令行操作所有 API 資源(agents、environments、sessions、vaults、skills、files 等)。建議使用 CLI 完成配置與初始化,用 SDK 處理運行時邏輯。

開發者可通過 CLI 創建並存儲 Agent 模板(例如使用 YAML 定義),然後在部署流程中應用。

架構優勢與未來展望

Managed Agents 的架構設計將系統分為三個獨立接口:「大腦」(Claude 及其運行框架)、「雙手」(執行沙箱與工具)、「會話」(記錄執行過程的事件日誌)。這種設計確保各部分可單獨失敗、單獨替換而不影響整體系統,為接入新的運行框架、沙箱或基礎設施預留了空間。

這意味著開發者不再需要關注底層運行框架的維護,而是將智能體視為 Claude API 中的一種新基礎原語,專注於更高層次的應用構建。

返回頂端