Agent 時代需要怎樣的分佈式基礎設施

Agent 時代需要怎樣的分佈式基礎設施

核心需求:企業級 Agent 需要集群化運行環境

在企業級 Agent 應用場景中,Agent 必須運行在集群上,其本質是需要一個具備類似單機操作系統靈活動態調度能力的分佈式系統,能夠實現資源的高效分配與任務的彈性伸縮。

基礎設施關鍵組成分層

面向 AI Agent 的下一代基礎設施,需從分層角度系統梳理其關鍵組成,包括:

  • 計算層:提供高吞吐、低延遲的推理能力,滿足 Agent 對實時響應的需求。
  • 身份與權限管理:確保多 Agent 間的安全訪問與操作權限控制。
  • 上下文與記憶管理:支持 Agent 在複雜任務中維持長期記憶與上下文一致性。
  • 執行環境與運行時:提供工具調用、任務執行的沙箱環境,保障安全性與穩定性。
  • 調度與協作機制:實現多 Agent 間的任務路由、會話狀態維護與動態編排。
  • 安全治理:防範潛在風險,保障數據與系統安全。
  • 支付與經濟系統:支持 Agent 在執行任務時的資源消耗與價值交換。

典型架構與技術方案

在多 Agent 協作方面,Nacos 已成為首個支持 A2A 協議的註冊中心,Agent 註冊後,調用方只需填寫 Nacos 地址即可實現分佈式多 Agent 的編排。

AutoGen 框架提供了分佈式運行時方案,主機服務通過 gRPC 協議連接所有活躍的 Worker,負責消息路由、會話狀態維護等關鍵功能。

基礎設施演進趨勢

隨著 Agent 的爆發式增長,其對底層基礎設施提出了三重共性需求:長上下文處理能力、高吞吐低延遲響應、彈性伸縮能力,這些需求正在從根本上重塑雲服務的形態。

未來基礎設施將從“模型中心化”演進為“Agent-Native”模式,需在混合數據中心部署與擴展代理式 AI 所需的新型基礎設施。

為滿足高吞吐、低延遲、彈性伸縮需求,推理基礎設施需具備拓撲感知的角色編排、以 KVCache 為中心的架構、智能差異化調度與生產級保障能力。

來源:https://36kr.com/p/3802850619809288

返回頂端