蘇媽上海行:Agent時代CPU不夠用了
蘇姿豐指出AI進入Agent時代,CPU與GPU需求結構發生根本變化
在上述業績交流會上,蘇姿豐認為,服務器CPU的需求可以分成三類:第一類是傳統的通用計算需求,增速相對溫和;第二類是作為GPU頭節點的CPU,在數據中心的服務器中扮演關鍵角色;第三類則是因AI Agent廣泛應用而產生的高併發計算需求。
CPU與GPU配比將向1:1靠攏
蘇姿豐表示,隨著AI Agent的廣泛使用,AI正進入「CPU+GPU」的時代。過去2022年至2025年,主要節點中的CPU與GPU比例約為1:4,目前正逐步向1:1的比例演進。她強調,在大量Agentic場景中,系統吞吐受限的並非GPU計算能力,而是CPU的核心數併發調度問題。
算力結構變化凸顯CPU核心重要性
在高併發場景下,CPU端到端延遲從2.9秒躍升至6.3秒以上,反映出系統性能瓶頸主要出現在CPU的併發調度能力上,而非GPU的計算能力。這表明,CPU在AI時代已從輔助角色轉變為與GPU同等重要的核心算力組件。
AMD推動AI全棧發展,強化雲端與個人端算力
AMD在雲端與個人PC端均佈局AI全棧方案,例如推出基於下一代MI455 GPU的Helios機架級平臺,單機架集成72塊AI GPU,算力高達2.9 ExaFLOPS,可通過成千上萬個機架拼接成超大訓練集群,以滿足AI Agent大規模訓練需求。
