AI進入Agent時代,CPU何以站上“算力C位”?

AI進入Agent時代,CPU何以站上“算力C位”?

工具處理環節成為CPU主要負擔

最新研究顯示,在完整的Agent執行鏈路中,工具處理相關環節在CPU上消耗的時間佔端到端延遲的比例最高可達90.6%。

大內存CPU成為關鍵承載容器

東吳證券指出,英偉達主動提升CPU權重,等同於在系統層面確認:在長上下文與高併發Agent場景中,大內存CPU是承載海量KV Cache(鍵值緩存)的最優容器。

Agent對CPU需求提升的三大來源

國金證券等多個機構總結道,Agent對CPU需求提升主要來自三方面,即應用調度壓力、高併發任務處理與內存訪問頻率的顯著增加。

高併發場景下CPU延遲顯著上升

在高併發場景下,CPU端到端延遲從2.9秒躍升至6.3秒以上。其結果揭示了在大量Agentic場景中,系統吞吐受限的並非GPU計算能力,而是CPU的核心數併發調度問題。

英偉達Rubin架構將大幅提升CPU核心數

英偉達計劃在下一代Rubin架構中大幅提升CPU核心數。英特爾與AMD在2026年的服務器CPU產能已基本售罄,計劃將產品價格上調以應對市場需求。

來源:https://36kr.com/p/3665611648426882

返回頂端