谷歌推出第八代 TPU,3 倍性能、2 倍頻寬,搭配自研 CPU

谷歌推出第八代 TPU,3 倍性能、2 倍頻寬,搭配自研 CPU

產品發布與核心規格

谷歌於 2026 年 4 月 22 日在 Google Cloud Next 2026 年度雲端科技大會上,正式發表了第八代張量處理器(TPU),並將其分為專攻訓練的 TPU 8t 與專攻推理的 TPU 8i 兩款產品。

TPU 8t 單個超級芯片組可擴展至 9600 張芯片,搭配 2PB 共享高頻寬記憶體,芯片間頻寬為上一代的 2 倍。整體而言,TPU 8t 陣列的計算性能較上一代 Ironwood 幾乎提升了 3 倍,每瓦性能提升至最多兩倍,提供 121ExaFlops 的計算能力。

架構創新與自研整合

此次發布的一大亮點是 TPU 8t 與 8i 均運行在公司自研的 Axion ARM CPU 平臺上,並由公司第四代液冷技術支援。

在系統效率方面,谷歌引入了自研的 Axion CPU 架構,將每臺服務器的 CPU 主機數量翻倍,並透過 NUMA 進行隔離優化,使整套系統在協同時更高效。此外,TPU 8t 還引入了 TPU Direct RDMA 與 TPU Direct Storage 技術,繞過主機 CPU,直接在 TPU 高頻寬記憶體(HBM)與網卡、高速儲存之間傳輸數據,大幅提升了儲存存取速度。

應用效益與市場影響

根據相關報導,引入新架構後,模型訓練時間從數月縮短至數周,推理的性價比則提升了 80%。此架構允許最複雜的模型充分利用算力,特別適合當前主流的 MoE(混合專家)模型應用。

此舉標誌著 AI 芯片進入「分工」時刻,TPU 8t 與 8i 的推出,旨在精準匹配 AI 智能體時代的需求,強化谷歌在超大型雲端服務與 AI 算力領域的領導地位。

來源:https://36kr.com/p/3778727740822536

返回頂端