馬斯克站臺谷歌第8代TPU,訓練從數月縮至數週、推理性價比提升80%
谷歌推出「訓推分離」雙芯片架構
谷歌正式推出第八代TPU(Tensor Processing Unit),並首次採用「訓推分離」策略,分別發佈兩款專用芯片:TPU 8t 與 TPU 8i。這一架構旨在優化不同階段的AI開發需求,顯著縮短模型訓練週期並降低推理成本。
TPU 8t:專為訓練設計的效能引擎
面向訓練的TPU 8t被定位為「訓練效能引擎」。相較於去年11月發佈的第七代Ironwood TPU,其整體計算性能提升了2.7倍,整體計算性能是上一代產品(Ironwood)的近三倍。谷歌研發負責人Amin Vahdat指出,TPU 8t的研發目標是將前沿模型的訓練週期從數月大幅縮短至數週,從而打破時間限制,加速AI模型的開發進程。
TPU 8i:推理成本大幅降低
另一款芯片TPU 8i則專注於推理任務。數據顯示,這些改進讓TPU 8i在推理任務上的性價比比上一代提升了80%。對於需要處理大量推理請求的企業而言,這一提升意味著顯著的成本節約。谷歌強調,這些改進讓TPU 8i在推理任務上的性價比比上一代提升了80%,有助於終結AI推理延遲,讓智能體真正實現隨叫隨到。
市場影響與英偉達面臨挑戰
隨著谷歌第八代TPU的發佈,AI半導體市場格局面臨生變。分析指出,TPU專為深度學習優化,性價比最高,其性能提升可能讓英偉達面臨市場壓力,甚至有觀點認為英偉達可能因此失去10%的市場份額。馬斯克站臺此產品,進一步凸顯了谷歌在AI算力領域的戰略地位。
