Nvidia發表Vera Rubin平臺,一口氣推CPU、GPU、LPU等7款晶片,瞄準代理AI的AI工廠需求
Vera Rubin平臺核心組成與功能
Nvidia在GTC 2026大會上正式發表Vera Rubin平臺,並推出包含Vera CPU、Rubin GPU、NVLink 6高速連結交換器、Blue Field-4DPU、Spectrum -6乙太網路交換器、Connect X -9 SuperNIC及Groq 3 LPU等七款晶片,構建新一代AI超級電腦,專為滿足代理式AI(Agentic AI)的AI工廠需求而設計。
軟體與硬體的垂直整合設計
黃仁勳強調,Vera Rubin平臺是垂直整合的系統,將軟體與硬體深度協同設計,從端到端延伸至AI工廠的運作流程。此設計針對代理AI的核心工作負載——「思考」,特別優化大型語言模型的詞元處理與對記憶體及非結構化資料的快速存取。
關鍵技術與效能優勢
- 效能提升:Vera CPU被定義為世界上第一款專為代理式AI設計的處理器,可將AI推論效能提升兩倍,同時降低能耗一半。
- 成本優化:透過極致協同設計,Rubin平臺可將推論詞元成本降低10倍,並減少訓練混合專家模型所需的GPU數量達4倍。
- 系統協同:六款晶片高度分工,確保GPU不會因非計算任務而被中斷,形成高效能、穩定的AI運算環境。
產業與應用展望
黃仁勳指出,Vera Rubin平臺已進入量產階段,並與臺積電合作,推動全球對AI工廠所需先進晶片的龐大需求。該平臺將廣泛應用於長文本推理、混合專家模型(MoE)與AI自駕車等領域。
