馬斯克的GPU也在摸魚?狂囤幾十萬張顯卡,只有11%在幹活
xAI GPU利用率僅約11%
據媒體報道,馬斯克旗下的xAI團隊目前擁有約55萬張英偉達GPU,但其實際訓練算力利用率(MFU)僅有約11%。xAI總裁Michael Nicolls在內部備忘錄中稱這一數字「低得尷尬」。
與同業對比存在明顯差距
相較之下,Meta和Google的GPU利用率分別達到約43%和46%,遠高於xAI的11%。這反映出xAI在AI軟件棧優化方面存在明顯短板。
算力利用率的定義與意義
11%的利用率並非指89%的GPU完全閒置,而是衡量有效訓練吞吐佔硬件理論峰值算力的比例。這一指標顯示,當前AI訓練流程中存在嚴重的算力浪費問題。
行業普遍面臨軟件棧優化難題
隨著GPU集群規模不斷擴大,硬件擴張速度遠超軟件棧優化能力,導致閒置時間累積。行業普遍面臨算力浪費現象,凸顯AI基礎設施在軟件層面的優化挑戰。
