英偉達最強B200算力浪費60%!普林斯頓團隊出手,利用率升至71%
核心突破:FlashAttention-4算法大幅提升GPU利用率
一款專為Blackwell架構GPU量身打造的注意力算法——FlashAttention-4,一舉將GPU算力利用率從行業普遍的20%-30%提升至71%。
技術團隊與合作背景
FlashAttention-4由Tri Dao領銜,攜手Meta、Together AI等團隊共同開發,展現了跨企業協作在AI算力優化上的強大潛力。
行業影響與市場關注
該技術突破被廣泛視為AI推理時代的重要進展,不僅提升了英偉達B200芯片的使用效率,也反映出產業界對AI算力優化的持續關注。
延伸資訊
相關報道指出,英偉達正全力押注萬億級AI推理市場,其最新處理器佈局引發市場高度關注,包括在CPU賽道的潛在佈局。
